In [ ]:
In [ ]:
유아용품과 가장 연관이 있는 제품군 알아보기¶
In [41]:
# https://www.kaggle.com/c/instacart-market-basket-analysis/data
In [1]:
from glob import glob
import pandas as pd
In [2]:
glob("*")
Out[2]:
In [9]:
pd.read_csv('products.csv').head()
Out[9]:
In [8]:
pd.read_csv('order_products__train.csv').head()
Out[8]:
In [7]:
pd.read_csv('order_products__prior.csv').head()
Out[7]:
In [5]:
pd.read_csv('orders.csv').head()
Out[5]:
In [4]:
pd.read_csv('departments.csv').head()
Out[4]:
In [3]:
pd.read_csv('aisles.csv').head()
Out[3]:
In [19]:
dept = pd.read_csv('departments.csv')[['department_id', 'department']]
pdt = pd.read_csv('products.csv')[['product_id', 'department_id']]
dept_pdt = pd.merge(dept, pdt)[['product_id', 'department']]
dept_pdt.head()
Out[19]:
In [20]:
d_1 = pd.read_csv('order_products__train.csv')[['order_id', 'product_id', 'reordered']]
d_2 = pd.read_csv('order_products__prior.csv')[['order_id', 'product_id', 'reordered']]
order_product = pd.concat([d_1, d_2])
order_product.head()
Out[20]:
In [21]:
combined = pd.merge(order_product, dept_pdt)[['order_id', 'department', 'reordered']]
combined.head()
Out[21]:
In [11]:
user_order = pd.read_csv('orders.csv')[['user_id', 'order_id']]
user_order.head()
Out[11]:
In [24]:
final = pd.merge(user_order, combined)[['user_id', 'department', 'reordered']]
final.head()
Out[24]:
In [28]:
pvt = final.pivot_table(index = 'user_id', columns = 'department', values = 'reordered')
pvt.head()
Out[28]:
In [40]:
corr = pvt.corr()
corr.head()
Out[40]:
In [39]:
corr.sort_values(by='babies', ascending=False)['babies']
Out[39]:
In [ ]:
'[중급] 가볍게 이것저것' 카테고리의 다른 글
[R]소득수준 / 소비수준 / 나이 / 성별을 기반으로 고객군 군집화 분석 예제 (0) | 2019.11.11 |
---|---|
고객 장바구니 분석 level_2 (0) | 2019.11.10 |
[Turbofan] 설비 잔존수명 예측 / 예방보전 / 관리한계선 설정방법 (0) | 2019.11.06 |
신용카드 거래내역 기반 고객 마케팅 적용기법 (0) | 2019.11.06 |
소비자물가지수 정보를 선형회귀분석과 경사하강법으로 알아보기 (0) | 2019.10.16 |