본문 바로가기

전체 글

(62)
고객 장바구니 분석 level_1 In [ ]: In [ ]: 유아용품과 가장 연관이 있는 제품군 알아보기¶ In [41]: # https://www.kaggle.com/c/instacart-market-basket-analysis/data In [1]: from glob import glob import pandas as pd In [2]: glob("*") Out[2]: ['aisles.csv', 'departments.csv', 'orders.csv', 'order_products__prior.csv', 'order_products__train.csv', 'products.csv', 'sample_submission.csv', &#3..
[Turbofan] 설비 잔존수명 예측 / 예방보전 / 관리한계선 설정방법 In [ ]: 각 센서 값들을 기반으로 RUL(잔존수명) 을 도출합니다.¶ In [183]: import pandas as pd import numpy as np from glob import glob unit_1 = pd.read_csv('FD001_RUL.csv') %matplotlib inline sns.set(rc={'figure.figsize':(15,6)}) RUL 은 향후 사용 가능한 잔여 횟수를 의미합니다.¶ 10회 미만 사용 가능할 경우 CRITICAL¶ 10 ~ 20 이면 CAUTION // 20 ~ 30 이면 NEED_CARE // 30 이상이면 HEALTHY 로 라벨링 하였습니다.¶ 라벨링 한 컬럼 이름은 LEVEL 입니다.¶ In [184]: unit_1.loc[unit_1['RU..
신용카드 거래내역 기반 고객 마케팅 적용기법 # 신용카드 거래내역 군집분석(고객 마케팅 용도) install.packages('fpc') package 'fpc' successfully unpacked and MD5 sums checked The downloaded binary packages are in C:\Users\one\AppData\Local\Temp\RtmpoZE3F5\downloaded_packages install.packages('useful') package 'useful' successfully unpacked and MD5 sums checked The downloaded binary packages are in C:\Users\one\AppData\Local\Temp\RtmpoZE3F5\downloaded_packages ..
소비자물가지수 정보를 선형회귀분석과 경사하강법으로 알아보기 소비자 물가지수 데이터 셋으로 선형회귀 + 경사 하강법 이해하기 import pandas as pd import numpy as np 데이터 불러오기 train = pd.read_csv('ca2.csv', encoding='euc-kr') train.head() 소비자물가지수 경제활동인구 KOSPI_평균 주택전세가격지수 대출평균 0 89.97 24082.0 1682.16 69.50 5.94 1 90.16 24035.0 1598.96 69.93 5.84 2 90.34 24382.0 1665.50 70.41 5.69 3 90.70 24858.0 1730.29 70.85 5.49 4 90.79 25099.0 1648.30 71.14 5.40 features = ['경제활동인..
알고리즘 문제풀이_1 알고리즘 문제풀이 1. selection_sort 2. 함수 f(n)는 1 부터 n 사이에서 1이 나오는 횟수를 구해준다. f(13) = 6, f(1) = 1 이다. f(n) = n 을 만족하는 첫 번째 양수가 1 이라고 할 때, 2 번째 양수는 얼마인가? 3. 개구리가 처음엔 한 칸 뛰고 그 이후부터는 앞선 점프의 2 배 거리를 뛴다. 점프시 도착지점을 넘어서리라 예상되면 다시 한 칸으로 뛰는 거리를 줄여 다시 2배씩 점프 거리를 늘려나간다. 원점(0) 부터 시작한 경우 25 위치에 도달하기 위해서는 9번의 점프가 필요한 셈이다.(1+2+4+8 + 1+2+4 + 1+2) x 위치까지 가기 위한 함수 hop(x) 만들기. 4. c, d 사이의 구간 안에서 일차함수 f(x) = ax+b 의 해를 구하는 함..
파이썬으로 데이터 주무르기 4장 코드에 주석을 달았다는 내용의 제목 원작자 : PinkWink¶주석 작성자 멘트 : 코드 호환성 문제 등으로 수정하여 작성한 부분이 있습니다.¶ 4장 셀프 주유소는 정말 저렴할까¶작성 : PinkWink¶4-1 Selenium 사용하기¶ In [1]: from selenium import webdriver 현재 최신 크롬드라이버의 명령 중 일부가 다른 버전과 다른듯 합니다. 본 Github에서 배포하는 driver를 사용하시기 바랍니다. In [2]: from bs4 import BeautifulSoup 4-2 서울시 구별 주유소 가격 정보 얻기¶ In [9]: import time from selenium.webdriver.support.ui import Select driver = webdriver.Chrome('../drive..
[자연어 처리]와인 추천 시스템 간단하게 구현하기 NLP 간단하게 구현해보기 - 와인 추천 시스템 kaggle 의 wine-reviews 데이터 셋을 이용하여 키워드 입력시 이와 가장 유사한 와인을 찾는 알고리즘 keyword - TFIDF, SGDClassifier, pandas, merge, outer-join, index, boolean-indexing import pandas as pd # https://www.kaggle.com/zynicide/wine-reviews path = 'winemag-data-130k-v2.csv' data = pd.read_csv(path, index_col=0) data.shape (129971, 13)# 95점 이상 데이터만 추려냅니다. pre = data.loc[data['points&#..
파이썬으로 데이터 주무르기 2장 코드에 주석을 달았다는 내용의 제목 ''' 원본 소스코드에 대한 설명: ### 작성 : [PinkWink](http://pinkwink.kr) * 강남3구의 주민들이 자신들이 거주하는 구의 체감 안전도를 높게 생각한다는 기사를 확인해 보도록 한다 * 기사 원문 http://news1.kr/articles/?1911504 * 작성 : PinkWink http://pinkwink.kr * Matplotlib의 heatmap 등을 그릴때 cmap의 디폴트 설정이 변경되어 heatmap 등에서 cmap을 적용할 때 옵션을 잡아주어야 교재와 동일한 효과가 나타난다. (소스코드에 모두 반영됨) * Folium이 0.4.0으로 판올림 되면서 choropleth 명령에서 geo_str 옵션명이 geo_data 옵션명으로 변경됨. (..