본문 바로가기

전체 글

(62)
[스마트 빌딩] 가정집 전력 소비량 알아보기_2 여러 날의 데이터를 합쳐서 보는 코드입니다. import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline month = pd.DataFrame() for i in range(10): i = str(i) path = 'data/GREEND/dataset_2014-04-1' + i + '.csv' day = pd.read_csv(path, sep=',') month = month.append(day) month.head() timestamp 000D6F00036BB04C 000D6F00029C2BD7 000D6F000353AC8C 000D6F0003562E10 ..
[스마트 빌딩] 가정집 전력 소비량 알아보기_1 가정집 전력 소비 데이터셋 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline path = 'data/GREEND/dataset_2014-04-10.csv' building = pd.read_csv(path, sep=',') apps = ['Coffee machine', 'washing machine', 'radio', 'water kettle', 'fridge', 'dishwasher', 'kitchen lamp', 'TV', 'vacuum cleaner'] building.columns = ['time'] + apps building['datetime'] = building['time']..
[스마트 빌딩] 건물의 전력 소비량 알아보기_2 전력 소비 소스의 정보 다루기 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline building = pd.read_csv('data/COMBED/total_main.csv') building.columns = ['time', 'Power'] dataset = ['1f', '2f', '3f', '4f', '5f', 'lift', 'ahu_0', 'ahu_1', 'ahu_2'] for i in dataset: path = &..
[스마트 빌딩] 건물의 전력 소비량 알아보기_1 COMmercial Building Energy Data set (COMBED) 데이터분석, 시각화 이 데이터 셋은 한 대학교 건물로부터 얻은 1달 간의 전력 소비량 데이터 입니다. 컬럼 설명 (데이터는 다음의 링크에서 다운받으실 수 있습니다) time 타임스탬프, 1/30 Hz 주기이고 밀리초(ms) 단위로 획득됩니다. Power 건물의 해당 시간 전기 에너지 소비량 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline path = 'data/COMBED/total_main.csv' building = pd.read_csv(path, sep=',') buildin..
[뉴스 정보] 조금 진지한 크롤링, selenium / beautifulsoup # 마치 사람이 접속하는 것 처럼 브라우저로 서버에 정보를 요청하는 seleuium # 딕셔너리처럼 타고타고 들어가기에는 너무나도 복잡할 때 사용하는 bs4 !pip install selenium bs4 Requirement already satisfied: selenium in c:\users\one\appdata\local\continuum\anaconda3\lib\site-packages (3.141.0) Collecting bs4 Downloading https://files.pythonhosted.org/packages/10/ed/7e8b97591f6f456174139ec089c769f89a94a1a4025fe967691de971f314/bs4-0.0.1.tar.gz Requirement alr..
[뉴스 정보] 데이터 수집/저장 입문_2 # xml 형식의 정보를 딕셔너리처럼 사용할 수 있게 도와주는 친구를 설치 !pip install xmltodict Requirement already satisfied: xmltodict in c:\users\one\appdata\local\continuum\anaconda3\lib\site-packages (0.12.0)import requests import xmltodict import pandas as pd # 네이버 검색 -> 뉴스 들어가서 RSS 복사/붙여넣기 url = 'http://newssearch.naver.com/search.naver?where=rss&query=%EC%82%BC%EC%84%B1%20%EB%B0%98%EB%8F%84%EC%B2%B4&field=0&nx_sea..
[환율 정보] 데이터 수집/저장 입문_1 import requests import pandas as pd # 구글 검색 = 환율 무료 api # 간단한 API 제공 사이트 happycgi # 홈페이지 바로가기 클릭 # 왼쪽 위 메뉴 -> exchange -> index 클릭 # 아래 주소 획득 url= 'https://api.manana.kr/exchange.json' # 해당 주소의 서버에 요청(request) 를 보내고, 그 결과를 req 로 저장한다. req = requests.get(url) # 이 결과는 json 이라는 형태로 들어오게 되는데 # 이는 결국 파이썬에서 리스트와 딕셔너리의 조합으로 다루게 된다. # .json() 이후부터는 리스트의 인덱싱과 딕셔너리의 키로 조회하는 방법을 사용한다. result = req...
[뷰티 상품] 추천 시스템 구축하기 import pandas as pd data = pd.read_csv('data/ratings.csv') # include='all' 을 해야 숫자가 아닌 컬럼들도 보이게 된다. data.describe(include='all') UserId ProductId Rating Timestamp count 2023070 2023070 2.023070e+06 2.023070e+06 unique 1210271 249274 NaN NaN top A3KEZLJ59C1JVH B001MA0QY2 NaN NaN freq 389 7533 NaN NaN mean NaN NaN 4.149036e+00 1.360389e+09 std NaN NaN 1.311505e+00 4.611860e..