kaggle실습

1. Kaggle [bicycle demand 예측]

풍요 평화 만땅 연구원 2020. 11. 23. 16:40

github.com/corazzon/KaggleStruggle/blob/master/bike-sharing-demand/bike-sharing-demand-EDA.ipynb

 

corazzon/KaggleStruggle

Kaggle Struggle. Contribute to corazzon/KaggleStruggle development by creating an account on GitHub.

github.com

 

1.

- 결측치 시각화 방법

m.blog.naver.com/PostView.nhn?blogId=youji4ever&logNo=221623491491&proxyReferer=https:%2F%2Fwww.google.com%2F

 

[데이터시각화] 파이썬 : 결측치(missing value) 시각화하는 5가지 방법

​오늘은 파이썬으로 탐색적 데이터 분석(EDA) 과정에서 수행하기 좋은 결측치 시각화에 대해서 정리를 ...

blog.naver.com

-datetime ??

문자열(object)을 datetime64 타입으로 변경하면 요일부터 다양한 추가 정보를 이용할 수 있습니다.

# object 타입을 datetime64[ns] 타입으로 바꾼다

=> df['Birth'] = pd.to_datetime(df['Birth'], format='%Y-%m-%d %H:%M:%S', errors='raise')

 

to_datetime( ) 함수에 첫번째 파라미터로 list를 입력하면 datetimeIndex가 반환됩니다.

Pandas의 Series타입을 입력하면 datetime64형태의 Series타입이 반환됩니다.

(Series타입이 다루기가 더 쉽습니다)

그리고 format파라미터에서 지정한 대표적인 시간 포멧은 아래와 같습니다.

%Y: Year, ex) 2019, 2020

%m: Month as a zero-padded, ex) 01~12

%d: Day of the month as a zero-padded ex) 01~31

%H: Hour (24-hour clock) as a zero-padded ex) 01~23

%M: Minute as a zero-padded ex) 00~59

%S: Second as a zero-padded ex) 00~59 ex) 2019-09-01 19:30:00 =(Directivs)=> %Y-%m-%d %H:%M:%S

 

이제 datetime64으로 변환했으므로 datetime64에서 제공하는

함수와 속성에 대해서 호출해보고 그 결과를 살펴보겠습니다.

가장 먼저 연, 월, 일, 시, 분, 초 속성들 입니다. 반환형태가 문자와 숫자로 상이 합니다.

 

-visulation 정리

 

do-first-dream-next.tistory.com/entry/Pandas-%EC%8B%9C%EA%B0%81%ED%99%94-%EB%B8%94%EB%9F%AD-%EC%97%AC%EB%9F%AC%EA%B0%9C%EB%A1%9C-%EB%9D%84%EC%9A%B0%EA%B8%B0

 

[Pandas] Visualization 관련 정리 (시각화)

figure size 바꾸기 plt.figure(figsize = (가로, 세로)) 로 변경 가능하다. plt.figure(figsize=(18,4)) dayofweek_order = ["Monday","Tuesday","Wednesday","Thursday","Friday","Saturday","Sunday"] sns.poin..

do-first-dream-next.tistory.com

2. 예측하기

github.com/corazzon/KaggleStruggle/blob/master/bike-sharing-demand/bike-sharing-demand-rf.ipynb

 

corazzon/KaggleStruggle

Kaggle Struggle. Contribute to corazzon/KaggleStruggle development by creating an account on GitHub.

github.com