1. Kaggle [bicycle demand 예측]
github.com/corazzon/KaggleStruggle/blob/master/bike-sharing-demand/bike-sharing-demand-EDA.ipynb
corazzon/KaggleStruggle
Kaggle Struggle. Contribute to corazzon/KaggleStruggle development by creating an account on GitHub.
github.com
1.
- 결측치 시각화 방법
[데이터시각화] 파이썬 : 결측치(missing value) 시각화하는 5가지 방법
오늘은 파이썬으로 탐색적 데이터 분석(EDA) 과정에서 수행하기 좋은 결측치 시각화에 대해서 정리를 ...
blog.naver.com
-datetime ??
문자열(object)을 datetime64 타입으로 변경하면 요일부터 다양한 추가 정보를 이용할 수 있습니다.
# object 타입을 datetime64[ns] 타입으로 바꾼다
=> df['Birth'] = pd.to_datetime(df['Birth'], format='%Y-%m-%d %H:%M:%S', errors='raise')
to_datetime( ) 함수에 첫번째 파라미터로 list를 입력하면 datetimeIndex가 반환됩니다.
Pandas의 Series타입을 입력하면 datetime64형태의 Series타입이 반환됩니다.
(Series타입이 다루기가 더 쉽습니다)
그리고 format파라미터에서 지정한 대표적인 시간 포멧은 아래와 같습니다.
%Y: Year, ex) 2019, 2020
%m: Month as a zero-padded, ex) 01~12
%d: Day of the month as a zero-padded ex) 01~31
%H: Hour (24-hour clock) as a zero-padded ex) 01~23
%M: Minute as a zero-padded ex) 00~59
%S: Second as a zero-padded ex) 00~59 ex) 2019-09-01 19:30:00 =(Directivs)=> %Y-%m-%d %H:%M:%S
이제 datetime64으로 변환했으므로 datetime64에서 제공하는
함수와 속성에 대해서 호출해보고 그 결과를 살펴보겠습니다.
가장 먼저 연, 월, 일, 시, 분, 초 속성들 입니다. 반환형태가 문자와 숫자로 상이 합니다.
-visulation 정리
[Pandas] Visualization 관련 정리 (시각화)
figure size 바꾸기 plt.figure(figsize = (가로, 세로)) 로 변경 가능하다. plt.figure(figsize=(18,4)) dayofweek_order = ["Monday","Tuesday","Wednesday","Thursday","Friday","Saturday","Sunday"] sns.poin..
do-first-dream-next.tistory.com
2. 예측하기
github.com/corazzon/KaggleStruggle/blob/master/bike-sharing-demand/bike-sharing-demand-rf.ipynb
corazzon/KaggleStruggle
Kaggle Struggle. Contribute to corazzon/KaggleStruggle development by creating an account on GitHub.
github.com