난 미래의 판매량을 예측해야하는데 보기가 거지같다. date 도 중복되어있고 store_nbr, family 도 중복되어있다.
이럴때 보기 쉽기 위해선 중복을 병합하는 방법을 써야한다.
우선 date 별로 보기 위해선 date 를 상위 index 로 끌어내야한다.
이걸 좀만 더 분석해보면 train data의 정보를 알 수 있는데
우선 1684일동안의 데이터를 나타낸 것이며
store_nbr는 총 54개가 있고
각 store 별로 33개의 물품이 있다. 모든 store 에서는 동일한 33개의 물품을 팔고 있는 모양이다.
기본적인 데이터 분석이 끝났으니 다음엔 본격적인 training 을 해보겠다.
'CS > DB' 카테고리의 다른 글
[DB] Maxscale 이중화 방법(ubuntu live) (0) | 2024.08.02 |
---|---|
[캐글] regression 시각화 (kaggle store-sales-time-series-forecasting_3) (0) | 2022.10.23 |
[캐글] 파이썬 CSV 데이터 확인하는 2가지 방법 (kaggle store-sales-time-series-forecasting_1) (0) | 2022.10.19 |
[MySQL] First normalization, 다대다, 연결 테이블 (0) | 2022.02.05 |
[MySQL] ER 다이어그램 entity, attribute, relationship (0) | 2022.02.04 |