CS/DB
[캐글] 중복된 데이터 병합하기 (kaggle store-sales-time-series-forecasting_2)
yeonlee
2022. 10. 23. 12:21
난 미래의 판매량을 예측해야하는데 보기가 거지같다. date 도 중복되어있고 store_nbr, family 도 중복되어있다.
이럴때 보기 쉽기 위해선 중복을 병합하는 방법을 써야한다.
우선 date 별로 보기 위해선 date 를 상위 index 로 끌어내야한다.
이걸 좀만 더 분석해보면 train data의 정보를 알 수 있는데
우선 1684일동안의 데이터를 나타낸 것이며
store_nbr는 총 54개가 있고
각 store 별로 33개의 물품이 있다. 모든 store 에서는 동일한 33개의 물품을 팔고 있는 모양이다.
기본적인 데이터 분석이 끝났으니 다음엔 본격적인 training 을 해보겠다.