2019.09.19
롯데홈쇼핑 방송의 판매 실적 예측 및 판매 증대를 위한 데이터 기반의 방안 제시
- 목표
데이터를 기반으로 미래 매출액을 예측하고, 매출 증진을 위한 방안을 제시.
- 파생변수, 외부변수 생성
초기 데이터로 주어진 것은 날짜 데이터 정보뿐이었기 때문에, 인사이트를 얻기 힘들었다. 따라서 파생/외부변수를 발굴하고자 했고, 매출에 영향을 미치는 요인에 대해 고민해보았다. 소득이 증가하면 소비가 함께 증가한다는 기본 경제 개념을 전제로, 주가 상승의 시기를 파악하여 소비자 물가지수, 코스피지수, 고용률을 변수로 활용했다. 시계열 분석을 통해 해당 변수들의 moving average들을 활용했으며, 또 날씨, 휴일 정보를 파생변수로 활용했다.
- 데이터 전처리
- 외부 변수: 날짜 → 날씨API, 경제상황(CPI, KOSPI, 고용률)
- 활용: 시계열 분석 (moving average)
- 파생 변수: 날짜 → 요일, 월, 연도, 휴일
- 랜덤 포레스트(모델링-채택)
- 그래디언트 부스팅
- 앙상블
- 의사결정트리(스코어링-채택)
- ANN
- 선형회귀
- 경제 지표 데이터를 외부변수로 생성하여, moving average를 적용
- 예측 모델 생성 및 학습
거시적인 지표들을 활용하여 경제상황을 판단하여 예측에의 정밀도가 떨어졌다. 따라서 미시적인 지표를 활용하여 모형의 성능을 높이고자 한다.
참가 당시 Neural Network에 대한 사전 지식이 없었기에, hyperparameter들을 조정하며 모델 생성을 해보지 못했다. hyperparameter의 조절을 통해 다양한 모델들을 적합시켜보고자 한다.