구분 | 설명 |
---|---|
프로젝트 명 | 자동차 생산 공정 데이터 분석을 통한 생산성 개선 방안 도출 |
제안 배경 | 공정 데이터 분석 기반 생산성 개선 방안을 찾기 위해 제안되었습니다. |
기간 | 2023.11 ~ 2023.12 |
주최 | 전공 프로젝트 |
요약 | target이 주어지지 않은 bottom-up 형식의 과제입니다. 다양한 변수간의 관계, 특징 등을 시각화해서 발견하고 가설을 수립했습니다. 수립한 가설은 통계적 검정을 통해 검정했고 최종 방안을 제안했습니다. |
역할 | 리더/ 프로젝트 일정 수립/ EDA/ 가설검정 |
생산수량 변수에 대한 시각화 2개, 불량률 1개, 시간가동률 1개를 확인했습니다.
[ 생산수량-1 : 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. ]
👉 아반떼 모델의 생산수량이 넓게 퍼져있는 것을 확인할 수 있다.
[ 생산수량-2 : LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. ]
👉 LINE_A에서 22년 4월 29일~22년 8월 1일 사이 평균 생산수량이 다른 날에 비해 높은 것을 확인할 수 있다.
[ 불량률-1 : 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. ]
👉 근속년수가 낮거나, 높을수록 불량률이 높은 것을 확인할 수 있다.
[ 시간가동률-1 : LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. ]
👉 생산수량이 375개 아래로 떨어지면 시간가동률이 현저히 낮아지는 것을 확인할 수 있다.
(시간가동률 = 가동시간 / 부하시간)
가설 🔻
가설 번호 | 가설 설명 | 도표 |
---|---|---|
생산수량-1 | 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. | EDA - 생산수량, 모델 |
생산수량-2 | LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. | EDA - 생산수량, 4월 29일 ~ 8월 1일, 설비(LINE_A) |
불량률-1 | 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. | EDA - 불량률, 근속년수 |
시간가동률-1 | LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. | EDA - 시간가동률, 설비(LINE_C) |
✅ [ 생산수량-1 : 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. ]
-
levene의 등분산검정 : 모델 2개씩 비교
$H_0$ :$s_{생산수량, 아반떼}^2 = s_{생산수량, model}^2$ for some$models$
$H_1$ :$s_{생산수량, 아반떼}^2 > s_{생산수량, model}^2$ for some$models$ 모델명 p-value 결과 아반떼 / 니로 0.05424536 귀무가설 채택 아반떼의 생산수량 분산이 니로의 분산과 유의미한 차이가 없다. 아반떼 / 소나타 3.786e-06 대립가설 채택 아반떼의 생산수량 분산이 소나타의 분산보다 크다. 아반떼 / 아이오닉 0.0 대립가설 채택 아반떼의 생산수량 분산이 아이오닉의 분산보다 크다. 아반떼 / 투싼 0.0 대립가설 채택 아반떼의 생산수량 분산이 투싼의 분산보다 크다. 아반떼 / 플러그인 투싼 0.0 대립가설 채택 아반떼의 생산수량 분산이 플러그인투싼의 분산보다 크다.
- levene의 등분산검정 : 모든 모델 비교
$H_0$ :$s_{생산수량, 아반떼}^2 = s_{생산수량, model}^2$ for some$models$
$H_1$ :$s_{생산수량, 아반떼}^2 \neq s_{생산수량, model}^2$ for some$models$
기각역 : 0.05
W-statistic: 58.7177
P-value: 0.0000
결론 : 대립가설 일부 채택
- 아반떼의 생산수량 분산이 니로를 제외한 다른 모델들의 분산보다 크다.
- 전체를 한 번에 검정했을 때는 모델별 분산에 차이가 있다는 결과
✅ [ 생산수량-2 : LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. ]
독립표본 t 검정 (단측)
<< 22/04/29~22/08/01 / 다른 날 >> 기각역 : 0.05 P-value: 0.0
결론 : 대립가설 채택
22/04/29~22/08/01때 LINE_A에서의 생산수량 평균이 다른 날의 평균보다 크다.
✅ [ 불량률-1 : 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. ]
독립표본 t 검정 : 2개의 구간화된 근속년수를 비교
-
근속년수 : 00-04년
$H_0 : \mu_{불량률, 00-04년} = \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(25년 이상 제외)
$H_1$ :$\mu_{불량률, 00-04년} > \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(25년 이상 제외)근속년수 p-value 결과 00-04년 / 05-09년 0.0 대립가설 채택 00-04년의 불량률 평균이 05-09년의 평균보다 크다 00-04년 / 10-14년 0.0 대립가설 채택 00-04년의 불량률 평균이 10-14년의 평균보다 크다 00-04년 / 15-19년 0.0 대립가설 채택 00-04년의 불량률 평균이 15-19년의 평균보다 크다 00-04년 / 20-24년 0.0 대립가설 채택 00-04년의 불량률 평균이 20-24년의 평균보다 크다
-
근속년수 : 25년 이상
$H_0$ :$\mu_{불량률, 25년 이상} = \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(00-04년 제외)
$H_1$ :$\mu_{불량률, 25년 이상} > \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(00-04년 제외)근속년수 p-value 결과 25 년 이상 / 05-09년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 05-09년의 평균보다 크다. 25 년 이상 / 10-14년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 10-14년의 평균보다 크다. 25 년 이상 / 15-19년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 15-19년의 평균보다 크다. 25 년 이상 / 20-24년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 20-24년의 평균보다 크다.
-
ANOVA : 모든 구간화된 근속년수를 비교
$H_0$ :$\mu_{불량률, 근속년수} = \mu_{불량률, 근속년수}$ for some$구간화\ 된\ 근속년수$
$H_1$ :$\mu_{불량률, 근속년수} \neq \mu_{불량률, 근속년수}$ for some$구간화\ 된\ 근속년수$ 기각역 : 0.05 F-statistic: 1385.8033 P-value: 0.0000
결론 : 대립가설 채택
평균적으로 00-04년과 25년 이상 근무한 근무자들의 평균 불량률은 다른 년수보다 높다.
✅ [ 시간가동률-1 : LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. ]
독립표본 t 검정(단측)
<< 375 이상 / 375 미만 >>
기각역 : 0.05
P-value: 0.0
결론 : 대립가설 채택
- 생산수량이 375 이상일 때 LINE_C 에서의 시간가동률 평균이 375 미만의 평균보다 크다.
- 생산수량이 375 미만이면 시간가동률이 0.5미만이 됨 = 조업시간 중 설비가 실제 움직인 시간 관점에서 매우 비효율 적임(정지시간이 많음)
가설 번호 | 가설 | 검정방법 | 결과 |
---|---|---|---|
생산수량-1 | 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. | 르빈의 등분산 검정 | 참(아반떼 / 니로 = 기각) |
생산수량-2 | LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. | 독립표본 t 검정(단측) | 참 |
불량률-1 | 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. | 독립표본 t 검정(단측), 분산분석(ANOVA) | 참 |
시간가동률-1 | LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. | 독립표본 t 검정(단측) | 참 |
- 생산수량 1 : 아반떼의 생산수량의 분산이 타 모델들에 높을 것이다.
👉 아반떼의 생산계획 최적화를 통해 적절한(분산이 적게) 생산계획을 수립한다.
👉 기존 생산계획(분산이 큰)에 맞게 작업자를 유동적으로 배치한다.
- 생산수량 2 : LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다.
👉 생산수량을 적절하게 예측해서 생산의 불균형을 최소화 한다.
👉 해당 기간에는 작업자의 피로를 분산시키기 위해 더 많은 인력을 투입하거나 복리후생에 신경쓴다.
- 불량률 1 : 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다.
👉 근속년수가 00-04년인 작업자들을 위한 불량 예방을 위한 교육을 기획한다.
👉 근속년수가 25년 이상인 작업자들은 노하우나 기술을 교육하는 교육의 업무를 맡도록 인력을 재배치한다.
- 시간가동률 1 : LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다.
👉 생산수량이 375개 미만이 되면 어떤 정지시간이 발생하는지 파악 후 로스타임을 줄여서 탄력적으로 생산을 수행하도록 한다.