기계학습 기반 쾌삭 스테인리스강 중형 선재 제조공정 최적화
Manufacturing Process Optimization for a Free-machining Stainless Steel Medium-sized Wire Rod: A Machine Learning Methodology Approach
- 한국생산관리학회
- 한국생산관리학회지
- 韓國生産管理學會誌 第33卷 第1號
- : KCI등재
- 2022.02
- 99 - 114 (16 pages)
본 연구는 국내 철강기업(S사)의 쾌삭 스테인리스강 중형 압연 선재 제조공정 빅데이터를 활용하여 생산품질 예측 모형을 개발하고, 이를 기반으로 불량률을 최소화시키기 위한 최적 공정조건을 탐색하는 절차를 제안한다. S사의 쾌삭 스테인리스강 압연 선재 제조공정은 크게 제강, 열간압연과 열처리/산세 공정으로 이루어지며, 연구 데이터는 생산관리시스템(MES)으로부터 37종의 공정변수 데이터를 수집하고 문헌조사와 현장 전문가들의 인터뷰를 통해 총 12종의 파생변수를생성하여 반영하였다. 본 연구는 총 49종의 변수에 대한 데이터 전처리 및 탐색적 분석, 차원 축소, 기계학습 모델링, 공정조건 최적화 단계로 수행되었다. 탐색적 데이터 분석을 통해 데이터의 속성과 패턴을 파악하고, 전처리 단계에서는 이상치․결측치 제거를 수행하였다. 차원 축소 단계에서는 생산품질 예측 모형의 다중공선성 등의 문제를 방지하고 효율성을향상시키기 위해 상관분석과 변수 중요도를 이용하여 품질 영향도가 높은 변수를 식별하였다. 기계학습 모델링 단계에서는 다양한 지도학습 모형들에 대한 예비적 실험에서 유의미한 수준의 성능을 보인 로지스틱 회귀(Logistic regression) 모형, 서포트벡터머신(SVM: Support Vector Machine), 랜덤포레스트(Random Forest) 모형, XGBoost(Extreme Gradient Boosting) 모형을 대상으로 겹 교차 검증을 통해 각 후보 모형의 하이퍼파라미터들(Hyperparmeters)을최적화(Tuning)하였다. 또한, 오분류표 기반 성능 지표들과 대수손실(Logarithmic loss)을 종합적으로 고려하여 후보모형들을 비교/평가하고, 가장 우수한 성능을 보인 XGBoost 모형을 생산품질 예측 모형으로 선정하였다. 마지막으로, 최적 공정조건 탐색 단계에서는 개체군집최적화(PSO) 알고리즘이 이용되었으며, 이때, 개발된 생산품질 예측 모형(XGBoost) 이 적합도 함수로 적용되었다.
Based on the manufacturing big data of a free-machining 303 series stainless steel mediumsized wire rod, this study proposes a production-quality prediction model and a methodology for searching operating conditions maximizing the likelihood of producing adequate products. The research data include 37 types of operation variables for 3,542 lots collected from the manufacturing execution system (MES). Based on the MES data, 12 types of derived variables are generated through a literature review and interviews with field experts. Data attributes and patterns are identified, and outliers and missing values are removed in the exploratory analysis and preprocessing. In dimensionality reduction, variables with high-quality influence are identified by variable importance measures to prevent multicollinearity and enhance the efficiency of machine learning models. A preliminary study selected the logistic regression, support vector machine, random forest, and extreme gradient boosting (XGBoost) models as the candidates for the production-quality prediction model in data modeling. Their hyperparameters are tuned by the grid and random search methods based on k-fold cross-validation. In addition, the XGBoost shows the best classification performance for the test dataset. Finally, based on the XGBoost model, a swarm optimization algorithm searches the operating conditions to maximize the likelihood of producing adequate goods.
Ⅰ. 서론
Ⅱ. 데이터 전처리 및 차원축소
Ⅲ. 중형 선재 생산품질 예측 모형
Ⅳ. 최적 조업 조건 탐색 알고리즘
Ⅴ. 결론 및 향후 연구방향