디지털 전환(Digital Transformation; DX)의 속도가 높아짐에 따라 각 조직은 다양한 IT 기술을 적용하여 고객, 시장, 판매, 운영 등의 다양한 출처로부터 디지털 데이터를 확보해 가고 있다. 이러한 디지털 데이터는 고객 가치 증대, 새로운 비즈니스 기회 발굴 그리고 프로세스 운영 혁신에 대한 유용한 정보를 포함하고 있을 것으로 기대된다. 이러한 정보를 올바로 획득하기 위해서는 빅 데이터(Big Data)의 특징을 갖는 디지털 데이터로부터 원하는 분석 목적에 적합한 변수 선택 그리고 데이터 전처리(Data Preprocessing)를 통하여 분석 가능한 표준 ABT(Analytical Base Table)를 생성할 수 있어야 한다. 본 논문에서는 표준 ABT에서 고려해야 할 데이터 품질을 정의하고 실무적으로 활용 가능한 데이터 전처리의 기준과 방법을 소개하고자 한다. 또한 소프트웨어 개발 운영 프로세스의 디지털화(Digitization) 결과인 빅 데이터에 대한 대한 전처리 사례를 통하여 표준 ABT 구성에 대한 경험적 기준을 제시해 보고자 한다.
As digital transformation (DX) accelerates, each organization is applying various IT technologies to collect digital data from various sources such as customers, markets, sales, and operations. Such digital data is expected to contain useful information about increasing customer value, discovering new business opportunities, and innovation of process operation. In order to correctly acquire such information, it is necessary to be able to select a variable suitable for the desired analysis purpose from digital data with the characteristics of Big Data, and to generate a standard ABT(Analytical Base Table) that can be analyzed through Data Preprocessing. In this paper, we will define the data quality to be considered in standard ABT and introduce standards and methods of data preprocessing that can be used practically. In addition, we would like to present the empirical criteria for standard ABT configuration through examples of preprocessing of big data, which is the result of digitization of the software development and operation process.
I. 서론
II. 데이터 품질과 표준 ABT
III. 데이터 전처리 기준과 방법
IV. 사례
V. 결론 및 추가 고려 사항
참고문헌