소스코드 유사성 평가에서 딥러닝 활용 방안
Application of Deep Learning in Source Code Similarity Assessment
- 한국소프트웨어감정평가학회
- 한국소프트웨어감정평가학회 논문지
- 20(4)
-
2024.1221 - 29 (9 pages)
- 0
Recentlry, the application of deep learning to assess source code similarity has been an area of interest. Although this approach is very promising in that it can improve the accuracy and efficiency of similarity detection tasks by leveraging the ability of deep learning models to automatically learn and extract features from various representations of source code, similarity assessment using deep learning has issues regarding the accuracy, fairness, and interpretability of the results. This paper considers the issues related to deep learning-based software similarity assessment techniques and discusses the improvements required for deep learning models to be used in software assessment from a technical perspective. This study aims to provide a practical method for deep learning-based software similarity assessment to be industrially efficient while minimizing legal disputes. Suggested improvements include introducing a hybrid approach, automating dataset augmentation and labeling, lightweighting and efficient learning of models, and introducing explainable AI. In addition, we present scenarios for utilizing various evaluation indicators to improve reliability.
소스 코드 유사성을 평가하는 데 딥러닝을 적용하는 것은 최근 몇 년 동안 관심 분야로 떠오르고 있다. 이러한 접근 방식은 딥러닝 모델이 소스 코드의 다양한 표현에서 자동으로 학습하고 기능을 추출하는 능력을활용하여 유사성 탐지 작업의 정확도와 효율성을 개선할 수 있다는 측면에서 매우 긍정적이기는 하지만, 딥러닝을 활용한 유사도 감정은 결과의 정확성, 공정성, 해석 가능성에 대한 문제를 안고 있다. 본 논문에서는딥러닝 기반 소프트웨어 유사도 평가 기법과 관련된 문제를 생각해 보고, 기술적 관점에서 딥러닝 모델이 소프트웨어 감정에 활용되기 위해 필요한 개선 방안에 대해 논의해 본다. 본 연구는 딥러닝 기반 소프트웨어유사도 감정이 산업적으로 효율적이면서도 법적 분쟁을 최소화하기 위한 실질적인 방안을 모색해 보는데 그목적이 있다. 개선 방안으로 하이브리드 접근법 도입, 데이터셋 증강 및 레이블링 자동화, 모델 경량화 및 효율적 학습, 설명 가능 AI (XAI) 도입 등과 함께 신뢰성 향상을 위해 다양한 평가 지표의 활용 시나리오를 제시한다.
(0)
(0)