상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
Journal of The Korean Data Analysis Society (JKDAS) Vol.25 No.2.jpg
KCI등재 학술저널

PIN 추정을 위한 최적모형에 관한 연구

MLE와 Bayesian 방법의 비교

본 연구는 정보거래확률(probability of informed trading; PIN)의 추정에 관한 두가지 모형을 비교하여 한국의 지수옵션시장에서 어떠한 모형이 더 안정적이고 활용성이 높은 방법인지를 조사한다. PIN을 계산하기 위한 방법으로서 본 연구에서는 MLE(method of maximum likelihood estimation, 최우추정법)와 베이지안(Bayesian) 방법을 이용한다. 본 연구의 표본기간인 2019년 5월부터 2020년 9월까지의 기간에 대해 KOSPI 200 지수옵션의 호가 및 체결자료(TAQ)를 이용하여 분석한 결과를 정리하면 다음과 같다. 첫째, 두 방법에서 해가 존재하지 않는 경우는 전혀 발생하지 않았다. 둘째, 베이지안 방법으로 delta(나쁜 뉴스가 발생할 확률)를 추정할 경우 경계해(boundary solution)가 전혀 발생하지 않았으나, MLE 방법에서는 경계해가 다수 발생하였다. 구체적으로 살펴보면, 5분 체결데이터에서 전체 해의 10%, 20분 체결데이터에서 47%가 발생하였다. 셋째, 20분 체결데이터의 경우 ITM 옵션에서 MLE 방법으로 추정된 PIN이 5분 데이터에 비해 현저하게 감소한 것으로 나타났다. 이는 앞의 경계해가 PIN의 하향편의(downward bias)를 야기한 것으로 추정된다. 넷째, MLE 방법에서는 추정치의 표준오차가 거의 0인 반면, 베이지안 방법은 20분 체결데이터에서 PIN을 기준으로 2% 정도의 평균오차율을 나타내고 있다. 결론적으로 샘플의 크기가 충분할 경우 경계해가 발생하지 않는 베이지안 방법이 우수하나 그렇지 않을 경우 오차율의 크기가 방법 선택에 있어서 중요한 요인이 될 것이라고 판단된다.

This study compares two models for estimating the probability of informed trading (PIN) and investigates which model is superior in the Korean index options market. The study uses the method of maximum likelihood estimation (MLE) and Bayesian methods to calculate the PIN. Using the bid and transaction data (TAQ) of KOSPI 200 index options from May 2019 to September 2020, we obtain the following results. First, there were no cases where there was no solution in either method. Second, when estimating delta using the Bayesian method, no boundary solutions occurred, but with the MLE method, multiple boundary solutions occurred. Specifically, 10% of the total solutions in 5-minute tick data and 47% in 20-minute tick data were boundary solutions. Third, in the case of 20-minute tick data, the PIN estimated by the MLE method for ITM options significantly decreased compared to that of the 5-minute data. This is estimated to be caused by the previous boundary solutions inducing a downward bias in the PIN. Fourth, in the MLE method, the standard error of the estimate is almost zero, while the Bayesian method shows an error rate of around 2% based on PIN from 20-minute data. In conclusion, the Bayesian method is superior when there is no boundary problem, given a sufficient size of closing data, but when not, the magnitude of the error rate is considered to be an important factor in the choice of method.

1. 서론

2. 데이터

3. 분석

4. 결론

References