상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
162554.jpg
KCI등재 학술저널

잠재토픽모형을 이용한 이미지 군집화에 대한 연구

Research for image clustering using latent topic model

DOI : 10.37727/jkdas.2022.24.2.539
  • 67

4차산업혁명으로 인해 이미지 콘텐츠의 양이 급속히 증가함에 따라 다양한 이미지를 저장 및 관리하기 위한 필요성이 커지고 있다. 이를 위해서 이미지 내용 및 주제의 파악이 선행되어야 하며, 이미지의 세부 객체를 판별하기 위한 방법론들이 제안되었다. 이와 같은 방법론들은 이미지 내의 세부 객체를 주석으로 제공하게 되는데, 이를 통해 전체 이미지의 주제를 설명하기에는 한계점이 있다. 본 논문에서는 이미지의 주석을 이용하여 주제를 파악하기 위해 잠재토픽모형을 이용하도록 한다. 잠재토픽모형으로는 Hofmann(2001)이 제안한 PLSA 모형을 이용하며, 이를 통해 각 이미지 및 주석을 잠재집단에 할당하도록 한다. 각 잠재집단에서 추정된 주석의 확률을 이용하여 잠재집단을 규명하고, 각 이미지 또는 주석이 잠재집단에 속할 사후확률을 추정하도록 한다. 본 논문에서는 Visual Genome에서 제공하는 300개의 이미지 및 주석을 분석하였으며, 다양한 잠재집단의 수를 설정하고 PLSA 모형을 적합한 후, 적합도 및 동질성 척도 등을 이용하여 모형을 평가하였다. 마지막으로, 수작업으로 분류한 결과와 모형을 통해 분류된 결과를 비교하여 오분류율을 구하고 적합도 및 동질성 척도의 결과와 비교하였다.

As the amount of image content rapidly increases due to the 4th industrial revolution, the need for storing and managing images is increasing. To figure out the subject of images for efficient storing and managing, various methods to provide the annotations describing the detailed object in the images has been proposed. However, it is hard to figure out the subject of images by using the annotations. In this paper, to understand the topic of the image PLSA model which is the latent topic model suggested by Hofmann(2001) is used. PLSA model assigns the annotations of each image to a latent group which can be identified by the estimated probabilities of annotation. In addition, by using PLSA model, the posterior probabilities of a latent group given by words or document are also provided. In this paper, 300 images and their annotations provided by Visual Genome are analyzed. To find out the appropriate the number of latent group, various models with different number of latent group are compared by using the goodness of fit such as AIC and BIC, coherence measures such as UCI and UMass coherence, and mis-specification rate.

1. 서론

2. PLSA 모형

3. 이미지 데이터의 분석

4. 모형의 평가

5. 결론

References

로딩중