유전 알고리즘을 적용한 확장된 죄수의 딜레마 게임에서 선택확률함수 조정에 따른 유효한 전략 분석
Analysis of Valid Strategies According to Selection Probability Function Adjustment in an Extended Prisoner’s Dilemma Game Using Genetic Algorithm
- 한국과학영재교육학회
- 과학영재교육
- 제15권 제3호
- 2023.12
- 455 - 464 (10 pages)
게임이론의 대표적 사례인 죄수의 딜레마(PD)는 두 가지 행동 전략(협력 또는 배신)에 따라 두 플레이어가 보상을 받는 고전적인 게임이지만, 조건(참가자 수, 행동 전략, 보상 가치, 게임 수 등)의 변화에 따라 많은 변형이 이루어지고 있다. 본 연구에서는 보상가치의 변화에 따라 어떤 행동전략을 선택해야 하는지 선택확률함수를 개선하기 위해 반복적 죄수의 딜레마(IPD) 게임에 유전자 알고리즘을 적용한 확장된 죄수의 딜레마(EPD) 게임을 위해 사용 가능한 선택확률전략(SPS)을 개발하였다. 프로그램 시뮬레이션 결과 이 전략은 초기에 상위권에 올라 좋은 성능을 보이며 최종 직전 단계까지 살아남는 대체로 우세한 전략에 속했다. 본 연구는 죄수의 딜레마 게임에서의 새로운 전략을 개발하는 방법의 가능성을 제시하고 전반적으로 유효한 기존 전략들도 재확인해 보았다는 데 의의가 있다.
The Prisoner’s Dilemma, a representative example of game theory, is a classic game in which two players receive rewards based on two action strategies(cooperation or defection). However, many variations have been made depending onchanges in conditions(number of participants, behavioral strategies, reward values, number of games, etc.). In this study, an extended Prisoner’s Dilemma game was used in which a genetic algorithm was applied to the iterative Prisoner’sDilemma game to improve the selection probability function to determine which action strategy should be selected according to changes in reward value. A possible SPS(selection probability strategy) was developed. As a result of theprogram simulation, this SPS ranked high in the early stages, showed good performance, and was generally a dominant strategy that survived until the final stage. This study is significant in that it suggests the possibility of developing a new strategy in the Prisoner’s Dilemma game and reaffirms existing strategies that are generally effective.
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법 및 절차
Ⅳ. 연구결과
Ⅴ. 결론