第85回情報処理学会全国大会 第5回中高生情報学研究コンテスト

勝率85%! 人間より強いオセロAIができた

チーム名:山本ぴあの

横浜サイエンスフロンティア高等学校附属中学校

山本ぴあのさん(3年) 

(2023年3月取材)

ディープニューラルネットワークを用いたオセロAIの作成

ニューラルネットワークを用いて、オセロゲームの対戦をするAIプログラム「E-Minor」を開発している。

初めに世界オセロ選手権の棋譜データを用いた教師あり学習を行い、次に学習したAI同士で互いに対戦させる強化学習を行い、最後に盤面の状態を数手先まで予測して最適な結果を判断する先読みによって強化した。

 

教師あり学習では、ニューラルネットワークの層数やフィルター数、層の種類を変えた時の正解率を比較した。その結果、フィルター128枚、畳み込み18層、ドロップアウト3層という構造に加えて、バイアス層を用いることで正解率が高いAIを作ることができた。

強化学習では、オセロ1プレイを複数回学習させるのではなく、1プレイを1回学習した時のみ学習が進行することが分かった。

 

学習を終えたE-Minorは一般に知られているオセロの定石を再現することができ、いくつかのオセロプログラムに勝利し、人との対戦で勝率85%を超えたため人間よりも強いオセロプレーヤーを作成することができた。

 

※クリックすると拡大します。

 

■今回発表した研究を始めた理由や経緯を教えてください。

 

小学生の頃からプログラミングを勉強して、PythonやC++を学んでいたため、それを研究に活かしたいと思ったのがきっかけです。

 

今最も成長している分野の一つであるAIについて興味を持っていたので、今まで勉強してきたことを応用してAIを作りたいと考えました。また、私はゲームが好きなので、それを研究に繋げたいと思い、ボードゲームであるオセロを研究の対象にしました。

 

 

■今回の研究にかかった時間はどのくらいですか。

 

中学1年生から3年生までの約3年間です。

 

初めからオセロの研究をするのは難しかったので、1年生の時に◯✕ゲームのAIを作って研究を行い、基本的な原理などを学びました。2年生からはオセロについて研究しましたが、3年生の時は別の研究と並行していたため、大部分は2年生の時に行いました。

 

 

■今回の研究ではどんなことに苦労しましたか。

 

ディープラーニングなどの原理を理解することです。まだ勉強していない数学の知識などが必要になるため、それも含めて理解するのに時間がかかりました。

 

 

■「ココは工夫した!」「ココを見てほしい」という点を教えてください。

 

教師あり学習、強化学習、αβ法の三段階でAIを学習させたことです。また、オセロの定石を再現することができ、いくつかのオセロプログラムに勝利し、人との対戦で勝率が85%を超えるなど、人間よりも強いAIを作成することができたところが、見てほしいポイントです。

 

 

■今後「こんなものを作ってみたい!」「こんな研究をしてみたい」と思うことがあれば教えてください。

 

作曲が趣味なので、今後は作曲AIを作ってみたいです。また、最近話題になっているChatGPTなどの影響から、生成AIにも興味を持っているため、勉強して知識の幅を広げたいと思っています。

 

※山本さんの発表は中高生研究賞最優秀賞・文部科学大臣賞を受賞しました。

 

河合塾
キミのミライ発見
わくわくキャッチ!