(1)参赛作品名称:五子棋
(2)参赛成员:巫丽蕾、王沿策、孙光赫
(3)指导教师:史江萍
(4)获奖等级:辽宁省一等奖
(5)比赛名称:2022年辽宁省本科大学生计算机博弈竞赛
(6)比赛简介:计算机博弈(Computer Games),亦称机器博弈,是一个挑战无穷、生机勃勃的研究领域。计算机博弈竞赛坚持以学生喜闻乐见的、高对抗性的棋牌游戏为研究载体,以理论与实际系统构建相结合为原则,竞赛投入低(一台电脑即可满足基本需求),适合团队协作,能实现与专业知识、人工智能技术的高度对接;可操作性强,竞赛规则透明,竞赛成绩判定准确,18年来的办赛历史充分证明竞赛的公平性、公开性和公正性,赛事也特别贴近新工科、人工智能人才培养的需要。
(7)五子棋(Amazons)竞赛规则:
棋盘:15×15围棋的棋盘。棋子:黑白两种围棋棋子。 棋规:
1. 先后手的确定:可由大赛组委会抽签或对局前猜先。
2. 开局:包括指定开局、自由开局两种,全国博弈大赛拟采用指定开局模式。
3. 对局双方各执一色棋子,黑先、白后交替下在棋盘的交叉点上,棋子下定后,不得向其它点移动,不得从棋盘上拿起另落别处。每次只能下一子(指定开局、三手交换和五手N打、行使PASS权除外)。
在采用指定开局时黑方的第一枚棋子应下在天元上。同时在下面的对局中应执行三手交换和五手N打及禁手规则。
4. 指定开局:指黑方决定了前三个棋子落于何处,其中包括两个黑子和一个白子,一般由黑方完成。黑方应同时给出第五手需要的打点数量。采用指定开局办法的比赛均采用斜指或直指开局(26种),黑方第一子应落在天元处(黑1)。黑方还决定了白方的第一子的落点(白2)。黑方的第二子(黑3),应落在围绕天元点5线×5线而形成的以天元为正中的由交叉点组成的区域内。
5. 自由开局:由双方轮流行棋共同决定开局前3个棋子落于何处。即黑方落第一子(黑1)、白方落第二子(白2),黑方落第三子(黑3)。采用此种开局时一般双方的对局数为偶数,或采用其他附加条款对黑方的先行优势进行限制。而不采用指定开局中使用的三手交换和五手N打,也可不执行禁手规则。
6. 三手交换
在采用指定开局的对局中,在黑3之后,白方在应白4之前,可选择黑棋或白棋,每盘棋只有一次选择机会,如提出交换黑、白方,则黑方必须同意交换。
7. 五手N打
黑方在指定开局的同时要给出本局盘面黑5时所需的打点数量,此后无论对局者谁执黑棋,都需要在落第五手时按照要求的打点数量,在盘面上的空白交叉点上放置相应数量且位置不同形的黑子,白方只能在这些黑子中留下一个黑子作为黑5。
8. 禁手
对局中如果使用三三禁手、四四禁手、长连禁手,将被判负。
9. 终局胜负判定:
(1)最先在棋盘上形成五连的一方为胜。白棋长连视同五连。(2)黑方出现禁手,则判白方胜。如白方在黑方出现禁手后,未立即指出而又落下一白子,则黑方禁手不再成立。若黑方走出长连禁手,白方只要是在终局前指出此禁手,判白方胜。黑方五连与禁手同时形成,禁手失效,黑方胜。
(3)对局中,一方出现下列情况之一判负:比赛对局中移子或棋局散乱、超过规定时限、人为辅助计算、主动停止计时。
(4)对局中出现下列情况之一,判和棋:对局双方同一回合均放弃行棋权、全盘下满,且无胜局出现、双方比赛同时超时。
(8)作品亮点:
针对五子棋游戏局面分支因素较大和棋局复杂多变等情况,基于蒙特卡洛树搜索与深度神经网络的五子棋算法,使用蒙特卡洛树搜索对五子棋对弈进行模拟,完全由自对弈强化学习训练。提出了基于改进的蒙特卡洛树搜索与深度神经网络的五子棋算法,在保持模型性能的同时,提高了模型的训练速度。