公益网站 速度稍慢 请您谅解

作者:曹国梁

2022.10.24

围棋的智能程序有阿尔法狗,卡塔狗等等。“狗”是围棋英文名称Go的音译。把这些人工智能程序翻译成某某狗,让人觉得格外亲切。所以我也把道棋人工智能程序简称道棋狗。

今年上半年一个偶然的机会让我动了训练道棋狗的心思。于是我购买了一台全新的电脑并且配上一个挺不错的GPU,把免费开源的KataGo加以修改来支持道棋。然后开始了训练过程。在经过几次尝试之后,从六月底到七月中,从零开始不间断地训练了两周多,终于成功训练出一个水平远超我自己的道棋狗。而且已经几乎达到硬件的瓶颈,继续训练提升不大了。因此我也就暂停训练,开始深入研究道棋狗的行为,发表了一系列文章和大家分享,引起了很多棋友的兴趣,其中一位就是许晓东博士。

许博士是一位非常热心的道棋爱好者。自从数年前接触道棋以后,被道棋的魅力所深深打动。当时正处于道棋宣传的低潮,原来的道棋网站都关门了。许博士为了宣传道棋,一手创办了新的道棋网站:http://www.daoqi.club。上传了很多资料,他自己也做了很多研究,提出了一些独到的见解。

许博士虽然不是计算机专业人士,但也是一名计算机程序爱好者,擅长Python语言。看到我训练出了战斗力强大的狗,他对如何训练道棋狗也产生了极大的兴趣。于是他从我的开源账号上下载了代码,熟悉训练步骤后就开始训练起自己的道棋狗。当时据我所知,他所用的GPU比我的要稍差一点。所以我想他的狗最后的水平应该比不上我的,也就没太关注。

不久以前,许博士携他的道棋狗出山了。我让两只狗互斗几局后,发现他的狗似乎还稍占上风。而更重要的是,他的狗使出来的招数和我家狗的竟然很不一样。比如我家狗最常用的招数是小飞,很少用一间跳等等。而许家狗则不一样,除了小飞以外,一间跳、肩冲都很常见。总的来说,许家狗的下法似乎更全面,我家狗的下法有些剑走偏锋。

顺便提一下,如果大家想要亲自体验一下两只狗的威力,可以到http://www.daoqi.org:8080挑战它们,或者可以挑动两只狗互斗,我们在一旁观战。

为什么都是从零开始训练,两个道棋狗下法和风格上有这么大的不一样呢?我感觉,如果我们把道棋狗学习的过程比做登山的话,也许就容易理解了。假设山巅是道棋的最高境界,作为一个站在山脚下的初学者,登山之路肯定不止一条,有的路平坦但是距离更远,有的路虽然近但是更险峻。还有的路达到一定高度之后却无路可走。至于选哪条路,是由很多偶然性所决定的。我的道棋狗似乎就选定了一条近而险的路,它的很多招数都是以作战为目的,动辄分断对方,开始一场你死我活的对杀。而这种下法,导致棋形不够厚实,到了高水平的时候就显出漏洞来了。因为越是高水平的对局,棋形厚薄的影响就越大。以上只是我的猜测,是否属实不敢保证。

既然同样的训练过程可能产生很不同的结果,我准备从零开始训练一个新的道棋狗,和现在的两个狗一决高下。希望在训练和比赛的过程中会有新的发现。请大家拭目以待。

返回谈棋论道

道棋对局