所在的位置： html >> html介绍 >> 崔灿名人还是业5从围棋AI分析,看中国清

崔灿名人还是业5从围棋AI分析,看中国清

03“关公战秦琼”——中国清代围棋国手水平分析

（一）样本的选择

年1月，BBC（英国广播公司）新闻台推出了一系列“重返湖北”报道，将武汉拍成了“十八线小县城”。在BBC的镜头里，天空永远是灰蒙蒙一片，各种场景总是显得杂乱无章，或给人一种压抑感。这与武汉人民当时的日常认知完全不同。

问题出在什么地方呢？BBC的视频并不是虚构的，但精心选择了拍摄地点与时间，并使用长焦、倾斜镜头等构图手法营造“偷拍”的印象，再通过剪辑，调色等后期处理，来暗示其想要表达的观点与评价，潜移默化的影响观众的价值判断。

很明显，通过选择性的展示样本，可以轻而易举的改变观者对人与事物的评价。以表3中出现的“当湖十局”吻合度为例，我们既可以选择双方全局吻合度超过60%[26]的第五局，并从中盘挑取吻合度70%多的棋局片段，来说明范施的棋力高超；也可以选择两人吻合度不足45%的第八局，再从里面找一段连续几步“不吻合”的场景，来论证两人只有业余水平。多年以来“崇古派”与“贬古派”的争论，本质上就是在不断上演这样的“证明”。这两种方法在逻辑上显然都是不可靠的，自然也不会得到任何有意义的结果。

当然，在围棋进入AI时代之前，人们并不具备客观评价不同时代棋手表现的条件。现在，我们可以借助围棋AI分析，来寻找“古今之争”的答案。不过，在开始之前首先要解决一个重要的问题，那就是如何合理选择代表不同群体的棋手及其棋谱样本，从而尽量避免抽样误差，尽可能地保证结果的有效性。

下面分别选定能够代表各时代围棋水平的棋谱样本，并详细阐述选择理由。

1.代表“当代职业高手水平”的棋谱样本

年3月之前的世界职业围棋大赛（除“亚洲杯”之外）全部决赛棋谱。

选取理由：

首先可以确定的，是将围棋AI超越人类顶尖棋手（年3月）之后的棋谱全部摈弃，彻底避免围棋AI对人类棋谱，尤其是布局阶段的影响。“古今之争”语境中的当代围棋高手，显然不包含围棋AI的帮助，这应该是“公平公正”对比较量时的底线。

当代职业高手棋谱范围很广，选择起来并不容易。江山代有人才出，最近三十年间，世界围棋版图风云变幻，棋坛领军人物几经更迭。究竟哪些棋手有资格代表当代围棋水平？即便是公认的具有“统治力”的棋手，也有巅峰期与低谷，赛事应该如何选择也是个棘手的问题。

好在本研究主要是探讨中国古代国手的水平，不需要对当代棋手一一进行分析。最终选取的是当代职业高手们“心心念念”，一生努力追求的目标——世界冠军——的争夺棋谱。这一选择最大限度的避免了“比赛分量”的问题，也减少了棋手“状态”方面的争议——能进入世界大赛决赛的棋手，从某种意义上来说，就是当时的世界围棋最高水平。

为了免除人为操纵数据的嫌疑，样本确定为从年世界围棋比赛创立开始，至年3月之前的全部决赛棋谱。详见图10。

图10世界职业围棋大赛决赛信息明细（.9-.2）

从年第一届富士通杯开始，到年AlphaGo横空出世之前，刚好走过了整整个世界大赛[27]。除去钱宇平弃权的年第四届“富士通杯”之外，总共盘棋。这样一份代表当代围棋顶尖水平的棋谱样本，相信能够得到大多数人的认可。

2.代表“业余高手水平”的棋谱样本。

年至年，十年间网络上有据可查的“晚报杯”棋谱。

选取理由：

首先，棋谱样本范围仍然限定在围棋AI时代之前。

最近十多年，“业余天王”与一些“退段职业棋手”牢牢把持了国内各项业余围棋赛事，大幅提高了业余围棋水平。考虑到该组的设立是为了对应“古今之争”语境中的“业余高手”，将目光回到导致这一“语词争议”的事件源头——年左右，此时的“业余高手”大致为职业高手让两子的水平。再根据这一标准，确立棋谱的大致时间。

赛事方面，“晚报杯”应该是毋庸置疑的选择。二十年前的业余赛事远不如今日红火，在当时仅有的两大全国性业余围棋赛事中，无论是媒体宣传，赛事规格还是整体水平，晚报杯都无可争议位于“黄河杯”之上。此外，晚报杯的特色“职业VS业余对抗赛”，也有助于确定当时的业余顶尖棋手与职业棋手差距大小。

“晚报杯”从年开始允许14岁以下的职业初段参赛，这一年也是老牌“业余强豪”们在该赛事上最后的辉煌。年晚报杯，“冲段少年”们全面占据榜单前排，此后国内业余棋手整体水平节节攀升，与职业低段的水平界限日益模糊，与最初“业余高手”的概念愈发遥远。因此，将样本棋谱的时间下限定为年，至于年的上限，则是因为再往前几届的晚报杯棋谱，如今网络上已经难以寻觅。

与相对方便收集的世界大赛决赛棋谱相比，“晚报杯”作为一项业余赛事，每年记录下来的棋局仅有一小部分。不过能够留存下来的棋谱，大多出自知名业余棋手，这也让代表业余高手水平的棋谱样本质量多了几分保障。

本研究的“业余高手”棋谱样本，采样地点为“弈客”APP棋谱库。具体操作方式为：在弈客APP“棋谱大全”板块，以“晚报杯”为比赛名进行条件搜索，为了尽可能保证“非人为挑选”的原则，在所有结果中选取年至年的全部棋谱。之后手动剔除了重复的棋谱与“职业业余对抗”棋局，剩下的棋谱即为最终样本，共74局。对局者名单见图11。

图11代表“业余高手”的棋谱样本对局者名单

3.代表“中国清代围棋水平”的棋谱样本

《中国围棋古谱精解大系》中的50局清代国手棋谱。

选取理由：

与当代棋手的样本相比，在中国古谱中进行合理的挑选更为困难。“当湖十局”的入选应该不会有任何异议，但其他古谱应当如何抉择呢？中国古棋大多未注明对局时间与性质，难以确定棋手的竞技状态，以及棋局的重要程度。棋手们的对局总数未知，许多古谱也无从收集。不过，下面两条原则想必能够得到公认：

(1)样本应该排除“授（受）子谱”

原因主要有两点：一是“让子棋”许多时候无法判定“过分”与“过缓”的着法能不能算作失误，从而影响棋手的棋力评价。二是按照围棋AI的标准，让子棋黑方前半盘长时间处于明显优势，这会放大前面提到的“吻合度”缺陷。

基于以上两点，“受子谱”与分先对局的当代棋谱直接进行对比有失严谨。虽然古代互先对局也不贴子，但在围棋AI眼中，即便是两子的优势，与“让先”的差别也是巨大的。此外，中国古棋的整体风格也在一定程度上淡化了先行优势。

(2)以清代黄龙士、范西屏、施襄夏三人的棋谱，作为中国古棋水平的代表

围棋在中国古代经历了一千多年的发展，竞技水平在清代达到了巅峰，无论对中国古棋水平的观点如何，这一史实如今各方都没有什么争议。同样，在清代棋手当中，无论是从文字评价还是棋谱来看，黄龙士、范西屏与施襄夏这三人是当之无愧的顶峰。评价中国古棋水平时，应以这三位国手的棋谱作为代表，其他国手的棋谱作为参考对照。

确定了以上两条原则，接下来是如何避免“人为选择数据”的问题。中国古棋并无任何现代意义上的“赛事”，无法像当代一样根据对局的重要程度，选择特定系列的棋谱。由于无法集齐全部古谱，也难以通过某种方式“抽签”来满足随机性。本着“具有公信力的特定标准”这一原则，最终确定的样本选取范围，是陈祖德所著的《中国围棋古谱精解大系》。

陈祖德在中国古谱研究方面的地位，前面已有论及。这套从书是陈老生前最后一项工作，为中国围棋留下了一份宝贵的财富。以陈老一生的经历与资源，积累的古谱资料应当不会有太多缺憾。另外，考虑到陈老出书的心意，是为了介绍中国古棋中的风景，必定对棋谱进行了一番精挑细选，能够出现在书中的古谱应该都属上乘之作。这对“中国古代国手水平”的棋谱样本质量，提供了充分的保证。

至于这种挑选会不会造成样本的偏差，导致对中国古棋整体水平的高估？的确存在这样的可能性。但考虑到与其对比的当代棋局全部为世界冠军争夺谱，就棋谱质量这一点而言，当代棋手至少不会吃亏。

在具体棋谱的选择方面，《中国围棋古谱精解大系》丛书总共十四本，体例为一本书十盘棋[28]。为了保证所有棋手的样本数量一致，在排除“授子谱”之后，最终确定选取《黄龙周虎》、《过周十局》、《梁程十局》、《当湖十局》、《最后两高峰》五本书中的全部棋谱作为样本。总共50局。

徐星友未能入选的原因，是他的对子谱除了上升期接受黄龙士的指导，就是六十多岁时与程兰如的对局——这十盘棋还有“众人合谋群殴”等故事演义。为了避免年龄因素影响棋手的评价，本研究尽量挑选国手们全盛时期的棋谱。丛书中范施二人与梁魏今、程兰如之间的对弈，也因为这一原因忍痛割爱。至于横跨明清两代的过百龄，年龄方面实在是没办法了，他的数据仅做为参考。

一位棋手只选十盘棋，样本会不会太少了？经过权衡，与挑选棋手不同年龄段的棋谱相比，现有的样本选取方案应该争议更少。“小样本”有相应的统计学处理方式，能够尽量减小与“真实”结果的差异。

4.代表“日本古代围棋水平”的棋谱样本

《御城棋谱》中，道策、丈和、秀策的全部棋谱。

选取理由：

与中国古棋相比，江户时代的日本由于有“御城棋[29]”这种地位的比赛存在，棋谱样本的选取范围无需太多思量。棋手人选也相对容易确定，道策、丈和、秀策作为公认的“日本古代围棋三棋圣”，代表江户时期的日本古棋顶尖水平应该当之无愧。这三人也都在“御城棋”中有过出战记录，在“御城棋”中留下的棋谱总量，也与“黄范施”代表的中国清代围棋水平棋谱样本相近。在不同年代棋手群体的代表中，日本古谱样本可以说各方各面都十分完美了。

在棋谱收集过程中，按照与中国古谱同样的遴选原则，剔除了三人所有的授子谱。另外，《御城棋谱》丛书除了“御城棋”棋局之外，还收录了部分御城棋之外的著名棋谱。上述三位棋手都有涉及，如道策的“出蓝秘谱”，丈和的“因彻吐血局”，秀策与太田雄藏“三十番棋”中的棋谱等。出于“非挑选”的原则，这些棋谱也纳入样本之内。最终的棋谱样本数量共40局，其中道策12局，丈和7局，秀策21局。

（二）研究方法

1.研究对象

上述代表“当代职业高手水平”、“业余高手水平”、“中国清代围棋水平”、“日本古代围棋水平”的四组棋谱样本。

2.研究工具

本研究使用的围棋AI为：KataGo1.5.b官方权重。

“1.5.0”版本为KataGo分布式训练[30]之前的“棋力最终版”。至于权重方面的选择理由，本研究最初考虑使用40b官方权重，但在测试过程中，发现该权重在某些时候出现明显“不合逻辑”的判断，见图12。

图12KataGo1.5.b官方权重的“非理性选择”

“当湖十局”最后一局，40b官方权重非要跑到右上角去“浪费劫材”。右边两图则是日常分析中发现的问题。这些案例都是KataGo倾向于“逻辑上不可能好”的下法，并且目差算的没错，但胜率显然不对。这种情况使用30b官方权重也有复现，程度稍微轻一些，20b官方权重与40b“胖权”则不会出现这样的问题。根据相同计算量下，不同权重的吻合度无显著差异这一理由，本研究最终选择用了KataGo20b官方权重作为棋谱分析工具。

3.棋局分析设定与操作流程

每手棋0k计算量，限制10个选点。

计算量方面是权衡了严谨性与分析效率的结果，0K的计算量可以保证在超过95%的局面下，围棋AI的胜率达到“稳定状态”，即继续计算下去，胜率也不会有超过1%的波动。“10个选点”则是考虑到围棋AI眼中排名前10之外的选点，“好棋”的可能性微乎其微。

棋谱样本分析具体操作方式为：在Lizzie中选择“批量分析”，将“每手棋总计算量”设定为0000。软件自动保存分析后的棋谱。在棋局分析过程中，所有棋谱都严格按照当时的规则与贴目（子）进行设定。

4.数据处理

由于中国古棋受到“子彩”影响，棋局大多官子收至最后，平均手数显著高于其他三组。例如“当湖十局”的平均手数是.9，而当代世界大赛决赛棋谱为.7，日本古谱样本的这一数值更低。为排除“棋局总手数不一致”对评价带来的影响，统一对所有棋谱的前手进行分析，同时剔除了样本中所有不足手的棋谱[31]。处理后的各组样本数量为：世界大赛决赛棋谱局，“晚报杯”棋谱57局，中国清代国手棋谱47局（黄范施30局），日本“御城棋”棋谱28局（道策9局，丈和5局，秀策14局）。

测试所得全部数据使用Excel录入整理。利用SPSS20.0软件对数据进行数理统计分析，并得出相应结果。

（三）结果与分析

1.当代职业高手棋谱样本概况

当代世界大赛决赛棋谱样本（前手）的基本数据如下：

表9当代世界大赛决赛棋手样本数据（N=）

图13世界大赛决赛棋谱AI指标直方图

结果显示：当代世界大赛决赛棋谱样本平均吻合度为53.62%。“均值95%的置信区间”与“中位数”的数值与其差异很小，表明样本选取相对合理，数据内部离散程度较小。

图13与表9中，都显示出AI评分与吻合度的高相关程度，以及AI评分数据分布更为均匀。平均胜率波动亦可作为基准，用于后文中与他组的比较。

根据时间顺序，将个世界大赛分为三个阶段，考察不同时期的棋手有没有水平上的差别。结果见图14：

图14不同时期世界大赛决赛棋谱平均数据

可见随着时间推移，职业棋手的整体水平确有小幅上升。其中后两个时期与-期间的棋谱相比，在吻合度与AI评分方面均有显著差异（P0.05span=），但效应量只有0.2左右，即实际差别并不明显。从图中数值也可以看出这一点。

另外，上面这一现象似乎支持了古今之争中“时代在进步”观点。但考虑到上述时期，世界围棋的霸主地位从日本转向了中国，中韩两国的围棋训练模式也发生了很大变化，导致了顶尖棋手的年轻化。很难确定是时间还是以上因素，对围棋水平的推动作用更大。当然“时代进步”一说本身也包含了训练方法的改进，对于一个时代整体来说，后浪更比前浪高是合理的推测。但具体到时代中的每一位棋手，是否都受到这一规律影响，就没那么容易判断了。

最后列出在世界大赛决赛中出战20局[32]以上的棋手数据。总共有5位棋手满足这一条件，恰好也是这一期间世界冠军排行榜的前五位。见图15。

图15部分著名棋手世界大赛决赛平均吻合度

李世石与古力领跑了这份榜单，两人的平均吻合度数值，比全体棋手的均值高出2%左右。不过这两人的数据并不是所有棋手中最高的，柯洁的世界大赛决赛平均吻合度达到了57.08%。由于其棋谱（手以上）只有9局，未能列入图表中。

令人颇感意外的，是李昌镐的评分位列倒数。这并不是他世界大赛生涯最后的“九连亚”拉低了围棋AI评价——去掉这一部分的数据，其吻合度平均值也没什么变化。从侧面体现出了吻合度的“信度”。

至于为何当代公认的棋坛王者，在围棋AI那里却评价不高，有以下几种可能性：一是围棋AI就是不待见李昌镐那种“缓慢”的风格，许多着法都被评定为“缓手”而不吻合。二是李昌镐的辉煌战绩沾了时代的光，在其巅峰期（-）其他棋手的整体水平就是弱一些。这一时期世界大赛棋手平均吻合度为52.07%，与图14的“-”组的数值几乎相等。从这一点来说，曹薰铉可谓是领先时代一个身位。三是该样本只统计了前手的数据，导致李昌镐的“官子神功”无从发挥。

2.当代业余高手棋谱样本概况

当代业余高手棋谱样本（前手）的基本数据如下：

表10-“晚报杯”部分棋手样本数据（N=）

图16-“晚报杯”部分棋谱AI指标直方图

在吻合度上下限极值方面，业余高手样本与职业高手几乎相同，但平均值存在不小的差距。表中数据的离散程度也明显大于职业组，从直方图与表10的置信区间与中位数来看，应该是个别业余强豪“挺身而出”，拉高了业余组的整体平均数据。

业余组与职业组的“吻合度”显著性检验，表7中已有叙述。业余棋手在AI评分与平均胜率波动这两项指标上，同样与职业棋谱样本存在极其显著的差异（P0.）span=，胜率波动方面差异体现的更为明显，这也是棋手对于局面的“控制力”不够的一种体现。

3.中国清代围棋国手棋谱样本概况（前手）

图17十位清代著名围棋国手的AI评价[33]

按照吻合度顺序排列，黄龙士，范西屏和施襄夏三人数据位列前三，与既有印象完全相符。周东侯与施襄夏的数据接近，其余国手则明显低一档。AI评分的数值也大致如此。

平均胜率波动方面，可以看出数值与对手有着明显关联。清初“过周”与晚清的“周陈”两组对局，四位棋手的胜率波动较高，与上面“业余高手”样本平均数据相近。

以“黄范施”为代表的中国清代围棋顶尖水平棋谱样本（前手）数据见下列图表：

表11“黄范施”三人棋谱样本数据（N=30）

图18“黄范施”部分棋谱围棋AI指标直方图

由于样本数量原因，“置信区间”数值范围大于当代两组棋手数据，其余数据各项与当代职业高手棋谱样本相近，后文将进行统计学比对。

4.日本“古代围棋三棋圣”棋谱样本概况

图18道策、丈和、秀策三人围棋AI评价（前手）

可以看出，道策各项指标数值明显比另外二人低一档。丈和与秀策的评价相近。由于三人数据之间存在明显差异，用来代表日本古棋的整体水平有不妥之处。

考虑到丈和的样本只有5局，其所处的年代也与秀策相近，故将丈和与秀策的棋谱合并，作为代表日本江户时代后期水平的样本。活跃于十七世纪的道策，其棋谱则作为日本江户时代前期水平的代表。同时，统计三人棋局对手的评价数据，作为江户前期与江户后期“时代对手”的样本数据作为对照。

“江户前期”、“江户后期”与其两组对手的棋谱数据（前手）见表12：

表12日本江户时代不同时期

棋手“御城棋谱”样本数据

根据12可知，被誉为“日本古代围棋三棋圣”的三位棋手，各项围棋AI评价指标确实都高出同期对手一档。他们能在各自的时代所向披靡是“有理有据”的。

5.中国清代围棋水平高度——与各时代棋手群体的对比

将“黄范施”为代表的中国清代围棋顶尖水平棋谱样本（前手），与代表当代职业高手、业余高手和日本江户时代前后期的棋谱样本，分别进行对比与统计学检验。

(1)与当代职业高手棋谱样本的对比

表13清代顶尖国手VS当代职业高手

注：采用独立样本t检验。检验结果t值与P值两栏，上方无括号数字为使用“吻合度”计算值，下方括号内数字为使用“AI评分”计算值。

两组群体各指标数值十分接近，在统计学意义上自然也是差异不显著。即清代围棋顶尖国手与当代职业职业高手之间，水平差异不具有显著性。

(2)与当代业余高手棋谱样本的对比

表14清代顶尖国手VS当代业余高手

注：采用独立样本t检验。检验结果t值、P值与效应量三栏，上方无括号数字为使用“吻合度”计算值，下方括号内数字为使用“AI评分”计算值。

清代围棋顶尖国手与当代业余高手之间，围棋AI吻合度数值存在的差异非常具有显著性（P0.01span=），“AI评分”数值存在的差异极其其具有显著性（P0.）span=。但在效应量方面，不如当代职业棋手组对比明显，可能是样本偏少的缘故导致。无论任何，清代围棋顶尖国手相比传统意义上的业余高手，在棋力方面的领先存在统计学意义上的显著差异，是毋庸置疑额度的事实。

(3)与日本“江户前期”代表道策的对比

表15清代顶尖国手VS道策

注：采用独立样本t检验。检验结果t值、P值与效应量三栏，上方无括号数字为使用“吻合度”计算值，下方括号内数字为使用“AI评分”计算值。

表15的数据表明，与对当代业余高手的领先相比，清代围棋顶尖国手在对道策的领先方面更为明显，效应量数值体现了这一点。尽管道策棋谱样本只有9局，但“t检验”原本就是一种适合小样本数据的参数假设检验方法。结论是清代围棋顶尖国手的水平优于“江户前期”的代表道策，并有统计学意义上的显著差异（P0.05）span=。

(4)与日本“江户后期”代表丈和＆秀策的对比

表16清代顶尖国手VS丈和＆秀策

注：采用独立样本t检验。检验结果t值与P值两栏，上方无括号数字为使用“吻合度”计算值，下方括号内数字为使用“AI评分”计算值。

表16结果显示，与前面“当代职业顶尖棋手”的对比类似，两组棋手群体数据虽稍有差别，但在统计学意义上并不显著，即无法判断这种差异是否来自抽样误差所致。结论是清代围棋顶尖国手与日本“江户后期”代表丈和＆秀策之间，水平差异不具有显著性。

6.清代围棋顶尖国手布局与中盘水平分析

(1)与各时代棋手群体中盘水平的对比

作为中国古棋公认的强项，清代顶尖国手在这方面的表现如何呢？“中盘”的标准取Lizzie中的默认值，即一盘棋中的61-手，汇总所有棋手群体组别数据一并比对，结果见表17。

表17各组棋手群体中盘（61-）实力AI评价

与全局（前手）各组比对的结果相比，清代围棋顶尖国手在中盘这一环节，平均吻合度与“AI评分”数值的领先幅度稍有增加，但领先优势的“差异显著性”范围反而缩减——在统计学意义上仅维持了与“业余高手”组的全面领先[34]，与“江户前期”代表道策的差异不具有显著性。

在平均胜率波动方面，清代围棋顶尖国手与当代职业职业高手的数据大致相同。印象中“大砍大杀”并没有导致这三人的平均胜率出现太过剧烈的波动。

(2)与各时代棋手群体布局水平的对比与中盘相反，中国古代国手们的布局一向受到当代棋手的诟病。即便是对中国古棋水平持正面态度的棋手，对其布局风格与具体着法，大多也只是希望人们抱有“宽容的态度”。那么清代围棋顶尖国手的布局，在围棋AI那里会得到怎样的评价呢？

Lizzie中的“布局”手数默认标准是前60手，然而中国古棋大多从20多手开始就迅速进入“缠斗”状态，按照这一标准对比可能有失公正。本研究将“布局”限定为前30手，各组棋谱在这一阶段的下法，都更符合“布局”这一词汇在如今的含义。由于所有样本棋谱均满足这一条件，不再有“手数不齐”导致的对比公正问题，因此统计对象为全部棋谱样本，汇总所有棋手群体组别数据进行比对，结果见图19。

图19各组棋手群体布局（1-30）实力AI评价

结果表明，当代棋手对中国古棋布局的印象，可以说是“对一半错一半”。围棋AI的确对清代顶尖国手布局的评价不高，“时代进步论”在布局方面似乎是适用的。从当代业余高手布局数据也能大幅领先中国古棋这一点，就能够看出“时代的红利”。然而，在历代棋人眼中“不敢恭维”的中国古棋布局，竟然力压当代棋手公认“理念先进”，“具有现代布局感觉”的江户前期棋手代表道策！并且差异具有显著性，效应量数值也不低。各组之间吻合度差异的统计学检验见表18。

在一盘棋的前30手，“平均胜率波动”这一指标受棋局因素干扰较小，其数值在一定程度上体现了棋手的布局水平。例如因时代而“获利”的业余高手组，与职业顶尖棋手相比，布局的平均胜率波动仍高出0.5%左右，相当于一盘棋前30手下完，胜率多亏损15个百分点。“江户后期”组在这方面体现出了明显优势，根据对数据与棋谱的观察，这主要归功于秀策，尤其是他在黑布局上的稳定发挥。

7.清代围棋顶尖国手“掌控力”分析

作为评价指标，围棋AI吻合度无法对“不吻合”着法的优劣程度进行区别，是其一大缺陷。“AI评分”在一定程度上弥补了这一点，但给出的评价仍然受到围棋AI计算量偏好的影响。上一章提到的反对使用围棋AI评价人类棋手水平，认为“棋手更应该选择自己能够理解、掌控的下法”这种观点，其潜台词是“围棋AI的标准太高，人类棋手熟悉的下法也亏不了多少”。因此，借鉴之前研究中的围棋AI指标提炼方法，在“胜率”方面设立一些不同的标准，以考察清代围棋国手的“棋局掌控力”——在一局棋中保持稳定发挥，尽量减少“恶手”的数量与严重程度。

(1)不同胜率损失标准下的“吻合度”

设立一系列的“掉胜率”标准，考察棋手着法与围棋AI推荐的选点相比，能将胜率损失控制在多大的范围内。具体标准设置为胜率损失2%、5%、10%和20%以下，结果见表19。

表19不同组别棋手各标准下的“吻合度”

注：数值为各组棋谱样本前手的统计。

仅仅将胜率标准放宽两个百分点，各组别棋手的AI评价均大幅提升。“江户后期”组的两位棋手又一次体现了“稳定性”，各标准下的数值均与当代职业高手相似。清代顶尖国手在这方面表现稍有逊色，但也与另外两组数据接近。

需要说明的是，表中最右侧一栏的数值，并非意味着各组棋手平均每盘棋都有10%左右的招法，胜率损失超过了20%。由于该项数据统计通过专门的软件[36]完成，对于围棋AI当前局面未曾考虑的选点，程序会从下一个局面的计算中择其最优变化，反推生成该落子变化的信息（胜率、目差、计算量等），但这种计算并不完全准确，有时会出现遗漏。就像前面提到的那样，人为设置的特定指标公信力有限，仅作参考之用，故不再对各组数据进行显著性检验。

(2)“大恶手”的损失程度

统计一局棋中，掉胜率最多的着法“TOP10”，并按照不同标准，计算其“最恶N手”所降胜率的平均值。结果见表20。

表20不同组别棋手“最恶N手”所降胜率平均值

“江户后期”组的恶手胜率亏损值，甚至低于当代顶尖棋手平均水平，不得不再次感叹秀策的稳定性。当然，胜率类指标参考更受棋手风格影响，考虑到“当湖十局”的激烈程度，清代顶尖国手能有这样的表现也算不错了。

（四）讨论

在围棋AI的检验下，清代顶尖围棋国手的各项主要指标，完全不亚于当代职业围棋高手。相信很多人会讶异于这一结果，从而质疑“吻合度”的棋力评估效力，尽管前面的围棋AI研究方法部分，已经从方方面面对该指标进行了彻底刨析，并得出其在样本满足条件时，可以与水平挂钩的结论。

在影响吻合度的因素中，“必然着法”一说虽无从证实，但也无法证伪，是最难以从逻辑上排除的一点。一定会有人将清代顶尖国手的高吻合度，归结于中国古棋的风格。不过以下两点研究数据有力的反驳了这种说法：一是风格相近的清代围棋国手，内部数据也有明显的层级之分；二是在中盘（61-）的数据评价中，公认为“铺地板”风格，“力量不足”的日本古棋反到是扳回一城。秀策14局“御城棋”的中盘平均吻合度为55.17%，与“黄范施”代表的清代顶尖国手相比毫不逊色。这是对“风格影响吻合度”观点的有力回击。

除了“时代在进步”一类与棋局内容无关的理由之外，当代职业棋手们之所以普遍不认同中国古代的围棋水平，是因为大多数棋手对中国古棋的了解仅停留在布局，并且用今天的围棋理论对其作出点评。即便不考虑规则方面的差异，这种评价方式也“时代局限性”——任何时期的棋手，都会认同当时围棋理论的正确性，但事实显然不是这样。当代围棋理论本身就存在强弱判断方面的偏差，按照围棋AI的标准，可以说是“过于谨慎”[23]。用这样的围棋理论去衡量中国古棋的布局，自然对其展现出的“分寸”感到格外无法入眼。

围棋AI指标数据表明，尽管中国古棋布局水平确实落后于当代，但棋手们夸大了这种差距。与日本江户时代前期相比，中国古棋“奇特”的开局下法，在围棋AI眼中反而更好一些。至于为何道策的布局当代棋手看起来“基本正常”，自然是当代围棋的布局理论，与日本传统围棋理论一脉相承的缘故。

日本古棋的布局在围棋AI那里“惨遭差评”，还有一个重要的原因，那就围棋AI不太认同“小目系[37]”的占角方式，以及那一时期的日本棋手对“角”的重要性认识不够，经常在棋盘上还有空角时，先选择他处挂角或守角之类的下法。按照围棋AI的标准，这会造成大量的“不吻合”。

图20道策“出蓝秘谱”布局及围棋AI评分

以著名的道策“出蓝秘谱”为例，这盘棋的前30手，除去布局风格之外，每一手看上去似乎都还好。然而白方没有一步棋踏入围棋AI的“吻合”之内！并且在初始胜率已经很低的情况下，仍然每步棋平均“掉胜率”4%以上。

当然，一定会有人觉得KataGo这种标准过于严苛，这是因为日本古棋的布局理念与当代围棋相似，今人的判断标准受其影响，对这种布局的“亏损”不易感知。围棋AI评价棋力，最大的优点就是标准一致，下面再来看看中国古棋的布局表现。

图21“当湖十局”第三局布局及围棋AI评分

清代围棋布局理论的精髓“九三投”，自然是不吻合。在围棋AI眼中，“先边后角”在任何规则下都是错误的思路，不过黑2的亏损程度只有1%左右，比“高目”或“目外”占角的胜率损失还要小。其余着法大致也是如此，虽不吻合但亏损有限，每步棋胜率都比“出蓝秘谱”掉的少一些。图21中，黑棋吻合的三步棋都出自左下的接触战，但道策那盘棋并不是完全没有局部战斗，一步都不吻合也无话可说。

如果说在中日古棋布局的对比中，清代国手们有什么“不当得利”之处，那就是日本古棋废除了“座子”，导致布局的难度有所增加——以围棋AI标准衡量的话。从中国古棋授二子谱的占角方式和时机来看，要是去掉座子让古代国手们自由发挥，中国古棋的AI评价可能也会有所下跌。也就是说，开局双方摆在角上星位的四颗子，让中国古棋布局失去了许多“犯错”的机会。然而这无碍于清代围棋布局在围棋AI眼中“错误”更小，水平高于日本江户前期布局水平的结论。

图22古今定式围棋AI评价

另外一个中国古棋布局的“黑点”，是图22左边双飞燕定式中的白1。许多棋手对中国古棋的负面印象都源自于此。根据KataGo（1.5.b权重）的判断，这步虎的确是大恶手。如果是双方胜率五五开的平衡局面，与A位顶过相比，白1造成了25%左右的胜率损失。问题是在当代定式中，也能找到像图22右边黑1这样，一步棋胜率亏损20%的恶手，然而长期以来当代棋手们对此毫无觉察。很显然，以个例评推断整体的评价方法是不科学的，人们总会对与自己原有认知相符的案例更加在意。

无论任何，清代顶尖棋手的水平在围棋AI那里得到了正名。就像前面提到的那样，时代的确在进步，只是无法因此就否定个别“天才棋手”的存在。中国古代围棋国手整体水平或许是有些“业余”，但这无法掩盖黄龙士，范西屏和施襄夏这三位清代围棋顶尖棋手，散发出的耀眼光芒。

（五）影响研究结果的可能因素

1.KataGo在中国古棋规则下的水平

KataGo对于“还棋头”规则的学习，占其全部“训练量”的20%，并且是在当代围棋规则“神经网络”的基础上训练而成。因此有KataGo学习古棋规则“过程不纯”，可能会影响其“还棋头”规则下水平的观点。如果KataGo在中国古棋规则下的水平不够高，其评价的效力显然会受到影响。

KataGo“古棋水平不够高”这个说法，很难采取什么方法来证伪。但至少KataGo在不同规则下，开局的下法有了明显改变——在当代规则中优先“点三三”，在中国古棋规则下则倾向于挂角。事实上，KataGo在任何尺寸的棋盘上都表现的很好，但其神经网络只是在十九路棋盘训练而成。另外，“还棋头”规则带来的改变是在棋盘上“虚”的方面，而这方面正是这一代围棋AI绝对的强项。因此，有理由信任KataGo在中国古棋规则下的实力。

2.不同时代的对局时限差别

当代世界大赛的时间限制，大多是每方3小时再加读秒；“晚报杯”则是90分组包干。而古代棋手没有这么多限制，这会不会给当代棋手水平的发挥带来负面影响呢？

中国古棋在用时限制方面的记载并不明确，从“半天”到“一周”的说法都有。考虑到中国古代高手棋局以“彩棋”居多，耗时方面至少不会像日本古棋那样长久，棋局用时因素少不影响中日古棋水平对比的结论。

至于当代棋手，可以以对比相同的日本棋手在“两日制”中的发挥与其他头衔战的差异，探究棋局时限对棋手水平的影响程度。从逻辑上来说，这种影响大概率只体现在棋局的关键阶段，如果以吻合度衡量，总体数值不会有太大差异。其实对于当代棋手而言，对棋局用时的把握，本身就是实力的一部分。

3.中国古棋“子彩”的影响

中国古棋大多以胜负目数决定输赢金额，这显然增加了棋局的精彩程度。但其是否影响对局质量，同样是一个无法验证的问题。考虑到KataGo在一定程度上基于“目差”思考，即便优势时也尽量选择目数赢更多的下法，如果中国古代棋手在追求目数的同时，带来的风险是可控的，应该会得到KataGo的认可。就像是赌桌前赌徒的最优选择，永远是依照概率行事。

4.样本选择

本章第一节费了大段笔墨，详细阐述了本研究所有棋局样本的选择理由，但对于中国古谱来说，无论样本怎样选择，都无法完全免除争议。

尽管如此，统计学的规律存在相当程度上的必然性。梁魏今程兰如两人流传至今共有32盘对局，本研究“梁程十局”的数据加上另外22局棋谱后，两人各项AI指标总体平均值，与原先10局平均值的差异不到1%。

黄龙士留下了为数不少的对子谱，但由于中国古谱对局信息的缺失，在对弈时间与棋局重要性难以得知的情况下，选其全部棋谱与当代世界大赛决赛棋谱进行对比，棋局分量方面显然有所失当。

范施二人流传下来的对子谱不多，并且有一些明显是“成熟期”之前的棋谱。无论如何，评价中国古棋，两人明确记载同处巅峰时期的“当湖十局”肯定是绕不过去的。围棋AI对这十盘棋的评价，就是对中国古棋水平最好的回答。

（六）结论

1.以KataGo1.5.B权重，0K计算量下的围棋AI“吻合度”等指标来衡量棋局前手，“黄范施”三人代表的中国清代围棋水平，与当代围棋职业高手的差异不具有显著性。

2.以KataGo1.5.B权重，0K计算量下的围棋AI“吻合度”等指标来衡量棋局前手，“黄范施”三人代表的中国清代围棋水平，领先于以道策为代表的日本江户前期围棋水平，与丈和、秀策为代表的江户后期日本围棋水平差异不具有显著性。

3.“黄范施”三人代表的清代围棋中盘水平，与当代职业顶尖棋手及日本江户时代顶尖棋手的差异不具有显著性。清代围棋布局的水平确实与当代棋手存在差距，但与日本古棋的布局水平至少在伯仲之间。

参考文献

[1]乔光辉.李汝珍《受子谱》及其与《镜花缘》的关系[J].围棋天地,(16):-.

[2]安永一.中国的围棋[M].长春.长春出版社,.

[3]陈祖德.中国围棋古谱精解大系.黄龙周虎[M].北京.

中信出版社,.

[4]胡廷楣.黑白之道:围棋名家访谈录[M].上海.上海文化出版社,.

[5]广东棋文化促进会.中国棋文化峰会文集[M].广州出版社,.

[6]谢锐.老聂惊喜中山棋迷技艺高超俞斌：小学生学棋好

[EB/OL].

转载请注明：http://www.aierlanlan.com/rzfs/4023.html

上一篇文章：怎样切换音频播放的输出方式,耳机和音响如

下一篇文章： ApacheDolphinSchedul