棋谱习题 | 经典棋局 | 段位测试 | 跟我学棋 | 实战解读 | 必胜棋谱 | 逸事杂谈 | VCF 练习

 位置: 连珠文库 >> 连珠知识 >> 竞赛规则 >> [专题]高级研究 >> 正文


博弈规则(全)

[ 作者:YeYuwzq    来源:本站原创    阅读:    更新:2007-11-30    录入:许相公


内容索引

1、博弈规则测试版1.0
测试版规则是规则落实实际的第一步,主要针对新人设计。目的1为了方便推广,2为了需要对规则的适应。本文详细介绍规则内容及解答了规则各种常遇到的问题,并作了一些补充。

2、五子棋规则的5项基本指标1.1
我们在判断规则中总有一定的判断依据,本文对各种判断依据进行系统整理,以方便读者对各种五子棋各方面性能进行鉴定对比。

3、从规则组件类型角度看规则1.1
在分析制定规则时,我们大多相对随意地将各种规则零件进行组合,而缺乏对各种规则零件进行深入的认识分析。本文从功能角度认识分析各种规则零件,努力将规则的理解上升到更理性的高度。

4、我对行棋思路看法1.1
      规则太复杂新手难以接受,规则难以推广;而简单的规则又存在诸多不合理之处;规则复杂程度与规则合理新的平衡点在何处?本文从普遍棋手实际行棋的思路出发,努力让规则制定往更理性的方向发展。

5、设想中的博弈规则1.40 (过期)
博弈规则的主要细节是组成博弈规则的要素,同时其本身比较活泼具有调整性,可以通过不断调整来适应实际对局的各种需要。本文以5项基本指标为评判依据,从理论上更抽象深刻地对博弈规则进行研究摸索,努力寻求适应不同实际需要的各种博弈规则,为博弈规则成熟提供理论基础。
不过由于目前更多重心放在测试版上,该部分内容主要之前研究为主。


博弈规则测试版

YeYuwzq,2007.11.27
博弈规则测试版:
1)        A方落任意3子,B方选择是否交换。
2)        从第4手至第10手,任一方除直接落子外;还可以连续落2子,但之后对方拥有选择权(可以选择持黑持白)。
(注:1博弈规则可用于有禁也可以是无禁,这里以无禁为例。2选择权=交换权)
模拟:
 A方开局,B方考虑选择持黑还是持白;假定B方交换,则A方持白先行
 
 
 
 
 
 
 
A方希望下这个4但又对其他5不熟,可以连续落2子即4、5手,然后B方考虑选择黑还是白;
 
 
 
 
 
 
假设B方不交换,那么A方持白下第6手;B方可以直接落7手,或者连续落2手;
 
 
 
 
 
 
 
 
B发现白6强劲,黑7不知道落哪好,B方可以连续落2子即7、8手,(若A不交换,B盘算9下6左上平衡),然后A方考虑持黑持白;
 
 
 
 
 
 
 
A方最终觉得还是白比较好,可以不交换继续持白;如此B按照自己原本设想下9手,争取局面平衡;
A这时同样2种选择,直接落10或者连续落2子;由于考虑到现在局势趋于明朗,落2子后B可以选择持黑持白,因此若再落2子的话不但自己有落平衡的2手的压力,同时给B方也比较容易选对更优势的一方;因此A方直接落10手为上策。
    10手后按照正常思路行棋,黑11落8下面,之后局面相对平衡,双方混战。
 
 
 
 
 
博弈规则测试版常见问题:
 
 
1,  博弈规则从4手开始即可以直接落子,又可以连续落2子,还涉及选择交换,是不是太复杂啦?
答:应该说字面上是比较复杂,但落实到棋手行棋思路上,并不复杂。因为:
1“连续落2子”,这是博弈规则给棋手的一种手段、权力,但是否使用完全取决于棋手,是完全自愿的; 若觉得复杂不适应那么不使用该手段权力,按照自己的原本思路行棋即可。(双方都不使用时候接近单纯无禁手规则)
2“不使用该手段权力,按照自己思路行棋”不必因此付出任何代价。因为该规则3手存在一次选择权,因此单纯技术上3手已经是平衡的啦(棋手行棋导致不平衡不能归咎于规则)。如此,无论任何一方不使用该手段权力,依然可以按正常思路行棋。
3博弈规则行棋动机上变化小:单纯的无禁手规则下,行棋思路总是争取下最强手,而博弈规则与此非常接近。这个需要相对其他平衡无禁规则说明:
2次交换:4,5手两次交换。该规则为了顾虑变化量及平衡性,必然要求至少2次的交换。如此必然导致4,5手行棋思路上与正常行棋动机冲突,(不是追求下最强,否则要受到规则的惩罚)。而博弈规则只需要第3手时候一次交换,与行棋动机冲突较小,而且事实上第3手下随意一点影响也不大。(下文说明)
 
 
 
 
 
SAKATA类:一方连续落2子,对方有选择权。博弈规则跟SAKATA规则这点是类似的,区别在于SAKATA 是强迫一方下弱手,而博弈规则是否使用及何时使用都是自愿的。因此博弈规则下出现这种“下弱手”是棋手自愿行为,另外博弈规则何时“下弱手”也是自愿的,棋手完全可以自主地把握使用最佳时机。
    综上,虽然看起来博弈规则复杂,但实际对局可以发现该规则与普通无禁手规则行棋思路上并没有太多出入。也就刚接触理解上不适应,就如用惯Windows98突然改用XP那般。
 
 
2,博弈规则4~10手开始有“连续落2子”的权力,那么双方一共可以使用3~4次,这样感觉很混乱麻烦?
答:应该说这种情况确实存在,但一般不多见。因为“连续落2子,对方拥有选择权”这种权力实际上多是种负担,麻烦。 (该权力源于Sakata,因此该性质跟Sakata一致)
为什么说该权力实际上多是负担、麻烦呢?
因为在没有研究的情况下,“连续落2手”的一方付出的代价比较大,“考虑选择交换”的一方付出的代价比较小。前者成本明显高于后者,得不偿失,如此棋手会滥用该权力吗?
如左图:随便摆出3手,然后强制一方使用该权力的话。显而易见,现在盘面上可行的4、5手组合量非常大,甚至上百种都有可能,而该方必须从中挑出一种能够平衡的组合。而对方只需要计算该方挑出来的1个4、5组合的平衡性即可。明显,前者成本大大于后者。
博弈规则测试版下由于可以自主选择使用时机,因此实际成本远小于上例,但肯定仍然大于后者,因此仍然不需要担心被滥用。
个别人提到某方可以连续使用落2子权力连续摆10手研究考验对手。这个表面上可以但实际根本不可行,因为每次落2子对方都有选择权,前提1研究至少表面上平衡才能瞒过对手;2即便瞒住了,对手也随时可以交换打断。如此花大力研究还纯*运气的事谁肯做?
 
 
3,博弈规则提供这种权力,若一方利用该权力摆对方陌生的2手棋考验对方,这不是对另一方的不公平?
答:这个问题本意应该是问一方有研究然后用研究考验对方的情况。因为若本身没研究还想摆2手棋来考验对方,如问题2所分析的,得不偿失,何必自找苦吃?
那么在一方有研究的情况下考验对方情况又如何呢?
如下面1图假设白方有研究下出这个8,这时黑方或者直接下黑9,或者利用最后一次权力落2子,但无论哪种情况明显都是吃亏的,都必须接受白方的考验。
 
 
  
但是上述考验成立的前提条件,是必须前面7手跟所准备研究一致。传统的研究是通过保证对方其它变化全部必败来控制对手落子;但在博弈规则下,一方完全无法控制另一方的落子。如2图,7手可以连续落2子摆脱研究;如3图,可以在7之前就变招摆脱对方研究;如4图,可以随便下个7,然后9手时候连续落2子摆脱研究。
明显,想在第8手用研究,前提条件之苛刻,几乎跟买彩票差不多。即便有再强大的计算机再多辛苦棋谱记录,也可能要花几年甚至几十年的研究积累,所得不过稍微考验一下对方。成本之高收益之低,怕连最疯狂的研究者都知难而退。第8手的研究不现实,想10手20手考验对方更不现实。
因此,只有在低手数使用研究考验对手才有意义。
比如左图,白4有研究,可以用来考验黑方。在传统规则下,黑5应对错误就直接败了;而在博弈规则下,即便黑应对错误,黑只需要在10手前选择恰当时机使用一次权力即可。
研究成本:4之后接近终结谱;
所得:逼对方使用一次权力,但对方可以自主选择恰当时机使用。
可见,虽然是可以用研究考验对方,但首先研究的作用并不致命,再者其本身的研究成本也是比较高的,因此并不需要担心研究上造成的不公平。
 
4,如问题2所答得,既然该权力是种负担,也不能为博弈竞技服务,为什么还要多这个权力,画蛇添足,自找麻烦?
答:这个问题比较复杂,涉及很多理论实践问题。但是,“连续落2子,之后对方拥有选择权”这个权力肯定是一种负担,SAKATA规则皆如此,而且手数越多负担越大。
虽然它是负担,但它在技术平衡与实用变化量上起着重要作用。这里通过对比来说明。(附:所谓技术平衡:指单纯理论上的平衡,或者说当双方研究计算都极其强大下仍然平衡。实用变化量意为实际对局可以用的变化量)
比如3手交换下的无禁手规则,其肯定是技术平衡的(因为有交换存在)但是技术平衡的难度却无法避免的非常大,1它要求1方能摆出足够平衡的3手型,这个在没研究前提极难完成的;2在4手开始局面模糊的阶段,要求双方都不能有一点弱手,这个没研究前提同样极难完成。同时这样平衡变化是极少的,容易被终结导致另一种极端。
 
 
 

    而博弈规则引入了该项权力,1最直接的作用就是允许但不提倡在10手内走弱手,因为走弱了导致局面劣势也可以利用权力重新平衡局面,但直接走强肯定更好;2它意味着3手相对比较随意,容易操作,不平衡的部分可以通过权力弄平衡,这也增加了变化量。
因此可以看到,虽然该权力是种负担,但它给规则大大降低技术平衡难题及大大增加了实用变化量。
该权力还有策略研究行棋思路等多方面的优点,但首先需要棋手对权力使用的适应以及成熟博弈规则的推出,这里不详细说明。
 
 
5,按照问题4的分析,博弈规则测试版的变化量到底多少,会不会太少容易被终结?
答:博弈规则测试版下最具有技术优势的变化肯定是平衡的3手型及之后最强的走法,但是由于研究的存在以及追求变化的棋手,他们完全可以充分利用权力将局面多样化(如开浦月,然后摆自己有把握平衡的2手)代价仅仅是多花点时间研究。因此只要棋手肯挖掘,变化量肯定源源不绝,具体最大能到多少,基本等同于是10手型能组合出来的任意平衡局面。另外这仅仅是测试版本(针对新手),成熟的博弈规则将做得更好。
 
 
6,博弈规则测试版不是说提倡下强手吗?为什么按照问题4分析说走弱手?
答:这里问题的关键是,棋手是自己主动下弱手的还是因为棋力有限下弱手。
若是前者,明显说明棋手有自己的想法有自己的准备,所以才敢如此;但这种行为肯定需要成本的,其事先的准备就是成本;而对方或者计算清楚考虑是否交换,或者找个有把握的地方使用权力变掉即可;可见成本所得效益仍然有限。
若是后者,那就是棋手本身的问题了。正如上面所分析的,下强手无须付出任何代价,而下弱手的代价要不就是接受局面上的劣势,要不就使用“摆2手然后对方有选择权”承担使用权力的负担。明显下强手肯定比下弱手,所以测试版是提倡下强手的,但并不等于一定不能下弱手。
 
 
7,五子棋或者说一个棋种应该是提倡下强手得到规则的奖励,下弱手受到规则的惩罚;而在博弈规则测试版下,即使下弱手仍然可以利用权力重新平衡即“规则在保护下弱手行为”,这不是对这条基本原则的颠覆?
答:先从纵向角度说,下弱手要完全承担规则惩罚的,个人认为唯一可行的要不就是禁手规则,要不就得再发明种禁手即新模式禁手;除此外SAKATA类型规则都存在“规则在保护下弱手行为”这样的情况。
再从横向角度说。在3手交换的无禁规则下,下弱手的规则后果就是局面劣势甚至必败;而在测试版的博弈规则下,下弱手的规则后果除了以上后果外,还可以选择“使用权力承受麻烦”一途。明显,“劣势甚至必败”程度大于“使用权力承受麻烦”,因此测试版博弈规则确实存在“规则在保护下弱手行为”这样的情况。  然而棋手仅仅是付出的代价减小了,并不等于不付任何代价,因此根本上还是提倡强手的,这个基本原则没有变。
那么测试版规则“减小了下弱手行为的代价”这种做法是否合理?
要解决这个问题,首先要先了解一些统计性资料。从大量的RIF规则下的对局研究统计下可以发现,无论任何棋手任何开局,都具有一定的统计性规律(如下图)。
同时该图不仅符合禁手规则,无禁手规则也适用。因此不难相信在博弈规则测试版下,开局阶段也是非常难以计算处理的,计算精度也是难以保证的。这并不是棋手的责任,或者说棋手棋力只占其中小部分原因,更多源于这是一种普遍现象普遍规律。既然这不是棋手的个人问题而源于一种普遍规律,那么采取一定的规则措施,给棋手予适当的权力保护,这并不过分。(RIF规则下是通过硬性要求棋手掌握大量的开局定式来回避这个问题的,仍然付出了代价“掌握大量的开局定式”,而测试版博弈规则代价仅仅是规则上的保护,而且该保护符合自愿规则,同样不过分)
另外这种“保护措施”不会出现偏袒,双方下弱手的概率都是一定的,棋力高的低些棋力低的高些,并不违背原则问题。因此认为“减小了下弱手行为的代价”是合理的。
 
 
 
在不考虑研究情况下,对局过程计算难度与计算精度的大体分布图像。
该图不仅适合禁手,无禁手亦适合,乃至围棋、象棋也有类似现象。
 
 
 
 
 
 
 
 
 
 
 
 
8,博弈规则顾名思义是提倡策略博弈竞技的,那么会不会出现“为了博弈而博弈”而改变了五子棋的原本内涵?
答:博弈规则的提出一个重要因素确实是为了提倡博弈竞技,确切说在开局阶段提倡博弈竞技,但不会也不可能出现“为了博弈而博弈”而改变了五子棋的原本内涵这样的问题。(策略竞技在成熟的博弈规则才体现,测试版不体现)
首先“博弈”思想并不是什么新元素,更不是博弈规则独有。在RIF规则乃至很多规则都存在,只是博弈程度、公平性不同罢了。比如RIF规则下,有研究对没研究的棋手,开局阶段都很可以明显看出双方的博弈竞技,是否交换,是否变打点,何时变招等等。当然众所周知RIF规则由于大量的定式已经导致这种博弈竞技性大大削弱,而博弈规则在兼顾技术平衡、变化量、行棋思路、研究等方面,还一个重要方面就是追求策略博弈竞技的程度激烈与公平。
其次,博弈规则的最初设想与设计源于上图,其最初口号是:“开局拼博弈,中盘拼计算,残局拼时间”。(其实基本所有规则都如此,只是博弈规则针对性强化罢了)
根据图像可以发现,开局阶段计算难度极大,计算实力差距不明显,而时间充溢,在过往对局又是策略博弈的最佳阶段,这就是“开局拼博弈”思路的由来;中盘阶段计算难度下降,棋手计算差距容易体现,时间损耗,以及过往对局经验,这自然是“中盘拼计算”思想;残局阶段计算难度低,计算实力差距不明显,但时间无多(成熟博弈以贴时为代价,增加残局时间压力,增强竞技性)以及过往对局经验,也就是“残局拼时间”思想。明显这样规则下更容易分胜负,给棋手更多表演空间。
若弄明白了博弈规则的设计思路,自然明白博弈规则首先不会“为了博弈而博弈”,其次它明显在强化五子棋原本内涵。
 
 
9,在博弈规则测试版下,假设第9手黑手占优,那不是逼白10手使用权力承担麻烦吗?
答:确实如此,但问题关键在于,既然9手能占优,那么说明白前面肯定下了弱手,下弱手付出一定的代价是合理的,不用付出任何代价才不合理。
 
 
10,既然有成熟的博弈规则,而且还是合理的,为什么不直接推出成熟的而先用测试的?
答:虽然成熟的博弈规则一样对棋手行棋思路没有造成根本的改变,但是字面理解更复杂,同时提供了更多可以进行博弈竞技的元素,适合高级棋手竞技但并不适合新手。因此测试版规则除了保证规则各方面的合理性,另一方面是借此让棋手适应博弈权的使用。
 
 
11,博弈规则测试版给新手建议:
答:大概了解下规则,不必太在意细节。下棋时候按照自己原本思路下就行了,10手前要觉得自己劣势,使用用一次权力把局面弄平衡点即可。
 
有其他问题给我留言:)
 
 
 
 
 
 
 
补充内容
 
博弈规则测试版替补:
1)        双方轮流落子,第2手必须紧跟1手,第3手白方有选择权;
2)        10手前,任一方除直接落子外;还可以连续落2子,但之后对方拥有选择权(可以选择持黑持白)。
 
该规则作为测试版的替补它与原测试版规则对比区别在于:
博弈规则
技术平衡及平衡难度
策略平衡及
激烈程度
行棋思路
变化率
实用
变化量
研究
地位
测试版
容易平衡
开局方较容易取得开局策略优势
行棋思路变化很小
测试版替补
容易平衡
开局方较不容易取得开局策略优势
字面理解较复杂,行棋思路变化较大
更大
更弱
 
 
游戏室建议——规则选项卡:
博弈规则测试版
博弈权(可多选)
手数上限
时限
 
默认:A落前3手,B拥有选择权
替补规则:轮流落子,2手紧跟1手,3手白方拥有选择权
默认:连续落2子,对方有选择权
其他:1,移任意一子位置,对方有选择权;
      2,建议刚落子打点N,对方先选择是否交换,再打N打,另一方挑某一打点
默认:10
替补:12,14,16。
 
 
 
 
 
附:博弈规则主要特点
 
1, 自愿主动地达成技术平衡
博弈-选择权具有的一样基本功能即:可以将不平衡局面转化为平衡局,但却不能将平衡局面转化为不平衡。再加上对局双方可以自愿使用,反复磨合之下可以轻松达成技术平衡。详细见《规则的5项基本指标》。
 
2,行棋思路变化小
该规则表面上看起来复杂,但实际上并不难上手,这主要因为该规则与单纯的无禁手规则相比,行棋思路改变很小。详细见《规则的5项基本指标》。
附:当前流行的诸多SAKATA类无禁手规则,理论上也可以达成技术平衡目标,但往往难以摆脱2项困难即:1强迫一方走出弱手来实现平衡,策略上不平衡;2理论可以平衡但实际操作起来难题大。
博弈规则其博弈权类型虽然本质是SAKATA类,但却是本着自愿原则使用而非强迫,事实上博弈规则是鼓励走强手的;再者何时使用由棋手自己把握,棋手有更多自我把握的空间,降低了操作难度。
 
3,博弈规则下,变化量得到另一种方式的增加,风险性则相反。
一般规则下,规则的变化量可以通过开局的几个落子大概知道。而博弈规则下,即便开局几个落子结束,它仍然可以通过博弈权,将不平衡的局面改成平衡以及进行一系列调整,这无形使变化量又大大增加一个台阶。
而风险性则相反,一般博弈规则手数上限至少为10,如此即便前几手失误走弱啦,只要及时发现,完全可以通过博弈权再改平衡。大大减小风险性,以及减少实际操作难度,非常适合新手上手。
 
 
 

五子棋规则的5项基本指标

        我们在分析规则的时候,总会有各种各样的指标来判断一个规则规则的好坏,但却缺乏对指标的系统认识。这里专门对常用的指标进行系统整理,并最终确定5项基本指标,以方便实际操作对规则的推理,判断,对比等。除此外,还有开局模式、美观性一些相对次要指标。

        5项基本指标分别为:技术平衡性;策略性;行棋思路变化率;实用变化量;研究地位。

1, 技术平衡性
        技术平衡性包括2部分含义:①局面黑白双方客观的平衡,或者表述成任意一方都不能在对方无法阻止的情况下占据盘面上的客观优势;②棋手将局面下平衡的难度。
        技术平衡是一个规则合理的基础,满足技术平衡第1方面的规则大多数都是带交换的规则,少部分是由禁手及新模式禁手构成。现行绝大多数规则都能满足第1方面的要求,但是第2方面却有显著的差异,可以作为判定规则好坏一个重要准绳。如sakata类规则,都不可避免存在强迫一方走弱手来实现平衡,平衡难度比较大。

2, 策略性
         策略性包括2部分:①策略平衡性;②策略竞技的激烈程度。
         策略平衡性指开局阶段双方策略博弈战术上的平衡。值得注意的是,规则制定应当让双方策略地位上平衡、平等,但并不等于双方策略手段必须一致,事实上更多时候双方是采取不同的手段同时又达到地位上平等的。
            在rif规则下,一般假先方总是希望开对方陌生而自己又熟悉的开局考验对方,通过开局来争取策略上的优势;而假后方相对比较被动,一般通过开局长考,确定自己是否有把握接受对方考验,或者考虑在哪里变招,整体上通过是否交换来取得策略上的优势。明显双方策略方式不同,地位相对还算平衡,但目前由于定式泛滥,rif规则的策略博弈性被大大削弱。
        策略竞技激烈程度主要通过策略失败代价的多少来体现。明显策略失败的代价越大,那么激烈程度肯定越高,但这个度必须控制的,否则会影响其它指标。
        个人认为策略激烈程度与研究地位有着密切关系,同时调整博弈规则主要细节包括适当削弱博弈权调整力可以有效提高策略竞技性。由于目前更多任务落实在测试版,这点还需要时间继续深入摸索。


3, 行棋思路的改变率
行棋思路的变化率,是以单纯的无禁手规则为参照而言的,即新规则与单纯的无禁手规则下行棋思路的差异程度。
行棋思路变化率主要包括2个方面:1,算棋思路上;2,行棋动机上。
行棋思路变化率是规则推行必须考虑的最重要因素之一。参考《我对行棋思路看法》
在禁手规则下,算棋的思路就发生巨大的改变,除了考虑连五,还要考虑诸多禁手问题,整个计算的方式都发生的改变;而SAKATA类的无禁规则,由于无禁因此算棋思路上是一致的,但是为了达到技术平衡强制一方下弱手,如此必然导致行棋动机上的不同。(无禁规则下行棋动机都是争取走最强的)

4, 实用变化量
实用变化量指该规则下实际可以用的变化的总合。任何一个规则的客观变化量肯定都是巨大的,但是随着规则认识的深入,必然导致相当部分变化不断被淘汰,用的变化量必然越变越少。最后经得住时间考验的变化,即实用变化,必然是公平的变化。因此制定一个规则,应当以检验其实用变化量来判定其好坏,而不能简单看其能摆出来的变化。
   以RIF规则为例,虽然表面上假先可以摆26种开局,但实际真正在用的变化就集中在几个平衡局。因此我们说RIF实用变化量是很少的,尽管表面上很多。
   有人或许会说,虽然很多开局必胜必败,但比赛不照样有人敢开出来用。这点肯定,本人就曾在比赛开过花浦,但是不能把这些风险变化、考验列入实用变化。因为实际数据就显示这些变化出现仅占少数,这些变化比实用变化多了风险;而且若真将这些变化列入实用变化,那么随便个规则的实用变化量都暴多。

另外需要提醒的是,现在对规则看法有很多新元素,比如19棋盘,边角开局等。这些新元素很新鲜,用的恰当的话我相信可以增加实用变化量,但用得不恰当就很难说。其中需要遵从的原则问题,目前还没有太多认识。
   如19棋盘下的rif规则,斜月流星都是黑简单胜的,瑞星疏星若简单结合目前研究,至少也是大优局,因此可以得出结论19棋盘下的rif规则其实实用变化量更少,根本无法起到增加实用变化量的作用。19棋盘一个基本思路认为15棋盘黑攻完空间太小,扩大空间给白更多机会,这是事实;但是增加空间的同时,也可以强化黑的进攻,包括让黑棋进攻延续到上百手……应该说19棋盘增加实用变化量是完全可能的,但是如何做到,不能简单想当然。
   边角开局也是种思路,它必然能增加实用变化量。不过要考虑诸如对称,控制,变招优势局等,实际变化量但未必能增长到一个可观的数字。或许通过恰当的方式,实现指数增长不是不可能。

5, 研究地位
研究可以说是棋的一种自然属性。无论喜欢不喜欢,随着对规则不断认识,总是自然产生、不断增长的。
研究地位指规则下研究将能发挥的作用。从过往经验看,作用太大肯定是有问题的;但是作用太小是否就没问题,这个还是未知数。
另外个人认为在研究地位被削弱的同时,棋手的棋感应当被强调。
由于rif研究威力过大,导致rif规则可用变化量大大减少,因此有了改规则的必要,但早期改规则不愿意放弃旧研究,虽然增加了实用变化量但并不大,研究的地位也没有发生改变,随着研究深入很容易再次出现问题;现在很多无禁规则直接放弃过往的所有研究,寻找新的开始,希望通过极大的变化量来彻底削弱研究的地位,这是不错的尝试;个人的博弈规则一方面从增加实用变化量出发削弱研究地位,另一方面在开局阶段引入博弈权,通过另一种方式来改变研究的地位,即让研究可以得到策略优势,但却难以实现局面优势。
棋感与研究的关系:棋感不同于研究,除了计算力,棋感是棋手实力的重要组成。棋感是经验性的产物,它需要棋手长期的积累,但即便再强的棋感也不是绝对准确的。


从规则组件类型角度看规则


 规则组件指一个五子棋规则组成的各种零件。到目前为止,五子棋的组件主要有交换,打点,SAKATA类(单方连续落子)移子,禁手,另外包含个人分析的新模式禁手。
     首先打个比方,假设五子棋变化就像一块草地,那么平衡局就像草地上的几朵鲜花。
1,如此看交换规则的话,那么交换规则相当于强迫对方选择草地上的鲜花(平衡局),但其本身对增加鲜花(平衡局)的数量并没有帮助,个人将其归为被动平衡规则;
2,而打点,SAKATA类,移子规则,(其中后2者结合交换使用,打点都可)通过强制1方选择弱手来达到平衡,一定程度上增加了鲜花(平衡据)的数量,个人将其归为单向主动平衡规则(在不出现混淆情况简称主动平衡规则);
○1,○2本质上都是通过强迫对方选择弱手来达到平衡,区别在于是否增加鲜花。
3,除此之外,传统的禁手通过削弱黑棋的优势一定程度促成平衡,整体上大量丰富了平衡局的数量及比例;同时一点很重要的,禁手规则下双方都是争取走最强点的,而不像○1○2般强制性要求一方选择弱手,因此个人将其归为双向主动平衡规则。
       因此,新模式禁手也属于双向主动平衡规则,博弈规则属于单向主动平衡规则。2次交换属于被动平衡规则。

    应该说,单纯的被动平衡规则也就是交换,本质上平衡能力比较有限;过去及当前提出的平衡规则基本都是单向主动平衡规则,比如5手2打,2次交换,SAKATA类,3+4,移子等等。
       个人最初比较看好双向主动平衡规则,因为单向主动平衡规则存在2个不大不小的问题:○1,该规则必然强制要求1方选择弱手,这是与棋手正常行棋动机相冲突的;○2,该规则要求一方下弱手,但问题在于对未知局面要对‘弱手’的度的把握是相当困难的,这一方面造成技术上策略上不公平,另一方面也对其实用性造成影响。
       而双向主动平衡规则虽然能轻松克服单向主动平衡规则的问题,但是①首先无论新模式的禁手表述上如何简单乃至一句话可以简单表达,但是行棋思路上必然会造成变化。若在200年前或许可行,但现在绝对不行。②新模式禁手要求对五子棋平衡的核心有一个非常严格的理性认识,这个目前只能接近但无法做到。因此个人最终放弃个人在新模式禁手上的探索。
       在失望之余,突然想起曾经一度构想的博弈规则,之所以没有落实是由于它也属于单向主动平衡规则。但它与其他单项主动平衡规则不同的地方在于,它虽然也要求一方下弱手,但是却服从自愿原则即 是否下弱手由自己决定,并不受对方控制(策略上被迫除外,但这是对方策略成功而来)。除此之外双方行棋都是争取最强的,也就是个双向主动的平衡规则。
       因此可以称博弈规则是种自愿的单向主动平衡规则,它刚好介于双向与单向主动平衡规则中间。


我对行棋思路看法


1, 规则越复杂,越不容易被接受?

从研究早期寻找禁手新规则开始,一直存在种普遍的观念——规则越复杂,越难被人们所接受,也越难推广。因此,简化规则一直以来被当作规则改革的决定性因素。
2年前个人研究新规则时,也把规则的简化当金科玉律。当时为了寻求最合理的简化,个人对各种规则组件进行分析,并最终得出2个结论:○1,想单纯利用被动平衡规则及单向主动平衡规则来制定规则,无论如何操作,简化程度必然是有限的;○2,要想用最简单方式来平衡的规则,必须采用新模式的禁手。
关于新模式禁手个人花了相当长时间研究甚至一定的实践检验,但最终还是失败了。尽管我对它的平衡性有相当把握,也写了不少证据资料数据进行分析,甚至可以将规则简单到一句话、一眼可以看懂理解的程度。而失败的原因仅仅是因为它将必然性改变棋手算棋的思路。
    自此,我不得不自我检讨。应该说:规则越复杂,越不容易被接受还是正确的。但是我们必须将规则字面上的复杂跟内容上的复杂分开,因为字面复杂最多导致棋手接受规则一瞬间的困难,而内容上的复杂直接关系棋手的整个行棋思路。因此,必须重新认识规则内容上的复杂。

附○1:早期个人将规则组件按其功能划分作过系统分析,发现禁手在整个规则中最复杂,同时其平衡能力又非常有限。从而萌发改进禁手的想法,并对禁手平衡原理及五子棋平衡的核心问题展开研究,最终提出新模式禁手。(规则组件参考《附件:从规则组件类型角度看规则》)
与传统禁手区别在于:传统禁手采用直观的方式限制黑棋优势,进而形成认为‘禁止走什么样的点’就是禁手的观念;而新模式禁手根据个人总结的理论限制黑棋优势,它并不一定表现为限制什么点。但它与传统禁手一致的地方在于,必然性导致算棋思路上的改变。
附○2:个人目前发现最简单的新模式禁手为:轮流落子,16手内白可以在任何时候移动任意一个棋子一格,完。没交换,没禁手,没打点,没落子限制……


2,什么样的规则内容复杂?

个人认为,要解答“什么样的规则内容复杂”这个问题,其本质就是了解棋手的行棋思路。如此,可以得到结论:
不容易被接受的规则,肯定是内容复杂的规则——与棋手行棋思路冲突大的规则,无论它字面理解多么简单;
容易被接受的规则,肯定是内容简单的规则——与棋手行棋思路冲突小的规则,即便它字面理解比较难。当然双者都简单最好。

附:行棋思路分为2部分:○1,算棋思路上;○2,行棋动机上。
算棋思路上在禁手与无禁已经体现这个问题,而真正意识到是在新模式禁手研究过程中发现的,后来之所以研究无禁手规则也是为了克服算棋思路上的问题。
行棋动机上改变方式其实很多,如打点,sakata类,移子都是,在适量使用时候棋手还是比较容易接受的;但过量一样会造成很严重的思路冲突。行棋思路最初是别人发现,然后通过一些统计证实的。


3,规则的制定方向

参考《从规则组件类型看规则》,将规则分为3类,被动平衡规则;单向主动平衡规则;双向主动平衡规则。
首先放弃的是被动平衡规则,明显单纯的交换实用变化量太少;其次放弃的是双向主动平衡规则,因为该规则无论如何改都必然导致算棋思路上的改变,这绝对不适合新手的。
因此规则的制定最终还是要在单向主动平衡规则中找。如前面所提,这类的规则组件主要有3,打点、sakata类、移子。
其中后2者后面都需要补偿交换组件,这类规则质上必然可以完成技术上平衡,而量的差别会造成一些性质的差别;而打点并不一定需要跟交换结合,但不结合交换容易导致实用变化量的有限,而在打点前补偿交换组件,可以很好解决这个问题。
这些规则组件的性质是一样的,因此即便一个规则同时使用多种组件,质肯定是一样的,量的调整会在性质上造成一些影响。而从字面简单的角度出发,规则避免复杂搭配,量上寻求简单适量是必然的;同时字面简单的追求必然是有限的,无论多么简单都必须包含至少一种单向主动平衡组件。

比如sakata连续落子后,对方必须有选择权,否则会出现1子落盘端这类过分削弱问题;而打点前补偿交换权,可以有效解决打点数量设置问题。
比如3手交换5手sakata+交换规则,这个其实是一个被动平衡规则组件与sakata规则组件的复杂搭配。明显单纯的sakata规则组件已经可以独立完成技术平衡,前面的交换设置更多是为了策略平衡需要设置的。
3手交换5手2打却不一样,因为2打对优势局削弱量有限,因此前面必须跟交换,否则明显还是大量开局直接2打必胜的。但这样的设置容易出现打点数量设置难的问题,而像3手交换4手指定打点交换5手打点规则,排除掉3手交换被动平衡规则组件不看,剩下就是交换与指定打点良好搭配的范例,它可以有效针对不同局面设置打点,大大提升打点使用空间。

博弈规则首先根据自愿原则,通过博弈-选择权让劣势方主动来削弱优势方(优势方不会自我削弱,只能强迫;而劣势方必然主动削弱优势方),克服过去思路总是要求优势方自我削弱而出现的强迫问题;其次博弈规则由于自愿,可以相当程度解决“何时削弱”的问题,有效解决一般单向主动平衡规则量上的设置问题 (设定第几手sakata,打点等);再者,完整的博弈规则包含多种单向主动平衡规则组件,做到既不冲突又能自主合理搭配使用,同时控制行棋思路变化率,增加了变化量,增强策略竞技性。明显的,设想中的博弈规则的行棋思路变化率并不大。
因此博弈规则测试版从争取字面简单出发,慢慢过渡到设想博弈规则,个人认为是可行的。


转载本文请注明出处(wuzi8.com)

点此下载本文

 


 

声明:1、转载本文请注明作者及出处;2、本文若涉及版权问题请及时联系我们;3、本文网友评论观点若侵犯作者利益请联系站长删除。
网友评论:(只显示最新30条。评论内容只代表网友观点,与本站立场无关!)
  • 上一篇文章: 谈谈我对五子棋的一些认识

  • 下一篇文章: 没有了
  • 最新5篇热点文章
     必胜谱的传说(全集)
     博弈规则(全)
     专访:第八届北京高校...
     专业老师在线解答您五...
     初学五子棋背定式重要...
     
    最新5篇推荐文章
     揭秘:五子棋项目为何...
     花月开局必胜问题
     孤竹:说说自己下棋的...
     博弈规则(全)
     专访:第八届北京高校...
     
    相 关 文 章