妈呀,从没玩过这么宽裕的比例,而且我都没圈到几个杀刺,一直在努力出虾。果然这场白方有大气运。
最近网上有个狼吃羊的AI训练小游戏纷纷在传,很有趣。
这个游戏的设计规则是如果狼抓到羊,就奖励10分;如果狼撞到了障碍物就扣1分;为了避免狼磨洋工,待在原地不动,每秒钟狼都会被动的扣0.1分。
他们训练了这只AI狼20万次,结果AI狼选择开局直接撞死,工程师们大为不解,于是开始人工推算各种选择的概率。
他们惊奇的发现,如果狼开局直接撞死,只扣1.1分,撞死1分,第一秒的惩罚0.1分。
可是他朝羊走两步再选择撞死,就有可能扣1.1分到2.4分,因为有可能撞到障碍物,路程花费的计时扣分也更多。
他有时候能够吃到羊,但总体来说,是不划算的,因为吃到羊的奖励,10分,不足以弥补抓羊的风险损失。
当然,从游戏设计的角度看,出现这个问题的原因在于分值。如果抓一只羊奖励100分,或者待在原地不动,每秒被动只扣0.01分,又或者撞到障碍物,只扣0.1分,再或者主动撞死直接扣1万分,都足以改变这只AI狼的选择,让他努力抓羊,或者不得不努力抓羊。
但是,这个设定的不太合理的奖惩制度,恰恰像极了很多人对生活的体验。
于是网友们纷纷说,这只AI狼好聪明,它学会拒绝卷了,它选择直接躺平。