“2016年3月,阿尔法狗与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;
2016年末2017年初,阿尔法狗在中国棋类网站上以“大师”(Master)为注册账号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;
2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。”
“这个程序甚至让一些世界着名棋手有一种挫败和无力感,甚至想退出棋坛。”
“那么,阿尔法狗为何在当时能够实现这一切呢?”
“根本原因在于,它的深蓝的区别。”
“深蓝虽然采用了混合决策方法,但是本质上来说是将所有的棋步与组合交给超级计算机来运算,依然是属于穷举的范畴;”
“但是阿尔法狗不同,它运用的是更为高明,更为智能的‘深度学习’模型。”
“这让它相比以前的围棋人工智能,它的思考要更加接近人类,通俗的理解来说,也就是——更加智能。”
“其实说到‘深度学习’,就应该先讲一讲‘神经网络’的,但是这些具体的原理我们放到后面再介绍吧,大家大致清楚,神经网络就是基于模拟人类神经的思路开发的模仿人类学习的机器算法就行了。”
“具体来说,阿尔法狗会将棋盘上的局势作为输入信息,预测当前的局面,减小搜索量,在缩小范围的基础上再预测接下来每种落子的赢棋概率。”
“总的来说,当前局势并不会直接用来运算推演棋路,而是作为一种输入量,一种程序用来观察情况的方式来输入,运算的全部都是概率,这种运算是通过反复的训练来形成的,就像调教一个小朋友一样。”
“这种机器学习方式,再叠加上本就比人类强大太多的运算能力,造就了这个人工智能历史上都要浓墨重彩去说一说的围棋程序。”
“而当时,他们面临的最大问题就是,你只有充足的、更多的训练,它才能表现地更好;甚至说这种训练数据都必须人工干预。”
“怎么说呢?大概就像你们的爸爸妈妈,在你们出生后也会输入各种有益于你们健康成长、智力开发的信息给你们。当时的阿尔法狗同样需要在监督下开展学习,有目的性地学习围棋棋谱,才能形成有针对性的神经网络。”
“即使如此,由于算法中具有相当的随机性,最终机器学习的效果就带有不确定,有的时候效果很好,有的时候又很迷,有时候又可能简简单单调整一个参数就能让它从很迷变成很牛,这种参数调整看上去似乎带点‘玄学’,在当时被从业人员戏称为‘炼丹’。”
听到这里,有的学生感觉相当新奇,甚至笑了起来。
其实周天麒讲的很多东西,网络上都有,他们用平板很轻易就能搜到,甚至于可以直接询问平板里珞珈大学开发APP里的AI助理“珞小珈”;但是,听到周天麒这样绘声绘色的讲述,体验感要明显好太多,让他们有种别开生面的感觉。
本章未完,点击下一页继续阅读。