论文部分内容阅读
人工智能阿尔法狗去年4胜1负战胜围棋高手李世石,经过9个多月的疯狂学习后,它升级了。阿尔法狗披着Master的马甲,在围棋对战网上以60胜0负的战绩横扫中日韩围棋大师,包括“棋圣”聂卫平。
围棋棋路复杂多变,一直被视为人类智慧的门槛,许多人终其一生都在研究。阿尔法狗“年纪轻轻”已经达到甚至超过围棋职业九段水平,这在围棋界和科技界可是件了不得的事情——机器的智慧接近甚至战胜了人类。
許多人知道阿尔法狗是一款厉害的人工智能围棋程序,但不知道阿尔法是怎么样学习围棋的。其实它的学习过程模仿了人类小孩,但更加疯狂。
人类小孩学习的过程,可以看做从书本、老师、家长和生活实际中学习知识,在头脑中理解知识,在考试、生活中应用知识三个阶段。就像先输入,再整合,最后输出。
用传统的英语学习过程打比方,第一个阶段是输入,是不断背单词、记句式、语法的过程。完成这个阶段已经很不容易,但是只完成这些还是不会用英语交流,和老外对话。
这个时候,就该进入第二个阶段,整合。在脑海中整合第一阶段的知识,才知道如何把单词组合成地道的句子,知道什么场合用什么话。
在第三阶段,就要输出了,能用英语交流,表达自己的想法。
人类学习概括起来就是经历从积累经验到总结规律,最终灵活运用这三个阶段。
那么,应该怎样教会机器学习呢?
机器没有办法读万卷书,行万里路,那么第一阶段只能从人类给它的数据中学习了。
在第二阶段,该怎么样教会机器从数据中总结规律,是机器学习的主要问题。几十年间,科学家们发明了各式各样的机器学习算法。通过编程,告诉机器学习需要的模型、执行学习的流程、学习模型中的参数。
我们用机器学习围棋做例子。专家们编写算法,把围棋的规则当模型,让机器执行自己和自己下棋的流程,并且下棋速度非常快。在机器下了成千上万盘棋后,就能获得许多参数,比如怎样的局势能赢,怎样的局势会输,对手的棋子占据哪些地方我输的概率大,我的棋子占据哪些地方赢的概率大……
渐渐地,机器就学会了下围棋,而且能战胜人类,完成了学习的第三阶段。
这样看来,机器学习的过程是模仿人类小孩的,甚至更简单,它不会像人类小孩一样会联想,会想象。
但机器学习的疯狂之处在于,突破了人类学习的速度、脑袋的容量和生命长短的限制。阿尔法狗可以在短时间内自己和自己下棋千万局,人类穷其一生也下不了百万局棋。
机器学习的模式简单,和人类如出一辙,但疯狂的量的积累,让机器有无限量的智慧和经验。
围棋棋路复杂多变,一直被视为人类智慧的门槛,许多人终其一生都在研究。阿尔法狗“年纪轻轻”已经达到甚至超过围棋职业九段水平,这在围棋界和科技界可是件了不得的事情——机器的智慧接近甚至战胜了人类。
許多人知道阿尔法狗是一款厉害的人工智能围棋程序,但不知道阿尔法是怎么样学习围棋的。其实它的学习过程模仿了人类小孩,但更加疯狂。
人类小孩学习的过程,可以看做从书本、老师、家长和生活实际中学习知识,在头脑中理解知识,在考试、生活中应用知识三个阶段。就像先输入,再整合,最后输出。
用传统的英语学习过程打比方,第一个阶段是输入,是不断背单词、记句式、语法的过程。完成这个阶段已经很不容易,但是只完成这些还是不会用英语交流,和老外对话。
这个时候,就该进入第二个阶段,整合。在脑海中整合第一阶段的知识,才知道如何把单词组合成地道的句子,知道什么场合用什么话。
在第三阶段,就要输出了,能用英语交流,表达自己的想法。
人类学习概括起来就是经历从积累经验到总结规律,最终灵活运用这三个阶段。
那么,应该怎样教会机器学习呢?
机器没有办法读万卷书,行万里路,那么第一阶段只能从人类给它的数据中学习了。
在第二阶段,该怎么样教会机器从数据中总结规律,是机器学习的主要问题。几十年间,科学家们发明了各式各样的机器学习算法。通过编程,告诉机器学习需要的模型、执行学习的流程、学习模型中的参数。
我们用机器学习围棋做例子。专家们编写算法,把围棋的规则当模型,让机器执行自己和自己下棋的流程,并且下棋速度非常快。在机器下了成千上万盘棋后,就能获得许多参数,比如怎样的局势能赢,怎样的局势会输,对手的棋子占据哪些地方我输的概率大,我的棋子占据哪些地方赢的概率大……
渐渐地,机器就学会了下围棋,而且能战胜人类,完成了学习的第三阶段。
这样看来,机器学习的过程是模仿人类小孩的,甚至更简单,它不会像人类小孩一样会联想,会想象。
但机器学习的疯狂之处在于,突破了人类学习的速度、脑袋的容量和生命长短的限制。阿尔法狗可以在短时间内自己和自己下棋千万局,人类穷其一生也下不了百万局棋。
机器学习的模式简单,和人类如出一辙,但疯狂的量的积累,让机器有无限量的智慧和经验。