安安芦荟祛痘洗面奶解释讲述人工智能领域内的专业词汇和算法,是AI君在2018年最先要做的事情,我们第一个要讲的就是大名鼎鼎的“机器学习”。
机器学习,英文全称Machine Learning,是人工智能领域的一个重要学科,Tom M. Mitchell在其著作《Machine Learning》中指出,机器学习就是指“计算机利用经验自动改善系统自身性能的行为”。简言之,机器学习是指通过计算机学习数据中的内在规律性信息,获得新的经验和知识,以提高计算机的智能性,使计算机能够像人那样去决策。
因为机器学习本身是诸多种算法的总称,所以读者如果在下文中看到不明白的名词也不必太费心了解,对于下文中提到的每一个算法,将来都会发布单独的一篇文章予以介绍。
监督学习用有标签的数据作为最终学习目标,通常学习效果好,但获取有标签数据的代价是昂贵的。
监督学习的数据集包括初始训练数据和人为标注目标,希望根据标注特征从训练集数据中学习到对象划分的规则,并应用此规则在测试集数据中预测结果,输出有标记的学习方式。因此,监督学习的根本目标是训练机器学习的泛化能力。
非监督式学习相当于自学习或自助式学习,便于利用更多的数据,同时可能会发现数据中存在的更多模式的先验知识(有时会超过手工标注的模式信息),但学习效率较低。
非监督式学习,用于处理未被分类标记的样本集数据并且事先不需要进行训练,希望通过学习寻求数据间的内在模式和统计规律,从而获得样本数据的结构特征,因此,非监督式学习的根本目标是在学习过程中根据相似性原理进行区分。非监督式学习更近似于人类的学习方式,被Andrew Ng誉为:人工智能最有价值的地方。
在未知环境中,关于智能体(agent) 的学习行为是一个既充满挑战又有趣的问题,强化学习通过试探(trial-and-error)与环境交互获得策略(policy)的改进,其学习和在线学习的特点使其成为机器学习研究的一个重要分支。
强化学习技术以马可夫决策过程(markov decision process)为基础,它的基本思想是:如果智能体(agent)的某个动作(action)导致环境正的奖赏(reward),即为强化信号,则智能体以后这个动作的趋势便会加强; 反之智能体产生这个动作的趋势减弱。
众所周知的打败人类围棋世界冠军的阿尔法围棋(AlphaGo)的技术原理就是强化学习。升级版的AlphaGo Zero更是不需要借助任何人类知识,从随机的自我对弈开始,只学习了3天就以100:0的战绩横扫曾经打败了李世石的AlphaGo版本。
结合深度学习(deep learning)的深层强化学习(deep reinforcement learning),是目前人工智能领域最前沿的研究和应用方向之一。近年来,计算机运算速度不断加快,量子计算领域的研究也在稳步进行,人类可以利用计算机对更大规模、更大尺度的数据进行处理,相信在不远的将来,人类终能迎来通用人工智能的时代。
机器学习的一般流程如下图。总之,机器学习就是计算机在算法的指导下,能够自动学习大量输入数据样本的数据结构和内在规律,给机器赋予一定的智慧,从而对新样本进行智能识别,甚至实现对未来的预测。
请在文章末尾留言写出你的想法,告诉AI君你最想了解的人工智能算法,我就会优先写出你想看的文章哦。公众号“AI君工作日记”,等你来撩。
|