人工智能、机器学习和深度学习有哪些区别?
提供一个学习路线和书单,谢谢! 很多人可能不明白『机器学习』、『AI(人工智能)』和『深度学习』之间的区别。这些都是现代数据技术应用中的重要关键字,但由于它们很相似,因此极易混淆。但是为了将 AI 引入日常工作中,正确理解这三个关键字的范围很重要。人工智能、机器学习和深度学习已成为当今商业世界中最受关注的技术,因为公司正在使用这些创新来构建智能机器和应用程序。尽管这些术语在全世界的商业对话中占主导地位,但许多人很难区分它们。
在进入技术细节之前,让我们看看技术影响者、行业人士和作者对这三个概念有什么看法。
[*]人工智能是创造智能智能机器的概念。
[*]机器学习是人工智能的一个子集,可帮助您构建人工智能驱动的应用程序。
[*]深度学习是机器学习的一个子集,使用大量数据和复杂的算法来训练模型。
先说结论,如果你赞同的话记得三联,然后往下看。
三者间的关系
机器学习、AI、深度学习的属性是一样的,只是占据的范围不同。
人工智能的范围最广,是指使用机器再现人类智能的所有技术。机器学习属于人工智能的范畴,是实现人工智能的技术之一。此外深度学习是这种机器学习的学习方法之一。
此外机器学习和深度学习之间存在技术差异。两者都分析检索数据中的哪些元素会影响结果。在机器学习中,人类对此进行判断和调整,但在深度学习中机器会自动进行结果的计算判断。
无论应用机器学习、AI、还是深度学习都需要从数据分析下手,整理我们需要的原始数据。 最近体验了一下猴子老师的数据分析入门课程,对基础数据处理的方法讲解的还是很透彻的。想要入行的小伙伴建议看看正确的数据预处理的方式和方法,为日后不论机器学习、深度学习还是人工智能打下一个良好的基础。
机器学习是什么
机器学习是基于计算机学习大量数据并基于算法分析信息的方法。通过样本发现数据规律,主要应用于识别(分类)和数据预测(回归&分类)。通过统计学中的算法分析学习的结果构建机器学习模型,完成输出数据返回的结果输出机制。分析的准确程度依照不同的模型分成不同的评估方法,比如AUC、AOC、MSE等等,虽然达不到100%的完美程度,但是可以通过不断的优化基础数据和模型进行充分的提高。
根据要处理的数据类型和机器学习的目的,有各种机器学习算法,但它们可以大致分为三类:『有监督学习』、『无监督学习』和『强化学习』。
『有监督学习』
意味着当给出学习数据时,需要指定数据的结果(即正确答案)。机器学习模型学习诸如 『当给定这样的数据时,结果看起来像这样』 的关系。通过足够的训练能够准确预测给定没有正确答案的数据时的结果。因此用于预测场景和目标识别对象。
<a href="http://zhuanlan.zhihu.com/p/465228241" data-draft-node="block" data-draft-type="link-card" class="internal">Mr数据杨:『迷你教程』使用XGBoost进行人口出生预测,时间序列版16 赞同 · 4 评论文章Mr数据杨:『迷你教程』利用主成分分析(PCA)居然可以做人脸识别2 赞同 · 0 评论文章一个监督学习方法的例子。该算法使用狗和猫的标记数据进行训练。训练后的模型预测新图像是猫还是狗。
监督学习的一些例子包括线性回归、逻辑回归、支持向量机、朴素贝叶斯和决策树。
『无监督学习』
在不给出正确答案数据的情况下学习数据之间的异同。由于没有正确的答案,模型无法知道给定的数据的结果是什么。因此将学习数据之间的关系,例如 『这个数据和这个数据非常相似。这个数据与其他数据有不同的特征』。 当想要检测异常或对数据进行分类时,通常会使用无监督学习。
Mr数据杨:『 迷你教程 』数据异常检测你没有听过的隔离森林和核密度方法1 赞同 · 0 评论文章一个使用未标记数据训练模型的无监督学习方法示例。在这种情况下,数据由不同的车辆组成。该模型的目的是对每种车辆进行分类。
无监督学习的一些示例包括 k 均值聚类、层次聚类和异常检测。
『强化学习』
与监督学习略有不同,将学习如何根据目的获得最佳结果。具体来说机器学习模型是反复学习 『采取某种行动时得到了什么样的结果』 。在学习的时候,如果采取的行动导致了好的结果则给出正分,如果导致不好的结果则给出负分,并且机器学习模型创建了通过试验和最大化分数的行动模式各种动作的误差。我会推导出来的。强化学习用于围棋游戏、自动驾驶和机器人控制的人工智能。
Mr数据杨:Python环境下用中文做了个《王者荣耀》AI脚本,附视频13 赞同 · 5 评论文章一个示例展示了如何训练机器识别形状。
强化学习算法的示例包括 Q 学习和深度 Q 学习神经网络。
这样三种学习方法各自处理的数据和目的是不同的,因此需要根据应用场景来使用它们。
AI(人工智能)是什么
AI 是人工智能的缩写,是自 1950 年代以来一直在研究的计算机科学之一。通过结合算法和数据,人为的表述为再现人类的认知和推理等动作。在现代 AI 这个词的范围非常广泛,机器学习和深度学习也被视为实现AI的方法之一。换句话说机器学习作为一个领域包含在广泛的人工智能中。
AI 可分为 『专用人工智能』和『通用人工智能』。
[*]『专用人工智能』也称为狭义人工智能,是专门从事一项任务的AI(人工智能),典型例子包括图像识别、语音识别、自动驾驶技术等,可以理解成没有思想和意识的 AI。是可以很好地执行非常具体的任务的机器,通常比人类执行的效果更好。然而这些机器的能力非常有限,只能在非常有限的环境中运行。
[*]『通用人工智能』是一种执行多项任务的人工智能,可以根据给定的信息自己思考和应用,比如我们小时候都知道的哆啦A梦,与人类具有相同思想和意识的AI。可以被认为非常像人类执行复杂的任务。这些机器可以在没有人工干预的情况下解决问题并将智能应用于任何事情,并且更接近于我们在《星际迷航》等电影中看到的那些。
深度学习是什么
深度学习是机器学习中的一种学习方法。不同于其他机器学习方法,因为它使用一种称为『神经网络』的技术进行学习。
神经网络具有不同的『神经元』层(『输入层』、『输出层』和『隐藏层』),用于输入数据、对其加权并返回输出。通过堆叠『层』组成的。
在机器学习方法中,用算法处理数据需要将数据的特征、重点关注的部分等信息组织起来,交给机器学习模型。然而在深度学习中,随着数据在每一层中被处理,如何处理数据的特征是确定的。因此对于视频、图像、音频等难以组织的问题可以达到比其他方法更高的精度。
因此有很多领域利用图像识别、语音识别、自然语言处理等深度学习取得了划时代的进步,设计了自动驾驶、机器翻译、人工智能助手等先进的人工智能技术。
Mr数据杨:面试官:都不懂Keras几步实现神经网络还来面试算法工程师?2 赞同 · 1 评论文章深度学习几个重要的网络
[*]卷积神经网络 (CNN) - CNN 是一类最常用于图像分析的深度神经网络。
[*]循环神经网络 (RNN) - RNN 使用顺序信息来构建模型。它通常更适用于必须记住过去数据的模型。
[*]生成对抗网络 (GAN) - GAN 是一种算法架构,它使用两个神经网络来创建新的合成数据实例,以传递真实数据。受过照片训练的 GAN 可以生成新照片,这些照片在人类观察者看来至少表面上是真实的。
[*]深度信念网络 (DBN) - DBN 是一种生成图形模型,由称为隐藏单元的多层潜在变量组成。
机器学习和深度学习的区别
深度学习是机器学习方法之一。只要有足够的训练数据,就可以利用神经网络自动提取数据的特征。
深度学习使学习以前难以数字化的非结构化数据(图像、自然语言、声音)成为可能。
此外数字化变化的增加使得生成自然语言和检测异常成为可能,提高了优化和推荐的准确性。 作为一个大数据从业人员,相信大家整天都在被AI、机器学习、深度学习等一些概念轰炸。有时候甚至有点诚惶诚恐,一方面作为一个“业内人士”而自豪,二方面觉得新概念一个接一个,自己不甚了解,有点恐惧。现在就来拆解一下这三个名词:
人工智能(Artificial Intelligence)
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。“人工智能”是“一门技术科学”,它研究与开发的对象是“理论、技术及应用系统”,研究的目的是为了“模拟、延伸和扩展人的智能”。我们现在看到的貌似很高端的技术,如图像识别、NLP,其实依然没有脱离这个范围,就是“模拟人在看图方面的智能”和“模拟人在听话方面的智能”,本质上和“模拟人在计算方面的智能”没啥两样,虽然难度有高低,但目的是一样的——模拟、延伸和扩展人的智能。另外,人工智能在50年代就提出了。
机器学习
随着人对计算机科学的期望越来越高,要求它解决的问题越来越复杂,已经远远不能满足人们的诉求了。于是有人提出了一个新的思路——能否不为难码农,让机器自己去学习呢?
机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。研究人员不会亲手编写软件、确定特殊指令集、然后让程序完成特殊任务;相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。这里有三个重要的信息:1、“机器学习”是“模拟、延伸和扩展人的智能”的一条路径,所以是人工智能的一个子集;2、“机器学习”是要基于大量数据的,也就是说它的“智能”是用大量数据喂出来的;3、正是因为要处理海量数据,所以大数据技术尤为重要;“机器学习”只是大数据技术上的一个应用。常用的10大机器学习算法有:决策树、随机森林、逻辑回归、SVM、朴素贝叶斯、K最近邻算法、K均值算法、Adaboost算法、神经网络、马尔科夫。
深度学习
相较而言,深度学习是一个比较新的概念,严格地说是2006年提出的。深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特点,是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉和自然语言处理(NLP)领域。显然,“深度学习”是与机器学习中的“神经网络”是强相关,“神经网络”也是其主要的算法和手段;或者我们可以将“深度学习”称之为“改良版的神经网络”算法。深度学习又分为卷积神经网络(Convolutional neural networks,简称CNN)和深度置信网(Deep Belief Nets,简称DBN)。其主要的思想就是模拟人的神经元,每个神经元接受到信息,处理完后传递给与之相邻的所有神经元即可。所以看起来的处理方式有点像下图(想深入了解的同学可以自行google)。
神经网络的计算量非常大,事实上在很长时间里由于基础设施技术的限制进展并不大。而GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展,“深度学习”才一下子火热起来。击败李世石的Alpha go即是深度学习的一个很好的示例。Google的TensorFlow是开源深度学习系统一个比较好的实现,支持CNN、RNN和LSTM算法,是目前在图像识别、自然语言处理方面最流行的深度神经网络模型。事实上,提出“深度学习”概念的Hinton教授加入了google,而Alpha go也是google家的。
总结:人工智能是一个很老的概念,机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是需要大量数据来“喂”的,是大数据技术上的一个应用,同时深度学习还需要更高的运算能力支撑,如GPU。
书单推荐:
1.Deep Learning
http://pica.zhimg.com/50/v2-de6b81661743d1ffdbf519c47081d791_720w.jpg?source=1940ef5c
这本书介绍很全面,由深度学习领域的专家撰写。被称为 AI 圣经,因为它将这个领域多年的研究汇集到一本书中。
如果你是一个有抱负的学生想要掌握深度学习并深入研究,或者你想教授深度学习课程,那么这本书肯定会对你有帮助。这本书可能是目前关于深度学习最全面的图书。
2.Deep Learning: A Practitioner&#39;s Approach
本书使用了 DL4J 这个 Java 库来训练和实现深度神经网络。针对初学者,如果你在 Java 或深度学习领域已经很有经验,可以直接去看它的例子。如果你没有深度学习的经验,但有很好的 Java 基础,建议你逐页阅读本书。如果你不了解 Java,则需要先去入门 Java。
通过阅读这本书,你将大致了解机器学习,特别是深度学习的基本概念。你将了解深度神经网络是如何从基本的神经网络演化而来。了解一些深度网络的架构,例如卷积神经网络(CNN)和循环神经网络(RNN)。
3.深度学习入门:基于 Python 的理论与实现
本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用 Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度学习。
4.模式识别与机器学习
作者是 Christopher M. Bishop。本书提出了近似推理算法和用于描述概率分布的图模型等多种最新分类方法。在阅读本书之前,最好有多变量微积分和基本线性代数等数理基础,面向人群为高年级本科生、研究生和相关研究人员。
更多精彩内容可以关注 华为云技术宅基地
看了大家的答案决定简答一波~一张图终结该问题(呸)!
人工智能指由人类制造出的机器表现出的智能。这是一个非常大的范围,长远目标是让机器实现类人智能。 不过目前我们还在非常非常初级的阶段,甚至都不能称为智能。
机器学习是指通过数据训练出能完成一定功能的模型,是实现人工智能的手段之一,也是目前最主流的人工智能实现方法。
深度学习则是机器学习的分支。深度即层数,超过 8 层的神经网络模型就叫深度学习——目前在语音、图像等领域取得了很好的效果。
所以三者之间是从大到小的包含关系~
书籍的话想要入门不需要太多,2 本书即可——
1、周志华教授的《机器学习》,著名的「西瓜书」,【文科生也不用害怕的机器学习专业书】!
或者李航教授的《统计学习方法》,特点是简洁高效、深入浅出,非常优美~但文科生入门大概不太行。
可根据自己的情况任选其一。
2、Ian Goodfellow、Yoshua Bengio、Aaron Courville 合著的《深度学习》,去年 8 月出了中文版,条理清晰,不论有没有基础都可以根据情况,选择适合自己的章节阅读。
如果对人工智能的学科背景及应用方向感兴趣,推荐轻松有趣的《漫谈人工智能》,编著这本书的集智俱乐部中有有好几位都是人工智能行业的创业者。从基础科普到自然语言处理、群集智能、天气预测应有尽有,是一本【相当有诚意的人工智能类科普读物】。
以上就是我们的答案和推荐,并感谢你看到这里(●°u°●) 」
我们会不定期奉上轻松有趣的科普视频,
及解读人工智能行业、历史的深度文章,
欢迎关注! 人工智能并不是一个新的术语,它已经有几十年的历史了,大约从80年代初开始,计算机科学家们开始设计可以学习和模仿人类行为的算法。
在算法方面,最重要的算法是神经网络,由于过拟合而不是很成功(模型太强大,但数据不足)。尽管如此,在一些更具体的任务中,使用数据来适应功能的想法已经取得了显着的成功,并且这也构成了当今机器学习的基础。
在模仿方面,人工智能专注于图像识别,语音识别和自然语言处理。人工智能专家们花费了大量的时间来创建诸如边缘检测,颜色配置文件,N-gram,语法树等。不过,这些进步还不足以达到我们的需求。
传统的机器学习:
机器学习(ML)技术在预测中发挥了重要的作用,ML经历了多代的发展,形成了具有丰富的模型结构,例如:
1.线性回归。
2.逻辑回归。
3.决策树。
4.支持向量机。
5.贝叶斯模型。
6.正则化模型。
7.模型集成(ensemble)。
8.神经网络。
这些预测模型中的每一个都基于特定的算法结构,参数都是可调的。训练预测模型涉及以下步骤:
1.选择一个模型结构(例如逻辑回归,随机森林等)。
2.用训练数据(输入和输出)输入模型。
3.学习算法将输出最优模型(即具有使训练错误最小化的特定参数的模型)。
每种模式都有自己的特点,在一些任务中表现不错,但在其他方面表现不佳。但总的来说,我们可以把它们分成低功耗(简单)模型和高功耗(复杂)模型。选择不同的模型是一个非常棘手的问题。
由于以下原因,使用低功率/简单模型是优于使用高功率/复杂模型:
[*]在我们拥有强大的处理能力之前,训练高功率模型将需要很长的时间。
[*]在我们拥有大量数据之前,训练高功率模型会导致过度拟合问题(因为高功率模型具有丰富的参数并且可以适应广泛的数据形状,所以我们最终可能训练一个适合于特定到当前的训练数据,而不是推广到足以对未来的数据做好预测)。
然而,选择一个低功率的模型会遇到所谓的“欠拟合”的问题,模型结构太简单,如果它复杂,就无法适应训练数据。(想象一下,基础数据有一个二次方关系:y = 5 * x ^ 2;你无法适应线性回归:y = a * x + b,不管我们选择什么样的a和b。
为了缓解“不适合的问题”,数据科学家通常会运用他们的“领域知识”来提出“输入特征”,这与输出关系更为直接。(例如,返回二次关系y = 5 * square(x),如果创建了一个特征z = x ^ 2,则可以拟合线性回归:y = a * z + b,通过选择a = 5和b = 0)。
机器学习的主要障碍是特征工程这个步骤,这需要领域专家在进入训练过程之前就要找到非常重要的特征。特征工程步骤是要靠手动完成的,而且需要大量领域专业知识,因此它成为当今大多数机器学习任务的主要瓶颈。
换句话说,如果我们没有足够的处理能力和足够的数据,那么我们必须使用低功耗/更简单的模型,这就需要我们花费大量的时间和精力来创建合适的输入特征。这是大多数数据科学家今天花时间去做的地方。
神经网络的回归:
在大数据时代,云计算和大规模并行处理基础架构的共同发展,使得机器处理能力在二十一世纪初得到了极大的提升。我们不再局限于低功耗/简单的模型。例如,当今最流行的两种主流机器学习模型是随机森林和梯度提升树。尽管如此,两者都非常强大,并且提供了非线性模型拟合的训练数据,但数据科学家仍然需要仔细地创建特征以获得良好的性能。
与此同时,计算机科学家重新使用神经网络的许多层来完成这些人类模仿的任务。这给DNN(深度神经网络)带来了新的生机,并在图像分类和语音识别任务方面提供了重大突破。DNN的主要区别在于,你可以将原始信号(例如RGB像素值)直接输入DNN,而不需要创建任何域特定的输入功能。通过多层神经元(这就是为什么它被称为“深度”神经网络),DNN可以“自动”通过每一层产生适当的特征,最后提供一个非常好的预测。这极大地消除了寻找“特征工程”的麻烦,这是数据科学家们最喜欢看到的。
DNN也演变成许多不同的网络拓扑结构,所以有CNN(卷积神经网络),RNN(递归神经网络),LSTM(长期短期记忆),GAN(生成敌对网络),转移学习,注意模型(attention model)所有的这些被统称为深度学习(Deep Learning),它正在引起整个机器学习界的关注。
强化学习:
另一个关键组成部分是关于如何模仿一个人(或动物)的学习,设想感知/行为/奖励循环的非常自然的动物行为。一个人或者一个动物首先会通过感知他或者她所处的状态来了解环境。在此基础上,他或者她会选择一个“动作”,将他或者她带到另一个“状态”。那么他或她将获得“奖励”,循环重复,直到他或她消失。这种学习方式(称为强化学习)与传统监督机器学习的曲线拟合方法有很大不同。尤其是,强化学习学习得非常快,因为每一个新的反馈(例如执行一个行动并获得奖励)都被立即发送到影响随后的决定。
强化学习也提供了预测和优化的平滑整合,因为它在采取不同的行动时保持当前状态的信念和可能的转换概率,然后做出决定哪些行动可以导致最佳结果。
深度学习+强化学习= AI
与经典的ML技术相比,DL提供了一个更强大的预测模型,通常可以产生良好的预测结果。与经典优化模型相比,强化学习提供了更快的学习机制,并且更适应环境的变化。
机器学习 vs 深度学习
在深度探讨machine learning和data science的联系之前,这里简要地讨论一下machine learning 和deep learning。machine learning是一套算法,来训练数据集做预测或者采取行动以使得系统最优化。举例来说,supervised classification algorithms被用来根据历史数据将想要贷款的客户分成预期好的和预期差的(good or bad prospects)。对于给定的任务(比如监督聚类),需要的技术多种多样:naive Bayes、SVM、neural nets、ensembles、association rules、decision trees、logistic regression,或者是很多技术的组合。所有这些都是数据科学的子集。当这些算法自动化后,比如无人驾驶飞机或者无人驾驶汽车,这就叫AI了,或者说的具体一点,deep learning。如果采集的数据来自传感器并且通过互联网传播,那么这就是机器学习或数据科学或深度学习应用于物联网了。
有些人对深度学习有不同的定义,他们认为深度学习是更深层次的神经网络(一种机器学习的技术)。AI(Artificial Intelligence)是创建于20世纪60年代的计算机科学的一个子领域,是关于解决那些对人类来讲非常容易但是对计算机而言很难的任务。值得一提的是,所谓的strong AI可能可以做所有人类可以做的事情(可能除了纯粹的物理问题)。这是相当广泛的,包括各种各样的事情,比如做计划,在世界上到处溜达,识别物体和声音,说话,翻译,社交或者商业交易,还有创造性工作(比如写诗画画)等等。
NLP(Natural language processing)只是AI要处理的语言部分,尤其是写。
Machine learning是这样的一种情况:给出一些可以被以离散形式描述的AI问题(比如从一系列动作中选出对的那个),然后给定一堆外部世界的信息,在不需要程序员手动写程序的情况下选出那个“正确的”行为。通常情况需要借助外界的一些过程来判断这个动作对不对。在数学上,这就是函数:你给一些输入,然后你想要他处理一下得到正确的输出,所以整个问题就简化为用一些自动的方式建立这种数学函数模型。和AI区分一下:如果我写了一段特别机智的程序有着人类的行为,那这就可以是AI,但是除非它的参量都是自动从数据中学会的,否则就不是机器学习。
Deep learning是当下非常流行的机器学习的一种。它包含一种特殊的数学模型,可以想成是一种特定类型的简单块的组合(或者说是块的功能的组合),这些块可以进行调整来更好的预测最终结果。
原文:http://click.aliyun.com/m/1000308131/
更多技术干货敬请关注云栖社区知乎机构号:阿里云云栖社区 - 知乎 人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。
为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。
图一 人工智能的应用
人工智能:从概念提出到走向繁荣
1956年,几个计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。之后的几十年,人工智能一直在两极反转,或被称作人类文明耀眼未来的预言,或被当成技术疯子的狂想扔到垃圾堆里。直到2012年之前,这两种声音还在同时存在。
2012年以后,得益于数据量的上涨、运算力的提升和机器学习新算法(深度学习)的出现,人工智能开始大爆发。据领英近日发布的《全球AI领域人才报告》显示,截至2017年一季度,基于领英平台的全球AI(人工智能)领域技术人才数量超过190万,仅国内人工智能人才缺口达到500多万。
人工智能的研究领域也在不断扩大,图二展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。
图二 人工智能研究分支
但目前的科研工作都集中在弱人工智能这部分,并很有希望在近期取得重大突破,电影里的人工智能多半都是在描绘强人工智能,而这部分在目前的现实世界里难以真正实现(通常将人工智能分为弱人工智能和强人工智能,前者让机器具备观察和感知的能力,可以做到一定程度的理解和推理,而强人工智能让机器获得自适应能力,解决一些之前没有遇到过的问题)。
弱人工智能有希望取得突破,是如何实现的,“智能”又从何而来呢?这主要归功于一种实现人工智能的方法——机器学习。
机器学习:一种实现人工智能的方法
机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。
举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这是商城根据你往期的购物记录和冗长的收藏清单,识别出这其中哪些是你真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并鼓励产品消费。
机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。
传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。
深度学习:一种实现机器学习的技术
深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。
最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。
深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车,预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。
三者的区别和联系
机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。
图三 三者关系示意图
目前,业界有一种错误的较为普遍的意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。这种意识的产生主要是因为,当下深度学习在计算机视觉、自然语言处理领域的应用远超过传统的机器学习方法,并且媒体对深度学习进行了大肆夸大的报道。
深度学习,作为目前最热的机器学习方法,但并不意味着是机器学习的终点。起码目前存在以下问题:
1. 深度学习模型需要大量的训练数据,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题,此时深度学习方法无法入手,传统的机器学习方法就可以处理;
2. 有些领域,采用传统的简单的机器学习方法,可以很好地解决了,没必要非得用复杂的深度学习方法;
3. 深度学习的思想,来源于人脑的启发,但绝不是人脑的模拟,举个例子,给一个三四岁的小孩看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩也十有八九能做出那是一辆自行车的判断,也就是说,人类的学习过程往往不需要大规模的训练数据,而现在的深度学习方法显然不是对人脑的模拟。
深度学习大佬 Yoshua Bengio 在 Quora 上回答一个类似的问题时,有一段话讲得特别好,这里引用一下,以回答上述问题:
Science is NOT a battle, it is a collaboration. We all build on each other&#39;s ideas. Science is an act of love, not war. Love for the beauty in the world that surrounds us and love to share and build something together. That makes science a highly satisfying activity, emotionally speaking!这段话的大致意思是,科学不是战争而是合作,任何学科的发展从来都不是一条路走到黑,而是同行之间互相学习、互相借鉴、博采众长、相得益彰,站在巨人的肩膀上不断前行。机器学习的研究也是一样,你死我活那是邪教,开放包容才是正道。
结合机器学习2000年以来的发展,再来看Bengio的这段话,深有感触。进入21世纪,纵观机器学习发展历程,研究热点可以简单总结为2000-2006年的流形学习、2006年-2011年的稀疏学习、2012年至今的深度学习。未来哪种机器学习算法会成为热点呢?深度学习三大巨头之一吴恩达曾表示,“在继深度学习之后,迁移学习将引领下一波机器学习技术”。但最终机器学习的下一个热点是什么,谁又能说得准呢。
近期,深蓝学院推出『深度学习:从理论到实践』在线课程,将从基础的数学模型以及算法实现出发,详细讲解CNN、 RNN、 LSTM等常见的深度神经网络模型,以及在计算机视觉、自然语言处理等领域经典任务中的应用。详情如下:
深度学习理论与实践 - 深蓝学院 - 专注人工智能的在线教育<hr/>深蓝学院(https://www.shenlanxueyuan.com/)是专注于人工智能的在线教育平台,致力于构建前沿科技课程培养体系的业界标准,涵盖机器学习、计算机视觉、智能语音、智能机器人等领域。
页:
[1]