【概述】以上四者的区别主要是要达成的目的不同,但达到目的的方法有很大重叠之处,比如【SVM,神经网络,Logistic回归,决策树、EM、HMM、贝叶斯网络、随机森林、LDA...】等算法在各个领域都有所使用。
【目的】
-
数据挖掘是用来 理解事物 的;
-
机器学习是用来 预测事物 的;
-
人工智能是用来 生成行动 的;
【人工智能】(Artificial Intelligence)
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
【通俗理解】:要让机器的行为看起来能够像人表现出来的行为那样,“有智慧”。
【本质上】:数据和模型为现有的问题提供解决方法。
【机器学习】(Machine Learning)
【解释】机器学习( ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
【补充】:M代表计算机程序(Computer Program),对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习。
【本质上的理解】:机器学习就是能够自动地从过往经验中学习知识,其主要功能是预测。
【另类理解】
-
机器学习应用在数据分析领域 = 数据挖掘
-
将机器学习应用在图像处理领域 = 计算机视觉
-
将机器学习应用在人脸识别领域 = 生物特征识别
-
【机器学习是解决人工智能问题的一种手段】
【应用】:数据挖掘、计算机视觉、自然语言处理、生物特征识别、语音、手写识别和机器人运用等。
深度学习(DL)
【概述】深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。
- 【深度学习本身是神经网络算法的衍生】
- 【区别】:深度学习
不全部包含于
机器学习;但是全部包含于神经网络算法
【发展历史】最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。
为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。
其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。
【应用】:无人驾驶汽车,预防性医疗保健;
【有待提升的地方】
- 深度学习模型需要大量的【训练数据】,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题(没有足够多的数据),此时深度学习方法无法入手,传统的机器学习方法就可以处理;
- 有些领域,采用传统的简单的机器学习方法,可以很好地解决了,没必要非得用复杂的深度学习方法;
- 深度学习的思想,来源于人脑的启发,但绝不是人脑的模拟,人脑不需要大量的数据训练支持,我们只要看过一张猫的图就认识了猫,而机器必须经过几百万张猫的图才能“认识”猫。(识别有待提高)。
【数据挖掘】
数据挖掘(Data mining)
又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
利用各种技术与统计方法,将大量的历史数据,进行整理分析,归纳与整合,是从海量数据中“挖掘”隐藏信息,如趋势、特征及相关的一种过程。
【服务】有目的的从现有的信息中提取数据的模式和模型,以用于未来机器学习和人工智能的数据使用。其核心目的是找到数据变量之间的关系。
【举个栗子】A 和 B 可能存在相关关系,但是它无法告诉你 A 和 B 存在什么相关关系,由此,我们通过数据挖掘去寻找关系。
【应用】:工作BI(商业智能)、数据分析、市场运营等。
【重点】
-
【数据挖掘不是一种用来证明假说的方法,而是用来构建各种各样的假说的方法。】
-
【统计学、数据库和人工智能共同构造了数据挖掘技术的三大支柱】
-
【数据挖掘的很多算法也来自机器学习但两者没有从属关系】:把数据挖掘理解为一种类型的工作(机器学习是帮助完成这个工作)