什么是机器学习,机器学习概述(新手必看)
机器学习(machine learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,简单理解,就是通过训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测,如下图所示。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。
之所以称为监督学习,是因为这类算法必须知道预测什么。监督学习又分为分类和回归两种类型:
无监督学习常用于聚类分析,如客户分群、因子降维等。例如,RFM 模型的使用,通过客户的销售行为(消费次数、最近消费时间、消费金额)指标对客户数据进行聚类。除此之外,无监督学习也适用于降维。
无监督学习与监督学习相比,其优势在于它的数据不需要人工打标记,数据获取成本低。
实际中的强化学习例子有很多,例如有名的 AlphaGo(机器第一次在围棋场上战胜人类高手),让计算机自己学着玩经典游戏 Atari。这些都是让计算机在不断的尝试中更新自己的行为准则,从而一步步学会如何下好围棋,如何操控游戏得到高分。
人工智能、机器学习、深度学习关系如下图所示:
深度学习归根结底也是机器学习,不过它不同于监督学习、半监督学习、无监督学习、强化学习的这种分类方法,它是另一种分类方法,基于算法神经网络的深度,可以分成浅层学习算法和深度学习算法。
浅层学习算法主要是对一些结构化数据、半结构化数据场景的预测,深度学习主要解决复杂的场景,例如图像、文本、语音识别与分析等。
图像识别和人脸检测的流行用例是自动好友标记建议,如 Facebook 提供了自动好友标记建议的功能。每当上传与 Facebook 好友的照片时,都会自动收到带有姓名的标记建议,这背后的技术是机器学习的人脸检测和识别算法。它基于名为“Deep Face”的 Facebook 项目,负责图片中的人脸识别和人物识别。
语音识别是将语音指令转换为文字的过程,也称为“语音转文字”或“计算机语音识别”。目前,机器学习算法被各种语音识别应用广泛使用,如百度助手、一些语音输入法等。
车辆的实时位置来自地图应用程序和传感器,每个使用手机地图的人都在帮助这个应用程序变得更好,因为它能从用户那里获取信息并将其发送回其数据库以提高性能。
例如,当在京东上搜索某种产品时,我们会在某浏览器上上网时收到同一产品的广告,这是因为机器学习。淘宝使用各种机器学习算法了解用户的兴趣,并根据客户的兴趣推荐产品。类似地,当使用淘宝购物时,我们会找到一些关于娱乐系列、电影等的推荐,这也是在机器学习的帮助下完成的。
很多汽车制造公司正在开发自动驾驶汽车,它使用无监督学习方法训练汽车模型,使其在驾驶时能自动检测人和物体。
每当我们进行一些在线交易时,欺诈交易可能会以多种方式发生,例如假账户、假身份证和在交易过程中偷钱。因此,为了检测到这一点,前馈神经网络通过检查它是真实交易还是欺诈交易来帮助我们免受欺诈。
在股票市场中,股票的涨跌风险总是存在的,因此对于这个机器学习的长短期记忆神经网络用于股票市场趋势的预测。
机器学习的图像识别技术有助于轻松发现脑肿瘤和其他脑相关疾病。
自动翻译背后的技术是一种序列到序列学习算法,它与图像识别一起使用,将文本从一种语言翻译成另一种语言。

机器学习是人工智能的核心,是使计算机具有智能的根本途径,它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。
机器学习分类
机器学习可分为监督学习、无监督学习、半监督学习以及强化学习。1) 监督学习
监督学习是给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。比如预测明天下雨的概率或者对投票者按照兴趣进行分组。之所以称为监督学习,是因为这类算法必须知道预测什么。监督学习又分为分类和回归两种类型:
- 例如,根据 6 年的天气预报信息进行学习后,将温度作为输入得到下雨或不下雨的输出,就是分类;
- 回归是用于预测数值型数据,例如根据 6 年的天气预报信息预测是否下雨的一个概率值。
2) 无监督学习
无监督学习跟监督学习的区别就是选取的样本数据无须有目标值,无须分析这些数据对某些结果的影响,只是分析这些数据内在的规律。无监督学习常用于聚类分析,如客户分群、因子降维等。例如,RFM 模型的使用,通过客户的销售行为(消费次数、最近消费时间、消费金额)指标对客户数据进行聚类。除此之外,无监督学习也适用于降维。
无监督学习与监督学习相比,其优势在于它的数据不需要人工打标记,数据获取成本低。
3) 半监督学习
半监督学习是监督学习和无监督学习相互结合的一种学习方法,通过半监督学习的方法可以实现分类、回归、聚类的结合使用:- 半监督分类:在无类标签的样例的帮助下训练有类标签的样本,获得比只用有类标签的样本训练更优的分类;
- 半监督回归:在无输出的输入的帮助下训练有输出的输入,获得比只用有输出的输入训练得到的回归器性能更好的回归;
- 半监督聚类:在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇,提高聚类方法的精度;
- 半监督降维:在有类标签的样本的信息帮助下找到高维输入数据的低维结构,同时保持原始高维数据和成对约束的结构不变。
4) 强化学习
强化学习是一类算法,让计算机实现从一开始什么都不懂,脑袋里没有一点想法,通过不断地尝试,从错误中学习,最后找到规律,达到目的,这就是一个完整的强化学习过程。实际中的强化学习例子有很多,例如有名的 AlphaGo(机器第一次在围棋场上战胜人类高手),让计算机自己学着玩经典游戏 Atari。这些都是让计算机在不断的尝试中更新自己的行为准则,从而一步步学会如何下好围棋,如何操控游戏得到高分。
深度学习
深度学习是目前关注度很高的一类算法,深度学习(deep learning, DL)属于机器学习的子类。它的灵感来源于人类大脑的工作方式,是利用深度神经网络来解决特征表达的一种学习过程。人工智能、机器学习、深度学习关系如下图所示:

深度学习归根结底也是机器学习,不过它不同于监督学习、半监督学习、无监督学习、强化学习的这种分类方法,它是另一种分类方法,基于算法神经网络的深度,可以分成浅层学习算法和深度学习算法。
浅层学习算法主要是对一些结构化数据、半结构化数据场景的预测,深度学习主要解决复杂的场景,例如图像、文本、语音识别与分析等。
机器学习的应用
1) 图像识别
图像识别是机器学习最常见的应用之一,用于识别物体、人物、地点、数字图像等。图像识别和人脸检测的流行用例是自动好友标记建议,如 Facebook 提供了自动好友标记建议的功能。每当上传与 Facebook 好友的照片时,都会自动收到带有姓名的标记建议,这背后的技术是机器学习的人脸检测和识别算法。它基于名为“Deep Face”的 Facebook 项目,负责图片中的人脸识别和人物识别。
2) 语音识别
在使用各种搜索软件时,有一个“通过语音搜索”的选项,它属于语音识别,是机器学习的一个流行应用。语音识别是将语音指令转换为文字的过程,也称为“语音转文字”或“计算机语音识别”。目前,机器学习算法被各种语音识别应用广泛使用,如百度助手、一些语音输入法等。
3) 交通预测
如果我们想去一个新的地方,会借助手机地图,它会向我们显示最短路线的正确路径并预测交通状况(如交通是否畅通、缓慢行驶或严重拥堵)。车辆的实时位置来自地图应用程序和传感器,每个使用手机地图的人都在帮助这个应用程序变得更好,因为它能从用户那里获取信息并将其发送回其数据库以提高性能。
4) 产品推荐
机器学习被京东、淘宝等各种电子商务和娱乐公司广泛用于向用户推荐产品。例如,当在京东上搜索某种产品时,我们会在某浏览器上上网时收到同一产品的广告,这是因为机器学习。淘宝使用各种机器学习算法了解用户的兴趣,并根据客户的兴趣推荐产品。类似地,当使用淘宝购物时,我们会找到一些关于娱乐系列、电影等的推荐,这也是在机器学习的帮助下完成的。
5) 自动驾驶汽车
机器学习在自动驾驶汽车中发挥着重要作用。很多汽车制造公司正在开发自动驾驶汽车,它使用无监督学习方法训练汽车模型,使其在驾驶时能自动检测人和物体。
6) 垃圾邮件和恶意软件过滤
每当我们收到一封新电子邮件时,它都会被自动过滤为重要邮件、正常邮件和垃圾邮件。我们总是会在收件箱中收到一封带有重要符号的重要邮件,垃圾邮件箱中也会有垃圾邮件,这背后的技术是机器学习。7) 虚拟个人助理
我们有各种虚拟个人助理,例如 Cortana、Siri。顾名思义,它们可以帮助我们使用语音指令查找信息,这些助手可以通过我们的语音指令以各种方式帮助我们,例如播放音乐、打电话给某人、打开电子邮件、安排约会等。这些虚拟助手使用机器学习算法作为重要组成部分。8) 在线欺诈检测
机器学习通过检测欺诈交易使我们的在线交易安全可靠。每当我们进行一些在线交易时,欺诈交易可能会以多种方式发生,例如假账户、假身份证和在交易过程中偷钱。因此,为了检测到这一点,前馈神经网络通过检查它是真实交易还是欺诈交易来帮助我们免受欺诈。
9) 股市交易
机器学习广泛用于股票市场交易。在股票市场中,股票的涨跌风险总是存在的,因此对于这个机器学习的长短期记忆神经网络用于股票市场趋势的预测。
10) 医学诊断
在医学中,机器学习用于疾病诊断。有了这个,医疗技术发展得非常快,并且能够建立可以预测大脑中病变的确切位置的 3D 模型。机器学习的图像识别技术有助于轻松发现脑肿瘤和其他脑相关疾病。
11) 自动语言翻译
当我们到国外旅游,但并不懂该国的语言时,机器学习会通过将文本转换为我们已知的语言来帮助我们。自动翻译背后的技术是一种序列到序列学习算法,它与图像识别一起使用,将文本从一种语言翻译成另一种语言。