机器人与人工智能爱好者论坛

 找回密码
 立即注册
查看: 19331|回复: 0
打印 上一主题 下一主题

能不能通俗地解释一下什么是机器学习?

[复制链接]

115

主题

116

帖子

392

积分

中级会员

Rank: 3Rank: 3

积分
392
跳转到指定楼层
楼主
发表于 2019-1-5 15:10:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
机器学习(machine learning):是一门多领域交叉学科,涵盖的范围也比较广涉及了概率论、统计学等多门学科。专门研究计算机怎样模拟或实现人的学习行为,它能够发现和挖掘数据所包含的潜在价值。机器学习已经成为了人工智能的一个分支,通过自学习算法,发现和挖掘数据潜在的规律,从而对未知的数据进行预测。机器学习已经广泛的运用在了,计算机科学研究、自然语言处理、机器视觉、语音、游戏等。机器学习的方法主要分为三种,监督学习(supervised learning)、无监督学习(unsupervised learning)、强化学习(reinforcement learning)。应用较多的有监督学习,下面我就简单的介绍一下这三种算法。

一、监督学习(supervised learning)
下面用一个简单的结构图来展示一下监督学习的系统构成

监督学习主要包括两个大类:分类算法回归算法监督学习最突出的特点就是,训练的数据必须要是有类标的。监督学习可以从带有类标的训练数据中,来学习数据中包含的一些特征,然后通过这些提取数据中的这些特征来对数据进行预测。
1、分类
比如说,你想训练一个系统能够区分猫和狗,那么你就需要事先准备好大量的猫和狗的照片,并标记哪张照片是猫哪张照片是狗。然后在通过反向传播,梯度下降来更新模型参数,最终系统会通过你给的照片来记住猫和狗的特征,从而来区分猫和狗。为了表示分类的效果,我们用一个二维的坐标系来表示,下图中的直线就表示分割平面,也就是我们系统所需要学习的,从下图可以看出这条直线能够很好的区分两类不同的数据。

2、回归
分类系统所预测的值是一个离散的结果,而回归系统的预测值是一个连续的数值,可以被应用在房间预测模型、股价等。系统通过大量的训练数据,来从中寻找自变量(输入)和因变量(输出)的关系,它们之间的关系可能是线性也可能是非线性的,系统会学习到输入与输出之间的映射的关系(y=f(x)),然后再根据输入数据来预测输出。我还记得在高中的物理实验探讨下降高度和时间的关系,其实我们有接触过这种思想,我们首先通过设定不同的下降高度,然后再记录小铁球的下降时间,通过记录很多的h和t,然后再通过最小二乘法来绘制下降高度(h)和下降时间(t)的曲线,最终可以得到近似于h=1/2*g*t^2(初速度为0)。下面我们还是在二维平面中,来举一个回归的例子

从上面的图可以发现,其实最终我们只需要知道直线的斜率和截距就可以确定这条直线。所以说,通过大量的数据,最后系统学到的就是这两个参数的值。

二、强化学习
强化学习是通过构建一个系统(agent),在与环境(environment)交互的过程中提高系统的性能。环境的当前状态信息会包括一个反馈信号,我们可以通过这个反馈信号对当前的系统进行评价改善系统。通过与环境的交互,agent可以通过强化学习来得到一系列行为,通过对激励系统的设计使得正向反馈最大。强化学习经常被使用在游戏领域,比如围棋比赛,系统会根据当前棋盘上的局态来决定下一步的位置,通过游戏结束时的胜负来作为激励信号。

其实可以将强化学习的过程理解为一个训练狗的过程,比如:你想要训练这只狗能够听懂你的指定,刚开始的时候狗肯定是不会听你的话的,当它不听你的话时候,你就打它一顿(不听话的惩罚),它听话的时候你就给他吃的(听话的奖励),随着训练时间的越来越久,它会越来越听你的话,这就是整个强化学习系统的工作过程。

三、无监督学习
无监督学习所处理的是无类标或者数据的总体趋势不明朗,通过无监督学习我们可以将这些不知道类标和输出标量以及没有反馈信号的情况下,来寻找数据中所潜在的规律。无监督学习可以分为聚类和降维。
1、聚类
聚类属于一种探索性的数据分析技术,在没有任何已知信息(类标、输出变量、反馈信号)的情况下,我们可以将数据划分为簇。在分析数据的时候,所划分的每一个簇中的数据都有一定的相似度,而不同簇之间具有较大的区别。

2、降维
在实际情况中所处理的数据都是高维的(成百上千),那么这将会导致我们每次所处理的数据量是非常的庞大,而存储空间通常都是有限的。无监督的降维技术经常被使用在数据特征的预处理中,通过降维技术我们可以去掉数据中的噪声,以及不同维度中所存在的相似特征,最大程度上在保留数据的重要信息情况下将数据压缩到一个低维的空间中,但同时也还是会降低算法的准确性。降维技术通常被应用在数据压缩和信息检索中,通过降维技术来压缩数据可以节省大量的空间。在信息检索中,由于信息量非常巨大,我们可以通过降维技术来提取数据中最主要的特征,然后再进行检索,可以大大提高效率和检索速度。ROSoft YaHei, Source Han Sans SC, Noto Sans CJK SC, WenQuanYi Micro Hei, sans-serif">了解更多机器学习,关注八斗问答
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

QQ|Archiver|手机版|小黑屋|陕ICP备15012670号-1    

GMT+8, 2024-11-25 14:22 , Processed in 0.058945 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表