三、无监督学习
无监督学习所处理的是无类标或者数据的总体趋势不明朗,通过无监督学习我们可以将这些不知道类标和输出标量以及没有反馈信号的情况下,来寻找数据中所潜在的规律。无监督学习可以分为聚类和降维。 1、聚类
聚类属于一种探索性的数据分析技术,在没有任何已知信息(类标、输出变量、反馈信号)的情况下,我们可以将数据划分为簇。在分析数据的时候,所划分的每一个簇中的数据都有一定的相似度,而不同簇之间具有较大的区别。 2、降维
在实际情况中所处理的数据都是高维的(成百上千),那么这将会导致我们每次所处理的数据量是非常的庞大,而存储空间通常都是有限的。无监督的降维技术经常被使用在数据特征的预处理中,通过降维技术我们可以去掉数据中的噪声,以及不同维度中所存在的相似特征,最大程度上在保留数据的重要信息情况下将数据压缩到一个低维的空间中,但同时也还是会降低算法的准确性。降维技术通常被应用在数据压缩和信息检索中,通过降维技术来压缩数据可以节省大量的空间。在信息检索中,由于信息量非常巨大,我们可以通过降维技术来提取数据中最主要的特征,然后再进行检索,可以大大提高效率和检索速度。ROSoft YaHei, Source Han Sans SC, Noto Sans CJK SC, WenQuanYi Micro Hei, sans-serif">了解更多机器学习,关注八斗问答