机器人与人工智能爱好者论坛

标题: 统计学里面有哪些数据分布? [打印本页]

作者: GY123456    时间: 2019-1-5 15:14
标题: 统计学里面有哪些数据分布?
一、正态分布
正态分布(Normal distribution):也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态分布也是机器学习中最常用的数据分布,其实在机器学习中我们通过数据进行训练,就是为了让我的模型来学习一个数据分布,然后再通过这个数据分布来预测新的数据。正态分布的实际应用例子有,考试成绩分布、身高体重、收入分布、金融应用等,据统计生活中有80%的数据分布都符合正态分布。



在机器学习中,我们很多时候都需要对数据做标准化处理,目的就是为了让数据符合0-1的正态分布(均值为0,方差为1)。
二、伯努利分布
伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况,为纪念瑞士科学家詹姆斯·伯努利(Jacob Bernoulli 或James Bernoulli)而命名。抛硬币的统计结果就是一个经典的伯努利分布。

三、更多的数据分布
除了正态分布和伯努利分布之外,还有均匀分布、指数分布、柯西分布等。
了解更多机器人问答,可以关注八斗问答







欢迎光临 机器人与人工智能爱好者论坛 (http://robot-ai.org/) Powered by Discuz! X3.2