正态分布的定义 :
如果随机变量X的概率密度为( -∞x+∞):
则称X服从正态分布,记作X~N(μ,σ2) 。其中-∞μ+∞ , σ0,μ为随机变量X的均值,σ为随机变量X的标准差 。正态分布的分布函数
正态分布的图形特点 :
使用Python绘制正态分布的概率分布图:
正态分布有一个3σ准则 , 即数值分布在(μ-σ,μ+σ)中的概率为0.6827,分布在(μ-2σ,μ+2σ)中的概率为0.9545,分布在(μ-3σ,μ+3σ)中的概率为0.9973,也就是说大部分数值是分布在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性很小很?。稣疾坏?.3%,属于极个别的小概率事件,所以3σ准则可以用来检测异常值 。
当μ=0,σ=1时,有
此时的正态分布N(0,1) 称为标准正态分布 。因为μ,σ都是确定的取值,所以其对应的概率密度曲线是一条 形态固定 的曲线 。
对标准正态分布 , 通常用φ(x)表示概率密度函数 , 用Φ(x)表示分布函数:
假设有一次物理考试特别难,满分100分,全班只有大概20个人及格 。与此同时语文考试很简单 , 全班绝大部分都考了90分以上 。小明的物理和语文分别考了60分和80分,python绘制密度函数他回家后告诉家长 , 这时家长能仅仅从两科科目的分值直接判断出这次小明的语文成绩要比物理好很多吗python绘制密度函数?如果不能 , 应该如何判断呢?此时Z-score就派上用场了 。Z-Score的计算定义 :
即 将随机变量X先减去总体样本均值,再除以总体样本标准差就得到标准分数啦 。如果X低于平均值,则Z为负数,反之为正数。通过计算标准分数,可以将任何一个一般的正态分布转化为标准正态分布 。
小明家长从老师那得知物理的全班平均成绩为40分,标准差为10,而语文的平均成绩为92分,标准差为4 。分别计算两科成绩的标准分数:
物理:标准分数 = (60-40)/10 = 2
语文:标准分数 = (85-95)/4 = -2.5
从计算结果来看,说明这次考试小明的物理成绩在全部同学中算是考得很不错的,而语文考得很差 。
指数分布可能容易和前面的泊松分布混淆,泊松分布强调的是某段时间内随机事件发生的次数的概率分布,而指数分布说的是 随机事件发生的时间间隔 的概率分布 。比如一班地铁进站的间隔时间 。如果随机变量X的概率密度为:
则称X服从指数分布,其中的参数λ0 。对应的分布函数 为:
均匀分布的期望值和方差 分别为:
使用Python绘制指数分布的概率分布图:
均匀分布有两种,分为 离散型均匀分布和连续型均匀分布。其中离散型均匀分布最常见的例子就是抛掷骰子啦 。抛掷骰子出现的点数就是一个离散型随机变量 , 点数可能有1,2,3,4,5,6 。每个数出现的概率都是1/6 。
设连续型随机变量X具有概率密度函数:
则称X服从区间(a,b)上的均匀分布 。X在等长度的子区间内取值的概率相同 。对应的分布函数为:
f(x)和F(x)的图形分别如下图所示:
均匀分布的期望值和方差 分别为:
如何在Python中实现这五类强大的概率分布R编程语言已经成为统计分析中的事实标准 。但在这篇文章中python绘制密度函数,我将告诉你在Python中实现统计学概念会是如此容易 。我要使用Python实现一些离散和连续的概率分布 。虽然我不会讨论这些分布的数学细节python绘制密度函数,但我会以链接的方式给你一些学习这些统计学概念的好资料 。在讨论这些概率分布之前python绘制密度函数,我想简单说说什么是随机变量(random variable) 。随机变量是对一次试验结果的量化 。
- mongdb python pythonmongodb操作
- pytho操作mysql
- python 连接mongo python操作mongodb用户连接
- python爬取数据存入mongodb 爬取数据到mongodb
- 将数据存到数据库 python 将数据存到redis
- mongodb python教程 mongodb安装爬虫
- 传智播客python百度云 传智播客百度云redis
- python类序列化 类序列化 MongoDB
- abs函数python abs函数mysql
- python redis封装 redis常用封装
