在离散型随机变量X的一切可能值中,各可能值与其对应概率的乘积之和称为该随机变量X的期望值 , 记作E(X)。比如有随机变量,取值依次为:2 , 2,2,4,5 。求其平均值:(2+2+2+4+5)/5 = 3 。
期望值也就是该随机变量总体的均值 。推导过程如下:
= (2+2+2+4+5)/5
= 1/5 2 3 + 4/5 + 5/5
= 3/5 2 + 1/5 4 + 1/5 5
= 0.6 2 + 0.2 4 + 0.2 5
= 60% 2 + 20% 4 + 20%*5
= 1.2 + 0.8 + 1
= 3
倒数第三步可以解释为值为2的数字出现的概率为60%,4的概率为20%,5的概率为20% 。所以E(X) = 60% 2 + 20% 4 + 20%*5 = μ = 3 。
0-1分布(两点分布) , 它的随机变量的取值为1或0 。即离散型随机变量X的概率分布为:P{X=0} = 1-p, P{X=1} = p,即:
则称随机变量X服从参数为p的0-1分布 , 记作X~B(1,p) 。
在生活中有很多例子服从两点分布,比如投资是否中标,新生婴儿是男孩还是女孩,检查产品是否合格等等 。
大家非常熟悉的抛硬币试验对应的分布就是二项分布 。抛硬币试验要么出现正面,要么就是反面,只包含这两个结果 。出现正面的次数是一个随机变量,这种随机变量所服从的概率分布通常称为 二项分布。
像抛硬币这类试验所具有的共同性质总结如下:(以抛硬币为例)
通常称具有上述特征的n次重复独立试验为n重伯努利试验 。简称伯努利试验或伯努利试验概型 。特别地 , 当试验次数为1时 , 二项分布服从0-1分布(两点分布) 。
举个栗子:抛3次均匀的硬币,求结果出现有2个正面的概率。
已知p = 0.5 (出现正面的概率),n = 3,k = 2
所以抛3次均匀的硬币,求结果出现有2个正面的概率为3/8 。
二项分布的期望值和方差 分别为:
泊松分布是用来描述在一 指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。生活中服从泊松分布的例子比如有每天房产中介接待的客户数,某微博每月出现服务器瘫痪的次数等等 。泊松分布的公式为 :
其中 λ 为给定的时间间隔内事件的平均数,λ = np 。e为一个数学常数 , 一个无限不循环小数,其值约为2.71828 。
泊松分布的期望值和方差 分别为:
使用Python绘制泊松分布的概率分布图:
因为连续型随机变量可以取某一区间或整个实数轴上的任意一个值,所以通常用一个函数f(x)来表示连续型随机变量 , 而f(x)就称为 概率密度函数。
概率密度函数f(x)具有如下性质 :
需要注意的是,f(x)不是一个概率,即f(x)≠ P(X = x)。在连续分布的情况下,随机变量X在a与b之间的概率可以写成:
正态分布(或高斯分布)是连续型随机变量的最重要也是最常见的分布,比如学生的考试成绩就呈现出正态分布的特征,大部分成绩集中在某个范围(比如60-80分),很小一部分往两端倾斜(比如50分以下和90多分以上) 。还有人的身高等等 。
正态分布的定义 :
如果随机变量X的概率密度为( -∞x+∞):
则称X服从正态分布,记作X~N(μ,σ2) 。其中-∞μ+∞,σ0,μ为随机变量X的均值,σ为随机变量X的标准差 。正态分布的分布函数
正态分布的图形特点 :
使用Python绘制正态分布的概率分布图:
正态分布有一个3σ准则,即数值分布在(μ-σ,μ+σ)中的概率为0.6827,分布在(μ-2σ,μ+2σ)中的概率为0.9545,分布在(μ-3σ,μ+3σ)中的概率为0.9973 , 也就是说大部分数值是分布在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性很小很?。?仅占不到0.3%,属于极个别的小概率事件,所以3σ准则可以用来检测异常值 。
- 使用redis实现分布式锁及其优化 redis分布式性能
- redis分布式锁死锁处理方案 redis宕机分布式锁
- mysqli获取所有数据 mysql的提取函数
- redis incr锁 redis加锁方式
- mysql 分组函数 mysql分组取数据
- 使用redis做分布式锁 redis设计分布式锁
- mongodb分布式集群搭建 mongodb具备优秀的分布式集群架构
- mysql分布式存储实现 分布式mysql集群部署
- mysql统计函数
- redission源码解析 redis源码分析分布式
