MATLAB统计工具箱中的基本统计命令.ppt
,统计工具箱中的基本统计命令,1.数据的录入、保存和调用,2.基本统计量,3.常见的概率分布函数,4.频 数 直 方 图 的 描 绘,5.参数估计,6.假设检验,7.综合实例,返回,一、数据的录入、保存和调用,例1 上海市区社会商品零售总额和全民所有制职工工资总额的数据如下:,统计工具箱中的基本统计命令,1年份数据以1为增量,用产生向量的方法输入.命令格式:x=a:h:b t=78:87,2分别以x和y代表变量职工工资总额和商品零售总额.x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,3将变量t、x、y的数据保存在文件data中.save data t x y,4进行统计分析时,调用数据文件data中的数据.load data,To MATLAB(txy),方法1,1输入矩阵:data=78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2将矩阵data的数据保存在文件data1中:save data1 data,3进行统计分析时,先用命令:load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵data的第一、二、三行的数据赋给变量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要调用矩阵data的第j列的数据,可用命令:data(:,j),方法2,To MATLAB(data),返回,二、基本统计量,对随机变量x,计算其基本统计量的命令如下:均值:mean(x)中位数:median(x)标准差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x),例 对例1中的职工工资总额x,可计算上述基本统计量.,To MATLAB(tjl),返回,三、常见概率分布的函数,MATLAB工具箱对每一种分布都提供5类函数,其命令字符为:概率密度:pdf 概率分布:cdf逆概率分布:inv 均值与方差:stat随机数生成:rnd,(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.),在MATLAB中输入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z),1密度函数:p=normpdf(x,mu,sigma)(当mu=0,sigma=1时可缺省),To MATLAB(liti2),如对均值为mu、标准差为sigma的正态分布,举例如下:,To MATLAB(liti3),3逆概率分布:x=norminv(P,mu,sigma).即求出x,使得PXx=P.此命令可用来求分位数.,2概率分布:P=normcdf(x,mu,sigma),To MATLAB(liti4),To MATLAB(liti5),4均值与方差:m,v=normstat(mu,sigma),例5 求正态分布N(3,52)的均值与方差.命令为:m,v=normstat(3,5)结果为:m=3,v=25,5随机数生成:normrnd(mu,sigma,m,n).产生mn阶的正态分布随机数矩阵.,例6 命令:M=normrnd(1 2 3;4 5 6,0.1,2,3)结果为:M=0.9567 2.0125 2.8854 3.8334 5.0288 6.1191,To MATLAB(liti6),此命令产生了23的正态分布随机数矩阵,各数分别服从分布:N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32).,返回,1给出数组data的频数表的命令为:N,X=hist(data,k)此命令将区间min(data),max(data)分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X.,2描绘数组data的频数直方图的命令为:hist(data,k),四、数 直 方 图 的 描 绘,返回,五、参数估计,1正态总体的参数估计,设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:muhat,sigmahat,muci,sigmaci=normfit(X,alpha),此命令在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值,muci是均值的区间估计,sigmaci是标准差的区间估计.,2其它分布的参数估计,有两种处理办法:一、取容量充分大的样本(n50),按中心极限定理,它近似地 服从正态分布;二、使用MATLAB工具箱中具有特定分布总体的估计命令.,(1)muhat,muci=expfit(X,alpha)在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计.(2)lambdahat,lambdaci=poissfit(X,alpha)在显著性水平alpha下,求泊松分布的数据X的参数的点估计及其区间估计.(3)phat,pci=weibfit(X,alpha)在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计.,返回,六、假设检验,在总体服从正态分布的情况下,可用以下命令进行假设检验.,1总体方差 已知时,总体均值的检验使用 z检验,h,sig,ci=ztest(x,m,sigma,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中sigma 为已知方差,alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail=0,检验假设“x 的均值等于 m”tail=1,检验假设“x 的均值大于 m”tail=-1,检验假设“x 的均值小于 m”tail的缺省值为 0,alpha的缺省值为 0.05.,返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.,2总体方差 未知时,总体均值的检验使用t 检验,h,sig,ci=ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail=0,检验假设“x 的均值等于 m”tail=1,检验假设“x 的均值大于 m”tail=-1,检验假设“x 的均值小于 m”tail的缺省值为 0,alpha的缺省值为 0.05.,返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.,3两总体均值的假设检验使用 t 检验,h,sig,ci=ttest2(x,y,alpha,tail)检验数据 x,y 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail=0,检验假设“x 的均值等于 y 的均值”tail=1,检验假设“x 的均值大于 y 的均值”tail=-1,检验假设“x 的均值小于 y 的均值”tail的缺省值为 0,alpha的缺省值为 0.05.,返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为与x与y均值差的的 1-alpha 置信区间.,4非参数检验:总体分布的检验,MATLAB工具箱提供了两个对总体分布进行检验的命令:,(1)h=normplot(x),(2)h=weibplot(x),此命令显示数据矩阵x的正态概率图.如果数据来自于正态分布,则图形显示出直线性形态.而其它概率分布函数显示出曲线形态.,此命令显示数据矩阵x的Weibull概率图.如果数据来自于Weibull分布,则图形将显示出直线性形态.而其它概率分布函数将显示出曲线形态.,返回,