haihongyuan.com
海量文库 文档专家
全站搜索:
您现在的位置:首页 > 初中教育 > 初中数学初中数学

蓝皮概率论讲义(18-23页)

发布时间:2014-01-03 14:45:39  

《概率统计》讲义 第18页

第七章 数理统计的若干基本概念及基本结论

一、几个基本概念

若我们要研究某类(或某个)事物在某一方面的特性,而此特性可以用一个随机变量的概率分布 或数字特征来表示,这个随机变量就称为总体,通常用X表示。

设对X进行了n次独立观察,得到了X的n个具体取值:(X1,X2,?,Xn) (X1,X2,?,Xn)n

共同的分布;②X1,X2,?,Xn相互独立。

也简称为样本。

数理统计的基本任务就是:研究如何进行统计推断,即根据样本观察值(x1,x2,?,xn),对X的 概率分布或数字特征进行推断。

设Y=g(X1,X2,?,Xn)的表达式中不含有任何未知参数,是个随机变量,则称Y是 其观察值记为g(x1,x2,?,xn)。 今后(X1,X2,?,Xn)总表示(来自XX1,X2,?,Xn皆与X具有 抽样之后,(X1,X2,?,Xn)的值就确定了,记为(x1,x2,?,xn)

二、常用的统计量

设X为总体,(X1,X2,?,Xn)是来自X的简单随机样本,样本观察值为(x1,x2,?,xn)。

1n1n2①样本均值:X=∑Xi ②样本方差:Sn=∑(Xi?X)2 ③样本标准差:Sn>0 i=1i=1

1n

④修正样本方差:S=(Xi?X)2 ⑤修正样本标准差:S>0 ∑n?1i=12

1n1nrr⑥样本的r阶原点矩:Ar=∑Xi ⑦样本的r阶中心矩:Br=∑(Xi?X) i=1i=1

1n1n1n222以上①-⑤的观察值:=∑xi,sn=∑(xi?),sn,s=(xi?)2,s。 ∑ni=1ni=1n?1i=1

1n22注:S,Sn,S,S的大小都反映了样本值的分散程度大小。不难证明:S=∑Xi?X。 i=12n22n

三、常用统计量的数字特征

设X为总体,(X1,X2,?,Xn)是来自X的简单随机样本,X,Sn2,S2的含义如上所述,则有:

证明:EX=E??X1++Xn??X1++Xn?EX1++EXnn?EX==EX, DX=D =???????

DX1++DXnn?DXDX2?X12++Xn22?EX12++EXn22===, ES=E=?EX?X?n?22nn??

2n?EX2DXn?1=?EX=(DX+E2X)?(DX+E2X)=(DX+E2X)?(+E2X)=DX, nn?n2?ES2=E?Sn?=ESn2=DX。 ?n?1?n?1

《概率统计》讲义 第19页

四、数理统计中的常用分布

1.正态分布:以前已作详细介绍。

2.χ2分布:设Z=X1+X2+?+Xn,其中X1,X2,?,Xn相互独立,且都服从于标准正态分布, 222

则称Z服从自由度为n的χ2分布,记为Z~χ2(n)。

3.t

分布:设Z=,其中X~N(0,1),Y~χ2(n),而X与Y相互独立,则称Z服从自由度 X/n1,其中X~χ2(n1),Y~χ2(n2),而X与Y相互独立,则称Z服从自由度 Y/n2为n的t分布,记为Z~t(n)。 4.F分布:设Z=

为n1,n2的F分布,记为Z~F(n1,n2)。

“上α分位点” 以下是几种常用分布的密度函数图像,以及它们的“上α分位点”的记号及含义。

也称为“上100α百分位点”。

2注:①uα、χα(n)、tα(n)、Fα(n1,n2)的值都可以根据α及自由度,查书末的数学用表得到。

②可以证明:Fα(n1,n2)=1/F1?α(n2,n1)。

五、正态总体的抽样分布

设X表示总体,(X1,X2,?,Xn)为来自X的简单随机样本,Y=g(X1,X2,?,Xn)是个统计量, 则Y的分布称为抽样分布。有时虽然Y=g(X1,X2,?,Xn)含有未知参数,它的分布也称为抽样分布。 为了研究的方便,以下我们在X服从于正态分布的前提下,研究Y的分布。

上述结论①是P.157定理1的特例,②的证明不作要求,③由样本均值与样本方差的含义不难理解, ④的证明见P.163上。典型例题:课本P.163例3。

《概率统计》讲义 第20页

第八章 参数估计

在本章中我们用θ表示与总体X有关的某未知参数。θ可能是X的某个数字特征,或者是X的分布列 或密度函数中的某未知常数。本章的任务是研究如何根据抽样所得的样本观察值(x1,x2,?,xn),对θ进行 估计。估计θ的方法有两大类:点估计,即估计θ等于多少;区间估计,即估计θ位于什么区间内。

第一节 点估计

一、点估计的概念与步骤:

设θ是与总体X有关的某个未知参数,可以按照下述步骤对θ进行估计:第一步:建立θ的估计量: ?=g(X,X,?,X),是个统计量。这一步是关键。建立了待估参数θ的估计量,也就制定了对θ进行 θ12n

?=g(X,X,?,X), 估计的方案。第二步:对X进行抽样,将所得的样本观察值(x,x,?,x)代入θ12n12n

?的观察值,作为θ的估计值。 求得θ

建立估计量的具体方法有“矩法”及“最大似然法”,下面分别介绍。在以下论述中,μ,σ2,σ,θ等 都表示未知常数,这些记号“戴帽子”表示对这些常数建立的估计量,是随机变量。

二、点估计的矩法(又称数字特征法):

, 设X表示总体,(X1,X2,?,Xn)是来自X的简单随机样本。根据辛钦大数定律(见课本P.138)

X1k+X2k+?+Xnk可以用估计EXk,即 n

设θ是与X有关的某未知参数,按上述思想建立的θ的估计量称为θ的矩估计量(简称矩估计)。

?=X。 ②若θ=DX,则θ?=S2。 具体做法: ①若θ=EX,则θn

?=f(X)。 ④若θ=f(EX,DX),则θ?=f(X,S2)。 ③若θ=f(EX),则θn

⑤若θ=g(m1,m2,?,mk),其中mk表示总体的k阶原点矩,

?=g(A,A,?,A),其中A表示样本的k阶原点矩。 则θ12kk

典型例题:课本P.186第1、4题。 补充例题:设X~B(m,p),求m与p的矩估计。

注:θ的矩估计可能不唯一,见P.168下所述。这是矩法的缺点之一。

三、点估计的最大似然法:

最大似然法的基本思想:一个事件既然已经发生了,它发生的可能性就不会太小。可通过下例理解: 例:设X~?,0<θ<1。①若对X进行8次独立观察,得到样本值(1,1,0,1,1,0,1,0), ???1θθ??01?

试估计θ的值。②若对X进行了n次独立观察,得到样本值(x1,x2,?,xn),试建立θ的估计量。

35解:①得到样本(1,1,0,1,1,0,1,0)的概率是:L(θ)=(1?θ)θ,0<θ<1。既然得到了此样本,

就有理由认为L(θ)比较大。不难求出:当θ=55时,L(θ)最大。因此估计θ=。 88

②得到样本(x1,x2,?,xn)的概率是L(x1,x2,?,xn;θ)=P(X=x1)P(X=x2)??P(X=xn)

??x1?xx+x+??+xnn?x?x??xnx1?xx1?x(1?θ)12=θ1(1?θ)1?θ2(1?θ)2????θn(1?θ)n=θ12。

x++xn上述函数简记为L(θ)。用先取对数再求导的方法,可以求出L(θ)的最大值点为:θ=1。 x++xn?=X1+X2+?+Xn=X。 因此估计θ=1。从而θ的估计量为:θ

《概率统计》讲义 第21页

一般地,设θ是与总体X有关的某未知参数,用最大似然法建立θ的估计量的基本步骤是:

第一步:建立θ的似然函数。假设对X进行了n次独立观察,得到样本观察值:(x1,x2,?,xn), 我们要分析得到此样本的可能性大小:L(x1,x2,?,xn;θ)。

如果X是离散型随机变量,则:L(x1,x2,?,xn;θ)=P(X=x1)P(X=x2)??P(X=xn)。 如果X是连续型随机变量,密度函数为f(x),则L(x1,x2,?,xn;θ)=f(x1)f(x2)??f(xn)。 L(x1,x2,?,xn;θ)可以简记为L(θ),称为θ的似然函数。应当明确其定义域,假设是区间I。 第二步:求似然函数的最大值点。若求出了L(θ)在区间I内的最大值点是θ=g(x1,x2,?,xn), ?=g(X1,X2,?,Xn)。这样就建立了θ的简称MLE。 则:θ

?θxθ?1,0<x<1,(θ>0) 求θ的最大似然估计。 典型例题:设fX(x)=?其它,?0,

解:θ的似然函数是:L(x1,x2,?,xn;θ)=θx1θ?1?θx2θ?1???θxnθ?1=θ(x1x2?xn)θ?1,θ>0。 要想求L(θ)的最大值点,我们只要求出lnL(θ)的最大值点。lnL(θ)=nlnθ+(θ?1)ln(x1x2?xn), ndndnlnL(θ)=+ln(x1x2?xn)。令lnL(θ)=0,得θ=?,此即L(θ)的最大值点。 dθθdθln(x1x2xn)

n?=?故θ的最大似然估计量是:θ。 (另一典型例题见课本P.171例7) ln(X1X2Xn)

通过实例可以看出,对于一个待估参数,分别使用矩法与最大似然法建立的估计量往往是不同的。

四、估计量的评价标准:

?=g(X1,X2,?,Xn)是对θ建立的估计量。若Eθ?=θ,称θ?为θ的无偏估计量。 设θ是待估参数,θ

?与θ?都是θ的无偏估计量,而Dθ?<Dθ?,则称θ?较θ?有效。不难理解,要想一个估计量代表一个 若θ121212

比较好的估计方案,这个估计量应当是无偏的,并且应当是尽可能有效的。

由上章知识可以知道:若X为总体,则:X是EX的无偏估计,样本容量越大,该估计越有效。 Sn2不是DX的无偏估计,S2是DX的无偏估计。

第二节 区间估计

一、对总体X的未知参数θ进行区间估计的基本步骤:

1.确定一个置信度1?α,其中0<α<1,α是个小正数。

2.寻找统计量=g(X1,X2,?,Xn)及=h(X1,X2,?,Xn),满足:P{θ∈(,)}=1?α。

3.抽样,根据样本观察值(x1,x2,?,xn),求得(θ,θ)的观察区间,作为θ的估计区间。

第2步是关键,因为它给出了对θ进行区间估计的方案,并对此方案的可靠性进行了分析。(θ,θ) 称为“θ的置信度为1?α的置信区间”,θ与θ分别称为θ的“置信下限”与“置信上限”。

估计的可靠程度与精确程度分别由1?α及E(θ?θ)的大小来体现,但两者往往难以同时兼顾。 注:“置信度”也称“置信水平”,上述(θ,θ)也可简称“θ的1?α置信区间”。

《概率统计》讲义 第22页

二、关于区间估计的常用结论:重点掌握以下三个:(应当会证明)

22(1)若X~N(μ,σ),其中σ已知,则μ的置信水平为1?α的置信区间是:

??X?,X+αα??。 证明:见P.178例1。 典型例题:P.188第16题。

??

22(2)若X~N(μ,σ),其中σ未知,则μ的置信水平为1?α的置信区间是:

??X?(n?1),X+(n?1)αα??。 证明:见P.179下。 典型例题:P.188第20题。

??

(3)若X~N(μ,σ2),其中μ未知,则σ2的置信水平为1?α的置信区间是:

?(n?1)S2(n?1)S2??2?。 证明:见P.180之(4)。 典型例题:P.188第22题。 ?χ(n?1)χ12?α(n?1)???

第九章 假设检验

在本章中,我们用H0表示与总体X有关的一个假设,它可能正确也可能不正确。本章的基本任务是: 研究如何根据样本值(x1,x2,?,xn)所提供的信息,来决定对H0的取舍。

一、假设检验的基本思想与基本步骤:

假设检验的基本思想是:我们可以认为小概率事件在一次观察或试验中不会发生。尽管这样判断可能 出错,但出错的可能性很小。此原理称为“小概率原理”。我们通过下例理解。

典型例题:某茶厂用机器包装茶叶,每袋茶叶标重500克。由以往经验知道,每袋茶叶的重量X服从 正态分布。每天开工后,应按时检查机器工作是否正常(也就是要检查EX是否为500克)。某日开工后,

,求得:x=499,

随机地抽取机器包装好的10袋茶叶,测得它们的重量分别为x1,x2,?,x10(单位:克)

sn==16。问是否可认为当天该机器工作正常(取显著性水平α=0.05进行计算)。 解:(一)设X表示“当天机器所装茶叶包的重量”,则根据题意,X~N(μ,σ2),且σ未知。 需要检验的假设为:H0:μ=μ0=500。

(二)若H0成立,则由正态总体抽样分布的有关结论,X?μ0

Sn/n?1~t(n?1)?Y=X?500~t(9) Sn/3

?P{Y<?t0.025(9)或Y>t0.025(9)}=0.05?P{Y<?2.2622或Y>2.2622}=0.05。这样得到一个 小概率事件:A={Y<?2.2622或Y>2.2622}。根据小概率原理,我们认为一次抽样不会使A发生。

(三)现在,具体的抽样结果是:Y=x?500499?5003==?=?0.1875。显然,小概率 sn/316/316

事件A没有发生,是正常现象。故我们接受H0,也就是认为当天机器工作正常。

注:若在上例中算出了Y=2.3,则应当拒绝H0,也就是认为当天机器工作不正常。

《概率统计》讲义 第23页

通过上例,我们可以总结出假设检验的基本步骤:

1.明确:对总体X已知什么,要检验的假设H0是什么,并要规定一个显著性水平α(是个小正数)。

2.经过理论上的推导,得知:当H0成立时,P{Y∈W}=α(其中Y是个统计量,W是个区间)。 这样便得到一个H0成立时的小概率事件{Y∈W}。根据小概率原理,认为一次抽样不会使{Y∈W}发生。 这样就得到了对H0进行检验的方案,检验方案由“检验统计量Y”及“拒绝域W”这两项组成:若抽样 所得的样本值使检验统计量Y落在了拒绝域W内,则拒绝H0;否则接受H0。

3.抽样,根据样本观察值,按上述方案具体操作,决定对H0的取舍。

4.分析可能犯的错误:犯“弃真”错误(又称第一类错误)的概率=α;犯“取伪”错误(又称第二 类错误)的概率分析比较复杂,不作要求。

具体解题时,除了可按上述步骤解答,对于一些常见问题,我们也可记住并直接利用有关结论。重点 掌握以下三个结论,这三个结论的证明同前面关于区间估计的三个常用结论的证明是完全类似的。

二、关于假设检验的常用结论:以下μ0及σ0表示已知常数。

(1)若X~N(μ,σ),其中σ=σ0已知,要检验假设H0:μ=μ0,可用统计量:2?μ0

σ0/n,

而拒绝域为:(?∞,?uα)?(uα,+∞)。 典型例题:P.191例2(设糖的装箱质量X服从正态分布)。 22

(2)若X~N(μ,σ2),其中σ未知,要检验假设H0:μ=μ0,可用统计量:?μ0

S/n,

而拒绝域为:(?∞,?tα(n?1)]?[tα(n?1),+∞)。 前面包装茶叶的例子可以直接运用此结论。 22

(n?1)S2

, (3)若X~N(μ,σ),其中μ未知,要检验假设H0:σ=σ0,可用统计量:σ022

2而拒绝域为:(?∞,χ12?α(n?1)]?[χα(n?1),+∞)。 典型例题:课本P.198例2。

例:P.191例2中,设包装机的装箱重量X服从正态分布,分析包装机工作是否正常。(α=0.05) 解:已知X~N(μ,σ2),其中σ=1.15。要检验的假设是:H0:μ=100。检验统计量可以采用:

Z=~N(0,1),拒绝域为:(?∞,?uα)?(uα,+∞)=(?∞,?1.96)?(1.96,+∞)。 具体可算出Z=?0.052,没有落在拒绝域内。因此接受H0,即认为包装机工作正常。

例:见讲义P.22下包装茶叶之例:

解:已知X~N(μ,σ2),要检验:H0:μ=500。检验统计量可采

用:Y=~t(n?1), 而接受域为:(?t0.025(9),t0.025(9))=(?2.2622,2.2622)。具体地,可以算出:Y=?0.1875, 落在了接受域内。因此,我们接受H0,即认为当天包装机工作正常。

网站首页网站地图 站长统计
All rights reserved Powered by 海文库
copyright ©right 2010-2011。
文档资料库内容来自网络,如有侵犯请联系客服。zhit326@126.com