haihongyuan.com
海量文库 文档专家
全站搜索:
您现在的位置:首页 > 小学教育 > 学科竞赛学科竞赛

研究生医学统计学第一讲作业与答案

发布时间:2014-01-12 11:57:50  

医学统计学第一讲作业与答案

教材:《医学统计学》,颜虹主编,2010年8月第2版

1. P.6, 简答题 1,3;

1 统计学在医学研究中发挥什么作用?

实际生活中由于个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。个体差异是自然界普遍存在的现象。统计学将这种差异称为变异。由于变异的存在,同一条件下对同一个体的重复观测结果具有不确定性。生物医学中充满了个体变异和不确定性,其原因有些是已知的,有些未知的,有些是可人为控制的,有的则是无法控制的。事实上,客观事物在数量上所变现出来的现象即受到本质规律的制约,又受到诸多偶然因素的影响,这就妨碍了我们对事物规律性的认识,统计学正是处理数据中变异和不确定性的一门科学和艺术,它通过偶然性的现象来探测和揭示那些令人困惑的医学问题的规律性,对不确定性的数据作出统计推断,它是认识客观世界的重要工具和手段。

3 西部农村A、B两县,每年各约有2000名婴儿出生,一位研究者分别从两县县医院的出生记录中获得50名儿童的出生体重,A县50名儿童平均出生体重为2980g,B县50名儿童平均出生体重为3055g。请评价下列说法是否正确,为什么?

(1)B县儿童平均出生体重高于A县。

(2)B县县医院的这50名儿童的平均出生体重高于A县县医院的50名儿童。

(3)B县县医院儿童的平均出生体重高于A县县医院。

答案:

(1)不正确,因为50名A县县医院儿童的出生体重和50名B县县医院儿童的出生体重并不能代表A县和B县的全部的儿童的出生体重。

(2)正确。

(3)不正确,A县县医院50名儿童平均出生体重为2980g,B县县医院50名儿童平均出生体重为3055g,均是样本的统计量,若对该两县县医院的儿童平均出生体重进行比较,需进行假设检验。

2. P.52-53,定量资料相关习题;

一、最佳选择题(9-11不要求)

1 C 2 A 3 D 4 B 5 E 6 E 7 C 8 D 12 D

二、简答题

1 简述编制计量资料频数分布表的方法步骤。

第一步:求全距,也称极差,即全部数据中最大值与最小值之差;

第二步:划分组段

确定组数:组数的个数与观察值的个数n有关,一般观察值的个数n在50以下时可分为5到8组,n在50以上时可分9到15个组,实际应用中应根据分析的要求,灵活确定组数;

确定组距:等组距分组时,组距=全距/组数,为便于计算,可适当取整; 确定各组段的上下线:每个组段的起点称为该组段的下限,终点称为该组段的上限,上限=下限+组距,各组段均为半闭半开的区间(下限为闭区间,上限为开区间);

第三步:统计各组段频数,统计各组段内观察值的个数。

2 简述描述计量资料集中趋势的统计指标的特性和使用区别。

均数:用于描述一组同质定量资料的平均水平,适用于单峰对称分布的资料,特别是正态分布或近似正态分布的资料。

几何均数:常用于描述变量值间呈倍数关系的偏态分布资料,特别是变量经对数变换后呈正态分布或近似正态分布的资料。

中位数:将一组观察值按大小顺序排序过后位次居中的数据,在全部观察之中,大于和小于中位数的观察值个数相等,适用于各种分布的资料,不受极端值的影响,主要用于分布不对称的资料、两端或一端无确切值的资料及分布不明确的资料。

3 简述描述计量资料离散程度的统计指标的特性和使用区别。

极差:也称全距,全部数据中最大值和最小值之差,适用于各种分布的资料,因只涉及两个极端值,没有利用全部数据信息,不能反映组内其他观察值的变异,易受极端值的影响。

四分位数间距:Q?P75?P25,常用于描述偏态分布的资料、两端无确切值或分布不明确资料的离散程度。

方差与标准差:标准差为方差的算数平方根,两者是描述单峰对称分布资料最常用的指标,特别是正态分布或近似正态分布的资料。

变异系数:变异系数=标准差/均数,主要用于量纲不同的变量间或者均数差别较大的变量间变异程度的比较。

4 简述描述计数资料的三中相对数的特性和使用区别。

率:是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总

数之比,用以说明该现象发生的频率或强度。根据计算公式分母中是否引入时间因素,又分为频率和速率。频率分母中无时间因素,无时间量纲,分子是分母的一部分,取值在0-1之间,常见的发病率、患病率、病死率等都是频率性指标。速率是带有时间因素的频率,是指随时间变化而改变的速度,在流行病学中也称发病密度。

构成比:事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,用以说明事物内部各组成部分所占的比重,常用百分数表示,特点是:①分子是分母的一部分,各组成部分构成比数值在0-1之间波动,各组成部分构成比数值之和等于1或100%,②事物内部各组成部分之间呈此消彼长。

相对比:两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几,根据分母和分子之间的关系又分为关系指标和对比指标,关系指标是指两个有关的非同类事物的指标,如守护人员与病床数之比,对比指标是指同类事物的两个指标之比,用以达到比较的目的,如性别比。

5 简述标准化率中标准构成选取的方法。

①根据研究目的选择有代表性的、较稳定的、数量较大的人群,例如全国的、全省的或本地区的数据;②也可将与比较的两地或两组的人口数合并作为标准组,或选其中一组人口作为标准。

6 某研究者在某企业进行职业病状况的调查,随机调查了1500名工人,其中200人患有职业病,患病人中男性20人,女性180人,得相对数为10%和90%。因此,该研究者在报告中得到男性患病率低于女性的结论。问此结论是否正确?请说明理由。如何才能得到正确的结论。

不正确。犯了构成比代替率的错误,此研究中只能得出患有职业病的人中男性占10%,女性占90%的结论,若想得出男性患病低于女性的结论应该计算男性和女性职业病的患病率,即男性和女性中患职业病的人数分别除以男性和女性的总工人数。

8 简述应用相对数时的注意事项。

①计算相对数应有足够的观察单位数。计算相对数时必须要有足够的观察单位数作为分母,当观察单位数少时,应用绝对数,若必须使用相对数则应列出率的置信区间。

②分析时不能以构成比代替率。构成比只能说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。

③应分别将分子和分母合计求合计率。对分组资料计算合计率的时候,不能

简单的把各组率求平均数,而应分别将分子和分母合计,再求合计率。

④相对数的比较应注意其可比性。影响相对数高低的因素较多,在比较相对数时,除了欲比较的因素之外,其余因素因尽可能的相同或相近。

⑤样本率或样本构成比的比较应作假设检验。由于样本率或样本构成比存在抽样误差,如果通过样本推断总体率或者总体构成比有无差别,不能凭样本率或样本构成比的差别作结论,而必须进行差别的假设检验。

3. P.71,第一大题中除1、4题以外的,第三大题的4、7两道小题。

一、最佳选择题(11不要求)

2 D 3 B 5 B 6 E 7 E 8 C 9 D 10 C

三、计算分析题

4 很据以往的资料8岁男童身高服从正态分布,现测量了200名8岁男童身高X=124.4cm,S=3.8cm,试估计该地身高界于120cm到125cm范围内的8岁男童比例及200名8岁身高界于120-125cm范围的人数。

解:Z1=(120-124.4)/3.8= -1.16

Z2=(125-124.4)/3.8= 0.16

Φ(Z1)=Φ(-1.16)=0.1230

Φ(Z2)=Φ(0.16)=1-Φ(-0.16)=1-0.4364=0.5636

Φ=Φ(Z2)-Φ(Z1)=0.4406=44.06%

该地界身高介于120cm到125cm的8岁男童的比例是44.06%,介于120cm到125cm的8岁男童的人数是200×44.06%=88.12,即89个人。

7 某地抽样测量300名健康成人血清总胆固醇值,均值4.48(mmol/L)标准差为0.54(mmol/L)。假定血清总胆固醇值为正态分布,试计算健康成人血清总胆固醇值95%医学参考范围,若某人的血清总胆固醇值为5.85(mmol/L),则认为其血清总胆固醇“异常”还是“正常”。

解、 μ±1.96S=4.48±1.96×0.54=(3.42, 5.54)mmol/L

健康成人血清总胆固醇值95%医学参考值范围是(3.42, 5.54)mmol/L,某人血清总胆固醇值为5.85(mmol/L),大于参考值范围的上限,故可以认为该人的血清总胆固醇异常。

网站首页网站地图 站长统计
All rights reserved Powered by 海文库
copyright ©right 2010-2011。
文档资料库内容来自网络,如有侵犯请联系客服。zhit326@126.com