haihongyuan.com
海量文库 文档专家
全站搜索:
您现在的位置:首页 > 幼儿教育 > 少儿英语少儿英语

统计的故事

发布时间:2014-01-03 12:01:12  

统而计之——统计的故事
统计及应用统计简介

什么是统计(一)
? Statistics ? State

Carl Friedrich Gauss (1777. 4. 30-1855. 2. 23)

什么是统计(二)
? 统计学的定义 ? 统计的起源

统计的定义
? 统计学是收集和分析数据的科学与艺术
(不列颠百科全书)

? 数理统计学是数学的一个分支,它是一门 用有效的方法收集和分析带有随机影响的 数据的学科,且其目的是解决特定的问题 (陈希孺院士) ? 数理统计是一门应用性很强的学科,它是 研究如何有效地收集、整理和分析受随机 影响的数据,并对所考虑的问题作出推断 或预测,直至为采取决策和行动提供依据 和建议的一门学科。(茆诗松)

统计学的起源(一)
中国在周朝就设有统计官员,称为司 书。设立“司书上士二人,中士四人,府 二 人,史二人,徒八人。” 负责 “邦之六 典……,以周知入出百物,……,以知 田野夫家六畜之数。”

(见《周礼· 天官· 冢宰》)

统计学的起源(二)
《管子· 问》中提到65个问,即65个调 查科目,均为管理国家所需要的数据。比 如, “问少壮而未胜甲兵者几何人?” “为一民有几年之食也?” 等等。(平均数、众数?)

统计学的起源--女士品茶试验
20世纪20年代后期,在英国剑桥的一个夏日的 午后,一群大学的绅士和他们的夫人们,还有 来访者,正围坐在户外的桌旁,享用着下午茶。 在品茶过程中,一位女士坚称:把茶加进奶里, 或把奶加进茶里,不同的做法,会使茶的味道 品起来不同。在场的一帮科学精英们,对这位 女士的“胡言乱语”呲之以鼻。然而,在座的 一个身材矮小、戴着厚眼镜、下巴上蓄着的短 尖髯开始变灰的先生,却不这么看,他对这个 问题很有兴趣。(实际上这位女士正确地分辨 出了每杯茶) 返回

统计学的起源
? 对人口作统计,无论在中国还是在西方 在公元前已开始,目的在于征税和征兵. 用统计方法研究社会问题开始于17世纪. ? 格兰特(1622-1674)研究了伦敦的死亡记 录,总结在《关于死亡公报的自然和政 治观察》(1662)一书中. ? 此书对后世影响很大,一些统计学家建 议,以该书的出版日作为统计学的诞生 日.
返回

? 统计学中最重要的一种曲线——正态曲线大约 在1720年由法国数学家棣莫弗(1667-1754)所发 现. 正态曲线有很大的普适性,可用来描述自 然科学与社会科学中的许多现象. ? 优生学的奠基人——英国的高尔顿在身高和智 力遗传研究中得出结论:人的生理结构是稳定 的,所有有机组织都趋于标准状态. 这种效应 称为回归效应.

返回

什么是统计(三)
? ? ? ? ? ? 统计学是关于收集数据

与分析数据的学问. 数据来源于社会问题,比如 1. 考虑一年每一日的平均气温; 2.考虑南昌市居民的平均收入; 3.某一只股票价格的走势; ………

返回

什么是统计(三)
? ? ? ? 接下来我们会遇到几个问题: 1.数据怎么来的? 2.怎么去处理这些数据? 3.怎么样从数据中得到一定的信息? 4.得到的信息对我们的生活是否有特殊的意义?

返回

什么是统计(三)
其实本质问题只有两个: ? 1.统计学能解释什么样的社会现象? ? 2.怎么样才能把社会现象解释清楚,完善处理? ? 这是统计学的任务,也是数十年来统计学家们 追求的目标。

返回

什么是统计(三)
? 描述性统计(descriptive statistics)

? 数理统计(mathematical statistics)

返回

什么是统计(三)
? 数理统计是现代统计的本质内容; ? 处理带有随机因素的数据; ? 主要分为参数统计推断(parametric statistical inference)和非参数统计推断 (nonparametric statistical inference),非参 数统计推断在现代计量经济,数理统计, 金融研究中扮演着重要的角色;
返回

什么是统计(三)
? ? ? ? ? ? 点估计理论;(Point Estimation) 区间估计理论;(Interval Estimation) 假设检验理论;(Hypothesis Testing) 方差分析理论;(Variance Analysis) 相关分析理论;(Correlation Analysis) 线性回归分析;(Linear Regression)

返回

数据是什么?

Data = ¥¥

数据的妙用(一)

数据的妙用(二)

数据的妙用(三)

什么是统计(四)
? Sir Ronald Aylmer Fisher (1890. 2. 17-1962. 7. 29) ? B. A. in Math., Cambridge University, 1912 ? Rothamsted Experimental Station, 1919-1933 ? Professor of eugenics at University College London, 1933-1943 ? Balfour Chair of Genetics at Cambridge, 1943

什么是统计(五)
试验设计 抽样调查 统计方法 (估计与检验)

实际问题

数据收集

数据分析

结论

建议与讨论

什么是统计(例子)

什么是统计(例子)

实验设计

对照实验

总是做得对。将使一些人满意,而使其 余的人惊讶。 ------- 马克·吐温 (1835-1910)

基本概念
? 一种新药的问世,怎样设计一个试验来测试

它的效果呢? ? 最基本的方法是 比较。 ? 将药分给处理组病人, 而把其他病人作为对 照。 ? 病人将以随机的方式被分到处理组和对照组。

脊髓灰质炎疫苗的现场试验
? 1916年第一次脊髓灰质炎第一次袭击了美国。

此后的四十年,在美国造成了成千上万的受 害者,特别是儿童。 ? 这种疾病在我国通常被称作小儿麻痹症。 ? 到上世纪五十年代,才发现这种疾病的疫苗。

脊髓灰质炎疫苗的现场试验
? Jonas

Salk培育的疫苗似乎最有希望。 ? 在实验室中,这种疫苗被证

实是安全的。 ? 但还是需要大量临床试验去证明疫苗的疗效。 ? 1954年美国公共卫生总署决定组织这样一类 试验 ? 共有200万名儿童被牵扯进这次试验。

脊髓灰质炎疫苗的现场试验
? 其中

50 万接种了疫苗,一百万故意不予接种, 另外50万拒绝了试验。 ? 这就说明了对照方法。 ? 据此进行试验。 ? 试验中首先出现的问题是避免 偏性。 ? 混淆是偏性的主要来源。

脊髓灰质炎疫苗的现场试验
为避免造成偏性,最终的方案是在同一年级 的小学生中父母同意进行试验的人群中进行 对比试验。 ? 还有一点需要注意,那就是双盲。
?

静脉吻合分流术
? 在肝硬化病例中,病人可能开始出现出血且

直到死亡。 ? 所谓静脉吻合分流术是运用外科手术的办法 使血流改变方向来避免出现死亡。 ? 得益 是 避免死亡。 ? 风险是花费时间且危险。

静脉吻合分流术
设计
无对照

显著
24

中等
7


1

对照,但并 不随机
随机对照试 验

10
0

3
1

2
3

观察研究

你在那里所经历的不是一个实验,而是一 种经验。 R.A. Fisher 爵士

观察研究
? 观察研究与对照研究的区别。
? 一个例子就是吸烟对健康的危害。 ? 研究者的工作就是分离偏性。

问题
? 在美国,1985年所有病例中有210万人死亡,

但是1960年只有170万,几乎增加了25%, 是不是说明公众的健康状况变糟糕了? ? 十八世纪,通过给病人放血去治疗黄热病是 一种常用的方法。当时一名著名的医生在日 记中写到:

?

我从每一次抽少量的血开始。血的显露以及 放血对身体的效应使我相信放血治疗的安全 性和有效性。 在这之前我从未经历过像现在 那种在期待我的治疗成功中所感受的异常的 兴奋。……. 感谢上帝,在我出诊或给予配方 的100个病人中,至今无人不幸。

注意
? 试验的主要任务是去掉偏性。
? 这和样本空间以及简单随机抽样的定义是一

致的。 ? 关联性不等于因果关系

抽样

抽样调查

“数据! 数据! ” 他不耐烦地喊道, “我不能 做无米之炊. ” ------- Sherlock Holmes

基本概念
? 通常存在着调查人员需要知道的关于总体的

某些数值特征, 这些数值特征称为参数。 ? 在预测美国总统选举中, 有关的两个参数是: ·全体合法选民的平均年龄。 ·当前登记投票的全体合法选民的百分数。 ? 参数由统计量或可根据样本算得的某些数值 估计.

? 两个重要问题:

· 选取样本的方法至关重要. · 最好的方法包含有计划地应用机会.

<<文学摘要>>民意测验
? 1936年选举年,

Roosevelt 与 Landon 竞选下

一任总统. ? <<文学摘要>>预测出现重大误差. ? 反思: 犯的两个错误 ? 1. 选择偏性(以

电话簿上的地址和俱乐部成员 名单上的地址)

<<文学摘要>>民意测验
启示: 当选择程序有偏时, 抽取一个大的样本 并无帮助. 这只不过是在较大的规模下去重 复基本错误. ? 2. 不回答误差(发出1000万封信,收到回信 200万封) ? 启示: 不回答者可能非常有别于回答者, 当出 现高不回答率时, 谨防不回答偏差.

民意测验Dewey选举年
? 三家主要的民意测验机构都预测失误.
? 他们选取样本的方法:

定额抽样方法 ? 当时的共和党人比民主党人较为富裕并受过 较好的教育, 相对较易访问. ? 启示: 在定额抽样中, 样本被精心挑选以使 在某些关键特征上与总体相似. 这方法似乎合 理, 但并不怎么奏效. 原因是无意的偏倚.

统计与数学的区别

统计与数学的区别

统计与数学的区别

统计与数学的区别
统计学 出发点 研究方法 评价方法 数 归 据 纳 数 演 学 绎

定义和公理 对与错

好与坏

统计在工业上的应用(一)
? Statistical Quality Control (On line) ? Taguchi Methods (Off-line) ? 6 Sigma Methods Beginner, Black belt, Master black belt, Green belt, Champion, Executive ? Reliability

Statistical Process Control (一)

Statistical Process Control (二)

Shewhart Chart-3?

-3?

-2?

?

2?

3?

Taguchi Methods (一)

Taguchi Methods (二)
? System Design ? Parameter Design ? Tolerance Design

Quality is squared loss function!

6 Sigma Methods
? http://www.sixsigmaspc.com/

摩托罗拉公司六西格玛的发展
2003 2002 1999
数字六西格玛

西格玛业务改进

行为准则,追求卓越和平衡的记分卡

1998 公司重组
1992 每两年减少缺陷十倍,运作周期每五年降低10倍。 1991 引入“黑带创意”

1988 马科姆·鲍德里奇全美质量大奖 1987 制定1992 应达到西格玛目标 1986 西格玛方法被引入摩托罗拉公司

平均
规格的下限

散布 规格上限

1?

p(不良率)

目标(Target)

减少散布是 6?的核心。

什么叫Six Sigma?
目标 规格限 目标 规格限

不 良 可能性

减少的 不良可能性

? 记号前的数值(Z值) 越大,不良发生概率 越小。

缩小不良的核心是减少散布。

六西格玛近乎完美
平均值

Cp = 2
规范下限

每10亿零件中 有2个零件
?

规范上限

缺陷

缺陷

??? ??? ??? ??? ??? ???

??? ??? ??? ??? ??? ???

“西格玛水平”的定义是 . . .
. . . 利用统一的衡量尺度对“优秀”的测量。
7 6 5 3 4
233
6210 66810 .02

西格玛

3.4

DPMO (百万出 错机会缺陷率)

六西格玛好比什么 . . .
三西格玛 品质等于
? 每年至少54,000次用

六西格玛品质等于
? 二十五年才有一次用

药错误处方 。 ? 每周每电视频道出现 27分钟的播出故障时 间。 ? 每天奥黑

尔国际机场 发生五次过短或过长 着陆。

药错误处方。 ? 每周每电视频道出现 2秒钟的播出故障时 间。 ? 全美国所有机场十年 才发生一次过短或过 长着陆。

六西格玛好比什么 . . .
2 西格玛 - 每轮6次不入洞. 每年100轮高尔夫球赛 3西格玛 -每轮1次不入洞. 4西格玛 -每9轮1次不入洞. 5西格玛 -每2.33年1次不入洞. 6西格玛 -每163年1次不入洞!!!

六西格玛方法是 . . .
? 一种推动业务改进的总体性方法。 ? 一套用以推动和实现某一组织内部过渡变革的、 经实用检验的成套工具。 ? 一次重点在于如下内容的持续改进过程:
? 顾客需求, ? 过程统一, ? 严谨分析, ? 及时执行。

DMAIC 与过程改进路线图
1.0
2.0 3.0 4.0 5.0

界定机会

衡量业绩

分析机会

改进业绩

控制业绩

什么是最 重要的?

我们现在 做得怎样?

错在哪里?

需要采取 哪些措施?

我们如何 保证业绩?

DMAIC
界定(Define)
什么是最重要的? 有哪些可以实现本组织目标并 提供最大收益的改进机会。 我们目前的业务水平怎样(如 西格玛水平或Cpk)? 业绩中存在之差距或问题的根 本原因是什么? 有哪些可能的解决方案,我们 如何实施最佳解决方案? 我们如何保持已经取得的成绩?

测量(Measure) 分析(Analysis)
错在哪里?

我们目前做得怎样?

改进(Improve)
控制(Control)

需要采取哪些措施?

我们如何保证业绩?

六西格玛改进过程
目标 主要活动
? 确认/找出业务机会 ? 确认/制订团队宪章 ? 明确过程并绘制过程图 ? 明确快速取胜的过程和过程梳理 ? 将顾客的需求转化为顾客的关键需求 ? 起草团队准则。

可能采用的工具与技巧
团队宪章
业务个案 目标陈述 差距 项目计划 机会陈述 项目范围 团队人选

可提交的成果
? 团队宪章 ? 行动计划 ? 流程图 ? 迅速取胜的机会 ? 顾客的关键需求 ? 做好准备的团队

1.0
界定机会 ? 找出并确认改进机会,开发业务 过程,界定顾客的关键需求,准 备建立有效的项目团队。

西格玛目标(CCR)

行动计划
TASKS TASKS ACTIVITIES RESP. START DUE STATUS &ACTIONS ACTIVITIES RESP. START DUE STATUS &ACTIONS

项目重点 $$

执行

CCRs

2.0
测评业绩

执行

? 找出评价成功、满足顾客关键需 求所需的关键性衡量项,为衡量 过程业绩表现而着手开发有效的 收集数据的方法。 ? 了解六西格玛计算的内容,为本 团队正在分析的过程确定基准西 格玛水平。

? 明确输入、处理、输出等指标 ? 起草操作定义和测评计划 ? 采集并分析数据 ? 确定是否存在特殊的原因 ? 确定西格玛水平 ? 收集其他基准业绩数据

输入

过程

输出

CCR

UCL

西格玛=

检查表
输入指标

过程指标 过

程指标 输出指标

A1 A1 A1 D1 D1 D1 D2 D2 D2 A2 A2 A2

A

A A

B

B

B

X

CCR

西格玛=

LCL

? 输入、处理和输出指标 ? 操作的定义 ? 数据采集的格式与计划 ? 基准业绩 ? 高效的团队氛围

X

差距

3.0
分析机会

执行

? 整理并分析改进机会,找出具体的问 题,起草一份通俗的问题陈述。 ? 找出并认证根本原因和本团队正在重 点分析的问题,落实杜绝“真正的” 根本原因。 ? 确定真实的波动源和导致顾客不满的 潜在故障模式。

? ? ? ? ? ? ? ? ? ? ? ?

整理过程 整理数据并找出具体问题 起草问题的陈述 找出根本原因 设计确认和分析根本原因 确认根本原因 比较方法 波动源研究 失效模式与效应分析 回归分析 过程控制与过程能力 实验设计
Surface Plot of Y11

量化的根本原因
50%

Process/Product: FMEA Team: Black Belt:

FMEA Date: (original) (Revised) Page: of

指标与问题 陈述(效果 )
Actions Results
Risk Priority Occurrence Detection Severity

问题陈述
25%

? 数据分析 ? 经认证的根本原因 ? 波动源 ? FMEA ? 问题陈述 ? 可能的解决方案

Process
Severity Detection

Item Process Steps

Potential Failure Mode

Potential Effects of Failure

Potential Cause(s) of Failure

Occurrence

Current Controls

Risk Priority

Recommended Action

Responsibility Action and Target Taken Completion Date

Total Risk Priority

Resulting Risk Priority

成本与收益

4.0
改进业绩

? 找出、评估并选择正确的改进解决 方案。 ? 开发变革管理方法,协助本组织适 应由于解决方案的实施而引出的变 革。

? 响应曲面方法 ? 解决方案构思 ? 确定解决方案的影响:好处 ? 评估并选择解决方案 ? 起草过程图和粗计划 ? 起草并讲解纲要 ? 向所有利益相关方沟通解决方案

100

Y11

50

成本
-1.0 -0.5

0 -1.5 0.0 0.5

X1

1.0

0.0 -0.5 -1.0 -1.5 1.5

0.5

1.0

1.5

X2

Solution

Sigma Impact 2

Time Impact 1

CostBenefit Impact 1

Other Impacts 1

Total

Rank

节能灯炮 $9,000 安装费 500 准备费用 1,500 总成本 $11,000

甘特图(试运行)
What Task Jan Feb When Mar Apr Who MayResponsibility Jim Sue Lynn Bill/Jim

收益- 第一年

电能减少 by 8% 5年保修费 总收益

$5,000 1,800 $6,800

A B C

力场分析
正面影响 负面影响

D

执行

? 解决方案 ? 流程图和文档化 ? 实施阶段的里程碑事项 ? 改进的影响与好处 ? 大纲(Storyboard) ? 变革路径图
? 过程控制系统 ? 标准与程序 ? 培训 ? 团队评估 ? 变革实施计划 ? 潜在问题分析 ? 示范与方案结果 ? 成功的经验 ? 训练有素的同事 ? 类似的机会 ? 对机会进行标准化处理

5.0
控制业绩

? 理解规划工作及按计划执行的重要 性,确定为保证实现规定成果而有 待于采取的措施。 ? 了解

如何推广所取得的经验,找出 类似的情况并对机会/过程进行标准 化处理,制定出相关的计划。

执行

? 起草试运行计划和试运行解决方案 ? 确认由于解决方案触及根本原因而产生的西 格玛水平的改进 ? 确定实现目标是否必需的其他解决方案 ? 找出类似的情况,对机会进行标准化处理 ? 将解决方案融入日常工作过程并对之进行管 理 ? 集中学到的经验 ? 明确团队的下一步行动,以及针对其余机会 的计划

失效模式与效应分析
Error Modes and Effects Analysis
Error Mode Effect Analysis (EMEA) Description:

Step#

Frequency

Detection

Severity

Process Step

Degree of Effect
Error Cause Effect

Occurrence Prevention (Countermeasure)
Total

Implemented Solution
过程控制系统

Assemble all outbound 4.2.1 containers in staging area

? Back injury ? Carry-all ? Back during lift not available injuries, ? Foot and toe ? Lifting lost time, injury from guidelines insurance dropped not followed expense cont. ? Non-standard ? Vendor pallets kept pallet used ? Container stack over end of pallet and fall when being lifted ? Pallet set 90 ? Back and off when hand injuries, positioned lost time, lift truck insurance can抰access expense and rework ? Stack ? Containers guidelines fall while not used being lifted

0 + 2 2

? Purchase two new carry-alls for mailroom ? Include topic in new safety film 4 3 9

4.2.2

Determine correct pallet size

2 + 2 4

? Inspect for non-standard pallets and return to vendors 1 1 6

Position empty pallet in marked 4.2.3 area of loading dock Stack outbound containers on pallet not to exceed two high

? Full pallets are rotated 90? by hand

2 + 3 5

? Update and clarify pallet placement procedures ? Include topic in new safety film 4 1 10

4.2.4

? First layer not completed before starting second layer

0 + 1 1

? Update and clarify loading guidelines

1

1

3

? Tie down Load pallets in ? Tie down guidelines vehicle with lines lift truck and damage bulk not clear 4.2.5 secure mail when tightened

? Injured fingers, damaged outbound mail

0 + 1 1

? Update and clarify loading guidelines

2

1

4

关键顾客需求特性

项目工作计划
X

关键顾客 需求特性

差距 西格玛目标(CCR)

差距

Reliability
? 产品寿命分布及统计分析
恒进应力寿命试验 加速应力寿命试验

? 截尾数据的统计分析
定时截尾 定数截尾

统计在农林牧渔业上的应用
? Design of Experiment (DOE) ? 气象 ? 渔业 ? 生态农业 ? 环境保护 ? 动物保护(capture recapture) ? ……

Design of Experiment
? ? ? ? ? ? ? ? 000 001 010 011 100 101 110 111 这是一个最基本的正交表

1.乾、 2.坤、 3.震、 4.巽、 5.坎、 6.离、 7.艮、 8.兑。

L8 ( 2 7 )

Design of Experiment
? 36军官问题(这是18世纪瑞士数学 家欧拉提出的)

设有6种军衔和来自6个团的36名军 官,能不能把他们排成6行6列的方阵, 使得每行每列里都有每种军衔的一名军 官和每个团的一名军官? ? 数学问题:是否存在6阶的正交拉丁方?

Design of Experiment
? 欧拉猜想:当N为奇数的2倍时(包括N=6), 问题是无解的 ? 到20世纪50年代,印度数学家Bosh等人 证明:除N=2和N=6外,这个问题都有解! 这就是说,欧拉的猜想除N=6外,其余都猜 错了!

Design of Experiment
4B 3C 2C 1D 5D 4E 3E 2A 1A 5B

2D
1E 5A

5E
4A 3B

3A
2B 1C

1B
5C 4D

4C
3D 2E

Climate (Global Temperature)

渔业(花港观鱼)

统计在商业中的应用
? ? ? ? 市场调查与咨询 物流(仓库的设计与储量分析) 交通运输业的统计分析 数据挖掘

市场调查与抽样(一)
? 传统的抽样方法: 1. 简单随机抽样 2. 分层抽样 3. 二阶抽样 4. 整群抽样 5. 二重抽样 ? 传统抽样的特点:成本与误差的平衡 设计与分析的结合

市场调查与抽样(二)
? 统计模拟与重抽样(Monte Carlo & Resampling) 1. 伪随机数的产生:
同余法、混合同余法、逆变换法等

2. 重抽样方法:
刀切法(Jecknife)、自助法(Bootstrap)

3. 新兴的抽样方法
MCMC (Markov Chain Monte Carlo) 模拟退火 (Simulated Annealing )

? 特点:计算机的应用!!! Ross, S. M. (2002). Simulation, 3rd Ed., Academic P

Data Mining (一)
99:8179,79 54, 76269,8406 ,9405, 7918934,1.9 1817. 舅舅:不要吃酒,吃 酒误事, 吃了二两酒,不是动 怒,就是动武, 吃酒要被酒杀死,一 点酒也不要吃。

Data Mining(二)
? ? ? ? ? ? ? ? ? 7÷ 2 2≦x≦3 40 ÷ 6 二四六八 1× 1=1 10002 =100× 100× 100 7/8 687 3x ? ? ? ? ? ? ? ? ? 不三不四 接二连三 陆续不断 无独有偶 一成不变 千方百计 七上八下 了不起 thanks

What Are These Numbers Trying to Tell Us?

Data Mining(三)

Data Mining(四)
? 统计方法 ? 计算机的应用 ? 计算方法

It’s hot!

Data Mining(五) (啤酒与尿布)
有一次,美国沃尔玛公司的分店经理发现: 一段时期以来,每逢周末店内啤酒和尿布 的销量 都会同比攀升。 ... 分析还发现:原 来这些人习惯晚上边看球赛、边喝啤酒, 对于要照顾 的孩子,为了图省事就用一次 性尿布。于是沃尔玛决定:把这两种商品 集中摆在一起。

Financial and Acturial Statistics
? Nobel Prizes
期权定价模型、投资组合模型…

? Insurance
保费的计算、产品的设计…

在军事及航空航天中的应用

在军事及航空航天中的应用

1986年1月18日,挑战者升空73秒后爆炸

在军事中的应用—广岛原子弹

The Applications In Social Sciences
? ? ? ? ? ? ? ? ? 法律 心理

学(测谎) 经济学 社会学 人口学 管理科学 文学 考古 ……

The Applications In Social Sciences (法律之一)
被告 白人 死刑 是 19 否 141 合计 160

黑人
合计

17
36

149
290

166
326

数据:美国佛罗里达,1976--1977年凶杀案 结论:白人被判死刑的比例为:19/160=11.9% 黑人被判死刑的比例为:17/166=10.2%

The Applications In Social Sciences (法律之二)
被 告 白人 黑人 被 害 死刑 是 否 死刑 比例

白人
黑人 白人

19
0 11

132
9 52

0.126
0.000 0.175

黑人

6

97

0.058

Contingency Table (列联表)

The Applications In Social Sciences (文学—红楼梦)

陈大康:从数理语言看后四十回的作者,《红楼梦学刊》,87年第1期

在IT业中的应用
? 分类、搜索 ? 图像或模式识别 ? 网络完全(数字签名)

统计在医药卫生中的应用
? Biostatistics
制药业(比对试验)

疾病的诊断(Bayes方法,图模型等) 病理分析 疾病的控制

统计在医药卫生中的应用-吸烟与肺癌

R A Fisher

J. Cornfield(1912-1979)

Journal of the National Cancer Institute, 22, 173-203

统计在生物遗传学中的应用-回归

The Applications In Bioinformation

The Applications In Other Fields
? ? ? ? 地质勘探 公安(指纹识别、脚印识别、图像恢复) 服务行业 体育

悟道诗
严加安

随机非随意,概率破玄机。 无序隐有序,统计解迷离。

本节结束! 谢谢!


网站首页网站地图 站长统计
All rights reserved Powered by 海文库
copyright ©right 2010-2011。
文档资料库内容来自网络,如有侵犯请联系客服。zhit326@126.com