Ⅰ 期权期货BS模型中N(d1)怎么算
实际上b-s模型中的n(d1)和n(d2 )实际上指的是正态分布下的置信值
d1={ln(s/x)+[r+(σ^2)/2]*(t-t)}/[σ*(t-t)^0.5],d2=d1-σ*(t-t)^0.5。利用相关数据先计算出d1和d2的值,然后利用正态分布表,找出对应的d1和d2所对应的置信值。
1.bs公式的原推导过程应用了偏微分方程和随机过程中的几何布朗运动性质(描述标的资产)和Ito公式,你要没学过随机和偏微估计只有火星人才能给你讲懂。
2.你要是只是要得到那个形式,看一下二叉树模型,二叉树模型简单易懂,自己就可以推导,且二叉树模型取极限(时间划分无限细)即为bs公式.
3.你要是真心要理解bs模型公式,我可以推荐一本书,姜礼尚的《期权定价的数学模型和方法》,老老实实从第一章看到第五章,只挑欧式期权看就够了。
(1)股票价格对数正太分布公式扩展阅读:
BS模型是由无风险套利的原则推导得来,其含义就是说如果某个权证的价格偏离了BS模型所计算的值,就有无风险套利的机会出现,而无风险套利的过程将使得权证的价格回归至BS模型所计算的理论值。这里有一个理论基础,即权证作为一种金融衍生产品,其完全可以通过持有一定标的证券和债券的形式复制出来,同时也完全可以通过相反的过程来对冲风险。
BS模型假设
(1)在期权寿命期内,买方期权标的股票不发放股利,也不做其他分配;
(2)股票或期权的买卖没有交易成本;
(3)短期的无风险利率是已知的,并且在期权寿命期内保持不变;
(4)任何证券购买者能以短期的无风险利率借得任何数量的资金;
(5)允许卖空,卖空者将立即得到所卖空股票当天价格的资金;
(6)看涨期权只能在到期日执行;
(7)所有证券交易都是连续发生的,股票价格随机游走。
成立条件
任何一个模型都是基于一定的市场假设的,Black-Scholes模型的基本假设有以下几点:
(1)无风险利率r是已知的,为一个常数,不随时间的变化而改变
(2)标的证券为股票,正股价格S的变化符合随机漫步,但这种随机漫步能够使股票的回报率成正态分布。
(3)标的股票不分红
(4)期权为欧式期权,即到期日才能行权
(5)整个交易过程中,不存在交易费用,没有印花税
(6)对卖空没有如保证金等任何限制,投资者可自由使用卖空所得资金
在我国,当标的证券分红除息时,权证的行权价格也做相应的除息调整,因此不需要标的证券不分红的假设。
Ⅱ 什么是对数收益率
对数收益率是两个时期资产价值取对数后的差额,即资产多个时期的对数收益率等于其各时期对数收益率之和。
衡量股票投资收益的水平指标主要有股利收益率与持有期收益率和拆股后持有期收益率等。
1、股利收益率
股利收益率,又称获利率,是指股份公司以现金形式派发的股息或红利与股票市场价格的比率其计算公式为:
该收益率可用计算已得的股利收益率,也能用于预测未来可能的股利收益率。
2、持有期收益率
持有期收益率指投资者持有股票期间的股息收入和买卖差价之和与股票买入价的比率。其计算公式为:
股票还没有到期日的,投资者持有股票时间短则几天、长则为数年,持有期收益率就是反映投资者在一定持有期中的全部股利收入以及资本利得占投资本金的比重。
持有期收益率是投资者最关心的指标之一,但如果要将其与债券收益率、银行利率等其他金融资产的收益率作一比较,须注意时间可比性,即要将持有期收益率转化成年率。
3、持有期回收率
持有期回收率说的是投资者持有股票期间的现金股利收入和股票卖出价之和与股票买入价比率。本指标主要反映其投资回收情况,如果投资者买入股票后股价下跌或操作不当。
均有可能出现股票卖出价低于其买入价,甚至出现了持有期收益率为负值的情况,此时,持有期回收率能作为持有期收益率的补充指标,计算投资本金的回收比率。其计算公式为:
4、拆股后的持有期收益率
投资者在买入股票后,在该股份公司发放股票股利或进行股票分割(即拆股)的情况下,股票的市场的市场价格及其投资者持股数量都会发生变化。
因此,有必要在拆股后对股票价格及其股票数量作相应调整,以计算拆股后的持有期收益率。其计算公式为:(收盘价格-开盘价格)/开盘价格股票收益率的计算公式 股票收益率= 收益额 /原始投资额其中:收益额=收回投资额+全部股利-(原始投资额+全部佣金+税款)
当股票未出卖时,收益额即为股利。
(2)股票价格对数正太分布公式扩展阅读:
在投资决策时的股票收益率计算公式:
假设股票价格是公平的市场价格,证劵市场处于均衡状态,在任一时点证劵的价格都能完全反映有关该公司的任何可获得的公开信息,而且证劵价格对新信息能迅速做出反应。在这种假设条件下,股票的期望收益率等于其必要的收益率。
而股票的总收益率可以分为两个部分:第一部分:D1/P0 这是股利收益率。解释为预期(下一期)现金股利除以当前股价,那下一期股利如何算呢,D1=D0*(1+g)。第二部分是固定增长率g,解释为股利增长率,由于g与股价增长速度相同,故此g可以解释为股价增长率或资本利得收益率。
举个例子来说明:股价20元,预计下一期股利1元,该股价将以10%速度持续增长
则:股票收益率=1/20+10%=15%
这个例子中的难点是10%,她就是g,g的数值可根据公司的可持续增长率估计,可持续增长率大家应该都知道了吧。g算出后,下一期股利1元也是由她算出的,公式上面已经列出。有了股票收益率15%,股东可作出决定期望公司赚取15%,则可购买。
Ⅲ 如果用matlab验证股票的收盘价符合对数正态分布
先导入数据,然后取收盘价的对数值即y=ln(y)
clc;clear
y=ln(y)
Std=std(y) %标准差
[F,XI]=ksdensity(y)
figure(1)
plot(XI,F,'o-')
x =randn(300000,1);
figure(2)
[f,xi] = ksdensity(x);
plot(xi,f);
画出概率分布图
ksdensity -------------------- Kernel smoothing density estimation.
表示核平滑密度估计
Ⅳ 期权、期货及其他衍生产品的目录
推荐序一
推荐序二
译者序
作者简介
译者简介
前言
第1章导言
1.1交易所市场
1.2场外市场
1.3远期合约
1.4期货合约
1.5期权合约
1.6交易员的种类
1.7对冲者
1.8投机者
1.9套利者
1.10危害
小结
推荐阅读
练习题
作业题
第2章期货市场的运作机制
2.1背景知识
2.2期货合约的规定
2.3期货价格收敛到即期价格的特性
2.4每日结算与保证金的运作
2.5报纸上的报价
2.6交割
2.7交易员类型和交易指令类型
2.8制度
2.9会计和税收
2.10远期与期货合约比较
小结
推荐阅读
练习题
作业题
第3章利用期货的对冲策略
3.1基本原理
3.2拥护与反对对冲的观点
3.3基差风险
3.4交叉对冲
3.5股指期货
3.6向前滚动对冲
小结
推荐阅读
练习题
作业题
附录3A最小方差对冲比率公式的证明
第4章利率
4.1利率的种类
4.2利率的测量
4.3零息利率
4.4债券价格
4.5国库券零息利率的确定
4.6远期利率
4.7远期利率合约
4.8久期
4.9曲率
4.10利率期限结构理论
小结
推荐阅读
练习题
作业题
第5章远期和期货价格的确定
5.1投资资产与消费资产
5.2卖空交易
5.3假设与符号
5.4投资资产的远期价格
5.5提供已知中间收入的资产
5.6收益率为已知的情形
5.7远期合约的定价
5.8远期和期货价格相等吗
5.9股指期货价格
5.10货币的远期和期货合约
5.11商品期货
5.12持有成本
5.13交割选择
5.14期货价格与预期即期价格
小结
推荐阅读
练习题
作业题
附录5A利率为常数时远期价格与期货价格相等的证明
第6章利率期货
6.1天数计算约定
6.2美国国债期货
6.3欧洲美元期货
6.4利用期货基于久期的对冲
6.5对于资产与负债组合的对冲
小结
推荐阅读
练习题
作业题
第7章互换
7.1互换合约的机制
7.2天数计量惯例
7.3确认书
7.4比较优势的观点
7.5互换利率的实质
7.6确定LIBOR/互换零息利率
7.7利率互换的定价
7.8货币互换
7.9货币互换的定价
7.10信用风险
7.11其他类型的互换
小结
推荐阅读
练习题
作业题
第8章期权市场的运作过程
8.1期权的类型
8.2期权头寸
8.3标的资产
8.4股票期权的特征
8.5交易
8.6佣金
8.7保证金
8.8期权结算公司
8.9监管规则
8.10税收
8.11认股权证、雇员股票期权及可转换证券
8.12场外市场
小结
推荐阅读
练习题
作业题
第9章股票期权的性质
9.1影响期权价格的因素
9.2假设及记号
9.3期权价格的上限与下限
9.4看跌看涨平价关系式
9.5提前行使期权:无股息股票的看涨期权
9.6提前行使期权:无股息股票的看跌期权
9.7股息对于期权的影响
小结
推荐阅读
练习题
作业题
第10章期权交易策略
10.1包括单一期权与股票的策略
10.2差价
10.3组合策略
10.4具有其他收益形式的组合
小结
推荐阅读
练习题
作业题
第11章二叉树简介
11.1单步二叉树模型与无套利方法
11.2风险中性定价
11.3两步二叉树
11.4看跌期权实例
11.5美式期权
11.6Delta
11.7选取u和d使二叉树与波动率吻合
11.8增加二叉树的时间步数
11.9对于其他标的资产的期权
小结
推荐阅读
练习题
作业题
第12章维纳过程和伊藤引理
12.1马尔科夫性质
12.2连续时间随机变量
12.3描述股票价格的过程
12.4参数
12.5伊藤引理
12.6对数正态分布的性质
小结
推荐阅读
练习题
作业题
附录12A伊藤引理的推导
第13章布莱克斯科尔斯默顿模型
13.1股票价格的对数正态分布性质
13.2收益率的分布
13.3预期收益率
13.4波动率
13.5布莱克斯科尔斯默顿微分方程的概念
13.6布莱克斯科尔斯默顿微分方程的推导
13.7风险中性定价
13.8布莱克斯科尔斯定价公式
13.9累积正态分布函数
13.10权证与雇员股票期权
13.11隐含波动率
13.12股息
小结
推荐阅读
练习题
作业题
附录13A布莱克斯科尔斯默顿公式的证明
第14章雇员股票期权
14.1合约的设计
14.2期权会促进股权人与管理人员的利益一致吗
14.3会计问题
14.4定价
14.5倒填日期丑闻
小结
推荐阅读
练习题
作业题
第15章股指期权与货币期权
15.1股指期权
15.2货币期权
15.3支付连续股息的股票期权
15.4欧式股指期权的定价
15.5货币期权的定价
15.6美式期权
小结
推荐阅读
练习题
作业题
第16章期货期权
16.1期货期权的特性
16.2期货期权被广泛应用的原因
16.3欧式即期期权和欧式期货期权
16.4看跌看涨期权平价关系式
16.5期货期权的下限
16.6采用二叉树对期货期权定价
16.7期货价格在风险中性世界的漂移率
16.8对于期货期权定价的布莱克模型
16.9美式期货期权与美式即期期权
16.10期货式期权
小结
推荐阅读
练习题
作业题
第17章希腊值
17.1例解
17.2裸露头寸和带保头寸
17.3止损交易策略
17.4Delta对冲
17.5Theta
17.6Gamma
17.7Delta、Theta和Gamma之间的关系
17.8Vega
17.9Rho
17.10对冲的现实性
17.11情景分析
17.12公式的推广
17.13资产组合保险
17.14股票市场波动率
小结
推荐阅读
练习题
作业题
附录17A泰勒级数展开和对冲参数
第
18章波动率微笑
18.1为什么波动率微笑对看涨期权与看跌期权是一样的
18.2货币期权
18.3股票期权
18.4其他刻画波动率微笑的方法
18.5波动率期限结构与波动率曲面
18.6希腊值
18.7当预期会有单一的大跳跃时
小结
推荐阅读
练习题
作业题
附录18A由波动率微笑来确定隐含风险中性分布
第19章基本数值方法
19.1二叉树
19.2采用二叉树来对股指、货币与期货期权定价
19.3对于支付股息股票的二叉树模型
19.4构造树形的其他方法
19.5参数与时间有关的情形
19.6蒙特卡罗模拟法
19.7方差缩减过程
19.8有限差分法
小结
推荐阅读
练习题
作业题
第20章风险价值度
20.1VaR测度
20.2历史模拟法
20.3模型构建法
20.4线性模型
20.5二次模型
20.6蒙特卡罗模拟
20.7不同方法的比较
20.8压力测试与回顾测试
20.9主成分分析法
小结
推荐阅读
练习题
作业题
附录20A现金流映射
第21章估计波动率和相关系数
21.1估计波动率
21.2指数加权移动平均模型
21.3GARCH(1,1)模型
21.4模型选择
21.5极大似然估计法
21.6采用GARCH(1,1)模型来预测波动率
21.7相关系数
小结
推荐阅读
练习题
作业题
第22章信用风险
22.1信用评级
22.2历史违约概率
22.3回收率
22.4由债券价格来估计违约概率
22.5违约概率的比较
22.6利用股价来估计违约概率
22.7衍生产品交易中的信用风险
22.8信用风险的缓解
22.9违约相关性
22.10信用VaR
小结
推荐阅读
练习题
作业题
第23章信用衍生产品
23.1信用违约互换
23.2信用违约互换的定价
23.3信用指数
23.4信用违约互换远期合约及期权
23.5篮筐式信用违约互换
23.6总收益互换
23.7资产担保债券
23.8债务抵押债券
23.9相关系数在篮筐式信用违约互换与CDO中的作用
23.10合成CDO的定价
23.11其他模型
小结
推荐阅读
练习题
作业题
第24章特种期权
24.1组合期权
24.2非标准美式期权
24.3远期开始期权
24.4复合期权
24.5选择人期权
24.6障碍式期权
24.7两点式期权
24.8回望式期权
24.9喊价式期权
24.10亚式期权
24.11资产交换期权
24.12涉及多种资产的期权
24.13波动率和方差互换
24.14静态期权复制
小结
推荐阅读
练习题
作业题
附录24A计算篮筐式和亚式期权价格时所需要矩的计算公式
第25章气候、能源以及保险衍生产品
25.1定价问题的回顾
25.2气候衍生产品
25.3能源衍生产品
25.4保险衍生产品
小结
推荐阅读
练习题
作业题
第26章再论模型和数值算法
26.1布莱克斯科尔斯的替代模型
26.2随机波动率模型
26.3IVF模型
26.4可转换证券
26.5依赖路径衍生产品
26.6障碍式期权
26.7与两个相关资产有关的期权
26.8蒙特卡罗模拟与美式期权
小结
推荐阅读
练习题
作业题
第27章鞅与测度
27.1风险市场价格
27.2多个状态变量
27.3鞅
27.4计价单位的其他选择
27.5多个独立因子的情况
27.6改进布莱克模型
27.7资产替换期权
27.8计价单位变换
27.9传统定价方法的推广
小结
推荐阅读
练习题
作业题
附录27A处理多项不定性
第28章利率衍生产品:标准市场模型
28.1债券期权
28.2利率上限和下限
28.3欧式利率互换期权
28.4推广
28.5利率衍生产品的对冲
小结
推荐阅读
练习题
作业题
第29章曲率、时间与Quanto调整
29.1曲率调整
29.2时间调整
29.3QUANTO
小结
推荐阅读
练习题
作业题
附录29A曲率调整公式的证明
第30章利率衍生产品:短期利率模型
30.1背景
30.2平衡性模型
30.3无套利模型
30.4债券期权
30.5波动率结构
30.6利率树形
30.7一般建立树形的过程
30.8校正
30.9利用单因子模型进行对冲
小结
推荐阅读
练习题
作业题
第31章利率衍生产品:HJM与LMM模型
31.1Heath、Jarrow和Morton模型
31.2LIBOR市场模型
31.3联邦机构房产抵押贷款证券
小结
推荐阅读
练习题
作业题
第32章再谈互换
32.1标准交易的变形
32.2复合互换
32.3货币互换
32.4更复杂的互换
32.5股权互换
32.6具有内含期权的互换
32.7其他互换
小结
推荐阅读
练习题
作业题
第33章实物期权
33.1资本投资评估
33.2风险中性定价的推广
33.3估计风险市场价格
33.4对业务的评估
33.5商品价格
33.6投资机会中期权的定价
小结
推荐阅读
练习题
作业题
第34章重大金融损失以及借鉴意义
34.1定义风险额度
34.2对于金融机构的教训
34.3对于非金融机构的教训
小结
推荐阅读
术语表
附录ADerivaGem软件说明
附录B世界上的主要期权期货交易所
附录Cx≤0时N(x)的取值
附录Dx≥0时N(x)的取值
……
Ⅳ 如何理解 Black-Scholes 期权定价模型
Black-Scholes-Merton期权定价模型(Black-Scholes-Merton Option Pricing Model),即布莱克-斯克尔斯期权定价模型。
1997年10月10日,第二十九届诺贝尔经济学奖授予了两位美国学者,哈佛商学院教授罗伯特·默顿(Robert Merton)和斯坦福大学教授迈伦·斯克尔斯(Myron Scholes),同时肯定了布莱克的杰出贡献。
斯克尔斯与他的同事、已故数学家费雪·布莱克(Fischer Black)在70年代初合作研究出了一个期权定价的复杂公式。与此同时,默顿也发现了同样的公式及许多其它有关期权的有用结论。默顿扩展了原模型的内涵,使之同样运用于许多其它形式的金融交易。
Ⅵ 金融数学的起源
金融数学的历史回顾
关于金融数学的起源最早可以追溯到1900年
l 法国天才Bachelier Louis在Einstein和Wiener(正式建立了Brown运动的数学模型1905年)之前1900年就已经认识了Wiener函数的一些重要性质,即扩散方程和分布,并在其博士论文The Theory of Speculation中首次给出了欧式买权的定价公式。
l 1952年Harry M. Markowitz(1927-)(纽约市州立大学,1990年诺贝尔经济学奖获奖者之一)提出投资组合的选择(Portfolio selection)理论。如果一个投资者为减少风险同时对多种股票进行投资,那么什么样的投资组合最好?均值方差最优投资组合模型。
l 1958年Modigliani,F.(1985年诺贝尔经济学奖获奖者之一), Miller,M.H.(1923-2000)(芝加哥大学,1990年诺贝尔经济学奖获奖者之一)提出Modigliani-Miller定理(MMT),他断言,在一定的条件下,公司的市场价值只依赖于它的利润流,而于它的资本结构无关,即与债权与股权之间的比例无关;也于它的分红策略无关,即与债权者与股权者之间的利润分割无关。William F. Sharpe(斯坦佛大学,1934-)资本资产定价理论模型(CAPM)。Markowitz, Miller, Sharpe 获1990年诺贝尔经济学奖。
l 1964年,Sprenkle提出了“股票价格服从对数正态分布”的基本假设,并肯定了股价发生随机漂移的可能性。同年,Boness将货币时间价值的概念引入到期权定价过程,但他没有考虑期权和标的股票之间风险水平的差异。
l 1965年,著名经济学家萨缪尔森(Samuelson)把上述成果统一在一个模型中。1969年,他又与其研究生Merton合作,提出了把期权价格作为标的股票价格的函数的思想。
l 1971年Robert C. Merton (1944-哈佛大学教授,数学硕士)首次提出了最优消费与投资组合问题,用随机动态规划的方法引入金融数学。Robert C. Merton,Myron S. Scholes1997获年诺贝尔经济学奖。
l 1973年Fisher Black(1938-1995哈佛大学应用数学博士)和Myron S. Scholes(1944-(斯坦福大学教授,工程学士))在《政治经济学杂志》发表具有划时代意义的“期权定价与公司财务”一文,该论文首次提出了金融衍生品的期权定价理论,获得了Black-Scholes期权定价模型。Robert C. Merton (1944-)进一步完善和系统化这一理论。1973年在Black和Scholes用几何Brown运动来刻画价格波动规律,用无套利复制的方法建立了欧式期权的定价公式。
两种证券:股票 债券
欧式看涨期权
,
在B—S模型之前,虽然众多学者已经建立了各种各样的期权定价模型,但这些模型几乎不具备任何实用价值,因为它仍或多或少地包含一些主观的参数,如投资者个人对风险的态度、市场均衡价格等。
1973年Robert C. Merton (1944-)在《经济和管理科学》发表题为“理性期权定价理论”论文,后来和Black,Scholes合作发表了多篇文章,并对经典的Black-Scholes模型从多方面做了进一步改进和发展(如股票价格的跳扩散模型)。
他们的工作被称为华尔街的“第二次革命”,B-S公式被成千上万的投资者每天是用,被誉为有史以来用的最多的数学工具,同时他们开创性的工作也大大推动了数学在经济学金融学的应用和发展(如随机分析,随机控制,随机微分方程,数值计算,优化理论,数理统计,非线性数学等)。
Black-Scholes “期权定价与公司财务”一文的发表过程曾被两次退稿,第一次《政治经济学杂志》主编退稿的理由是:金融内容太多,经济学内容少;《经济与统计评论》退稿时甚至没有说任何理由。后来《政治经济学杂志》换了主编,在Miller的推荐(“打招呼”)下,在1973年才得以发表。而B-S公式的实证论文在1972年就在《金融学杂志》上发表。B-S公式是使用频率最高的数学公式之一,该文的引用率高达一万三千多次(13299次)远远高于其他经济学诺奖的获奖者(如Samuelson 为3993)。
l 1976年Ross,S.A.(1944- )针对资本资产定价模型(CAMP)提出了一个多因子模型,即套利定价模型(ATP),其主要结论是:无套利假设等价于某种等价概率测度的存在,这使得每一种金融资产对该概率测度的期望收益率都等于无风险证券的收益率。
l Harrison 和 Krops(1979), Harrison 和 Pliska(1981),奠定了期权定价鞅方法的理论。主要结论是,在给定的市场模型下,如果等价鞅测度存在,则市场是无套利的,如果等价鞅测度存在且唯一,则市场是完备的,即市场上的任意未定权益都是可达到的。完备市场上任意未定权益有唯一无套利定价,即为未定权益的折现价格在等价鞅测度下的数学期望。完备市场是以理想的市场模型,现实市场多为不完备市场。
l Follmer 和 Sondermann(1986)首次用均值方差准则研究了不可达未定权益(non-attainable claim)的套期保值问题,依此准则,Martin Schweizer (1994),在假定风险资产的价格过程是满足一定形式的半鞅并且未定权益满足F-S分解的条件下,给出了任意未定权益的最优套期保值策略和近似定价。
Ⅶ 为什么股票价格服从对数正态分布
我们可以假设连续复利,用lnS1-lnS0来近似股票的收益(S1-S0)/S0,而且根据集合布朗运动可知,此收益是服从正态分布的。
Ⅷ 个股k线值怎样计算听过一个金融人士的理论:XX值取对数呈正态分布,这个XX指的什么
这些理论也不一定准确
Ⅸ 怎么用Excel做蒙特卡洛模拟
进行频度统计。首先选中与总工期相对应的频度下面的单元格D2:D23,然后输入公式“=FREQUENCY(A2:A101,C2:C23)”,然后按下Ctrl+Shift+Enter。如此会计算出模拟出来各个总工期的发生次数。
Ⅹ 正态分布的公式及含义
正态分布
normal distribution
一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。
生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。
from http://www.5yiso.cn
(一)正态分布
1.正态分布
若 的密度函数(频率曲线)为正态函数(曲线)
(3-1)
则称 服从正态分布,记号 ~ 。其中 、 是两个不确定常数,是正态分布的参数,不同的 、不同的 对应不同的正态分布。
正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。
2.正态分布的特征
服从正态分布的变量的频数分布由 、 完全决定。
(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于 。
(2) 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中。 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高。
(二)标准正态分布
1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,通常用 (或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。
2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。
3. 标准正态分布表
标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例 。
(三)正态曲线下面积分布
1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式3-2计算。
(3-2)
。
2.几个重要的面积比例
轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.27%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%。
(四)正态分布的应用
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式(3-2)估计任意取值 范围内频数比例。
2. 制定参考值范围
(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
表3-1 常用参考值范围的制定
概率
(%) 正态分布法 百分位数法
双侧 单 侧 双侧 单侧
下 限 上 限 下 限 上 限
90
95
99
3. 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
from http://www.foodmate.net/lesson/41/3-1.php
一、正态分布的概念
由表1.1的频数表资料所绘制的直方图,图3.1(1)可以看出,高峰位于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图3.1(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。
图3.1频数分布逐渐接近正态分布示意图
为了应用方便,常对正态分布变量X作变量变换。
(3.1)
该变换使原来的正态分布转化为标准正态分布 (standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。
二、正态分布的特征:
1.正态曲线(normal curve)在横轴上方均数处最高。
2.正态分布以均数为中心,左右对称。
3.正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用表示均数为,方差为的正态分布。用N(0,1)表示标准正态分布。
4.正态曲线下面积的分布有一定规律。
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。
查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式(3.1)求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数和标准差S分别代替μ和σ,按式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。
正态分布曲线下有三个区间的面积应用较多,应熟记:①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ,μ+1σ)的面积占总面积的68.27%;②标准正态分布时区间(-1.96,1.96)或正态分布区间(μ-1.96σ,μ+1.96σ)的面积占总面积的95%;③标准正态分布时区间(-2.58,2.58)或正态分布时区间(μ-2.58σ,μ+2.58σ)的面积占总面积的99%。如图3.2所示。(μ-3σ)的面积比例为99.74%,(μ-2σ)面积比例为95.44%。