logo资料库

2019年 闵祥伟 概率论和数理统计 论文.docx

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
数理统计论文 选题:概率悖论+计算机方面应用+分布类型之间的联系 班 级: 学 号: 2018211309 2018211352 姓 名: 曹雅琳 学 院: 计算机学院 2019 年 12 月 14 日
关键字 悖论 人工智能 大数据 概率分布 一、概率论研究中的有趣悖论 (1)基本比率谬误 事例: 小 C 去医院检查,发现他患上某病的结果为阳性,他网上查询资料得到以下 提示:该病的检查有 1%的假阳性率和假阴性率,也就是说,在得病的人中有 1% 的假阳性和 99%的真阳性,在未得病的人中有 1%的假阴性和 99%的真阴性。 小 C 根据“在得病的人中有 1%的假阳性和 99%的真阳性”这句话,计算出 他实际上得了该疾病的可能性(即概率)为 99%() 然而他的医生却说:“99%是指测试的准确性,而不是你实际得病的概率。” 还说他患病的概率只有 9%左右。 医生的计算方法为:测试结果的误报率是 1%,也就是 1000 个人有 10 个人 检查结果为“假阳性”;根据该病在人口中的比例(1/1000),真阳性只有 1 个。因此,大约在 10+1=11 个测试为阳性的人中有 1 个是真阳性(有病)的,所 以小 C 被感染患病的几率是大约 1/11,即 9%。 对这一个例子,我们利用贝叶斯定理进行解释:随机变量 A 指的是“小 C 得病”,随机变量 B 指的是“小 C 检查结果阳性”。先验概率 P(A)指的是小 C 没有检查出阳性时得病的概率,P(A) = 0.1%,而条件概率 P(A|B)指的是小 C 检 查结果为阳性的条件下得 X 病的概率,代入公式计算可知 P(A|B)=9%。 (2)圣彼得堡悖论 圣彼得堡游戏规定:假设掷出正面(反面)为成功,游戏者投掷未成功就继 续投掷,直到成功投出正面(反面)游戏结束。第一次投掷成功得奖金 2 元;第 二次投掷成功得奖金 4 元;……;第 n 次投掷成功,得奖金 2^n 元。 期 望 值 计 算 和 游 戏 理 论 玩 法 : E(X) = 1/2 *2+1/4*4+ … … +1/ ( 2^n ) *(2^n)=1+1+1+……+1=∞。由概率的已知结论,多次重复试验结果值接近于其数 学期望值,玩家只需要参加游戏,最终都会得到无穷多的收益。 但是实际的游戏结果表明:多次投掷结果的实际均值最多几十元。 通过计算机的模拟试验,我们发现矛盾的产生原因在于:样本均值在这里随 着实验次数的增加发生变化。在 n 次实验以后,均值 X 关于试验次数的函数可以 近似表示为 X=lgn/lg2。实验次数 n->∞时,样本均值 X->∞,但对数函数的性质 使 得 均 值 趋 于 无 穷 大 的 速 度 减 慢 。 比 如 进 行 10^6 次 实 验 的 平 均 值 等 于 6/0.301=19.9,样本均值约为 20 元;而要想样本均值达到 20 元的 50 倍(1000 元),需要 10^322 次实验。(10^6 次实验的 10^316 倍)。因此我们通过计算 可得:如果玩家花费一亿元参加游戏,则需要重复玩 10^301000000 次以上才能 赚回他所花费的钱,这几乎不可能。 这个悖论引出了一个结论:我们不能总是完全按照期望来做决策,还需要考 虑期望和实验次数的关系。当实验次数和数学期望有关时,我们按照数学期望来 做决策的方法是错误的。
(3)贝特朗悖论 悖论内容:“在圆内任选一条弦,事件“弦的弦长长于圆的内接等边三角形 的边长”的概率是多少?” 一共有三种看似合理的解决方法: 解法一:在圆内垂直于圆的内接等边三角形任意一条边的直径上,我们随机 取一个点,通过该点作一条垂直于该直径的弦。由圆内正接三角形的性质可得, 在该点位于半径的中点时,弦长度等于三角形的边长度,当点和圆心的距离小于 r/2 时弦长度将大于三角形边长。由几何概型得概率 P= 1/2. 解法二:通过内接等边三角形任意一个顶点做圆的切线,由于等边三角形内 角 60°,所以左边右边的角度数都是 60°。在该顶点做一条弦,弦的另一端和 圆相交于一点。可知弦与切线成 60°角和 120°角之间时,弦长大于三角形边长。 所以由几何概型概率 P= 1/3. 解法三:当弦的中点在阴影标记的圆内时,弦的长度大于三角形的边长,而 大圆的弦中点一定在圆内,大圆的面积是 pi*r^2,小圆的面积是 pi*(r*2)^2。 所以概率 P= 1/4. 同一问题有三种不同答案,原因在于“取弦”的规定不够具体,不同的“等 可能性假定”导致了不同的样本空间: 解法一中假定弦的中点在直径上均匀分布,直径上的点组成样本空间Ω1。 它预先指定弦的方向,作垂直于此方向的直径,只有交直径于 1/4 点与 3/4 点 间的弦,其长才大于内接正三角形边长。所有交点是等可能的,此时弦的中心在 直径上均匀分布。 解法二中假定弦的另一端在圆周上均匀分布,圆周上的点组成样本空间Ω2, 它预先固定弦的一端,仅当弦与过此端点的切线的交角在 60°~ 120° 之间, 其长才合乎要求,所有方向是等可能的,此时假定另一端点端点在圆周上均匀分 布。
解法三中假定弦的中点在大圆内均匀分布,大圆内的点组成样本空间Ω3。 它假设弦被其中点位置唯一确定,只有当弦的中点落在半径缩小了一半的同心圆 内,其长才合乎要求。中点位置都是等可能的,此时假定弦长被其中心唯一确定。 可见,上述三个答案是针对三个不同样本空间引起的,虽然结果不同,但都 是正确的。 贝特朗悖论可得一个结论:在定义概率时要事先明确指出样本空间是什么。 从概率论发展的角度来说,贝特朗悖论的提出促进了古典概型向几何概型的转 变。 (4)男孩女孩悖论 对于男孩女孩悖论,问题描述中细微的理解差异会导致推导结果的不同。 问题描述:一个家庭有 2 个孩子,有一个孩子是女孩。求另一个孩子是女孩 的概率。 一般人认为,孩子的性别是相互独立的,一个孩子的性别不会影响另一个孩 子的性别,所以另一个孩子是女孩的概率是 1/2。 但是另一种推导过程如下: 两个孩子的性别共有三种可能:两个男孩、两个女孩、一个男孩一个女孩。 三种情况的概率并不相等,因为按照孩子出生的顺序,一共有 4 种可能,分别是 (男,男)、(女,女)、(男,女)、(女,男)。每种情况的概率都是四分 之一。在已知有一个女孩时,(男,男)的情况可排除,剩下三种情况概率相等。 其中只有(女,女)符合题设,因此另一个孩子是女孩的概率是 1/3。 这两种答案的分歧主要来自于对于“有一个孩子是女孩”的不同理解。如果 理解为“这个女孩已知”(也就是她是姐姐还是妹妹已知),那么我们得到 1/2 为题目答案;如果理解为“至少有一个女孩”(她是姐姐还是妹妹未知),那么 我们需要列举出几种等可能情况,得出答案为 1/3。 二、概率论在计算机领域的应用 概率论与数理统计作为计算机科学的一门基础学科,在计算机的具体应用中 有很重要的应用。 (1)在人工智能方面的作用 在人工智能方面,概率为人工智能提供随机性和预测基础;而统计则对数据 进行处理与分析,让结果满足我们的要求,以便于我们的应用。 随机初始化 训练神经网络有时需要权重随机初始化,如果把权重或者参数都初始化为 0,梯度下降将无法起作用,无论多少层都无法正确拟合。为此,我们需要通过 正态分布对权重随机初始化,以便达到比较好的效果。 深度学习 深度学习的核心原理在某种意义上可以用拟合来代替,通过多层网络、多神 经元以及激活函数构建一个计算图,学习样本进行拟合,求得较好的参数集。得 到训练好的模型后,可以代入计算进行决策。
拟合 拟合是统计学的一个重要内容。统计学中用到的最小二乘法便是一种线性拟 合方式,这种利用已有数据对未知数据进行判断和决策的思想,在深度学习有很 好的应用。神经网络可以说是应用于复杂数据的一种复杂的拟合方式,因此,统 计学中很多概念如无偏估计、有偏估计同样可以应用在拟合的优化中。在深度学 习中,方差可以用来描述实际的拟合情况:方差高意味着过度拟合。深度学习参 数修正与神经网络改善的一大难题便是如何得到一组恰到好处的方差。 从上述讨论,可以看出概率与统计在人工智能领域各种算法中的重要意义。 无论是数据的处理分析还是数据的拟合决策,概率与统计都提供了重要支持。因 此在大学期间学好概率论可以为未来的研究应用打下基础。 (2)在大数据方面的应用 大数据、概率论及数理统计在研究的目标上是一致的,都是针对于数据结构 进行分析和探索,从而找到数据之间的联系和规律,为人们的生活和工作提供参 考。 在大数据分析中,概率论与数理统计广泛应用的常见方法主要涉及两种:一 是层次分析法;二是蒙特卡罗法。 层次分析法 层次分析法主要对于不确定因素的演变规律以及发展趋势进行分析,对这些 因素之间的关联性进行把握考量,按照层次对因素进行划分,实现对不确定因素 的归类。 在运用层次分析法分析与解决问题的过程中,需要判断不确定因素的概率, 这就涉及到了概率问题。解决此类概率问题主要使用数学模型进行分析。数学模 型在层次分析法中应用时,需要明确问题中各个因素,对因素进行层次划分,使 问题形成一个递阶层次结构。在问题分析的过程中,需要将上一级要素作为准则 和下一级要素对比,结合评定尺度将下一级要素和上一级要素的重要程度进行分 析,计算出问题综合重要度,进而给决策提供相应的参照。 蒙特卡罗法 蒙特卡罗法对不确定因素进行反复随机抽样,判断不确定因素对于实际决策 带来的影响。蒙特卡罗法的应用要根据问题进行真实模拟,使得实际问题达到更 好的解决效果。 综上所述,概率论与数理统计为大数据分析提供了有效辅助,提升大数据分 析的效果和质量,满足了人们对数据的实际需要。我们必须掌握和了解大数据、 概率论与数理统计相关基础知识,同时熟悉它的必要性,这对我们的日常生活和 生产会起到积极作用。 三、常见分布之间的联系 对于这学期所学习的知识,我们所常用的概率分布有如下几种: 离散型:二点分布、二项分布、泊松分布; 连续型:均匀分布、指数分布、正态分布; 后续在数理统计中,我们学到了χ^2 分布、t 分布、F 分布。 此外,我们还有柯西分布、负二项分布、超几何分布等分布。
对于这些分布,我们已学的联系有: (1)两点分布在 n 次独立重复实验之后体现的是二项分布; (2)二项分布的 n(试验次数)和 p(成功概率)的积,在 n 无穷大时,可作 为泊松分布的参数。 (3)χ^2 分布、t 分布、F 分布的定义是层层递进的,χ^2 分布是另外两 个的基础。 通过查阅文献,我们可以了解到更多的分布关系: (1)泊松分布和二项分布关系: X~π(λ1),Y~π(λ2),且 X,Y 相互独立,则 X|X+Y ~ B(n,λ1/(λ1+λ2)); (2)二项分布和负二项分布关系: X~Nb(r,p),P(X=k)=r*P(Y=r)/(r+k),Y~B(r+k,p); (3)χ2(n)和 t(n)的关系: 和 X,Y 独立同分布于χ2(n)分布,则(√n*X-Y)/(2√(X+Y))~t(n); (4)t 分布和 F 分布的关系: T~t(n),T^2~F(1,n); (5)正态分布和柯西分布的关系: X~N(0,1),Y~N(0,1),且 X,Y 相互独立,则 X/|Y|服从柯西分布; (6)F 分布和均匀分布的关系: X~F(2,2),X/(1+X)~U(0,1); (7)几何分布(离散型)和指数分布(连续型)的关系: X~Exp(λ),Y=[X+1]~Ge(p),p=1-e^(-λ);
参考文献 [1]陶会强 《常见概率分布之间的关系及应用研究》 1671-9743(2011) 05-0075-04 [2]陈召召 《贝特朗悖论新说》 1673-260x(2019)11-0022-04 [3]【圣彼得堡悖论-Hellolijunshy 的博客-CSDN 博客】 网址:https://blog.csdn.net/Hellolijunshy/article/details/80976488 [4]【问题|果壳 科技有意思】 网址:https://m.guokr.com/question/461993/ [5]【贝特朗悖论_百度百科】 网址: https://m.baidu.com/sf_bk/item/%E8%B4%9D%E7%89%B9%E6%9C%97%E6%82%96%E 8%AE%BA/9241081?fr=aladdin&ms=1&rid=8049582107269123286 [6]【【个人总结】概率论与数理统计在人工智能领域的应用-无极阁-CSDN 博客】 网址:https://blog.csdn.net/Swocky/article/details/82928704 [7]【常见概率分布背后的直觉和相互联系-电子发烧友网】 网址: http://m.elecfans.com/article/803732.html [8]【两孩悖论——蒙洛迪诺的挑战和史密斯的反击 - 日记 - 豆瓣】 网址:https://m.douban.com/note/711338278/ [9]【男孩还是女孩?悖论?_飘在海的另一边_新浪博客】 网址:http://blog.sina.cn/dpool/blog/s/blog_16c3c62160102x530.html
分享到:
收藏