华中科技大学博士学位论文Copula理论与相关性分析姓名:吴娟申请学位级别:博士专业:概率论与数理统计指导教师:任佳刚;刘次华20091024
华中科技大学博士学位论文 I摘 要 本文主要研究利用Copula理论分析多维随机变量的相关性及其应用。Copula是一个“连接”多维联合分布及其边缘分布的函数,其优点主要有两点:第一,它能完整地刻划变量之间的相关性结构;其次,它可以将单个随机变量的边缘分布与变量间的相关结构拆开来处理,然后再加以整合,这样能生成灵活多样的高维概率分布。论文首先分析了多元Copula函数的特点,然后基于Copula理论研究了随机变量的相关性,探讨了多元Copula参数模型的选择问题,以及利用Copula函数在多元极值理论中获得了一些成果,最后研究了Copula模型在金融和保险等领域的应用。 本文的创新点和主要工作如下: 1. 深入分析了Copula理论在研究多变量的相关性中的重要作用,与传统的相关性分析方法相比,Copula函数所具有的优势和特点。讨论了当边缘分布是连续和非连续的两种情形时Sklar定理的不同结果,并用一种新的方法更简单地证明了此定理。利用Copula理论研究了Kendall’s τ系数与 Spearman’s ρ系数之间的关系,得到了两者比值ρτ变化的不等式。针对一类Copula参数族,证明了比值ρτ的极限值是3/2. 2. 如何选取合适的Copula函数来描述多维随机变量的相关性结构是目前Copula理论研究中的一个难题。论文讨论了一类多元Copula参数模型的选择问题,其Copula函数能与一个一元函数构成一一对应的关系,从而达到降维的目的。研究了4种此类常见的Copula模型的性质和图形,并分别在参数已知或未知两种情况下进行了拟合优度检验。对中国股市的上证指数与深证综指作了实证分析,结果表明两者存在着较强的正相关性,相关性模型选取Gumbel Copula模型最合适。 3. 多元极值理论的研究比较复杂,特别是当多个随机变量不是相互独立时,联合分布的极值行为除了要考虑边缘分布的极值性质外,更重要的是要分析变量之间的相关性。因此,相关性分析在多元极值理论研究以及金融与保险等应用领域中都扮演着重要角色,其中对尾部相关性的研究尤为引人关注。针对金融数据呈现出的尖峰、厚
华中科技大学博士学位论文 II尾等特点,论文利用一种特殊的Copula—极值Copula函数,得到了两个多维随机向量的最大量的相关结构,并把此结果应用到了巨额医疗索赔中,构建了计算再保险费用的模型。结果显示:选择恰当的极值Copula来计算再保险费用在各种方案中是最优的。 关键词: Copula; 相关性; Kendall’s τ; Spearman’s ρ; 极值理论; 极值Copula; 尾部相关性
华中科技大学博士学位论文 IIIAbstract The present work concerns the study of the multivariable dependence using cop-ula theory and its application. Copula is a kind of function that “connects” multivari-ate joint distribution and margins, and the major advantages are: first, it can character-ize the multivariate dependent structure completely; Secondly, it can deal with the uni-variate margin and the dependent structure separately, and then integrate them, so thatcopula can generate a variety of flexible high-dimensional probability distribution. Weanalyze the characteristics of multivariate copula functions, and then discuss the depe-ndence between variables based on copula theory. We also integrate the selection of multivariate copula parameter models, as well as getting some results about multivari-ate extreme value theory in terms of copula functions. Finally the applications of co-pula are considered in finance and insurance fields. The key points and main achievements of this thesis are listed as follows: 1. The importance of copula theory on the multivariate dependence is given, and the advantages and characteristics are compared to the traditional methods. We disc-uss the different forms about Sklar theorem when the margins are continuous or not, and prove it easily by a new way. The relationship between Kendall’s τ and Spearm-an’s ρ coefficient is studied in terms of copula theory, and the inequalities about th-e changes of their ratio ρτ are verified. For a class of copulas with parameters, t-he limit of ratio is proved to be 3/2. 2. How to select the appropriate copula to describe the multivariate dependent structure? It is a difficult problem in recent research. We select a special kind of cop-ula which can only be decided by a unary function, so as to reduce the dimension. Giving the nature and graphics of such four copulas, goodness-of-fit tests are sugges-ted within parameter is known or unknown. We make the empirical analysis of China’sstock market. The results show that the Shanghai index and Shenzhen composite index
华中科技大学博士学位论文 IVshare a strong positive dependence, and Gumbel copula is the most suitable in the de-pendent models. 3. Multi-extreme theory is much complex, especially when variates are not inde-pendent. The extreme behavior of just one component of a random vector is unlikely to imply the extreme behavior of the whole vector. Therefore, the analysis about dep-endence plays an important role in the extreme value theory research and application areas such as finance and insurance in which tail dependence is particularly remarkab-le. For the financial data showing a leptokurtosis, thick tail and other characteristics, we get the tail dependence of multivariate maxima using a special kind of copula cal-led extreme value copula, and the result is applied to the area relating to medical ins-urance large claims. We construct the model for calculating the cost of reinsurance. The results show that the plan for selecting the extreme value copula to calculate the costs is optimal in all programs. Keywords: Copula, Dependence, Kendall’s τ, Spearman’s ρ, Extreme Value Th-eory, Extreme Value Copula, Tail Dependence
独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本论文属于 (请在以上方框内打“√”) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日保密□,在 年解密后适用本授权书。 不保密□。
华中科技大学博士学位论文 1 1 绪 论 1.1 问题的提出与研究现状 本章主要介绍利用Copula研究多维随机变量的相关性的意义,阐述Copula理论近50年来发展的基本脉络,以及应用Copula函数研究多元极值理论的成果。 1.1.1 利用Copula研究相关性的意义 相关性分析是多变量随机分析中的一个中心课题。理论上,多个随机变量之间的相关性关系是非常复杂的,对于高维情形尤其如此,我们很难对变量间的相关性做出全面的了解。从实际应用角度来看,在金融和保险等领域,诸如投资组合、金融风险分析和保险费用计算等问题都与相关性分析密不可分([1]-[4]). 过去对相关性的研究主要集中在对随机变量之间相关程度的分析上,而忽略了对相关模式的研究。这些方法均存在着一定的局限性,例如最常用的Pearson相关系数只能反映变量间的线性相关程度,而无法捕捉到非线性的关系。当变量间存在着非线性关系时,如果仍采用Pearson相关系数来分析相关性就可能产生错误([5],[6]). 其它常用的一些相关性系数如Kendall’s τ系数、Spearman’s ρ系数和Gini关联系数等虽然能在一定程度上反映变量间的非线性相关性,但都不能全面完整地刻划变量间的相关结构。格兰杰(Granger)因果分析法([7])虽然也可以分析相关性,但是它只能做定性的结论,而给不出定量的描述。 另一方面,构造高维随机变量的联合分布也是一个难题。知道了每个随机变量的边缘分布以及相关系数,足够解决问题吗?一般情况下,答案是否定的。多元联合分布的构造在相关的理论推导和计算中都是极为繁琐的,尤其是当随机变量的个数比较大时,要想准确估算出联合概率分布几乎是不可能的。过去的处理方法往往是假设联合分布是多维正态分布或t-分布等椭球分布来做分析推断。现在越来越多的学者,例如Embréchts和McNeil([6])以及Cherubini([8])等人认识到许多实际数据并不服从多维正态分布等事先指定的分布,而错误的假设可能会导致严重的后果。Demarta([9])和Harrington([10])指出,多维正态分布的假设将低估巨大事件(如金融危机等)发生时股价同时下跌及多个交易对手同时发生违约的概率,并因而可能低估整个投资组合所面
华中科技大学博士学位论文 2 临的风险。 Copula的出现有助于我们解决上述难题。作为一种灵活、稳健的相关性分析工具-Copula理论在分析变量间的相关结构时具有很多优点([11]-[14]). 首先,由Copula函数导出的相关性度量,不仅在线性变换下不会改变,而且对于严格单调增的变换都不会改变,因此Copula具有很强的实用性;其次,运用Copula理论可以将随机变量的边缘分布和它们之间的相关结构分开来研究,其中边缘分布的选择不受限制,可以根据实际情况来选择合适的分布,并且变量间的相关性能被Copula函数完整地描述;另外,Copula函数可用于构造更符合实际的多元概率分布,而不再局限于多维正态分布和t-分布等少数几种概率分布。 1.1.2 Copula理论研究的历史和现状 Copula一词的本意是交换、连接的意思,是一个拉丁单词。Copula函数能把多维随机变量1,,nXX的联合分布()1,,nFxx与它们各自的边缘分布()()11,,nnFxFx相连接,Sklar([15])证明了在很一般的情况下存在着一个多元实函数()1,,nCuu, 使得 ()()()()111,,,,.nnnFxxCFxFx= 这个多元函数C就是Copula. 利用Copula构造多维随机变量的联合分布时,不需要对边缘分布作任何假设,这样可得到各种不同的多元分布;另外,我们也可以将随机变量的边缘分布与相关结构拆开分别进行讨论,多元概率分布的研究会因此变得更为简单。然而Copula的作用绝不仅限于此,它自身还具有一系列优良的性质。Copula理论及其应用近年来发展非常迅速,特别是本世纪近十年来,Copula技术在金融、保险、生物和医药等领域的广泛应用是毋庸置疑的。 Copula理论的发展按照时间来划分大致可以分为三个阶段([16]): 第一阶段是1986年以前,Copula理论最早要追溯到Wassily Hoeffding 和 Maurice Fréchet在上世纪40年代初的工作([17],[18]),虽然Copula一词是由Sklar在1959年首次提出的。这一阶段主要是一些数学家的工作,他们的贡献包括Copula理论中重要的Sklar 定理,Copula函数的上下界的确定等问题,其主要结论参见Schweizer 和Sklar等人的文献([19]-[23]). 第二阶段是1987年至1996年,Copula 概念被越来越多的概率统计学家所认识并被接受。他们注意到Copula函数不仅可以构建联合分布与边缘分布之间的桥梁,而且还能精确度量变量间的相关结构([24]-[26]). Genest([27])基于Copula理论来做统计推