logo资料库

数学建模,B题,翻译后.doc

第1页 / 共20页
第2页 / 共20页
第3页 / 共20页
第4页 / 共20页
第5页 / 共20页
第6页 / 共20页
第7页 / 共20页
第8页 / 共20页
资料共20页,剩余部分请下载后查看
摘要 在本文中,我们提出了一个计算机模型来预测基于地点和对过去的罪 行序列的连环犯罪的下一个可能犯罪地点和住所。我们首先创建一个 “路线度量指标”,以衡量汽车行驶时的距离。 为了预测未来犯罪的地点,我们应用核密度估计的无参统计技术与我 们的路线度量指标,其中线路度量指标是允许我们估计一个与时间相 关的概率分布函数。为了预测连环犯罪的地址,我们使用由 Rossmo 开发的一个精细模型,使之适应路线度量指标。这种方法开发了一种 关于犯罪分子可能的居住地点的概率分布通过平衡以往犯罪地点与 观察,离家越远就有越多的机会作案,被抓的几率就越少。我们把我 们的模型应用到多次大规模连环杀人案,即彼得萨克利夫的“约克郡 开膛手”案,和 “亚特兰大儿童”案的凶手韦恩威廉姆斯。在这两案件 中,我们的模型在预测犯罪地点中取得了成功,并且证明可能在刑事 调查中有用。 1 简介 在本文中,我们呈现了一个研究犯罪模式的计算机模型。我们的模型 将高速公路系统作为犯罪分子如何犯罪的一个重要的决定因素。特别 的,我们建立了一个路度量来计算司机从地图上的一点到另一点开车 要花费多少时间。我们把这个路度量纳入许多不同的模型中来预测下 一次犯罪将会是在哪里发生和嫌疑人住在哪里。我们的模型给执法部
门一种预测在哪里搜查才能最大可能的抓获嫌疑人的方法和 。 1.1 我们方法的大纲 我们论文的开始给出了我们计算机模型的理论框架和大纲。后面部分 将我们的模型应用到著名的刑事案件中并检验模型的精确度。对每个 案件的调查我们都大致做如下处理 1. 建立路度量来计算基于在两地间开车所花费的时间的距离。这 个度量主要基于当地的高速公路系统 2. 估计推断下一次作案的可能地点的概率密度函数 3. 用基于路度量的一个最合适环路来估计嫌疑人的住所 1.2 假设 由于犯罪活动的巨大变动以及几乎所以连环杀人案的凶手通常患有 心理疾病,所以采用相对简单的计算机模型去预测连环杀人案一般都 面临几个障碍。以下是应用于我们模型的对犯罪行为所采取的假设: 1 犯罪是由个人构成的。我们假设模型中的案件都是由单独个体作案 的,我们的模型不是为有组织的犯罪,团伙犯罪和暴动而建立的。 2 犯罪分子都是驾车逃离。我们模型在分析高速公路模式时有意义, 这里,我们通过计算驾车行驶所花费的时间来判断距离。 3 作案地点在被发现地点的附近。在凶杀案中这意味着尸体的发现地 点就是作案地点。这不是个不合理的假设,因为多数连环案件的凶手 在作案后会把受害人尸体丢到作案地点附近。在连环案件中,比如连 环强奸案,爆窃或纵火案,作案地点与警方发现地点是没有区别的。 4 犯罪发生在一个狭小的区域,比如一个市或县。这里忽略案件发生
在州或国家之间的情况。在那些案件中,我们的模型必须被应用于每 一个集群。 2 测绘犯罪和路度量 我们用数学软件 Sage 来生成一幅案发地点附近的地图。地图中的主 要特征有主要的高速公路线路和案发现场。 我们把高速公路系统看 作一个图,把高速路的每个出口入口看作图中的顶点,把出口入口间 的公路部分看作图的边。给相邻两顶点间的边赋一个权值,该权值为 两顶点间的欧几里得距离。 2.1 路度量 对每一个图M,计算一个路度量d:M * M —〉R+ 。在一个地区 内,路度量根据两地开车所花费的时间来计算两点间的距离。这个方 法是建立在司机总是走两点间最短路径和尽量利用高速路而不是走 侧街道的假设基础上。路度量建立连这样的假设: 在侧街道上花费的时间是与曼哈顿度量成正比的,因为侧街道总是 被规划成网格形状。 花费在高速路上的时间是与欧几里得距离成正比的。 已知点a,b,我们的道路指标计算如下: 1. 对于我们高速路系统的每个顶点V,(对应于高速路的入口或 是出口),我们计算曼哈顿距离M(V,a),M(V,b)。 2. 对于每一对顶点V1,V2,我们应用Dijkstra算法来寻找图中V1 到V2的最短路径(考虑边缘部分的长度),我们把这个距离记
做E(V1,V2)。 3. 然后我们的路度量定义为: d(a,b)=min{ min 1, 2 V V {M(a,V1))+ E(V1,V2)+ M(V2,b))},M(a,b) } 或者换句话说,把它定义为走高速路的最短时间与不走高速路的所花 费时间的最小值。 在实际计算路度量时,我们将图分为m×n个网格并计算,然后记录从 一个网格空间到其他网格空间的距离。 3 估计推断概率密度函数 3.1 核密度估计 给出犯罪的地点跟位置,我们对未来犯罪的概率密度分布做出初步估 计。在欧几里得距离情况下,给出一组由随机变量产生的简单点{x1, x2,…xn} ,则概率密度函数为  ( ) x  1 N N  i 1  ( K x A  xi ) 其中, ( AK x  xi )  1 2 A 1 2  (( e x xi A  ) t  1 ( x xi  )) , A为协方差矩阵,相当于在每 个点周围添加小正态分布来产生一个概率密度估计函数[7],[10],[2]。 我们发现因为协方差矩阵式正定的,二次型xtAx在Rn上的范数定义 为: x  t x Ax ,这反过来又。。。?? 通过将高斯函数K(如上所示)替换为修改后的高斯函数G,提供了 对路度量的一个应用 。其中 , ) G x xi t ( ,  1 ( ) M t i Exp (  2 ) ( , d x xi ( ( )) ti h t  ) 2 ,d 为上面定义的路度量,h 为内 核协方差的一个间接控制因子,Mi 为正火系数,定义为:
( ) M t i  Exp (   ( , d x xi ( ( h t ti  2 ) )) 2 dx ) 我们把h看成是时间的函数由于近期的犯罪多比早期犯罪更容易估计 未来的犯罪的这个假设是合理的,因此通过将h定义为增函数,让修 改后的高斯函数在时间上发散。由经验确定 h(t)=2.5arctan(2t+0.5)t以周为单位,是一个不错的选择。我们对 概率密度函数的估计也因此成为  ( , ) x t 1   N 1  N i , ) G x xi t ( , (1) 在实际计算 ( , )x t 时,如同我们计算路度量时,我们在分好的m *n个 网格的每一个网格中用预先计算出来的路度量计算。 3.2 推断未来的概率密度函数 我们以上的叙述给出了一个寻找犯罪地点的合理的方法,但是期望犯 罪分子总是根据单个概率密度函数来实施犯罪就不见得合理了。因此 我们决定建立基于上面讨论的概率分布函数的趋势的加权最小二乘 逼近。这个方法使线形逼近概率密度函数并预测数据集以外的概率密 度函数。我们的方法如下:用x1,x2,…xn表示犯罪地点,分别发生 在t1tn时犯罪的发生地点。 1. 在我们的方程 ( , )x t (方程1)中,我们将在t时间之前发生 的犯罪求和。 a) 所以我们的线形逼近与核函数的初始峰值没有偏颇,造成个 别谋杀案。。。我们希望我们的密度函数尽可能的发散。使 用公式(1)的概率密度估计,我们得到概率密度函数 ( , 2 x t  , ( , 3 x t )  ,… ( , x tn )  ,尽可能小, )
,tM在tn和t*之间。 3. 我们现在做加权最小二乘逼近来估计 ( , *) x t 。在m * n 的网格 上,我们逐点考虑 ( , )x t 并进行加权最小二乘。我们修改众所 周知的标准最小二乘问题 t X X  的正规方程如在[1]中所 t X y 述,来得到修改后的正规方程 t X WX   t X Wy ,W是权值。我们 选择的概率密度函数的权值与时间呈线性关系(所以后来犯罪 的权值远大于先前犯罪的权值)。 4.1 中心图学 估计连环作案凶手居住地的一个常用的方法是将每一个案发地点 看作一个质点,通过空间平均来找到这些质点的中心。根据参考书 【9】,中心图学是最常用的罪犯搜寻方法之一,并且已经被应用于 验证圣地亚哥的连环强奸案和约克郡开膛手案件中。根据参考【4】, 大量重要证据表明连环作案凶手往往居住在诸多案发地中心的附近。 4.2最匹配圆圈 在应用图心来分析罪犯居住地的方法中做一个尝试着将犯罪活动地 点围成一个圈的合理扩展。这个扩展基于一个假设:罪犯会特别避免 在距离他们居住地非常近的地方作案,但是于此同时他们在每一起案 件中耗费的精力是大致相等的。因为我们认为罪犯在一起案件中投入 的精力与他们花费在路途上的时间成比例,所以应用前面建立的道路 度量标准进行分析。 4.2.1 第一个尝试 我们所做的最基本尝试是通过取案发地与圆圈距离平方的最小值来
找到与数据适配的圆圈。例如:  ), (( yxCd  , yxd  ))    r 2 | | ( r 2 i i 取点d与所有案发地xi距离的平方和的最小值。但是这种方法很不稳 定,如图1所示:找三个点的最适圆圈,一旦中间的点稍作移动,就 会最适圆圈的半径和圆心发生极大变动。 图1:基本最匹配圆的不稳定现象 4.2.2 改进的最匹配圆 一个更好的推广:在欧几里德坐标系中,给定一系列点x1….xn, 那么经过  x || n i nx 2|| 取得最小值,点x即为给定区域的中心。这种方 法使得道路度量标准得到普遍的推广,这也许是对中心图学这种常 用方法一个更好的扩展。即,定义使   ixxd 2 , 取得最小值的点x   n i 为最匹配圆的圆心,定义半径r为圆心x到各案发地点的平均距离, 即 r  1 n n  i 1    ixxd ,   图2为一个由高速公路系统构成的道路测量标准中的一个圆圈。该特
定的高速公路系统取自苏克利谋杀案件,我们将会在后面的论文中 对该案件做详细讨论。 图2:由英国曼彻斯特利兹市地区曲线所生成道路度量标准中的圆圈, 黑色的为高速公路系统曲线,灰色的为圆圈 4.3 应用于Rossmo模型 在参考书【9】中,Rossmo提出了根据犯罪活动地点预估罪犯居住地 的模型,在该模型中使用了缓冲地带的概念。缓冲地带是指位于罪犯 居住地四周、罪犯避免进行犯罪活动的地带。缓冲地带的深层含义是 指罪犯企图在距离他们住处很远的地方作案所耗费的巨大精力以及 在住处附近作案的高风险性两者之间得到均衡。在参考书【5】【8】 的犯罪模型和狩猎模型中,大量研究验证了Rossmo模型及缓冲地带 的概念。 Rossmo 的模型基于将普通犯罪地点的地图细分为网格,
分享到:
收藏