摘要
在本文中,我们提出了一个计算机模型来预测基于地点和对过去的罪
行序列的连环犯罪的下一个可能犯罪地点和住所。我们首先创建一个
“路线度量指标”,以衡量汽车行驶时的距离。
为了预测未来犯罪的地点,我们应用核密度估计的无参统计技术与我
们的路线度量指标,其中线路度量指标是允许我们估计一个与时间相
关的概率分布函数。为了预测连环犯罪的地址,我们使用由 Rossmo
开发的一个精细模型,使之适应路线度量指标。这种方法开发了一种
关于犯罪分子可能的居住地点的概率分布通过平衡以往犯罪地点与
观察,离家越远就有越多的机会作案,被抓的几率就越少。我们把我
们的模型应用到多次大规模连环杀人案,即彼得萨克利夫的“约克郡
开膛手”案,和 “亚特兰大儿童”案的凶手韦恩威廉姆斯。在这两案件
中,我们的模型在预测犯罪地点中取得了成功,并且证明可能在刑事
调查中有用。
1 简介
在本文中,我们呈现了一个研究犯罪模式的计算机模型。我们的模型
将高速公路系统作为犯罪分子如何犯罪的一个重要的决定因素。特别
的,我们建立了一个路度量来计算司机从地图上的一点到另一点开车
要花费多少时间。我们把这个路度量纳入许多不同的模型中来预测下
一次犯罪将会是在哪里发生和嫌疑人住在哪里。我们的模型给执法部
门一种预测在哪里搜查才能最大可能的抓获嫌疑人的方法和 。
1.1 我们方法的大纲
我们论文的开始给出了我们计算机模型的理论框架和大纲。后面部分
将我们的模型应用到著名的刑事案件中并检验模型的精确度。对每个
案件的调查我们都大致做如下处理
1. 建立路度量来计算基于在两地间开车所花费的时间的距离。这
个度量主要基于当地的高速公路系统
2. 估计推断下一次作案的可能地点的概率密度函数
3. 用基于路度量的一个最合适环路来估计嫌疑人的住所
1.2 假设
由于犯罪活动的巨大变动以及几乎所以连环杀人案的凶手通常患有
心理疾病,所以采用相对简单的计算机模型去预测连环杀人案一般都
面临几个障碍。以下是应用于我们模型的对犯罪行为所采取的假设:
1 犯罪是由个人构成的。我们假设模型中的案件都是由单独个体作案
的,我们的模型不是为有组织的犯罪,团伙犯罪和暴动而建立的。
2 犯罪分子都是驾车逃离。我们模型在分析高速公路模式时有意义,
这里,我们通过计算驾车行驶所花费的时间来判断距离。
3 作案地点在被发现地点的附近。在凶杀案中这意味着尸体的发现地
点就是作案地点。这不是个不合理的假设,因为多数连环案件的凶手
在作案后会把受害人尸体丢到作案地点附近。在连环案件中,比如连
环强奸案,爆窃或纵火案,作案地点与警方发现地点是没有区别的。
4 犯罪发生在一个狭小的区域,比如一个市或县。这里忽略案件发生
在州或国家之间的情况。在那些案件中,我们的模型必须被应用于每
一个集群。
2 测绘犯罪和路度量
我们用数学软件 Sage 来生成一幅案发地点附近的地图。地图中的主
要特征有主要的高速公路线路和案发现场。 我们把高速公路系统看
作一个图,把高速路的每个出口入口看作图中的顶点,把出口入口间
的公路部分看作图的边。给相邻两顶点间的边赋一个权值,该权值为
两顶点间的欧几里得距离。
2.1 路度量
对每一个图M,计算一个路度量d:M * M —〉R+ 。在一个地区
内,路度量根据两地开车所花费的时间来计算两点间的距离。这个方
法是建立在司机总是走两点间最短路径和尽量利用高速路而不是走
侧街道的假设基础上。路度量建立连这样的假设:
在侧街道上花费的时间是与曼哈顿度量成正比的,因为侧街道总是
被规划成网格形状。
花费在高速路上的时间是与欧几里得距离成正比的。
已知点a,b,我们的道路指标计算如下:
1. 对于我们高速路系统的每个顶点V,(对应于高速路的入口或
是出口),我们计算曼哈顿距离M(V,a),M(V,b)。
2. 对于每一对顶点V1,V2,我们应用Dijkstra算法来寻找图中V1
到V2的最短路径(考虑边缘部分的长度),我们把这个距离记
做E(V1,V2)。
3. 然后我们的路度量定义为:
d(a,b)=min{
min
1, 2
V V
{M(a,V1))+ E(V1,V2)+ M(V2,b))},M(a,b) }
或者换句话说,把它定义为走高速路的最短时间与不走高速路的所花
费时间的最小值。
在实际计算路度量时,我们将图分为m×n个网格并计算,然后记录从
一个网格空间到其他网格空间的距离。
3 估计推断概率密度函数
3.1 核密度估计
给出犯罪的地点跟位置,我们对未来犯罪的概率密度分布做出初步估
计。在欧几里得距离情况下,给出一组由随机变量产生的简单点{x1,
x2,…xn} ,则概率密度函数为
( )
x
1
N
N
i
1
(
K x
A
xi
)
其中,
(
AK x
xi
)
1
2
A
1
2
((
e
x xi A
)
t
1
(
x xi
))
, A为协方差矩阵,相当于在每
个点周围添加小正态分布来产生一个概率密度估计函数[7],[10],[2]。
我们发现因为协方差矩阵式正定的,二次型xtAx在Rn上的范数定义
为:
x
t
x Ax
,这反过来又。。。??
通过将高斯函数K(如上所示)替换为修改后的高斯函数G,提供了
对路度量的一个应用 。其中
, )
G x xi t
( ,
1
( )
M t
i
Exp
(
2
)
( ,
d x xi
( (
))
ti
h t
)
2
,d 为上面定义的路度量,h 为内
核协方差的一个间接控制因子,Mi 为正火系数,定义为:
( )
M t
i
Exp
(
( ,
d x xi
( (
h t
ti
2
)
))
2
dx
)
我们把h看成是时间的函数由于近期的犯罪多比早期犯罪更容易估计
未来的犯罪的这个假设是合理的,因此通过将h定义为增函数,让修
改后的高斯函数在时间上发散。由经验确定
h(t)=2.5arctan(2t+0.5)t以周为单位,是一个不错的选择。我们对
概率密度函数的估计也因此成为
( , )
x t
1
N
1
N
i
, )
G x xi t
( ,
(1)
在实际计算 ( , )x t 时,如同我们计算路度量时,我们在分好的m *n个
网格的每一个网格中用预先计算出来的路度量计算。
3.2 推断未来的概率密度函数
我们以上的叙述给出了一个寻找犯罪地点的合理的方法,但是期望犯
罪分子总是根据单个概率密度函数来实施犯罪就不见得合理了。因此
我们决定建立基于上面讨论的概率分布函数的趋势的加权最小二乘
逼近。这个方法使线形逼近概率密度函数并预测数据集以外的概率密
度函数。我们的方法如下:用x1,x2,…xn表示犯罪地点,分别发生
在t1tn时犯罪的发生地点。
1. 在我们的方程 ( , )x t (方程1)中,我们将在t时间之前发生
的犯罪求和。
a) 所以我们的线形逼近与核函数的初始峰值没有偏颇,造成个
别谋杀案。。。我们希望我们的密度函数尽可能的发散。使
用公式(1)的概率密度估计,我们得到概率密度函数
( , 2
x t
, ( , 3
x t
)
,… ( ,
x tn
)
,尽可能小,
)
,tM在tn和t*之间。
3. 我们现在做加权最小二乘逼近来估计 ( , *)
x t 。在m * n 的网格
上,我们逐点考虑 ( , )x t 并进行加权最小二乘。我们修改众所
周知的标准最小二乘问题 t
X X
的正规方程如在[1]中所
t
X y
述,来得到修改后的正规方程
t
X WX
t
X Wy
,W是权值。我们
选择的概率密度函数的权值与时间呈线性关系(所以后来犯罪
的权值远大于先前犯罪的权值)。
4.1 中心图学
估计连环作案凶手居住地的一个常用的方法是将每一个案发地点
看作一个质点,通过空间平均来找到这些质点的中心。根据参考书
【9】,中心图学是最常用的罪犯搜寻方法之一,并且已经被应用于
验证圣地亚哥的连环强奸案和约克郡开膛手案件中。根据参考【4】,
大量重要证据表明连环作案凶手往往居住在诸多案发地中心的附近。
4.2最匹配圆圈
在应用图心来分析罪犯居住地的方法中做一个尝试着将犯罪活动地
点围成一个圈的合理扩展。这个扩展基于一个假设:罪犯会特别避免
在距离他们居住地非常近的地方作案,但是于此同时他们在每一起案
件中耗费的精力是大致相等的。因为我们认为罪犯在一起案件中投入
的精力与他们花费在路途上的时间成比例,所以应用前面建立的道路
度量标准进行分析。
4.2.1 第一个尝试
我们所做的最基本尝试是通过取案发地与圆圈距离平方的最小值来
找到与数据适配的圆圈。例如:
),
((
yxCd
,
yxd
))
r
2
|
|
(
r
2
i
i
取点d与所有案发地xi距离的平方和的最小值。但是这种方法很不稳
定,如图1所示:找三个点的最适圆圈,一旦中间的点稍作移动,就
会最适圆圈的半径和圆心发生极大变动。
图1:基本最匹配圆的不稳定现象
4.2.2 改进的最匹配圆
一个更好的推广:在欧几里德坐标系中,给定一系列点x1….xn,
那么经过
x
||
n
i
nx
2||
取得最小值,点x即为给定区域的中心。这种方
法使得道路度量标准得到普遍的推广,这也许是对中心图学这种常
用方法一个更好的扩展。即,定义使
ixxd
2
, 取得最小值的点x
n
i
为最匹配圆的圆心,定义半径r为圆心x到各案发地点的平均距离,
即
r
1
n
n
i
1
ixxd
,
图2为一个由高速公路系统构成的道路测量标准中的一个圆圈。该特
定的高速公路系统取自苏克利谋杀案件,我们将会在后面的论文中
对该案件做详细讨论。
图2:由英国曼彻斯特利兹市地区曲线所生成道路度量标准中的圆圈,
黑色的为高速公路系统曲线,灰色的为圆圈
4.3 应用于Rossmo模型
在参考书【9】中,Rossmo提出了根据犯罪活动地点预估罪犯居住地
的模型,在该模型中使用了缓冲地带的概念。缓冲地带是指位于罪犯
居住地四周、罪犯避免进行犯罪活动的地带。缓冲地带的深层含义是
指罪犯企图在距离他们住处很远的地方作案所耗费的巨大精力以及
在住处附近作案的高风险性两者之间得到均衡。在参考书【5】【8】
的犯罪模型和狩猎模型中,大量研究验证了Rossmo模型及缓冲地带
的概念。
Rossmo 的模型基于将普通犯罪地点的地图细分为网格,