城市表层土壤重金属污染分析
摘要
本文给出重金属浓度空间分布、各区域污染程度和污染原因,建立神经网
络模型用遗传算法求解污染源位置,再将模型拓展以期得到地质环境演变模式。
问题一:通过八种重金属浓度的等值线图来描述其空间分布,利用污染程
度指数来衡量不同功能区的污染程度。
以八种重金属在各采样点的浓度为初始数据,利用三角形线性插值法,运
用 matlab 编程得到八种重金属浓度值在空间上的分布,并绘制成等值线图,得
到了八种重金属的空间分布特点。同时,我们利用污染程度指数作为指标来衡量
不同功能区的污染程度,得到结论:污染程度从高到低依次是工业区、交通区、
公园绿地区、生活区、山区。
问题二:通过相关分析和关联规则分析来确定重金属污染的主要原因。
我们运用 spss 软件在显著性水平 0.01 的情况下对八种金属浓度进行
person 相关分析,并对不同金属之间的相关性进行双侧检验,结果发现:重金
属 Cu、Cr、Ni 具有显著的相关性,其中 Cr、Ni 的相关性极其显著;重金属 Pb
与 Cd、Pb 与 Cu、Zn 与 Pb 有显著的相关性。我们再利用 SAS 进行关联规则分析,
其中将功能区作为前项,土壤表层是否收到重金属污染作为后项,根据所得可信
度分析出:所有重金属污染都主要来源于工业废水废渣,另外 As 和 Cr 污染还来
源于生活垃圾,Pb 污染还来源于汽车尾气的排放。
问题三:建立神经网络模型,用遗传算法确定污染源的位置。
为了确定污染源的位置,我们建立了基于matlab平台的BP人工神经网络模
型。结果表明该模型能准确反映重金属污染物的传播特征并得出重金属浓度的空
间分布。然后利用遗传算法搜索到污染源的位置。求解结果如下表:
As
Cd
Cr
Cu
Hg
Ni
Pb
Zn
(1200,3006)
(2105,2593)
(3487,5325) (2101,3390) (2643,2875)
(3211,5686)
(1991,3329) (1699,2867)
(18508,10206) (4753,10875)
(27680,12111) (17450,3825)
(21301,11467)
(3198,5822) (13868,2354) (24001,12366) (4508,5412)
(3725,5487)
(15243,9186)
(9583,4512)
(13653,9655)
综合分析所得污染源所在位置,发现不同金属的污染源有同源现象,依据
同源性汇聚污染源,绘制了八种重金属的污染源汇总图。
问题四:神经网络模型的优点是具有较强的自组织、自学习能力、泛化能
力和充分利用了海拔高度的信息;缺点是训练要求样本点容量较大。可以通过搜
集前几年该城区八种重金属浓度的采样数据和近几年工厂分布多少位置的变化、
交通路段车流量的变化、人口及生活区分布变化与植被分布多少位置的变化等数
据,进一步拓展神经网络模型,得到该城市地质环境的演变模式。
关键词:三角形线性插值 相关分析 关联规则 神经网络 遗传算法
1
随着城市经济的快速发展和城市人口的不断增加,研究人类活动影响下城市
地质环境的演变模式,日益成为人们关注的焦点。
不同的区域环境受人类活动影响的程度不同,按照功能划分,城区一般可分
为生活区、工业区、山区、主干道路区及公园绿地区,现对某城市城区土壤地质
环境进行调查。将所考察的城区划分为间距 1 公里左右的网格子区域,按照每平
方公里 1 个采样点对表层土(0~10 厘米深度)进行取样、编号,并用 GPS 记录
采样点的位置、海拔高度及其所属功能区等信息。分析获得了每个样本所含的多
种化学元素的浓度数据。另一方面,按照 2 公里的间距在那些远离人群及工业活
动的自然区取样,将其作为该城区表层土壤中元素的背景值。
我们需要解决如下问题:
(1) 给出八种主要重金属元素在该城区的空间分布图,并建立指标来分析该
城区内不同区域重金属的污染程度。
(2) 对数据进行挖掘,分析出重金属污染的主要原因。
(3) 分析重金属污染物的传播特征,由此建立模型,从而确定污染源的位置。
(4) 分析所建立模型的优缺点,收集更多的信息,通过这些信息建立模型来
研究城市地质环境的演变模式。
符号
意义
表示不同功能区
表示金属的种类
表示不同的样本
表示样本 中金属 的浓度
表示金属 背景值的平均值
表示金属 背景值的标准差
表示 标准化后的值
表示金属 的权重系数
区域 的污染程度指数
2
kijijxixjiiiiijYijxikIik
① 假设样本值真实可信。
② 假设重金属浓度随空间是连续变化的。
图 1 该城区的地形分布图
首先,我们根据样本点的位置和海拔绘制出该城区的地貌,见图 1。我们运
用 matlab 软件,根据各个网格区域中的重金属含量,用三角形线性插值的方法
得到各种重金属含量在空间上分布的等值线图。
1
2
图 2-1 图 2-2
1
2
图 2-1 给出了 As 在该区域的空间分布:图中可以观察到 As 有两个明显的高
值中心,我们标记为区域 1 和 2。这两个区域都处于工业区分布范围内,并以该
两个区域作为中心向外延伸,浓度逐渐减少,同时我们注意到在山区的很多区域
3
浓度都在背景值之下。
图 2-2 给出了 Cd 在该区域的空间分布:同样我们也可以在该图中观察到两个
明显的高值中心区域 1 和 2,这两个高值中心的地理位置和图 2-1 中高值中心的
地理位置很相近,说明金属 As 和 Cd 在该城区的空间上的分布很相近。同时从图
中我们还可以看到在整个城区内 Cd 的浓度普遍较大,而且很多区域内 Cd 的浓度
都远超过背景值的最大浓度。
1
图 2-3 图 2-4
图 2-3 和图 2-4 分别给出了 Cr 和 Cu 在该区域的空间分布:显然,我们可看
出 Cr 和 Cu 的浓度高值中心都出现在了西南角的工业带处。但两者的不同之处为:
Cr 的浓度在城区的大部分区域都大于背景值的最大浓度,而 Cu 的分布正好相反。
1
1
2
3
1
2
图 2-5 图 2-6
图 2-5 给出了 Hg 在该区域的空间分布:可以看点 Hg 有三个高值中心——区
域 1、2 和 3,这三个区域都分布在工业区的附近,并且还可以看出这三个高值
中心处的等值线都十分密集。
图 2-6 给出了 Ni 在该区域的空间分布:区域 1 和区域 2 是 Ni 浓度的两个高
值中心,大约占该城区面积的 1/3,但在远离工业区的生活区交通区、绿地和山
区,Ni 的浓度普遍较小。
4
1
2
1
图 2-7 图 2-8
图 2-7 给出了 Pb 在该区域的空间分布:浓度的高值中心区域 1 分布在工业带
上而另一个高值中心区域 2 在交通区内。这可能反映了 Pb 污染的来源主要是工
业废水废渣和交通工具尾气的排放。
2
3
图 2-8 给出了 Zn 在该区域的空间分布:从图中可以看出 Zn 的出现了三个浓
度高值中心分别标为区域 1、2、3,并且影响范围较广,在生活区、交通区和绿
地的大部分区域内 Zn 的浓度普遍都比较高。
我们引入一个区域污染程度指数 来衡量不同区域重金属的污染程度,定
义如下:
(1)
其中 表示不同功能区, 表示金属种类, 表示金属 在功能区 内的样本个
数。
( 为样本 j 中金属 浓度, 、 分别表示金属 浓度背
景值的平均值和标准差), 为权重,由公式
求得,中 值见表 1[1].
表 1 八种重金属的毒性系数
重金属
毒性系数 e 1
Zn
Cr
2
Cu
5
Pb
5
Ni
5
As
10
Cd
30
Hg
40
我们运用 matlab 软件,对剔除异常值后的数据进行分析计算,得到的数值
如下,见表 2:
5
kI8111()mkiijijIYmkimikijiijixxYijxiixiii81iiiieeie
表 2 五个功能区的区域污染指数
生活区 工业区 山区
功能区
区域污染指数 6.0232 36.5382 0.7511 24.8282 6.5437
通过表 2 中的数值我们分析可以得到:污染程度从高到低依次是工业区、交
通区、公园绿地区、生活区和山区,其中工业区的污染程度远大于其他功能区,
而山区的污染程度远小于其他功能区,同时,交通区的污染程度也较大,比较而
言,公园绿地的污染程度相对较小。
交通区 公园绿地区
根据上面的分析,我们可以发现各种重金属在城区的含量基本都大于背景值
中的最大值,可以说明土壤表层重金属的含量受人类活动的影响。而人类活动引
起的重金属污染大致可以分为三种类型:工业废水废渣污染、生活垃圾污染、交
通废气污染。下面我们对八种重金属做来源解析。
我们可以通过分析不同元素之间的相关性来衡量不同元素同源的可能性大
小,一般情况下,若元素之间的相关性显著,说明它们来自同一污染源的可能性
较大。Person 相关分析就是研究变量间相关程度的一种统计分析方法,通过计
算在一定的显著性水平下的相关系数来衡量不同元素之间的相关性。Person 相
关系数取值在-1~1 之间,绝对值越大,说明相关性越显著。
为了分析重金属污染的主要原因,我们可以计算八种重金属元素的 Person
相关系数,可以认为相关性高的重金属元素是同源的。陈怀满等人曾对我国土壤
重金属污染的主要来源进行了总结表[2](见表 3-1),表明在我国工矿生产、农业
活动、污灌等人为活动都是造成土壤重金属污染的重要来源。然后进一步分析该
类重金属污染的主要原因。
表 3-1 我国土壤重金属污染的主要来源
来源
重金属
矿产开采、冶炼、加工排放的废气、废水和废渣
Cr、Hg、As、Pb、Ni、Mo
煤和石油燃烧过程中排放的飘尘
Cr、Hg、As、Pb
电镀工业废水
Cr、Cd、Ni、Pb、Cu、Zn
塑料、电池、电子工业排放的废水
Hg、Cd、Pb、Ni、Zn
Hg 工业排放的废水
染料、化工制革工业排放的废水
汽车尾气
农药、化肥
Hg
Cr、Cd
Pb
As、Cu、Cd
我们运用 spss 软件,在显著性水平为 0.01 的情况下,对题目所给的八种
重金属元素含量数据进行 person 相关分析,并对不同金属之间的相关性进行双
侧检验,得到的相关系数如下表 3-2:
6
表 3-2 不同金属间的相关系数
Cd
Cr
Cu
Hg
Ni
Pb
Zn
As
1
相关系数
As
Cd
Cr
Cu
Hg
Ni
Pb
Zn
1
1
0.255
0.189 0.352
0.160 0.397 0.532
0.064 0.265 0.103 0.417
0.317 0.329 0.716 0.495 0.103
0.290 0.660 0.383 0.520 0.298 0.307
0.247 0.431 0.424 0.387 0.196 0.436 0.494
1
1
1
1
1
分析表 3-2,我们可以得到如下结论:
① 土壤中重金属 Cu、Cr、Ni 含量的相关性显著,其中 Cr、Ni 的相关性极其
显著,表明它们来自同一污染源的可能性很大。
② 土壤中重金属 Pb 与 Cd、Pb 与 Cu、Zn 与 Pb 含量之间达到了显著的正相关,
表明它们来自同一污染源的可能性很大。
③ 土壤中重金属 Pb 与 Cd、Cu、Pb 具有显著的相关性,表明土壤中 Pb 的污
染源可能比较多、来源途径较多。
④ 土壤中重金属 Hg、As 与其它各重金属之间的相关性不强,表明土壤中 Hg、
As 的来源可能比较独特,具有自己特有的污染源。
若土壤表层中重金属的浓度大于背景值取值范围中最大值的浓度,我们将认
为其受到污染,反之,则为无污染。将功能区作为前项,土壤表层某金属是否收
到污染作为后项,利用关联规则挖掘,分析不同功能区与受各种金属污染的可信
度,见表 4。
表 4 不同功能区中各种金属污染的关联规则
As 的关联规则分析
Cd 的关联规则分析
Rule
交通区==>As 污染
山区==>无 As 污染
生活区==>As 污染
公园区==>As 污染
工业区==>As 污染
Confidence(%)
50
83.33
68.18
74.29
61.11
Rule
交通区==>Cd 污染
山区==>Cd 无污染
生活区==>Cd 污染
工业区==>Cd 污染
Conifence(%)
76.81
74.24
72.73
86.11
Cr 的关联规则分析
Cu 的关联规则分析
Rule
山区==>无 Cr 污染
公园==>无 Cr 污染
生活区==>Cr 污染
工业区==>Cr 污染
Conifence(%)
77.27
77.14
43.18
38.89
Rule
交通区==>Cu 污染
山区==>无 Cu 污染
工业区==>Cu 污染
生活区==>Cu 污染
公园区==>Cu 污染
Conifence(%)
81.88
75.76
91.67
72.73
68.57
7
Hg 的关联规则分析
Ni 的关联规则分析
Rule
山区==>无 Hg 污染
交通区==>Hg 污染
工业区==>Hg 污染
生活区==>Hg 污染
公园区==>Hg 污染
Conifence(%)
95.45
40.58
52.78
40.91
40
Rule
交通==>无 Ni 污染
山区==>无 Ni 污染
公园==>无 Ni 污染
工业区==>Ni 污染
生活区==>Ni 污染
Conifence(%)
80.43
81.82
85.71
41.67
27.27
Pb 的关联规则分析
Zn 的关联规则分析
Rule
交通区==>Pb 污染
山区==>无 Pb 污染
工业区==>Pb 污染
生活区==>Pb 污染
公园==>无 Pb 污染
通过表 4 我们可以得到每种金属的污染主要原因,结论如下:
Rule
山区==>无 Zn 污染
公园==>无 Zn 污染
交通区==>Zn 污染
工业区==>Zn 污染
生活区==>Zn 污染
Conifence(%)
63.04
83.33
80.56
56.82
60
Conifence(%)
87.88
51.43
71.01
77.78
59.09
① As 污染的主要原因分析:在山区中无 As 污染的可信度为 83.33%,在公
园绿地区、生活区和工业区的有 As 污染的可信度均大于 60%,这说明 As 主要来
源于工业废水废渣、生活垃圾,由于公园绿地大多与工业区、生活区交叉分布,
所以在公园绿地区 As 污染也较为严重。
② Cd 污染的主要原因分析:在山区中无 Cd 污染的可信度为 74.24%,在工
业区、交通区和生活区的有 As 污染的可信度均大于 70%,这说明 Cd 主要来源于
工业废水废渣、汽车尾气,由于生活区大多在工业区与交通区之间,所以在生活
区 Cd 污染也较为严重。
③ Cr 污染的主要原因分析:在山区和公园绿地区中无 Cr 污染的可信度都
约为 77%,在工业区和生活区的有 Cr 污染的可信度大约 40%,这说明 Cr 主要来
源于工业废水废渣、生活垃圾。
④ Cu 污染的主要原因分析:在山区和公园绿地区中无 Cu 污染的可信度都
约为 75.76%,在工业区、生活区和交通区的有 Cr 污染的可信度大约 70%,其中
工业区高达 91.67%,这说明,工业废水废渣、汽车尾气、和生活垃圾的堆放都
是 Cu 污染的重要原因,其中工业和交通的污染尤为重要。
⑤ Hg 污染的主要原因分析:在山区中无 Hg 污染的可信度高达为 95.45%,
在工业区有 Hg 污染比较严重,另外在交通区,生活区和公园绿地区都有污染但
较轻,这说明,Hg 的主要污染来源于工业。
⑥ Ni 污染的主要原因分析:在山区、交通区和公园绿地区中无 Ni 污染的
可信度都大于 80%,工业区中有 Ni 污染的置信度为 41.67%,这说明 Ni 污染主要
来源于工业废水废渣。
⑦ Pb 污染的主要原因分析:山区中无 Pb 污染的的可信度大于 80%,公园
区无 Pb 污染的可信度为 60%,交通区和生活区有 Pb 污染的可信度均大于 55%,
工业区中有 Pb 污染的可信度大于 80%,这说明 Pb 污染的主要来源于工业废水废
渣和交通工具尾气的排放,而生活区主要分布在交通区的附近,所以生活区 Pb
污染也较为严重。
⑧ Zn 污染的主要原因分析:山区中无 Zn 污染的可信度高达 87.88%,在交
通区和工业区中有 Zn 污染的可信度均大于 70%,生活区中有 Zn 污染的可信度约
8