地理数学方法及其应用
Mathematical Methods for Geography
(2008 年)
陈彦光 ◎编著
北京大学城市与环境学院
研究生地理数学方法 摘要
摘 要
本书面向地理学问题,讲述了常用数学方法的基本原理和应用实例。全书分为五大部分、
二十四章。第一部分讲述基本概念和知识,属于基础内容;第二部分讲述相关分析和回归分
析,包括线性回归、非线性回归、logistic 回归、虚拟变量回归以及基于回归分析的模型选
择等方法;第三部分讲述多元统计分析,包括主成分分析、因子分析和聚类分析等方法;第
四部分讲述时空过程分析,包括时(空)间序列分析、Markov 链、R/S 分析等方法;第五
部分讲述系统分析,包括线性规划、层次分析法和模糊综合评价等方法。本书作为北京大学
研究生地理数学方法教材试用多年,其特点是简明、详细,便于自学者使用。在讲解原理的
过程中穿插了大量实例,读者可以通过实例解析了解有关方法的应用要领和分析思路。
本书可以供地理学、生态学、环境科学、地质学、经济学、城市规划学等诸多领域的学
生、研究人员以至工程技术人员学习或参考。
研究生地理数学方法 序言
序
朋友,您手上的书是陈彦光博士在北大的研究生教材《地理数学方法及其应用》。应他
之邀,在卷首写几句我对数量地理的感受,作为序。
与今天的高考制度不同,1959 年我通过文科科目加试数学进入北大经济地理专业。当
时北大地质地理系基本上用的是前苏联莫斯科大学的教学计划,但是对地理学的理解接受的
主要是哈特向的观点,即地理学的性质在于研究区域差异,区域的独特性是地理研究的核心。
大一时大名鼎鼎的李同孚先生教我们高等数学(我还是课代表),遗憾的是后面的专业课根
本就没有用上数学。每周 6 学时的中国区域经济地理和外国区域经济地理各上了两个学期,
是最大的课程。其它的重头戏还有工业地理、交通地理、农业地理等。这些课给了我们比较
扎实的地理基础知识,但同学之间也有出于不满足的一种疑问,难道地理学就是描述吗?我
们学的数学有什么用?我的毕业论文虽然做得很精心,基本上也没有脱离定性的分析和描
述。1964 年大学毕业后,我被留校任教。不料,接着是“四清”和文化大革命,接近十年
没有接触业务。直到七十年代,为了配合当时的地理教育革命,北大地理系办过两份油印刊
物《地理译丛》(1973-1974)和《城市规划参考资料》(1978-1979),小心翼翼地从欧美、
苏联、日本的最新刊物上了解国外地理学动向。结果令教员们大吃一惊,在中国关起门来埋
头于阶级斗争的同时,世界的地理学,特别是西方人文地理学已经发生了根本的变革,“计
量运动”不仅发生,并已进入尾声,对人文地理学产生了重大的影响。我翻译的三篇文章:
“学校教学和城市地理:一些新的方法”,“计算机在地理学中的过去、现在、将来”和“中
国城市人口估算”,都与数学方法、运用计算机、提取遥感数据有关,使我立即产生了业务
上的紧迫感。1981 年 10 月,香港梁蕲善教授在北大地理系完整开设数量地理学课(当时叫
计量地理学)。抓住这个机会,我学了一点数量地理学的皮毛。这门课深深地影响了我,使
我在后来的研究里尽量用可被检验的数据和数量分析说话,觉得这样心里才比较踏实;同时
也坚定了我通过学术研究寻找规律性的信念。尽管国外其它学派对计量学派有种种非议,展
开了大量的争论,但我始终认为,地理学的理论化是必要的,寻找规律的理想是可敬的。关
键是对规律的理解。由于人文地理研究对象的特殊性,规律性在尺度上是有层次的,窃以为
这可以把不同学派的观点互补融合起来。
改革开放以后,我国的数量地理学开始起步,北大在其中起了一定的积极作用。1985
年,以北大杨吾扬教授为首,发起成立了中国地理学会数量地理专业研究组。1986 年 10 月
6-25 日,中国地理学会在武汉举办城市与区域规划动态模型讲习班,研究组副组长北大朱
德威先生主讲“地理系统动态模型与系统动态学”,华中工学院邓聚龙教授讲“灰色系统理
论、方法与应用”,武汉数字工程研究所吴学谋研究员讲“泛系方法论”。这次讲习班虽然不
能与美国 1955 年华盛顿小组的第一个地理学数量方法讨论班相类比,却也算得上中国数量
地理普及与发展的一件大事。1993 年数量地理专业组换届,成立由华东师大张超教授领衔
的数量地理专业委员会,北大朱德威教授留任副主任委员。朱德威在北大地理系讲授的研究
生课《数学在地理学中的应用》在国内盛名远扬。遗憾的是他 1995 年退休以后,居然一时
找不到合适的教员,教本科数量地理的教员又出国未归,有好几年北大停开了本科和研究生
的数量地理课。我给好几届的学生说过:“没有数量地理学的地理系,不是一流的地理系”。
有一年,一位在香港浸会大学地理系任教的朋友,当面向我抱怨:“你们北大来的一个学生,
怎么不懂地理数学方法?不会使用 SPSS 软件?! ”这件事深深地刺激我,必须尽快解决这
个问题。
大约在 1996/97 年,河南信阳师范学院陈彦光的名字引起我的关注,发现他经常在刊物
上发表数量地理的论文,很多与城市地理有关。大概是缘分,不久我们有了直接接触。我很
- 1 -
研究生地理数学方法 序言
快认定这一位既出身地理又擅长数学的思想活跃的年轻人,是北大地理系所需要的人才。双
方经过许多艰苦的努力,2001 年,他正式在北大攻读博士学位,同时兼任研究生地理数学
方法的教学工作,实现了我“复活”北大数量地理课的心愿。又经过许多难以想象的曲折,
拿到博士学位以后,他终于成了我的北大同事。
在北大这个舞台上,他兢兢业业致力于《地理数学方法》的教学,教学效果很好,不仅
吸引了许多校外的学生,还赢得不少请教问题的“回头客”。这本书就是他多年辛勤教学的
积累。我愿意把这本“建模思想-实例分析-软件操作”融为一体的数量地理学教材推荐给
地理界的朋友们。特别对在校的青年学生说一句:此书值得一读。
这套教材计划分四册,第一本是数量地理的基本原理和方法,第二本是基于 Excel 的地
理数据分析。后面两本分别是基于 Mathcad 的地理数据分析和基于 SPSS 的地理数据分析。
这次出版了前面两本,我希望作者趁热打铁,尽快出齐,保持其完整性。
陈彦光的专业方向和知识取向是“城市与理论地理学”,数量地理仅是其中侧重于统计
分析的一个部分。十余年来他以城市地理学的已有理论为起点,对城市化过程、城乡人口异
速生长、城市体系空间结构、城市人口规模分布等传统领域的非线性研究,已经取得了不少
进展,在理论深度上有了升华。这些领域过去我接触过,因而有一些直接的感受。此外,作
者不时有一些理论思考、新概念、新模型,有时超出我的知识基础,作为导师,我更多的是
给他支持,为他提供发展的条件和空间。他还常常呼吁地理学特别是人文地理学的基础理论
建设,有时不被人们理解。我知道,他的本意并非要掀掉传统地理学或应用地理学的什么“屋
顶”,他的目标不过是希望为理论地理学建设打开一个小小的“窗户”,提醒人们不要忘记上
世纪四、五十年代地理在美国一些著名大学面临灭亡的危机。
凭我多年来对他的了解,陈彦光是一位有才华的严肃学者,我为他已经取得的成绩而欣
慰。希望作者戒骄戒躁,进一步提高综合素质,扩大国内、国际的学术交流,要听得进各种
意见,包括不理解的、反对的甚至反对错了的意见,要“闻过则喜”,志存高远,不以国内
论短长,朝着世界一流水平继续努力。
2008 年 8 月 28 日撰写,9 月 2 日修改
- 2 -
研究生地理数学方法 前言
前 言
西方地理学有两大源流:一是天文-地理学源流,可以追溯到古希腊的埃拉托色尼
(Eratosthenes)和托勒密(Ptolemy),到德国洪堡德(Alexander von Humboldt,1769-1858)
之后中断,直到计量运动时期才逐步复兴;二是历史-地理学源流,可以追溯到古希腊的希
罗多德(Herodotus)和斯特拉博(Strabo),到德国的李特尔(Carl Ritter,1779-1859)那里
得到进一步发扬。第一个源流在研究方法上重视数学描述,第二个源流则与数学方法无关。
由于德国哲学家康德(Immanuel Kant,1724-1804)的巨大影响,地理学研究的数学传统一
度被局限在自然地理学的很小领域,整个地理学被定位在区域描述的学科范畴。当代地理学
延续的主要是历史-地理学路线。德国理论地理学家克里斯塔勒(Walter Christaller,
1893-1969)的中心地理论在地理学计量运动之前一直得不到地理界的承认,与当时的地理
学传统不无关系。
然而,源于历史-地理学源流的区域地理学派在方法论是有别于标准科学的。该学派的
鼎盛之日,也是地理学巨大危机潜伏之时。上个世纪五十年代,美国地理学面临着一场灭顶
之灾。在这种背景下,地理学的“计量革命”终于爆发。经过十年的努力和发展,计数概念、
定量思想在地理界终于深入人心。计量革命在上个世纪六十年代初期基本上就已经结束。但
是,继之而起的地理学理论革命却无可奈何地不了了之。一般说来,数学方法应用于一门学
科,主要行使两种功能:一是作为观测数据的整理手段,二是构造假设和发展理论的辅助工
具。在地理学的计量运动过程中,数学方法作为地理观测数据整理手段的功能被过分夸大,
在构造假设、建立模型和发展理论方面却没有取得突破性的进展(R.P. Moss)。理论革命的
挫折,导致了数学方法在地理学中的影响逐渐下降。上个世纪七十年代之后,地理学的区域
思潮悄然回归。
在地理学的计量运动时期,定量地理学派与定性地理学派一度形成严峻对立的两大阵
营。但是,到了九十年代的时候,两派敌对情绪逐渐冰释。人们开始重新思考地理学的定性
与定量的区别,标志在于如下三个方面。其一,定性地理学家利用计算机程序包展开对访谈
文本和其他原始文件进行系统分析方面的兴趣迅速增长。其二,定量地理学家在处理人文地
理学问题方面的能力已经准备就绪。一方面,政治、社会和文化问题可以经过量化形成他们
进行分析的数据基础;另一方面,他们也开始注重思考自己的发现、地图和其他研究成果中
更为广泛的人文意义。其三,理论家和学科史学家较之从前已经能够更为认真地对待地理学
定性、定量倾向交替发展的复杂历史——定性-定量的杂合过程构成地理学学科的过去和今
天(C. Philo 等)。
今天,如果有人还将地理学的定性研究与定量研究对立起来,那其观念就退回到上个世
纪七十年代之前了。其实,早在上个世纪六十年代初,就有人喊出了“打倒二分法”的口号。
将地理学研究方法简单地定性、定量二元化,就像将地理学研究内容自然、人文二元化一样,
对学科有害无益。当代很多的地理学者,其研究是定性、定量有机结合,无法对其进行简单
的二元归类。走定性-定量相结合的道路,既是地理学研究的现实特征,也是地理学发展的
长远趋势。对于地理专业的学生而言,学习数学方法,不仅是能够掌握一种描述语言和一些
分析技巧,更是一种十分重要的思维训练。
有人打了一个比方,说数学工具对于科学研究工作者而言,是望远镜和显微镜。没有数
学工具,不懂得数学方法,一个勤奋、严谨、聪慧的学者照样能够取得重大科学成就,对那
些以实验为研究支撑的领域尤其如此。但是,有了数学工具,就有了显微镜,有了望远镜,
可以看得更细,望得更远。达尔文的科学成就可谓登峰造极——他的进化论被誉为影响人类
思想的五大学说之一,但他到晚年依然后悔当初没有学习数学工具,恐怕就是意识到自己巨
- 3 -
研究生地理数学方法 前言
大学术成就背后的思维手段欠缺了。如今时过境迁,与达尔文时代大不相同。今天的科学研
究更重视的不是单人皮马的奋斗,而是小组协作、团队创造。对于单个研究人员而言,是否
掌握数学方法无关紧要。但是,对于一个团队、一个研究小组,理当具备掌握数学方法的研
究成员——知识结构齐备,功能才会更强。至于一个学术共同体,数学方法的重要性更是不
言而喻了。作者在课堂上反复强调数学方法的对地理学的重要意义,消息传出,一度一起误
解乃至曲解,以为本人强调所有地理工作者都需要掌握数学方法。作者所谓的地理数学方法
的重要性,是就整体而言,不是就个体来说,在此顺便澄清。
国内许多重点大学如今都打出了创造国际一流大学的旗号,这是一种令人振奋的现象。
无论如何,“不想当元帅的士兵不是好士兵”,没有远大目标的高校永远成就不了国际一流高
校。然而,理想和愿望毕竟是一厢情愿,关键在于如何创造国际一流。“一流水平”路在何
方?将人才源源不断地送到欧洲、送到美国去深造?派人到国际科学中心学习,当然是非常
重要而且不可替代的发展途径,但绝对不是唯一的途径,更不是解决问题的根本途径。要知
道,我们的科技在历史上也曾一度遥遥领先——西方有学者估计,当今世界上的重要技术,
至少有一半起源于中国!作者丝毫无意借助“我的先人比你强”的阿 Q 精神来自我安慰。
作者想要说明的一个事实是:地理学的研究对象就在自己的脚下。只有与地球表面的自然和
人文系统直接沟通,我们才能进行最原初的创造;只有开展最原初的创造,才有可能领导潮
流。如果我们将希望单纯地寄托在欧美,我们只能亦步亦趋、在追随中创造,而难以在创造
中引领。西方科学的领先地位,根本上来自与大自然和人类社会的直接沟通和深度思索,而
不是派人到更高级的天外文明那里学习的结果。
我们要创造一流的大学,就得培养一流的人才。以地理科学为例,培养一流人才,至少
要重视如下三个方面。第一,我们的学生要学会直接与地理系统沟通,建立原初的理论和学
说。要想与地理系统直接沟通,一方面我们要有切实有效的实验手段,另一方面要掌握研究
对象自身的语言。三百多年前,伽利略就曾指出,大自然的语言是数学,其语言构成要素为
几何形体。今天看来,地理系统的语言也是数学语言。不了解地理系统的语言,通过观察、
实验,同样可以发现很多规律、进行重要的科学创造;但是,如果我们了解它们的语言,就
可以与地理系统进行更为有效的交流,从而更好地创造和发展。第二,我们的学生不仅能够
发表基于科学“原材料”的简单加工产品,而且有能力发表科学深加工、精加工和“制造品”。
我们的研究生、博士生每年都发表大量的 SCI 论文,但大多是基于实验数据和第一手观测
资料的、附加值较低的粗加工作品。如果我们能够发展理论,以至有能力提出自己的学说,
我们才算有能力发表“高附加值”的科学制造品。在工业中原材料至关重要,在科学中第一
手资料绝对重要。但是,如果不具备原材料加工的技术,任何原材料都无法实现高附加值;
同样地,如果不具备将第一手资料发展为理论的能力,非常重要的第一手资料都会成为别人
创建理论的材料,而不能有效为我所用。千百年年来,数学思维、逻辑推理是一直发展理论
的、行之有效的工具。第三,我们的学生必须具备并且发扬自己的比较优势。这既是一个经
济学思维的问题,也是一个运筹学思维的问题。一方面,“数学无王者之道”,不下苦功夫绝
对掌握不了数学方法。人们大多不愿意通过吃苦耐劳掌握数学方法,如果我们的学生在这方
面加大精力的投入,我们较之于西方的学生就有具有强大的比较优势。另一方面,扬长避短,
才能出奇制胜。西方的科学大大领先于我们,如果我们用上等马对别人的上等马、下等马对
别人的下等马,在竞赛中没有太多取胜的机会。但是,如果我们用上当马对别人的中等马、
中等马对别人的下等马,那我们就有了三分之二的胜算。众所周知,西方近现代科学本于两
大基础:一是基于系统受控实验的实证道路,二是基于逻辑推理的数学语言。我们在实验条
件和设备方面与西方竞赛目前没有太多的胜算,毕竟我们的经济实力、科技投入都无法与西
方相提并论。但是,学习数学语言不需要太多的经济投入,只要我们的学生吃苦耐劳、有精
力投入就可以实现。培养我们学生的数学思维,才是我们发展科学的比较优势所在。对于地
- 4 -
研究生地理数学方法 前言
理学而言,这个发展思路意义尤其深远。
北京大学一直非常重视地理数学方法的教学工作,由此可见我们的领导早就具备上述远
见卓识。正是在这个背景下,这一套《地理数学方法》教材才应运而生。本教材全套四册。
第一本是主教材——《地理数学方法及其应用》;与之配套的有三个辅助教材:《基于 Excel
的地理数据分析》、《基于 Mathcad 的地理数据分析》和《基于 SPSS》的地理数据分析。
教学内容的遴选遵循如下三个标准。其一是通用性质。由于本书属于方法性的教材,主
要讲述普遍适用的数学方法,如回归分析、多元统计分析、时间序列分析以及优化与评价方
法等。学习这些方法之后,我们的学生不仅掌握了本学科的一些研究工具,同时可以了解相
关学科的研究手段。其二是基本需要。如前所述,数学工具的应用有两大功能:一是观测数
据的整理,二是构造假设、发展理论。考虑到绝大多数学生的发展目标是应用研究,观测数
据的整理功能对他们而言更为现实。因此,本教材着重是将数学工具作为观测数据的整理手
段来进行课程安排的。对构造假设、建立模型的数学思维和方法,书中涉及不多。其三是技
术支持。要有现成的、流行的计算机软件支持课本中的教学内容。本书的基本方法在电子表
格 Excel 里就可以开展工作,复杂的数学计算可以借助于数学软件 Mathcad,大型的统计分
析可以借助于统计软件 SPSS。掌握了 Excel、Mathcad 和 SPSS,可以方便而快捷地完成教
学计划中的各种计算过程。
对于那些非常重要的基础性方法,本教材着重并且优先讲述。以回归分析为例,这种方
法看起来似乎简单,但实践中很容易被误用和滥用。实际上,掌握回归分析方法有助于更多
数学方法的学习和入门。主成分分析、因子分析、判别分析、时间序列分析(包括自相关、
自回归和功率谱分析)、小波分析、神经网络、灰色系统的 GM(1,N)预测分析,如此等等,
都可以通过回归分析了解其基本原理。因此,本教材系列实际上是以回归分析为主线,有机
安排全部教学内容。
从 2001 年开课至今,这一套教材先后在北京大学城市与环境专业经过了七个轮回的教
学试验。通过反复修改、多次增删,才发展成为今天的面貌。作者讲授的每一个数学方法,
在正式走向课堂之前,都要采用一个相对简明的教学案例,在 Excel 里一步一步完成计算过
程。只有能够基于过程分解逐步计算,才算真正掌握了一种数学方法的原理;只有在 Excel
里的计算结果与统计软件 SPSS 自动给出的结果以及与 Mathcad 编程计算的结果彼此吻合无
误的时候,作者才敢于课堂讲授这一套方法。对于某个数学方法,如果不能逐步计算出正确
的结果,那就意味着还存在作者没有理解透彻的环节,决不能“以其昏昏、使人昭昭”在课
堂上轻易讲授。正因为如此,这门课程连续七年总体上获得学生的好评。本教材还有一个特
点,那就是不厌其烦地精细讲解。考虑到许多学生的数学基础不是太好,而且很多人没有完
整的时间听课学习,本书充分考虑了学生自学的需要,尽可能借助实例深入浅出的展开论述。
加拿大天体物理学家 B.H. Kaye 在其《分维漫步(A Random Walk Through Fractal
Dimensions)》一书的导言中,一开头就讲述一个故事。有一次一个学生递来两页纸,上面
写着 Kaye 第一本中出现的一系列错误的修改意见。事过多年之后,Kaye 的另一部著作即将
付梓,依然不能保证书中没有失误,因此特别借助一个西方名言在前言中提醒读者:“如果
读者发现错误,请记住‘一个不犯错误的人必然没有任何作为(A man who never made a
mistake never made anything)’。”这本教科书在撰写过程中,每一届学生都帮助作者发现许
多疏忽和问题。正是在广大学生真诚的帮助下本书才得以尽快地提高质量。现在,本书即将
正式出版,作者却无法保证没有失误,只能诚恳地欢迎读者发现问题之后尽快提出批评和指
正意见。
陈彦光
2008-9-24
- 5 -
研究生地理数学方法 目录
目 录
第一篇 地理数学方法导论............................................................................................................ 1
第 1 章 数学方法的教学意义、内容和目标........................................................................ 1
§1.1 从一个实例讲起..................................................................................................... 1
§1.2 数学:分析工具和思维方式................................................................................. 4
1.2.1 数学是实现效率的工具................................................................................ 4
1.2.2 数学是一种思维方式.................................................................................... 6
§1.3 地理数学方法的教学内容和主要目标................................................................. 8
1.3.1 基本内容........................................................................................................ 8
1.3.2 主要目标........................................................................................................ 9
1.3.3 学习方法...................................................................................................... 10
§1.4 小结........................................................................................................................11
第 2 章 基本概念与基础知识.............................................................................................. 12
§2.1 基本概念............................................................................................................... 12
2.1.1 均值.............................................................................................................. 12
2.1.2 方差和标准离差.......................................................................................... 13
2.1.3 协方差.......................................................................................................... 14
2.1.4 极差.............................................................................................................. 14
2.1.5 变异系数...................................................................................................... 15
2.1.6 标准误差...................................................................................................... 15
2.1.7 自由度.......................................................................................................... 15
§2.2 数据标准化........................................................................................................... 17
2.2.1 数据标准化的方法...................................................................................... 17
2.2.2 标准化数据的性质...................................................................................... 18
2.2.3 广义标准化.................................................................................................. 19
§2.3 相关系数与相似系数........................................................................................... 20
2.3.1 相关/似系数的计算公式............................................................................. 20
2.3.2 几何意义和实例.......................................................................................... 21
2.3.3 基于二样本的变量相关系数...................................................................... 24
§2.4 实验和调查数据的处理....................................................................................... 25
2.4.1 平均值代表真实值...................................................................................... 25
2.4.2 平均值代表真实值的数学原理.................................................................. 26
§2.5 数据的缺失与估计............................................................................................... 28
2.5.1 无交互作用双因素方差分析...................................................................... 28
2.5.2 数据补缺实例.............................................................................................. 30
§2.6 变量的分类........................................................................................................... 32
2.6.1 变量分类系统之一...................................................................................... 32
2.6.2 变量分类系统之二...................................................................................... 32
§2.7 小结....................................................................................................................... 33
第二篇 回归分析与相关分析.................................................................................................. 35
第 3 章 问题的产生与理论的发展...................................................................................... 35
i