地理实体:指自然界现象和社会经济事件中不能再分割的单元,它是一个具体的、有概括性,复杂性,相对意义的概
念。是一种在现实世界中不能再划分为同类现象的现象。如城市、湖泊、道路,甚至是某种现象的度量结果,如高温
区,干旱区等
空间实体的类型:点状。线状、面状(面积、周长)、体状、复杂实体五种
线状实体:具有相同属性的点的轨迹,线或折线。特征:实体长度(从起到终点的总长)方向性
体状实体:立体状实体用于描述三位空间中的现象与物体。他具有长度、狂读及高度等属性,特征:体积、面积(每
个二维平面的面积)周长。 空间实体的空间关系:1 度量空间关系:欧式距离 (笛卡尔坐标系) 曼哈顿距离、时
间距离(纬度差) 大地测量距离(大地线,沿大圆) 2 拓扑空间关系 3方向空间关系
空间数据特征:空间特征(位置特征、关系特征)、属性特征
空间数据结构:空间数据的编排方式和组织关系
栅格数据的基本定义:
点:由单个栅格表达。线:由沿线走向有相同属性取值的一组相邻栅格表达。
面:由沿线走向有相同属性取值的一片栅格表达。
栅格数据表示的是二维表面上的地理数据的离散化数值。栅格数据中,地表被分割为相互邻接、规则排列的地块,每
地块与一个象元相对应。因此,栅格数据的比例尺就是栅格(元)的大小与地表相应单元的大小之比,当象元所表示的
面积大时,对长度、面积等的量测有较大影响。每个象元的属性
是地表相应区域内地理数据的近似值,因而有可能产生属性方面的偏差。
栅格数据层的概念:
在栅格数据结构中,物体的空间位置就用其在笛卡尔平面网格中的行号和列号坐标表示,物体的属性用像元的取值表
示,每个像元在一个网格中只能取值一次,同一像元要表示多重属性的事物就要用多个笛卡尔平面网格,每个笛卡尔
平面网格表示一种属性或同一属性的不同特征。
要表示多种专题属性,必须分层存储属性数据
表示:1 二维数组(最常用) 组合方式节约存储量 比特面方式:能在各面间进行高效率的逻辑运算,存储设备利用
率高。但处理耗时。2 一维数组将栅格面内的全体像素按照一定规则存储在一维数组中,主要用于栅格数据的压缩编
码
栅格数据取值方法:中心归属法,长度占优法 面积占优法 重要性法
栅格数据存储的压缩编码:链式编码 行程编码 块式编码 四叉树编码
链式编码:优点:链码可有效地存贮压缩栅格数据,便于面积、长度、转折
方向和边界、线段凹凸度的计算。
缺点:不易做边界合并,插入操作、编辑较(对局部修改将改变整体结构)。区域空间分析困难,相邻区域边界被重
复存储。
行程编码:1)属性码,长度 2)属性码,点位
特点:
对于行程长度编码,区域越大,数据的相关性越强,则压缩越大,适用于类型区域面积较大的专题图,而不适合于类
型连续变化或类别区域分散的分类图(压缩比与图的复杂程度成反比)。这种编码在栅格加密时,数据量不会明显增
加,压缩率高,并最大限度地保留原始栅格结构,编码解码运算简单,且易于检索,叠加,合并等操作,这种编码应
用广泛
块式编码:采用正方形区域作为记录单元,每个记录单元包括相邻的若干栅格。
特点:具有可变分辨率,即当属性变化小时图块大,对于大块图斑记录单元大,分辨率低,压缩比高。
小块图斑记录单元小,分辨率高,压缩比低,所以,与行程编码类似,随图形复杂程度的提高而降低分辨率
四叉树编码:指针四叉树编码、线性四叉树编码
指针四叉树编码需要六个变量存储:一个变量表示父结点指针、四个变量代表四个子结点指针、一个变量代表结点的
灰度或属性值。
线性四叉树编码:记录叶节点,并用地址码表示叶节点的位置。最常见的地址码是四进制或十进制的Morton码1)基
于深度和层次的线性四叉树编码:记录每个叶节点的地址和属值性2)四进制地址码(MQ码)
MQ码计算公式:MQ = 2×Ib+Jb公式中Ib、Jb分别为栅格单元行列号的二进制数
线性四叉树的十进制编码(MD) 如行为2、列为3的栅格的MD
步骤:(1)行、列号为二进制Ib= 1 0 Jb= 1 1
(3)再化为十进制.
(2)I行J列交叉
1 1 0 1 = 13
实质上是按左上、右上、左下、右下的顺序,从零开始对每个栅格进行自然编码。
四叉树编码的优点
(1)易于计算多边形的数量特征;
(2)是一种可变分辨率编码,可用较少的存储量精确的表示复杂的图形;
(3)栅格到四叉树及到四叉树到简单栅格结构的转换比其他压缩方法容易。
(4)便于在多边形中嵌套多边形,如表示“岛” 。
四叉树编码的缺点
(1)数据结构复杂,当同时提供多种四叉树结构时,不利于分析。
(2)未能表示物体间的拓扑关系。
(3)一个物体的图像在构成四叉树时会被分割到若干个象限中,使它失去了内在的相关性
矢量数据结构:实体式数据结构、拓扑数据结构
实体式编码的优缺点:优点
结构简单、直观、易实现以实体为单位的运算和显示。
缺点:1、相邻多边形的公共边界被数字化存储两次,造成数据冗余和碎屑多边形—数据一致,浪费空间,导致
双重边界不能精确匹配。2、自成体系,缺少多边形的邻接信息,无扑关系,难以进行邻域处理,如消除多边形
公共边界,合并多边形。3、岛作为一个单个图形,没有与外界多边形联系。不易检查拓扑错误。所以,这种结
构只用于简单的制图系统中,显示图形。
拓扑数据结构特点:优点
Ø一个多边形与另一个多边形之间没有空间坐标的重复,这样就消除了
重复线;
Ø 拓扑信息与空间坐标分别存储,有利于包含、连接、相邻等查询操作。
缺点
Ø 拓扑表在一开始时就要创建,需要时间;
Ø 一些简单的操作,如图形显示等比较慢,因为图形显示需要的是空间
栅矢量数据比较:
优点
缺点
矢量 1 结构紧凑、冗余度低,便于描述线或边界.
2 空间位置精度高
3 利用网络、检索分析,提供有效的拓扑编码,对需要
拓扑信息
的操作更有效
4、输出快速,成本低廉
栅格
1 结构简单,易数据交换
2 叠加分析和地理现象模拟较易。
3 利于与遥感数据的额匹配应用和分析,便于图像处理
4 输出快速,成本低廉
1 数据结构复杂。各自定义,不便于数据
标准化和规范化,数据交互困难。
2、多边形叠加分析困难,没有栅格有效,
表达空间变化性能力差
3 不能直接处理数字图像信息
4 软硬件技术要求高,显示与绘图成本较高
1 数据量大,数据结构不严密不紧凑,需要压
缩技术解决该问题
2 现象识别效果不如矢量方法,难以表达拓
扑
3 投影转换困难
4 图形质量较低,图形输出不美观,线条有锯
齿,需要增加栅格数量来克服,但会增加数据
文件
三维数据结构: 栅格
八叉树
矢量
三维边界
三维空间数据模型:三位边界表示法、八叉树、四面体格网
空间概念模型:矢量数据模 栅格数据模型矢-栅一体化数据模
空间逻辑模型:层次模型网络模型关系模型面向对象模型
物理模型:物理表示组织 空间数据存取
第四章 GIS数据输入
数据的规范化和标准化
统一的地理基础:统一的地图投影系统、统一的地理坐标系统(大地坐标、地理坐标、高程坐标)以及统一的地理编
码系统
统一的分类编码原则:分类编码应遵循科学性、系统性、实用性、同一性、完整性、课扩充性等原则、
数据交换格式标准:是规定数据交换时采用的数据记录格式,主要用于不同系统之间数据交换。
标准采集技术规程:我国-图形采集技术规程和摄影测量数据采集技术规程
地理编码:将地址映射成地理坐标的过程。
空间数据交换:1 通过外部数据交换文件进行 2、通过标准空间数据文件转换 美国的STDS,中国的CNSDTF,DXF文件
3 通过标准的API函数进行转换
地图数字化:手工数字化 数字化仪数字化(手扶跟踪数字化仪 生成矢量数据) 扫描仪数字化(栅格数据)
数字化仪的操作方式:点方式、流方式
空间数据质量的概念:是指空间数据在表达实体空间位置、特征和时间所能达到的准确性、精确性、一致性、完整
性、现势性和几者统一的程度,以及数据适用于不同应用的能力。
微观方面的数据质量问题:定位及精度、属性精度、一致性、分辨率
定位精度-偏差(精确度):对现象描述的额详细程度。精度低的数据并不一定准确度也低。偏移(准确度)
一致性:指对同一现象或同类现象的表达的一致程度
属性精度:指要素分类的正确性、属性编码的正确性、注记的正确性等,用来描述属性数据的质量。
分辨率:对于栅格数据来说,分辨率指的是图像表达的精密度,对于矢量数据,指制图的最小单元,有时也称粒度。
宏观方面的数据质量问题:完整性、现势性、地域性、数据档案
数据采集步骤:确定数字化路线(选择底图 地图分层与分幅) 地图预处理 地图数字化
地图预处理:数字化之前需要对数字化地图进行适当处理,主要包括减少图纸变形的影响、线化要素的分段、选取
控制点
第五章:数据处理
1 数据编辑
窗口操作:开窗显示时窗口操作中主要的基本的功能。包括:1)裁剪技术-关键是拍短空间实体是否在开窗范围内。
2)二维观察变换:坐标之间的变换 在地图数据库中,三种坐标系之间均是双向变换关系:
图形数据编辑;点的捕捉:设光标点为是s(x,y),某一点状要素的坐标为A(x,y)可设一捕捉半径D(通常为3~
5个象素,这主要由屏幕的分辩率和屏幕的尺寸决定)。若S和A的距离d小于D则认为捕捉成功,即认为找到的点是A,
否则失败,继续搜索其它点。捕捉范围有圆改为矩形,这可大大加快搜索速度。
线的捕捉:设光标点坐标为S(x,y),D为捕捉半径,线的坐标为(x1,y1),(x2,y2),…(xn,yn)。通过计算S到该线
的每个直线段的距离d。.若min(d1,d2,…dn-1)<D,则认为光标S捕捉到了
加快线捕捉的速度的方法:1)在实际的捕捉中,可每计算一个距离di就进行一次比较,若di<D,则捕捉成功,不需
再进行下面直线段到点S的距离计算了。
2)把不可能被光标捕捉到的线,用简单算法去除。
3)对于线段也采用类似的方法处理。
4)简化距离公式:点S(x,y)到直线段(x1,y1),(x2,y2)的距离d的计算公式为:
简化为d=min(dx,dy)
面的捕捉:实际上就是判断光标点s(x,y)是否在多边形内,若在多边形内则说明捕捉到。
方法有垂线法或转角法。垂线法的基本思想是从光标点引垂线(实际上可以是任意方向的射线),计算与多边形的交点
个数若交点个数为奇数则说明该点在多边形内;若交点个数为偶数,则该点在多边形外。
加快速度的方法:
1)找出该多边形的外接矩形,若光标点落在该矩形中才有可能捕捉到该面,否则放弃对该多边形的进一步计算和判
断。
2)对不可能有交点的线段应通过简单的坐标比较迅速去除。
3)运用计算交点的技巧。
编辑操作:
结点的编辑:1)结点吻合 方法:结点移动 鼠标拉框 求交点 自动匹配
结点与线的吻合:方法:结点移动 使用线段求交 自动编辑(在给定容差内,自动求交并吻合在一起)
需要考虑两种情况:A、要求坐标一致,而不建立拓扑关系;如高架桥(不需打断,直接移动)
B、不仅坐标一致,且要建立之间的空间关联关系;如道路交叉口(需要打断)
清除假结点(伪结点) 有些系统并不清除假结点。因为他们不影响空间查询、分析和制图
伪结点:当单条线自相交时,或只有两条弧相交时,会产生伪结点。伪结点不一定就是错的。
图形编辑:包括用鼠标增加或删除一个点、线、面试题,移动、旋转一个点、线、面实体。
图幅接边
逻辑接边:同一地物地物编码不同或具有不同的属性信息,如公路的宽度,等高线高程等。
几何接边步骤:1)识别或提取相邻图幅。2)几何接边
多边形自动生成:
拓扑关系建立:手工建立 自动建立(自动建立面域、弧段及其节点之间的拓扑关系,多采用弧段跟踪
法)
自动建立步骤:1)链的组织 2)结点匹配 3)检查多边形是否闭合 4)建立多边形 5)岛的判断 6)确定多
边形的属性
1 链的组织 1)找出在链的中间相交的情况,自动切成新链;
2)把链按一定顺序存储,并把链按顺序编号。
2 结点匹配 1) 把一定限差内的链的端点作为一个结点,其坐标值取多个端点的平均值。2)对结点顺序编号。
3 检查多边形是否闭合 通过判断一条链的端点是否有与之匹配的端点来进行.
多边形不闭合的原因:
1)由于结点匹配限差的问题,造成应匹配的端点未匹配;
2)由于数字化误差较大,或数字化错误,这些可以通过图形编辑或重新确定匹配限差来确定。
3)还可能这条链本身就是悬挂链,不需参加多边形拓扑,
这种情况下可以作一标记,使之不参加下一阶段拓扑建立多边形的工作
空间数据的误差分析:方法:分析体系、敏感度分析、蒙特卡罗法、空间滤波。。
误差校正:二次变换、高次变换 二者消除图纸变形或数字化过程中所产生的随机误差 使用语原图有非线性变形
的情况。
一次变换(同素变换):线性变换 适用于校正由于图纸伸缩和地图定向引起的系统误差。
几何变换—仿射变换的变形:比例尺变换(图形缩放) 坐标旋转 坐标平移
空间数据的压缩与光滑
数据压缩:节省存储空间,加快处理速度
数据光滑:恢复数据,使得图形显示美观
栅格数据压缩(上面) 矢量数据压缩
矢量数据压缩:间隔取点法,垂距法、合并法、分裂法
数据光滑:根据一组离散点,寻找形式较简单、性能良好的曲线解析式
插值方式 ::曲线通过给定的离散点。如拉格朗日插值,三次样条曲线
逼近方式::曲线尽量逼近给定离散点。如贝塞尔曲线和B样条曲线
栅格数据与矢量数据的相互转换
矢量向栅格的转换
1 点的转换设矢量数据的一坐标点值为(X,Y),转成栅格数据其行列值为(I,J)。X0、Y0,表示栅格
原点在矢量坐标系中的坐标值。
2 线的转换1)用点栅格化方法,实现直线的起点终点坐标点栅格化用以上点栅格计算公式分求出矢量数据中直线
端点a、b的栅格行列值(ia、ja)和(ib、jb)。
2)求出直线段所对应的栅格单元的行列值围
这里直线段ab所对应的栅格单元的行范围为(ia - ib);列围为( ja - jb)
3)求直线经过的中间栅格数据所在行列值
两种方法:
八方向栅格化:每行或每列上只有一个像元被栅格化
全路径栅格化:直线经过的所有像元都被栅格化
3 多边形数据的栅格化方法:就是在矢量表示的多边形边界内部的所有栅格上赋予相应的多边形编号,从而形成栅
格数据阵列。
转换方法;①边界代数算法②内部点扩散法③复数积分法④射线算法和扫描算法
栅格向矢量的转换
点的矢量化
2 线段的矢量化 将具有相同属性值的连续的单元格搜索出来,最后得到细化的一条线。
3 多边形(面)的矢量化:将具有统一属性的单元归为一类,在检测两类不同属性的边界作为多边形的边,最终提
取以栅格集合表示的区域边界和边界的拓扑关系。
栅格格式向矢量格式转换一般步骤:
1) 栅格数据的二值化 2)多边形边界提取和细化 3)多边形边界跟踪 4)去除多余点及曲线光滑 5)拓扑关
系生成
栅格数据的二值化:由于栅格数据常以不同灰度级或彩色来表示,为实现矢量化转换需要先进行二值化。二值化
的关键是在灰度级的范围内取一个
阈值,使小于闽值的灰度级取值为0,大于阅值的灰度级取值为1。
对扫描输人的栅格图,由于各种原因,获取的栅格图上总会存在污点、污迹、线轮廓凹凸不平等现象。为此,在
二值化前要进行预处理,如通过人工交互编辑处理,修补断线,通过低通滤波除去污迹,通过高通滤波除去污点
等等。
多边形边界提取和细化:实质是消除线段横截面栅格数的不一致,将图像中的线条沿中心细化,使其具有一个像
素宽度的线条。
细化意味着要删除一部分栅格,但细化后要保持图像的连接性不变,要保留原图像的关键部分。实现算法主要有
“剥皮法”和“骨架法”,为获得好的处理结果,算法的选择应视图像情况而定
3) 多边形边界跟踪 的目的是,将细化处理后的栅格数据转换成矢量图形坐标系列
4)去除多余点及曲线光滑由于上述过程是逐个栅格进行的,因此存在大量多余点需要除去,多余点去除根据直线
方程求得,即找线段上连续的3个点,检查中间点是否在直线上或基本上(规定误差范围内)在直线上时,如上述条
件成立则去除中间点。同时,由于栅格精度所限,跟踪曲线可能不光滑,为此可用线性叠代法、分段三次多项式
插值、样条函数插值等算法使曲线光滑。
(5) 拓扑关系生成
拓扑关系生成需要找出用矢量表示的结点、线段,形成拓扑关
系,并建立相应属性信息。
第六章 空间数据管理
计算机对数据的管理有四个阶段:程序管理阶段 文件管理阶段 数据库管理阶段 数据仓库阶段
文件管理阶段:顺序文件 索引文件 直接文件 倒排文件
数据库管理阶段:层次数据库 网络数据库 关系数据库 面向对象数据库
数据仓库阶段:数据经过重构、融合等,面向主体组织,服务于决策系统。
特点
文件管理
文件和关系数据库混合管理
扩展模型1-全关系数据库管理
程序依赖于数据结构,不能达到数据共享
用户课在通过一界面下处理图形数据和属性数据,对于空间数据缺少安全性,
一致性,完整性、并发控制
GIS软件商在标准RDBMS上对二进制块开发读写效率比较慢,
遇到有嵌套时更慢
扩展模型2-对象-关系数据库管理 数据库软件商对标准RDBMS进行开发,解决变长记录
面向对象数据库管理
的存储仍未解决嵌套问题,且空间数据结构不能由用户定义
最适合于空间数据的表达和管理,不仅支持变长记录,
且支持对象的嵌套,信息的继承和聚集,价格昂贵,技术不成熟
GIS中面向对象模型;1)空间地物的几何数据模型 2)拓扑关系与面向对象模型 3) 面向对象的属性数据
模型
空间数据特征:1 空间特征:一般需要建立空间索引
2 非结构化特征:结构化的,即满足第一范式每条记录定长,而空间数据数据项变长,对象包含一个或多个
对象,需要嵌套记录。
3 空间关系特征:拓扑数据给空间数据的一致性和完整性维护增加了复杂性。
4 分类编码特征:一种地物类型对应一个属性数据表文件,多种地物类型共用一个属性数据表文件。
5 海量数据特征
空间索引:对存储在介质上的数据位置信息的描述。
分为:矩形范围索引 单元格网索引 R树索引 四叉树索引
矩形范围索引:在记录每个空间对象的坐标时,同时记录每个空间对象最大最小坐标。这样,在检索空间对象时,
根据空间对象的最大最小范围,预先排除那些没有落入检索窗口内的的空间对象,仅对那些最大最小范围落在检
索窗口的空间对象进行进一步的判断,最后检索出那些真正落入检索窗口内的空间对象。
主要是靠空间计算来进行判断。
单元格网索引:也叫栅格索引,它是将工作区按照一定的规则划分成格网,然后记录每个格网内所包含的空间
对象。通常建立一个平行于坐标轴的正方形数字网格,把整个数据库数值空间划分成32×32(或64×64)的正
方形网格,建立空间索引文件 使用于大型数据量的。空间范围确定的GIS应用
元数据的定义和作用
定义:地里的数据和信息资源的描述性信息。他是通过地理空间数据的内容、质量、条件和其他特征进行描
述和说明,以便人们有效地定位、评价、比较、获得和使用语地理相关的数据。
作用:1)用来组织和管理空间信息,并挖掘空间资源
2)帮助数据使用者查询所需空间信息
3)组织和维护一个机构对数据的投资
4)用来建立空间信息的数据目录和数据交换中心。
5)提供数据转换方面的信息
元数据按所描述的数据内容分:数据集系列元数据 数据集元数据 要素类型和要素实例元数据
属性类型和属性实例元数据
第一层是目录层,主要用于对数据集信息进行宏观描述,
适合在数字地球的国家级空间信息交换中心或区域以及全球范围内管理和查询空间信息时使用。
第二层是空间元数据标准的主体,由八个基本内容部分和四个引用部分组成
栅格与影像数据库
栅格数据库可以与矢量数据库联合使用,复合显示各种专题信息
细节层次模型 金字塔及分块显示
栅格、影像数据库通常采用金字塔结构存放多种空间分辨率的栅格数据。统一分辨率的栅格数据被放在一个层
面上:而不同分辨率的栅格数据具有上下垂直的组织关系:越靠近顶层,数据分辨率越小,数据量也越小,只
能反映原始数据的概貌:越靠近底层,数据的分辨率越大,数据量也越大,更能反映原始详情。
时空数据模型:内容包括;空间时态数据的表达 空间时态数据的更新和查询
时态GIS数据模型:时间片快照模型 地图叠加模型
时间片快照模型:常规的时空数据模型(如遥感图像数据的采集方式)即属于时间片快照模型。它是用一系列状
态对应的地理数据来反映地理现象的时空演化过程。其中可分为矢量快照模型和栅格快照模型两种
地图叠加模型:首先确定空间数据的初始状态,即底图数据。然后按照适宜的时间间隔记录数据随时间发生的变
化。再通过空间叠加操作,利用记录的变化数据来恢复各个时间片的状态数据,每一次叠加则表示状态的一次变
化
第八章:空间分析
GIS的空间分析是以地理事物的空间位置和形态特征为基础,以空间数据运算、空间数据与属性数据的综合运算
为特征,提取与产生新的空间信息的技术和过程。
空间分析目的是通过对空间数据的分析处理,获取地理对象的空间位置、空间分布、空间形态、空间演变等新
信息
空间分析的步骤:
1、建立分析的目的和标准
2、准备空间分析的数据
3、进行空间分析操作
4、准备表格分析的数据
5、进行表格分析
6、结果的评价和解释
7、如有必要、改进分析
8、结果输出(地图、表格和文档)
空间叠置分析(Spatial Overlay Analysis)是指在统一空间参照系统条件下,每次将同一地区两个地理对象的图层进
行叠置,以产生空间区域的多重属性特征,或建立地理对象之间的空间对应关系。
邻域变换:计算新图层属性时,不仅考虑原始图上对应山歌本身的值,还不考虑该图元邻域关联的其他图元值的影响。
如面元分布图,生成面元边界图时,判断是否为边界点,需判断本
身为面属性,且其邻域包含背景属性(四、八邻域)
矢量系统的叠置分析
多边形与多边形的叠加