ArcGIS矢量数据处理指南
北京捷泰科技有限公司
2012年3月
标题
版权声明
本文档版权为北京捷泰科技有限公司所有。未经北京捷泰科技有限公司书面许可,任何单位和个人不得以任何形式摘抄、复制本文档的部分或全部,并以任何形式传播,或以任何电子或文本方式翻印、转载本书的任何部分。
如有疑问,请与北京捷泰科技有限公司联系:北京市东城区东直门南大街甲3号居然大厦19层。
北京捷泰科技有限公司 |ArcGIS矢量数据处理指南
目 录
1 2
概述 ......................................................................................................................................- 1 - 总体流程 ..............................................................................................................................- 1 - 2.1 2.2 3
电子地图制作与发布流程 ......................................................................................... - 1 - 电子地图数据处理流程 ............................................................................................. - 1 -
数据处理 ..............................................................................................................................- 2 - 3.1 3.2 3.3 3.3.1 3.3.2 3.4 3.4.1 3.4.2 3.4.3 3.5 3.6 3.7 3.7.1 3.7.2 3.7.3 3.8 3.8.1 3.8.2
数据要求 ..................................................................................................................... - 2 - 数据获取 ..................................................................................................................... - 3 - 格式转换 ..................................................................................................................... - 3 -
转换工具集 ...........................................................................................................- 3 - 数据互操作扩展模块 ...........................................................................................- 3 - 数据整合 ..................................................................................................................... - 4 -
数据提取 ...............................................................................................................- 5 - 数据裁切 ...............................................................................................................- 6 - 数据拼接 ...............................................................................................................- 7 - 数据组织重构 ........................................................................................................... - 13 - 分类代码转换 ........................................................................................................... - 14 - 兴趣点数据处理 ....................................................................................................... - 14 -
兴趣点数据的应用场景 .................................................................................... - 14 - ArcGIS中常用的点抽稀方法 ............................................................................ - 15 - 兴趣点数据抽稀实例 ........................................................................................ - 18 - 坐标投影变换 ........................................................................................................... - 20 -
动态投影 ............................................................................................................ - 20 - 投影变换 ............................................................................................................ - 21 -
4 数据质量控制 ................................................................................................................... - 23 - 4.1 4.2
几何检查与修复 ....................................................................................................... - 24 - 逻辑关系检查 ........................................................................................................... - 26 -
北京捷泰科技有限公司 |ArcGIS矢量数据处理指南
4.3 4.4 4.5
重复数据的处理 ....................................................................................................... - 27 - 拓扑检查 ................................................................................................................... - 29 - 属性检查 ................................................................................................................... - 32 -
附录 ........................................................................................................................................... - 35 - 附录1 1:10000成果数据命名规范 ..................................................................................... - 35 - 附录2 1:10000成果数据分层 ............................................................................................. - 35 - 附录3 1:10000成果数据属性结构 ..................................................................................... - 36 -
北京捷泰科技有限公司 |ArcGIS矢量数据处理指南
概述
- 1 - 1 概述
空间数据是GIS的一个重要组成部分,整个GIS都是围绕空间数据的采集、加工、存储、
分析和表现展开的。原始数据往往由于在数据结构、数据组织、数据表达等方面与目标系统不一致而需要进行转换与处理,如不同数据格式之间的相互转换,数据的裁切、拼接以及投影变换等。
OneMap地图制图模板中预先对电子地图组成图层的显示内容、显示比例范围、渲染方式和标注样式进行了设置,用户可以通过导入数据源来套合模板完成地图制图过程。为了使源数据贴合制图模板的套用需求,仍需进行一系列的数据处理工作。本文将介绍基于ArcGIS进行矢量数据处理的流程和方法。
2
2.1
总体流程
电子地图制作与发布流程
基于ArcGIS进行电子地图制作与服务发布大概包括三个步骤:前期数据处理、电子地图配图和地图服务发布。
前期数 据处理 电子地 图配图 地图服 务发布
其中前期数据处理主要包括确定数据来源、进行数据格式转换并进行数据整合,最终形成成果数据以供电子地图使用;电子地图配图指导入成果数据套合OneMap地图制图模板从而完成电子地图制作的过程;地图服务发布指将制作好的电子地图发布为服务以供第三方调用,并进行地图缓存制作的过程。
本文主要讨论前期数据处理的过程,电子地图配图及地图服务发布详见《OneMap地图制图模板v2.0使用手册》。
2.2 电子地图数据处理流程
电子地图数据处理主要包括数据获取、数据格式转换、数据整合、数据组织重构、分类
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 2 - 代码转换、兴趣点数据处理、坐标投影变换、质量检查等步骤,技术流程见下图:
数据获取 格式转换 数据整合 数据组织重构 分类代码转换 POI 数据处理 坐标投影变换 质量检查 成果数据
3
3.1
数据处理
数据要求
地图制图模板依赖于一定的数据规范,满足规范的数据才能更好的与模板相套合。数据规范一般会对数据的数学基础、数据格式、数据分层及属性、存储单元、数据精度等进行要求,例如国家地理信息公共服务平台对数据作了如下要求:
数学基础:坐标系统为2000国家大地坐标系,坐标单位为度;
存储与交换格式:生产过程中可采用通用的可交换格式存储(如Esri shapefile
格式),建库后采用所使用数据库的格式;
数据分层及属性:参见《400万-5万地理实体数据整合技术要求》及本文附录中
1:1万数据分层及属性说明;
存储单元:生产过程中的数据依据数据比例尺采用国家标准《国家基本比例尺地形
图分幅和编号》(GB/T 13989-92)分幅存储,建库后统一拼接;
数据精度:几何精度:数据整合改造过程中应保证与源数据精度一致,不得损失、
破坏或降低原始数据精度;成果数据相邻图幅的要素要严格接边,包括数据几何接边与属性接边。由于整合改造时所使用数据源不同而引起的相邻图幅无法接边的情况,需要在项目技术总结中说明;属性精度:保留原始数据属性信息。
Esri提供了一套完全符合国家地理信息公共服务平台规范的基于ArcGIS File Geodatabase的数据模型,在地图制图模板中也参照规范对坐标系统、数据分层及表达等进行了设置。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 3 - 3.2 数据获取
矢量电子地图数据通常来源于测绘部门的基础地理信息数据,包括1:100万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000、1:2000、1:1000、1:500等不同比例尺,以及公共服务设施等专题地理信息。
确定数据来源后最关键的工作就是建立源数据与成果数据的分层对应关系及要素选取转换对照表。
3.3 格式转换
ArcGIS中常用的数据格式转换工具包括:转换工具集(Conversion Tools)和数据互操作扩展模块(Data Interoperability Tools)。
3.3.1 转换工具集
转换工具集支持常用的数据格式转换,包括OGC规范数据格式WFS、KML格式转换,多种栅格数据转换,CAD、Collada、Coverage、dBASE、Shapefile、Geodatabase格式导出等。
3.3.2 数据互操作扩展模块
利用数据互操作(Data Interoperability)扩展模块可实现超过100种数据格式的直接读取,超过70种数据格式转出,以及自定义格式的转出。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 4 -
数据互操作扩展模块需要独立的授权许可,使用时需要在扩展模块中对“数据互操作”进行勾选。
3.4 数据整合
源数据转为目标格式后,就可以按照分层对应关系及要素选取转换对照表对数据进行整合处理了。数据整合的过程较复杂,根据源数据与成果数据的关系数据整合处理可能涉及到数据提取、数据裁切、数据拼接等方法。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 5 - 3.4.1 数据提取
数据提取是指将源数据图层中的部分要素通过属性筛选或空间过滤的方式提取到目标图层中,例如将道路图层中的高速公路、国省道提取出来。数据提取比较简单的方法是将图层加载到ArcMap中利用Selection菜单对要素进行选取:
然后将选取的要素导出到目标数据集即可。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 6 -
3.4.2 数据裁切
数据裁切是指将源数据图层中指定区域内的数据导出到目标图层中,并且导出的数据内容与选取的多边形要素类严格契合,例如将全国1:400万道路图层中北京市范围内的要素选取出来,常用Clip工具实现。该工具位于工具箱“Analysis Tools->Extract”下,打开Clip对话框,在输入要素类中输入待裁剪的要素,裁剪要素输入框中,选择一个面要素(注意:裁剪要素数据集必须是面),作为“模具”,输出要素类将包含输入要素的所有属性。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 7 - 3.4.3 数据拼接
数据拼接是指将空间相邻的数据拼接成为一个完整的目标数据。原始数据经数据提取、裁切等操作后形成若干中间结果,要对这些中间结果进行拼接形成最终结果要素类。拼接的前提是矢量数据经过了严格的接边,下面首先来介绍数据接边操作。
3.4.3.1 数据接边
在ArcGIS中利用空间纠正中的边匹配方法可实现数据的自动接边。
下面具体介绍下ArcMap里的接边步骤。 1)设定接边数据
对选择接边的数据类型进行选择,可只对所选中数据进行接边,也可选择对应的图层的所有要素进行接边。
2)选择空间校正中的边匹配方法
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 8 -
3)为边匹配设置参数,例如源图层、目标图层,平滑还是直线接边等。
边捕捉支持两种方法:平滑和线。使用“平滑”边捕捉方法时,位于连接线源点的折点将被移动到目标点。其余折点也会被移动,从而产生整体平滑效果,针对等高线、水系等对平滑效果有一定要求的数据,可选择采用这种方式。使用“线”边捕捉方法时,只有位于连接线源点的折点会被移动到目标点。要素上的其余折点保持不变。
勾选中“校正到连接线的中点”时,源和目标图层都改变,都往连接线的中点靠拢。没选中时只有源图层变化,往目标图层靠拢,目标图层不变。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 9 -
选中“每个目标点一条连接线”,实现一对一的连接,也就是说一个目标点只有一个源点连接;而选中“避免重复连接线”后,可实现一对多连接,即一个目标点可有多个源点连接。
根据需要,勾选“使用属性”,并点击右侧的“属性”按钮,设置接边数据源属性,所设置属性信息一致的数据源,才能接边。
4)点击“边匹配”,框选要接边范围内的相关接边点。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 10 - 可看到参与接边的相关点对。
5)点击“校正预览”可实现接边效果预览,点击“校正”后,完成接边校正处理。
需要注意的是,虽然边匹配给我们提供了一个自动接边的工具,但它不是万能的,有些地方还得靠人工接。接边时要设定捕捉容差值,当要结合的对应点大于容差值时不会被接在一起,所以容差值不能太小,但也不能太大,否则不该接在一切的点也被接到一起了。容差值的设定在捕捉工具条的选项里。
3.4.3.2 数据合并
接边后的数据可以通过数据合并来构成一个整体。数据合并有多种方法,如Append、
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 11 - Merge、Load等。
Append方法
Append是常用的数据合并的方法,位于工具箱“Data Management Tools->General”下,Append可以将多个图层的数据合并到一个已存在的目标图层中。属性传递有两种模式:TEST和NO_TEST,其中TEST模式要求原始和目标图层的属性结构一致,不一致将会报错;NO_TEST模式不要求二者的属性结构一致,它以目标图层的属性结构为准,原始图层中与之不一致的属性字段将会丢失,若想保留原始图层中的所有字段,在执行该工具前要对目标图层的属性结构进行处理,使其包含原始图层的属性,还可以在Field Map中通过字段映射建立原始与目标图层中的属性对应关系。推荐采用NO_TEST模式。
Merge方法
Merge工具位于工具箱“Data Management Tools->General”下,该工具也可以将多个图层合并为一个,与Append不同的是它将结果生成了一个新的要素类,而不是合并到已存在的要素类当中。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 12 -
Load方法
在ArcCatalog中可以直接通过Load方法将其他要素类的内容合并到当前要素类中。选中要与其他要素类进行合并的要素类,右键单击Load->Load Data菜单命令,在弹出的对话框中选择需要进行合并的要素类。
注:这里的合并要求所有的要素类必须具有相同的属性字段。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 13 - 3.5 数据组织重构
数据整合处理完成后形成了中间结果数据,接下来需要进行数据组织重构。 数据组织重构包括两方面的内容,数据分层命名和属性结构规整。
数据分层命名分为两种情况,一种是经过数据整合后的数据层与要求的数据层一一对应,可直接按照命名规范进行修改;另一种是数据整合后的数据层与要求的数据层并不一一对应,需要针对不同情况做相应处理。
属性结构规整分为三步,首先按照规范的属性字段及类型长度给由以上步骤所生成的数据层添加属性项;其次是按照属性值对应关系将旧的属性值赋到新属性字段中;最后删除旧属性项。
建立属性字段对应表,将旧属性项字段值赋到新属性项字段值中。
属性结构规整一般通过属性表中的计算几何工具和字段计算器即可完成,计算几何工具可以计算要素的长度或面积,字段计算器可以完成多种赋值操作。
如果在数据整合过程中丢失了部分属性,也可以通过建立连接的方式与原始数据建立空间或属性连接,然后通过字段计算器获得相应属性。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 14 -
3.6 分类代码转换
OneMap地图制图模板中各图层分类渲染依据的是CLASID字段,即国标分类码字段,所采用的标准是GB/T 13923-2006。
源数据通常来源于基础地理信息数据,属性中带有数据分类代码字段,但是有的分类代码可能依据的标准是GB/T 13923-1992,因此需要将分类代码转为GB/T 13923-2006。
OneMap地图制图模板中提供了分类代码转换工具,转换时需要建立分类代码转换表,建立GB/T 13923-1992分类代码与 GB/T 13923-2006分类代码的对应关系,执行工具完成转换,该工具的使用详见《分类代码转换、Label换行和符号处理工具说明》。
3.7 兴趣点数据处理
3.7.1 兴趣点数据的应用场景
兴趣点(POI)数据的用途大体上分为两类:一类作为底图供用户浏览,一类作为业务数据供查询、统计分析等使用。作为底图的兴趣点数据又包含两种情况:一是单纯作为底图,如天地图;二是提供底图上的兴趣点动态识别功能,如百度、搜狗地图等。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 15 -
由于兴趣点数据通常数据量较大,在空间上容易重叠,为了制图美观,用于底图时需要对其进行抽稀。而用于业务数据时为了查询统计的准确则不宜进行抽稀,如果需要叠加到地图上可用小图标的方式动态绘制。
本文主要讨论底图中的兴趣点数据处理方法。
3.7.2 ArcGIS中常用的点抽稀方法
目前在ArcGIS中有三种点抽稀的方法:Maplex自动点抽稀、Subset点抽稀和Sub Points点抽稀。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 16 - 3.7.2.1 Maplex自动点抽稀
Maplex是ArcGIS的高级智能标注引擎,利用Maplex的牵引线标注,将Symbol作为label显示,从而使点符号与文字标注绑定在一起,通过调整阙值自动进行标注间避让,计算出地图上所有标注的最佳放置位置,达到点抽稀的目的。
Maplex点抽稀方法的优点是自动化、方便快捷,只需对图层标注样式进行设置就可以自动完成点抽稀。缺点是作牵引线标注后点符号的中心与实际点位存在半个符号的偏差。
如果POI单纯用于底图浏览,并且对数据精度没有特别高的要求可以采用这种方式。
3.7.2.2 Subset点抽稀
Subset Features工具是ArcGIS地统计分析模块的一个工具,该工具可将数据按照百分比进行抽稀,生成两个结果数据集,一个是抽稀后保留的数据,另一个是互补的那一部分数据。
用Subset工具执行效率较高,但该方法保持了原图的疏密程度,并不能使数据均匀分布,原有数据密度高的地方抽稀后还是较密,因此单纯利用该工具难以实现底图上的抽稀效果。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 17 -
左图:抽稀前 右图:30%抽稀后
3.7.2.3 Sub Points点抽稀
Sub Points工具是Esri中国自主开发的一个插件,该工具优先考虑点在空间分布上的均匀合理性,并结合点数据中包含的“优先级”属性进行筛选。通过获取每个点在一定范围内拥有的相邻点的数目信息,得到地图中点密度的分布状况。抽稀时在若干相临近的点中首先比较优先级,保留优先级高的;优先级相同时比较NAME字段,保留NAME长度短的;两者都相同时随机选择。
Sub Points使用方法:
1)先利用Point Distance(Point Distance指图上两个POI点之间的距离)工具计算临近要素,生成临近要素表;
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 18 -
2)原数据中建立“优先级”(short)和“status”(long)字段,并给“优先级”字段赋值;
3)运行Sub Points工具计算status的值: status > -99,表示要保留的要素; status = -99,表示要删除的要素。
Sub Points点抽稀方法能达到比较好的图面效果,并且能保持点位的精确,但是大数据量时(超过100000条)耗时较长。
3.7.2.4 Subset与Sub Points方法的综合运用
对于大数据量POI,为了兼顾图面效果、数据精确性以及执行效率,我们可以采用Subset与Sub Points相结合的方法。首先通过Subset方法进行空间上的抽稀以减少数据量,再利用Sub Points方法进行抽稀以达到较好的制图效果,详见下面的示例。
3.7.3 兴趣点数据抽稀实例
以北京市兴趣点数据为例,兴趣点总数为163736个,在一个图层中,对L14(比例尺1:36072)、L15(比例尺1:18036)、L16(比例尺1:9018)、L17(比例尺1:4509)采用Subset与Sub Points相结合的方法分别进行点抽稀。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 19 - 点抽稀的几点注意事项:
Point distance表示临近要素的距离,抽稀后表现为图上两个点之间的距离,它的值
由比例尺决定,一般取图上距离1cm,换算成实际距离是多少米。例如14级比例尺为1:36072,图上距离1cm对应实际距离360.72米,因此设置point distance为400米;
不同级别下用到的数据不一样,要根据图面效果确定subset抽稀的比例,一般最
后的记录数(Subpoints后记录数)不超过Subset后记录数的1/3;
Subpoints工具运行的效率与数据的记录数和point distance的值有关系,记录数越
多运行越慢point distance越大运行越慢。 点抽稀步骤(以14级为例):
1)兴趣点数据中建立“优先级”(short)和“status”(long)字段,并结合兴趣点分类给“优先级”字段赋值,“status”字段可设置初始值-999。
2)使用Subset Features工具进行抽稀,抽稀比例设置为10%,得到抽稀后的要素类POI_10,抽稀后记录数为16374条。Subset后仍会有空间上的压盖,要再用Sub Points方法进一步点抽稀。
3)对于2)生成的结果POI_10,使用Point Distance工具生成临近要素表,搜索距离(Search Radius)设置为400米。
4)打开Sub Points工具,导入3)生成的临近要素表及2)生成的结果POI_10,运行工具得到最终结果。
通过上述步骤抽稀后的第14级如下图所示:
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 20 -
在不同的级别下,Subset的百分比和Point Distance的值可能需要根据图面效果进行实验,以选择最合适的值。下表是在本示例中得到的参数列表: 级别 比例尺 Subset 比例 L14 L15 L16 L16 L17 L17 36072 18036 9018 9018 4509 4509 10% 10% 10% 30% 30% 50% Subset 后记录数 16374 16374 16374 49121 49121 81868 Point distance(m) 400 200 100 100 50 50 Subpoints 运行时间 2’45” 1’56” 54” 3’58” 2’58” 5’38” Subpoints 后记录数 2547 5073 8687 14606 24255 31558 OK OK 有点稀 OK 有点稀 OK 效果 3.8 坐标投影变换
成果数据的空间参考要满足3.1数据要求中的数学基础,对于不满足要求的数据要进行处理。
3.8.1 动态投影
所谓动态投影是指:改变ArcMap中的数据框(Data Frame)的空间参考或是对后加入到ArcMap工作区中数据的投影变换。ArcMap的数据框(Data Frame)的坐标系统默认为第一个加载到当前数据框(Data Frame)的那个文件的坐标系统,后加入的数据,如果和当前
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 21 - 工作区坐标系统不同,则ArcMap会自动做投影变换,把后加入的数据投影变换到当前坐标系统下显示,但此时数据文件所存储的实际数据坐标值并没有改变,只是显示形态上的变化!因此叫动态投影。表现这一点最明显的例子就是在导出数据时,用户可以选择是按数据源的坐标系统导出,还是按照当前工作区的坐标系统导出数据。
3.8.2 投影变换
要真正的改变数据的坐标值该怎么办?那就要做投影变换。在工具箱的“Data Management Tools->Projections and Transformations”中提供了若干工具,其中以下几个工具最常用:
定义坐标系统(Define Projection)
当数据在没有任何空间参考信息时,在ArcCatalog的坐标系统描述(XY Coordinate System)选项卡中会显示为Unknown。这时如果要对数据进行投影变换就要先利用Define Projection工具来给数据定义一个坐标系统。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据处理
- 22 -
坐标系定义也可以通过直接在ArcCatalog数据属性框的XY坐标系标签页中完成。 定义坐标系统不会更改数据的坐标,要将数据从一个坐标系统转换到另一个坐标系统,就要使用投影变换工具。
投影变换(Project)
投影变换有两个工具:Feature->Project工具和Raster->Project Raster工具,分别用来处理矢量数据和栅格数据。
使用投影变换工具时一个重要的步骤是选择地理变换(Geographic Transformation)。我国常用的坐标系统为北京54和西安80,当这两个坐标系统的数据变换到其它坐标系统下时,就需要提供这个Geographic Transformation,这是由于不同坐标系统所基于的椭球体及基准面不同,关键是基准面不同,Geographic Transformation就是用来进行不同基准面之间的转换的。下面介绍Geographic Transformation的定义方法。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 23 - 创建自定义地理变换(Create Custom Geographic Transformation)
坐标系统转换的核心是不同基准面之间的转换。常用转换方式包括三参数(三个平移参数ΔX、ΔY、ΔZ表示两坐标原点的平移值)和七参数(三个平移参数ΔX、ΔY、ΔZ表示两坐标原点的平移值;三个旋转参数εx、εy、εz表示当地坐标系旋转至与地心坐标系平行时,分别绕Xt、Yt、Zt的旋转角;最后是比例校正因子,用于调整椭球大小)。其中,三参数精度较低,适用于30公里范围内的数据,而七参数转换过程严密,结果较为精确。
我国的坐标系统转换参数是保密的,需要向测绘部门索要;如果工作区内有足够多的对应源和目标坐标系的控制点,可直接计算坐标转换所需的三参数或七参数,其中三参数要求至少一个已知坐标点,而七参数至少需要三个已知坐标点,通过布尔莎模型可计算七参数。
知道转换参数后,就可以用Create Custom Geographic Transformation工具进行创建了,在弹出的窗口中,输入一个转换的名字,如Xian80_CGCS2000。要选择合适的地理变换方法,通常对于三参数转换,我们可以选择GEOCENTRIC_TRANSLATION方法;对于七参数转换,我们可以选择POSITION_VECTOR或COORDINATE_FRAME方法。
4 数据质量控制
数据是GIS的基础和源头,甚至某种程度上决定了GIS的成败,这使得数据质量也成为影响GIS应用的重要因素,它直接影响着GIS应用分析结果的可靠程度和应用目标的真正实现,因而对GIS数据进行质量控制显得尤为重要和关键。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 24 - 在电子地图的制作和展示方面,数据质量直接影响着地图的渲染效率和制图效果,因此在数据处理的整个过程中都要进行质量控制。下面介绍基于ArcGIS的几种常用的质量控制方法。
4.1 几何检查与修复
ArcGIS在数据管理工具箱中提供了对要素类中每个要素的几何问题进行自动检查与修复的相关工具,能发现的几何问题包括:短线段(short segment )、空几何(null geometry)、不正确的环走向(incorrect ring ordering)、不正确的线段方向(incorrect segment orientation)、自相交(self intersections)、重复节点(duplicate vertex)、非闭合环(unclosed rings)、空的部分(empty parts)、不匹配的属性(mismatched attributes)、不连续的部分(discontinuous parts)、空的 Z 值(empty z values)。有效的输入格式包括 shapefile 以及存储在个人地理数据库或文件地理数据库中的要素类。而 SDE 地理数据库则会在导入数据时自动检查每个几何的有效性,因此,检查几何和修复几何工具无需用于 SDE Geodatabase。
检查几何
检查几何工具将在给定的要素类中生成一个包含所有存在几何问题的要素的报告,检查结果将以dbf表格的形式输出,如果未发现任何问题,则该表为空。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 25 -
注:如果是多个要素类需要进行几何检查,可以在选中某工具命令后,右键单击批处理命令,进行批量操作,后述工具的应用同样如此,如下图所示:
修复几何
针对检查几何工具中发现的问题,可直接采用修复几何工具进行自动修复处理。单击工具,在弹出的对话框中输入待修复的要素类,默认勾选“自动删除空几何对象(Delete Features With Null Geometry)”,如下图所示:
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 26 - 4.2 逻辑关系检查
某些数据由于本身的一些问题,可能会导致逻辑上的错误。比如一些POI(兴趣点)落入水系面中或者道路面上,如仅凭人工检查工作量大且效率较低。
在ArcMap中,可通过Selection->Select by Location命令查找出不符合逻辑的点,在Select By Location界面的第一个下拉框中选择“select feature from”操作,在列出来的图层里选择要检查落到水系面中的点图层,第二个下拉框中,选择“are completely within”关系(或其它逻辑关系,如相交、位于某一距离范围内、共线、完全包含、位于范围内等),最后一个下拉框选择点图层所在的面图层,假如为水系面。
查询结果如下图所示,同时也会在地图上高亮显示出符合条件的点。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 27 - 对于查找出来的点,需要按照实际情况在地图上进行处理,例如将其移动到真实位置,对此,可先将属性表中高亮显示的数据单独导出来,然后根据新导出来的dbf表格,进行一一调整即可。
4.3 重复数据的处理
数据整合过程形成的结果数据中可能存在重复数据,如果通过手动逐个查找,工作量是非常大的,我们可以借助ArcMap中的工具进行查找和处理。
Delete Identical方法
ArcMap 10.0里提供了Delete Identical工具来删除重叠的点、线或多边形数据,该工具位于工具箱“Data Management Tools->General”下。对于空间上重叠的数据,我们可以根据Shape字段来进行删除,但它只能处理空间上完全重合的要素,不能处理部分重叠的要素。
利用Point Distance工具查找重叠点数据
查找重合的点数据可以使用Point Distance工具,该工具位于工具箱中“Analysis Tools->Proximity”下,在弹出来的Point Distance对话框中,我们只需将距离设定为0,输入要素和附近要素都选择同一要素类即可查找出所有重合点。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 28 -
点击OK后,将自动生成一个dbf表格,以存储重合点的属性,主要为重合点的ID号,如下图左方属性表中INPUT_FID字段即对应了图右边属性表中的Object ID字段,从而可以根据一一对应的ID号在图上找出相应的要素,进行处理。
利用拓扑检查重叠线、多边形数据
利用ArcGIS中的拓扑可以对线、多边形类型的数据进行重叠性检查,拓扑检查的流程将在4.4节进行详细介绍。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 29 - 4.4 拓扑检查
拓扑(Topology)最基本的用途是:保证数据质量、提高空间查询统计分析的正确性和效率,进而为相关行业提供真实有效的指导,同时也使地理数据库能够更真实地反映地理要素。以ArcGIS拓扑为例,在数据集当中建立适当的拓扑规则,进行拓扑检查,就能标记出有悖于该拓扑规则的拓扑错误,便于用户修改,进而严格控制数据质量。
目前ArcGIS提供的数据存储方式中,Coverage和GeoDatabase能够建立拓扑,Shapefile格式的数据不能建立拓扑。ArcGIS拓扑是在同一个要素集下的要素类之间的拓扑关系的集合。所以要构成一个拓扑的所有要素类,必须在同一个要素集内。一个要素集可以有多个拓扑,但每个要素类最多只能参与一个拓扑。
ArcGIS中的拓扑操作主要是在ArcCatalog中的拓扑规则以及ArcMap中的拓扑处理。在ArcCatalog中创建拓扑规则,主要是用于进行拓扑错误的检查,其中部分规则可以在容限内对数据进行一些修改调整。
ArcGIS 10.0提供了32种拓扑规则,包括点拓扑规则中的必须与其它要素重合、必须不相交、必须完全位于面内部等等;线拓扑规则中的不能重叠、不能相交、不能有悬挂点、不能有伪结点等等;面拓扑规则的不能重叠、不能有缝隙、不能与其它要素叠置、边界必须被其它要素覆盖等等。可根据实际数据要求和要素类间相互关系情况进行合理的拓扑规则设置。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 30 - 建立好拓扑规则后,就可以在ArcMap中根据拓扑规则对错误进行查找并修改。 下面以检查重叠线为例来介绍拓扑检查的流程: 建立拓扑
首先,要进行拓扑检查的数据必须放在Geodatabase的同一个数据集中。 在数据集上点击右键,新建拓扑,弹出创建拓扑对话框:
点击“下一步”,设置拓扑的名称,并设置好容差,继续点击“下一步”,选择要参与拓
扑的线要素类,并添加拓扑规则。为了检查重叠线,我们需要将“Must Not Overlap”规则加进来:
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 31 - 拓扑创建好以后,可以立刻进行拓扑校验,也可以在ArcMap中利用拓扑工具条进行校验。
拓扑检查
在ArcMap中加载拓扑工具条,并启动编辑。通过“Validate Topology In Specified Area”和“Validate Topology In Current Extent”按钮可以分别对指定区域或当前视域内的数据进行校验:
用拓扑检测器可以枚举出所有违反重叠规则的要素:
拓扑处理
点击列表中的错误记录可以对数据进行进一步处理。例如下图中第1条要素和第6条要素存在重叠的部分:
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 32 -
我们可以在该错误记录上点右键,选择“Subtract”,将重叠的部分删掉。
4.5 属性检查
空间数据除了几何、位置关系等相关检查外,属性内容的检查也是数据质量控制的重要部分。
在ArcGIS中除了可通过Geodatabase属性域、子类型的设置有效保证属性字段质量外,还可通过对属性表的相关操作处理,完成对属性字段和内容的相关检查处理。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 33 -
可通过“计算几何(calculate geometry)”获取要素的空间度量信息,如长度、周长、面积等,快速获取到过短或过小面等一些由于误操作导致的过小几何要素。
通过升、降序排列方式,汇总与统计处理,快速核实相关属性内容并辅助属性内容的相关处理,对数据整体分布和全局有直观的展现与分析。
另外,还可通过按属性选择对话框,对属性内容进行相关处理,包括字段的获取唯一值、基于SQL语句的查询和分析等,快速获取文本型、数值型等属性字段中非常规或异常数据情况。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
数据质量控制
- 34 -
还可对选取的要素进行图属联动的查看与分析,并可快速导出所检测出的要素,进行后期处理与操作。
另外,还可利用属性字段的汇总功能,实现对字段内容的汇总统计处理,可对待输出表中的数值型字段进行最小值、最大值、平均值、总和、标准差、方差的汇总,文本型字段选择第一个或最后一个统计,用以核实相关属性字段内容是否符合相关规定或标准事实。
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 35 - 附录
附录1 1:10000成果数据命名规范
成果数据层命名方式为:“数据比例尺代码”+“数据层内容标识”+“数据层几何类型标识”+ “行政区划代码”
数据比例尺代码为: 1:10 000 – G 数据层几何类型标识为: PT:点 LN:线 PL:多边形
行政区划代码标明数据来源,而非数据覆盖范围,依据数据生产或维护各级测绘部门政区级别进行编码。
例如,北京市的省级政区图层名称为“GPROPL110000”。
附录2 1:10000成果数据分层
分类 定位基础 图层名称 控制点 公里网线 水系 水系 水系 水系 水系附属设施 水系附属设施 水系附属设施 居民地 居民地 居民地及设施名称 居民地 房工矿及其它设施 CPT GRD HYD HYD HYD HFC HFC HFC RES RES RES RFC 几何类型 点 线 点 线 多边形 点 线 多边形 点 线 多边形 点 主要要素内容 三焦点、水准点等 公里网线 泉、井等 单线河流、沟渠、河流结构线等 双线河流、水库、湖泊等 涵洞、、礁石、闸、坝等 流向、闸、坝等 干出滩、滩涂等 普通房屋、棚房、窑洞等 普通房屋、窑洞等 街区、高层房屋等 工矿、农业、公共服务、宗教、名胜古迹、科学观测站等 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 36 - 分类 图层名称 房工矿及其它设施 房工矿及其它设施 铁路 道路 RFC RFC RAI ROA TFC TFC TFC PIP PIP BOU MAR PRO DIS COU TOW OTA OTA OTA TER TER TER VEG VEG VEG RPN NPN 几何类型 线 多边形 线 线 点 线 多边形 点 线 线 点 多边形 多边形 多边形 多边形 点 线 多边形 点 线 多边形 点 线 多边形 点 点 主要要素内容 工矿、城墙、垣栅等 工矿、农业、公共服务等 标准铁路、窄轨铁路等 国道、省道、县道、乡道、专用道、其它道路、城市道路、农村道路等 桥梁、隧道、车站、机场等 桥梁、隧道、渡口等 依比例尺台阶等 变电站等 输电线、各类管道等 各级境界线 界桩、碑 省级行政区域 地级行政区域 县级行政区域 乡镇级行政区域 自然保护区、特殊地区等 自然保护区界、特殊地区界等 自然保护区域、特殊地区区域等 高程点、峰、柱等 等高线、沟壑、垄等 沙地、地质灾害地貌等 零星树木、独立树等 防火带、行数等 耕地、林地、园地、草地、城市绿地等 各级行政地名和城乡居民地名称等 交通要素、纪念地、名胜古迹、山名、自然地域名等 交通 交通构造物及附属设施 交通构造物及附属设施 交通构造物及附属设施 管线 管线 管线 境界线 界桩点 省级政区 地级政区 境界与政区 县级政区 乡镇级政区 其它区域 其它区域 其它区域 地貌与土质 地貌 地貌 地貌与土质 植被 植被 植被 植被 居民地地名 自然地名 地名及注记 附录3 1:10000成果数据属性结构
分类 定位基础 图层名称 CPT(点) 属性项 ELEMID CLASID CLASID92 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
描述 图元标示码 国标分类代码 国标分类代码 附录
- 37 - 分类 图层名称 属性项 TREG ELEV ELEMID 描述 测量控制点等级 高程值 图元标示码 国标分类代码 国标分类代码 图元标示码 国标分类代码 国标分类代码 名称 类型 角度 图元标示码 地理实体编码 国标分类代码 国标分类代码 名称 通行月份 图元标示码 地理实体编码 国标分类代码 国标分类代码 名称 水质 库容量 通行月份 类型 图元标示码 国标分类代码 国标分类代码 名称 类型 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 名称 GRD(线) CLASID CLASID92 ELEMID CLASID CLASID92 NAME TYPE ANGLE ELEMID ENTIID CLASID CLASID92 NAME PERIOD ELEMID ENTIID CLASID CLASID92 HYD(点) HYD(线) 水系 HYD(多边形) NAME WQL VOL PERIOD TYPE ELEMID CLASID HFC(点) CLASID92 NAME TYPE ELEMID CLASID CLASID92 NAME ELEMID CLASID CLASID92 NAME HFC(线) HFC(多边形) 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 38 - 分类 图层名称 属性项 TYPE ELEMID CLASID CLASID92 NAME TYPE ANGLE ELEMID CLASID CLASID92 NAME ELEMID CLASID 描述 类型 图元标示码 国标分类代码 国标分类代码 名称 类型 角度 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 名称 类型 图元标示码 国标分类代码 国标分类代码 名称 类型 角度 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 名称 类型 图元标示码 地理实体编码 地理实体编码 地理实体编码 地理实体编码 地理实体编码 国标分类代码 国标分类代码 RES(点) RES(线) RES(多边形) CLASID92 NAME TYPE ELEMID CLASID CLASID92 NAME TYPE ANGLE ELEMID CLASID CLASID92 NAME ELEMID CLASID 居民地及设施 RFC(点) RFC(线) RFC(多边形) CLASID92 NAME TYPE ELEMID ENTIID ENTIID1 ENTIID2 ENTIID3 ENTIID4 CLASID CLASID92 交通 RAI(线) 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 39 - 分类 图层名称 属性项 NAME NAME1 NAME2 NAME3 NAME4 TYPE ELEMID ENTIID ENTIID1 ENTIID2 ENTIID3 ENTIID4 CLASID CLASID92 NAME 描述 名称 名称 名称 名称 名称 类型 图元标示码 地理实体编码 地理实体编码 地理实体编码 地理实体编码 地理实体编码 国标分类代码 国标分类代码 名称 名称 名称 名称 名称 公路技术等级 铺设材料 车道数 单双行线 路宽 通行月份 图元标示码 国标分类代码 国标分类代码 名称 类型 载重 层数 角度 公里数 通行月份 车站编号 图元标示码 国标分类代码 国标分类代码 ROA(线) NAME1 NAME2 NAME3 NAME4 RTEG MATRL LANE SDTF WIDTH PERIOD ELEMID CLASID CLASID92 NAME TYPE TFC(点) WEIGHT BRGLEV ANGLE KM PERIOD RN ELEMID TFC(线) CLASID CLASID92 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 40 - 分类 图层名称 属性项 NAME TYPE WEIGHT BRGLEV ELEMID CLASID CLASID92 描述 名称 类型 载重 层数 图元标示码 国标分类代码 国标分类代码 名称 类型 载重 层数 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 名称 类型 电压值 图元标示码 地理实体编码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 界桩号 名称 图元标示码 地理实体编码 国标分类代码 国标分类代码 名称 图元标示码 地理实体编码 国标分类代码 TFC(多边形) NAME TYPE WEIGHT BRGLEV ELEMID CLASID CLASID92 NAME ELEMID CLASID CLASID92 NAME TYPE KV ELEMID ENTIID PIP(点) 管线 PIP(线) BOU(线) CLASID CLASID92 NAME ELEMID CLASID MAR(点) 境界与政区 CLASID92 BNO NAME ELEMID ENTIID PRO(多边形) CLASID CLASID92 NAME ELEMID DIS(多边形) ENTIID CLASID 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 41 - 分类 图层名称 属性项 CLASID92 NAME ELEMID ENTIID 描述 国标分类代码 名称 图元标示码 地理实体编码 国标分类代码 国标分类代码 名称 图元标示码 地理实体编码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 国标分类代码 名称 高程值 角度 图元标示码 国标分类代码 国标分类代码 高程值 图元标示码 国标分类代码 国标分类代码 名称 图元标示码 国标分类代码 COU(多边形) CLASID CLASID92 NAME ELEMID ENTIID TOW(多边形) CLASID CLASID92 NAME ELEMID CLASID CLASID92 NAME ELEMID OTA(点) OTA(线) CLASID CLASID92 ELEMID CLASID CLASID92 NAME ELEMID CLASID CLASID92 NAME ELEV ANGLE ELEMID OTA(多边形) TER(点) 地貌与土质 TER(线) CLASID CLASID92 ELEV ELEMID CLASID CLASID92 NAME ELEMID CLASID TER(多边形) 植被 VEG(点) 北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
附录
- 42 - 分类 图层名称 属性项 CLASID92 ELEMID 描述 国标分类代码 图元标示码 国标分类代码 国标分类代码 图元标示码 国标分类代码 国标分类代码 图元标示码 名称 汉语拼音 地名分类编码 地址名称 地址代码 地理实体编码 图元标示码 名称 汉语拼音 地名分类编码 地址名称 地址代码 地理实体编码 VEG(线) CLASID CLASID92 ELEMID VEG(多边形) CLASID CLASID92 ELEMID NAME PINYIN RPN(点) CLASPN ADDNAME ADDCODE ENTIID ELEMID NAME PINYIN 地名及注记 NPN(点) CLASPN ADDNAME ADDCODE ENTIID
北京捷泰科技有限公司 | ArcGIS矢量数据处理指南
因篇幅问题不能全部显示,请点此查看更多更全内容