地理信息共享标准和公共平台研究

地理信息共享标准和公共平台研究


 



──地理信息共享的标准化环境


 


蒋景瞳 刘若梅 周 旭 贾云鹏


国家基础地理信息中心 北京海淀区紫竹院百胜村1号 100044


rmliu@public3.bta.net.cn


 



--------------------------------------------------------------------------------



摘要:地理信息共享的标准化环境是实现地理信息共享的必要条件之一。地理信息共享标准化环境是一个广义的概念,它不仅指地理信息共享所需各项标准的研究、制定和实施,还包含确立统一的空间参照系统、建立统一的地理信息空间定位载体即共享平台等。本文从实用角度,结合我国实际就这些方面涉及的问题进行讨论,分析了国际地理信息标准化进程和我国目前已经发布实施的国家标准,列举了我国规定的基于坐标的空间参照系统和各种基于标识的空间参照系统,介绍了可供选用的各种比例尺地理信息共享平台,并提出各种专题空间图形信息和属性信息与地理信息共享平台配准的原则与方法等。依此营造我国地理信息共享的标准化环境。


关键词:信息共享 地理信息标准 标准化 地理信息系统 数据库 基础地理信息 公共平台 空间参照系统


 


地理信息共享的标准化环境是实现地理信息共享的必要条件之一。地理信息共享标准化环境是一个广义的概念,它不仅指地理信息共享所需各项标准的研究、制定和实施,还包含确立统一的空间参照系统、建立统一的地理信息空间定位载体即共享平台等。


标准化是一门技术性、管理性兼长的综合学科,是在经济、技术、科学及管理等社会实践中,对重复性事务和概念通过制定、发布和实施标准,达到统一,以获得最佳秩序和社会效益的过程。


标准化的综合性具体表现为法制性、政策性、技术性和经济性。随着科学技术的发展,现代标准化还具有超前性和动态性的特征。综合性是基本的,超前性和动态性是特殊的,现代标准化所沉淀的应该是那些经过努力才能达到的动态指标。


标准化过程需要解决诸如发展与稳定的矛盾、统一与不统一的矛盾、生产与使用的矛盾、通用与专用的矛盾、水平高与水平低的矛盾、繁与简的矛盾、标准化与多样化的矛盾等。总之,推行标准化目的在于使标准成为运用新技术的手段,提高标准在生产、产品等方面的整体最佳功能,对生产、产品等技术和质量水平进行科学规划,建立能保证最佳条件的跨专业部门的统一体系,以适应国民经济各部门之间进行复杂协调工作的客观需要,保证各级标准的统一协调和整体最佳效果。


与其他领域的标准化一样,地理信息标准化亦是如此,为解决地理信息共享中的各种矛盾,营造地理信息共享的标准化环境尤为重要。


以下从实用角度出发,结合我国实际就这些方面涉及的问题进行讨论,分析了国际地理信息标准化进程和我国目前已经发布实施的国家标准,列举了我国规定的基于坐标的空间参照系统和各种基于标识的空间参照系统,介绍了可供选用的各种比例尺地理信息共享平台,并提出各种专题空间图形信息和属性信息与地理信息共享平台配准的原则与方法等。依此营造我国地理信息共享的标准化环境。


1. 国外地理信息标准化进程


国际地理信息标准化工作大体可分为两部分。一是以已经发布实施的信息技术(IT)标准为基础,直接引用或者经过修编采用;二是研制地理空间数据标准,包括数据定义、数据描述、数据处理等方面的标准。


同其他标准一样,国外地理信息标准分为五个层次,即国际标准、地区标准、国家标准、地方标准、其他标准。


国际地理信息标准是最高一层的标准,一般为推荐性标准,实用于全球各国。与地理信息国际标准研制有关的国际组织主要有:国际水道测量组织(IHO)、国际制图协会(ICA)、国际标准化组织下设的地理信息/地球信息业技术委员会(Tecnical Committee of Geographic Information/Geomatics,ISO/TC211)等。


设在摩纳哥的国际水道测量组织(IHO)有66个成员国。IHO的转换标准S-57用于在各国水道测量局之间交换数字水文数据和向厂商、水手及其它用户分发数据。该标准支持交换矢量(其后栅格和格网)水文数据。它包含作为标准基础的理论数据模型、数据结构说明、目标和属性分类编目。S-57还包括电子海图(ENC)产品规范。国际海事组织(IMO)指定各国电子海图显示信息系统(ECDIS)执行S-57标准。S-57标准也是ISO/TC 211制定国际地理信息标准的重要基础。


国际制图协会下设四个技术委员会开展地理信息标准化工作:空间数据转换委员会、元数据委员会、空间数据质量委员会和空间数据质量评价方法委员会。


ISO/TC211是最主要的研制地理信息国际标准的机构,其工作范围为数字地理信息领域的标准化,主要任务是制定一套针对直接或间接与地球上位置相关的目标或现象信息的国际标准,以便确定地理信息数据管理(包括定义和描述)、采集、处理、分析、查询、表示、以及在不同用户、不同系统、不同地方之间转换的方法、工艺和服务。该项工作与相应的信息技术及有关数据标准相联系,并为使用地理数据进行各种开发提供标准框架。该技术委员会目前正开展27个国际标准项目的研制工作。每个项目均以一些比较成熟的国家标准、地区性标准为基础。内容主要涉及地理信息框架和参考模型、地理空间数据模型和算子、地理空间数据管理、地理空间数据服务和专用标准等。标准项目包括参考模型、地理信息术语、一致性与测试、空间模式、时间模式、应用模式规则、要素分类方法、数据质量、空间参照系统、元数据、地理信息表述、数据编码、影像和栅格数据、实用标准等。其中,已有2个项目成为国际标准(IS或TR),4个项目进入DIS阶段,其余23个项目均完成CD。


上述这些标准项目中,参考模型设计地理信息标准的总体结构框架、研制这类标准所应用的基本原理、标准的整体概念和组成部分,确定各个标准之间的关系;空间参照系统标准包括大地参照系统和间接参照系统,为数据共享规定统一的空间定位体系;数据模型标准定义地理空间目标空间特征和时间特征的概念模型及关系,空间特征包括几何特征和拓扑特征,是构成地理信息的两个主要方面,是其他地理信息标准的基础,时间特性的概念模型能提高地理信息系统的应用能力,该标准致力于向用户提供具有一致性的、易理解的空间数据结构和时间数据结构的地理信息,增强地理信息的共享能力;要素分类和编码标准制定统一的地理信息数据(包括空间数据和属性数据)分类原则、方法及代码;元数据标准明确定义描述数据项,是关于数据或数据集的数据,说明数据或数据集的内容、质量、特性和适用范围,为用户提供所需的数据是否存在和怎样能够得到这些数据的途径、方法等方面的信息,帮助人们了解数据、使用数据;数据质量标准包含数据质量定义、质量元素和数据质量评价过程与方法,同时规定统一的数据质量报告内容和形式。
参加ISO/TC211工作的正式成员(亦称积极成员,即P成员)有33个、观察员(即O成员)15个、通讯成员4个。我国从1995年开始从O成员升为P成员,一直积极参与其各项工作,并组团参加了它的每一次全体会议,与各国专家密切合作,相互交流在地理信息标准化方面的经验。ISO/TC211的工作已经进入最实质阶段,一些以前从未参加会议的国家(如意大利、匈牙利、文莱、沙特阿拉伯、斯洛文尼亚等)已经开始积极参与,目的是在这一阶段更清楚地了解国际标准内容,以便于尽快转化为本国标准,加快本国地理信息标准化进程。


ISO/TC211为使其制定的19100系列国际标准能有效地实施,积极与开发地理信息系统协会(OGC)开展合作。后者研制的互操作规范是GIS软件发展的前沿问题,关系到软件今后的发展方向。


OGC是生产与管理部门为实现地理信息的互操作而成立的公共与私人组织的联合体。其目标是实现地理空间数据与地理信息处理资源的全面集成,通过信息基础设施广泛使用商业化的、可互操作的地理信息处理软件。在网络环境中真正实现开放的、可互操作的空间信息处理,透明地共享庞杂的地理数据与地理信息处理资源。OGC的主要任务之一就是合作开发互操作技术规范,按照OGC的技术开发计划,要逐步开发独立于计算平台的通用规范(Abstract Specification)和计算平台特有的实施规范(Implementation Specification)。目前通用规范有14章,部分章节内容已经完成,新的章节还在酝酿中。OGC与ISO/TC211已经达成合作协议,ISO/TC211组织制定的标准,OGC予以采纳和实施,使该项标准具有ISO/TC211和OGC的“双重标记”。传统GIS是面向单一应用的、单一的空间型信息系统与关系型信息系统集成,开放的GIS是动态互操作的,使用组件化的软件、分布式目标及通过元数据实现网络信息查询等。因此,OGC的工作极富创新意义。


ISO/TC 211研制的各项地理信息国际标准,特别是参考模型、地理信息术语、一致性与测试、要素分类方法、数据质量、空间参照系统、元数据、影像和栅格数据等标准对我国建立地理信息共享标准具有非常重要的意义。


2. 我国地理信息共享标准研究与制定


早在20世纪80年代初期我国刚刚开始研究和发展地理信息系统(当时称为资源与环境信息系统)时,就吸取国外一些国家忽视标准化的严重教训,始终将地理信息的标准化和规范化作为GIS发展的重要组成部分,经过几个五年国家科技攻关研究和各部门在地理信息标准化方面做了大量工作,已经取得了一定的进展。不仅提出了大量标准研究报告和标准方案,而且,已经发布实施许多国家标准。还有一些已经制定但尚未评审和发布的国家标准及行业标准等,如全国河流名称代码、中国山脉山峰名称代码等。目前正在积极研制的有地理信息元数据、地理信息数据质量控制、地理信息分类编码体系,计划研制的有一致性与测试等。


以下介绍与地理信息共享关系特别密切的已经发布或正在制定的几个地理信息国家标准:


2.1.地理信息分类编码体系


地理信息是指一切与地球上的位置直接或间接相关的目标或现象的信息,其内容极其丰富,涉及资源、环境、灾害、经济与社会诸多方面。就其中某一类信息而言,有的已经制定了该类信息的数据分类与代码国家标准或行业标准,有的正在或准备制定分类代码标准。它们是相互独立、互不关联的。各种地理信息按照这些分类编码国家标准或行业标准采集、更新、使用信息的工作也已经延续多年,形成了较为固定的分类习惯。为保证这些信息的持续采集与更新,同时也便于地理信息交换与共享,需要尽快制定地理信息分类编码体系框架。


该标准在更高的层次上,本着科学性、系统性、可延性、兼容性和综合实用性的分类原则,在基础地理信息和各种专题信息本身已经或将要制定的分类编码的基础上,在更高级别上研究制定所有地理信息的总体分类体系框架及其编码方案,规定各专业类别的代码,以便在数据交换的过程中和交换后的应用分析只,能够容易地区分和识别各种不同种类的信息,而不会产生矛盾和混淆。


该标准已经获得国家质量技术监督局批准立项制定,计划2001年底完成。


2.2.基础地理信息数据分类与代码


国土基础信息数据分类与编码(国家标准GB13923-1992)规定了比例尺1:5,000至1:1,000,000国家基础地理信息数据分类与代码,用以标识数字形式的国家基础地理信息,保证其存储及交换的一致性。适用于国家基础地理信息系统1:5,000至1:1,000,000地形数据库数据采集、存储、检索、分析、输出及交换。适用于各种类型专题地理信息系统的公共基础地理信息平台及在系统间交换基础地理信息。


由于基础地理信息是多级比例尺的,不同比例尺的主要差异表现为数据内容繁简不一,但相同要素在不同比例尺数据库中的分类代码均保持一致,即均从国土基础信息数据分类与编码国家标准中提取一个代码子集(Profile),并视需要,根据该标准规定的扩展原则扩充个别要素的代码,形成各比例尺基础地理信息数据分类与代码实用标准。


国土基础信息数据分类将全部要素划分为9个一级类别。即测量控制点、水系、居民地、交通、管线与垣栅、境界、地形与土质、植被、其它。其中水系包含海洋要素。共有42个二级类、300个三级类和240个四级类。分类代码由六位数字码组成,其第五位为属性分类,第六位为识别位,由用户自行定义,以便于扩充。一般为“0” 。


该标准自1992年发布以来,已在许多系统和数据库中应用。目前正在进行修订,计划2001年完成。


2.3.中华人民共和国行政区划代码(国家标准GB2260-1999)


中华人民共和国行政区划代码唯一标识全国各省、地、县三级行政区域。用于存储和查询与行政区划有关的图形数据或属性数据,如省、地、县三级行政区域多边形,省、地、县政府驻地等图形要素,以省、地、县为单元的各种专题统计数据等。


行政区划代码为6位数字码,其中前两位是省代码,中间两位是地区代码,最后两位是县代码。


行政区划代码应用十分广泛,它也是专题统计数据与图形要素数据关联的重要接口码,是地理信息共享必不可少的标准。


由于我国行政区划变动频繁,该标准每两年更新一版。应该注意使用最新版本。


2.4.全国河流名称代码(送审稿)


该标准规定了全国主要河流名称的标识代码,用于标识以数字形式表示的河流信息,以保证这些河流数据在各种信息系统中采集、存储、检索、交换的一致性、唯一性。该标准对于建立和发展我国各级、各种类型的空间或非空间信息系统,实现地理信息共享具有重要意义。


该标准将全国划分为外流区和内流区。外流区含一级流域9个,二级流域43个,内流区含二级流域14个(表1)。
表1


 


该标准以全国范围的主要河流作为对象进行编码,原则上以集水面积大于1000Km2、主干河道长大于500Km,作为主要选取依据。考虑到区域特点,对西部干旱内流区,台湾、海南岛等岛屿上的河流,以及沿海独流入海河流,适当放宽上述选取指标。总共选取约1900条河流,分为五个等级。


该标准因非技术原因迄今尚未进行审查和发布实施,但已在许多系统和数据库中应用,成为事实上的标准。


2.5.国家干线公路名称和编号(国家标准GB917.2-89)


该标准规定了全国国家干线公路名称和编号,用于唯一标识每条国道,以保证国道数据在各种信息系统中采集、存储、检索、交换的一致性、唯一性。该标准对于建立和发展我国各级、各种类型的空间或非空间信息系统,特别是与交通关系密切的系统,实现地理信息共享具有重要意义。


国家干线公路(简称国道)名称和编号采用6位字符数字混合码。第1位为字符“G”,是汉语拼音“国道”的首字母,表示道路等级;第2位为数字,说明道路的主要延伸方向,“1”表示以首都为中心的放射线,“2”表示由北向南的纵线,“3”表示由东向西的横线;第3、4位为各个方向道路的序号;最后两位为数字,等同于国家标准中华人民共和国行政区划代码中用于表示省级行政区划的前两位数字,用来说明各条国道在各省(自治区、直辖市)区域范围内延伸的路段。


2.6.地理信息基本名词术语


为了规范和统一地理信息共享中涉及到的地理信息基本名词术语,需要在广泛收集术语资料的基础上,编纂《地理信息基本名词术语》。目前可供参考的主要资料有《地理信息技术基本术语》(GB/T 17694-1999)、《城市地理信息标准化指南》、《地图学术语》(GB/T16820-1997)、《测绘基本术语》(GB/T14911-94)、《摄影测量与遥感术语》(GB/T14950-94)、《地理学词典》、《测绘学词典》、Geographic Information – Termnology(ISO/TC 211 19104 CD)、GIS Dictionary(by the Association for Geographic Information and the University of Edinburgh Department of Geography)、DICTIONARY OF ABBREVIATIONS AND ACRONYMS IN GEOGRAPHIC INFORMATION SYSTEMS, CARTOGRAPHY, AND REMOTE SENSING(By Philip Hoehn and Mary Lynette Larsgaard. Designed by John Creaser. June 2000 Version)等。


国家科学技术名词术语委员会正组织专家编制中英文对照地理信息基本名词术语,计划2001年完成。


2.7.理信息元数据标准


地理信息元数据标准是地理信息共享最为重要的标准之一。该标准规定地理信息元数据的内容,包括数据的标识、内容、质量、状况及其他有关特征。可用于对各种地理信息数据集的全面描述、数据集编目及信息交换网络服务。实施对象可以是数据集、数据集系列、要素实体及属性。


元数据是关于数据的数据。该标准规定元数据内容由三种成分构成:元数据子集、元数据实体和元数据元素。元数据元素是元数据的最基本的信息单元, 元数据实体是同类元数据元素的集合,元数据子集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。


该标准定义三种性质的元数据子集、实体和元素:


l 必选(Mandatory,M)──元数据的核心内容,适用于各种被描述对象,是元数据文件必须包含的子集、实体或元素。


l 一定条件下必选(Conditional,C )──针对不同的被描述对象特征,在满足一定条件时,元数据文件所必须提供的子集、实体或元素。


l 可选(Optional,O)──该子集、实体或元素是可选的,由用户决定是否将其包含在元数据文件中。


地理信息元数据标准内容分为两个层次,一级元数据和二级元数据。一级元数据是唯一标识一个数据集(数据集、数据集系列、要素和属性)所需要的最少的元数据实体和元素。任何数据集(数据集、数据集系列、要素和属性)一般都应有一级元数据,其内容主要包含一级元数据中性质为必选和条件必选(如果具有该条件特征的话)的实体和元素。一级元数据有100多个元数据实体和元素,这一等级的元数据实体和元素具有通用性,是对各种数据集的总体的、概括的说明。


二级元数据是建立完整数据集(数据集、数据集系列、要素和属性)文档所需要的全部元数据实体和元素。二级元数据内容有400多个元数据实体和元素。在确定数据集的元数据具体内容时,除元数据实体或元素特征为必选的必须包含外,要根据数据集的具体情况决定是否应包含性质为条件必选的元数据实体或元素,同时决定选择哪些性质为可选的元数据实体或元素。二级元数据的主要子集有:元数据实体集信息、标识信息 (包括数据和服务标识)、限制信息 (包括法律和安全)、数据质量信息、维护信息、空间表示信息(包括栅格和矢量表示)、参照系统信息 (包括时间、坐标和地理标识)、内容信息 (包括要素分类和Coverage说明)、符号(Portrayal)分类信息、分发信息、元数据扩展信息、应用模式信息、数据类型信息、覆盖范围信息、引用和负责单位信息。


上述各部分的详细内容在元数据字典中说明,同时各元素的取值范围、代码表如职责代码、数据集使用限制分类代码、数据集现状代码、数据空间表示类型代码、参照系统名称代码等在标准中都做了详细规定。


我国地理信息元数据国家标准已经获得国家质量技术监督局批准立项制定,计划2001年底完成。


2.8.地理信息数据字典


数据字典是数据及数据库的详细说明,它以数据库中数据基本单元为单位,按一定顺序排列,对其内容作详细说明。数据字典可用于数据库数据的查询、识别与相互参考。数据字典内容涉及各类地理信息的定义及说明,用于数据管理、数据维护、数据共享、数据分发服务等。


数据字典与元数据有相似之处,但也有不同。元数据提供地理信息数据标识、内容、质量、状况及其他有关特征的描述,数据字典虽然也具有对信息的说明性,但其更侧重对信息的定义与诠释,二者各有侧重。在某些条件下,数据字典是元数据全集的一部分。


中国地理信息数据字典涉及的数据类型包括矢量数据、统计(属性)数据库数据、栅格数据、影像数据、文本数据、音频数据和视频数据等。依据数据的类型特征,数据字典包括的内容有所区别。数据字典包括的主要内容见表2。


表2



内 容
含 义
使用限定
类 型


1
数据库或数据文件全名
中文全称,如:“国家基础地理信息系统全国1:100万数据库”、“全国自然保护区数据库”或论文全名等。
任何数据库或数据文件必须说明
文本


2
数据库或数据文件简称
计算机内存储的数据库或数据文件名称及命名规则,如A01.doc、bridge.dbf、BOUNT等及命名方法说明。
可选,加入此项内容可以帮助用户理解和使用该信息
文本


3
数据库或数据文件存储格式
计算机物理存储格式,如doc、rtf、dbf、e00、dgn、shp、mif、tiff、img、eps、avi等。
任何数据库或数据文件必须说明
文本


4
数据库或数据文件主要技术参数
矢量、栅格和影像数据库或数据文件提供使用所需要的必要参数,如投影参数、分辨率说明、定位点坐标等。
矢量、栅格和影像数据库或数据文件必须说明
文本


5
数据库或数据文件内容说明
数据库、数据文件、论文、影像等所表述的主题内容,包括分层信息、表的说明、矢量要素分类信息、几何特征、论文内容简介等。
任何数据库或数据文件必须说明
文本


6
数据库数据项定义及说明
矢量、统计数据库包含的所有数据项定义及说明。
矢量、统计数据库必须说明。
文本


7
数据项内容说明
数据值、代码及依据标准说明
矢量、统计数据库必须说明。



8
数据使用方法简介
包括硬件、操作系统及工具软件要求、解压缩方法、数据库倒入、调用说明等。
任何数据库或数据文件必须说明
文本


9
数据库或数据文件补充信息
数据字典各项内容无法包括的信息或数据字典作者认为有必要让用户了解的信息。
可选,加入此项内容可以帮助用户理解和使用该信息
文本


10
数据字典负责单位信息
对本数据字典负责的单位或个人信息,包括名称、地址、联系办法等。
任何数据库或数据文件必须说明
文本



迄今,我国只对数据字典进行研究或根据项目需要制定临时标准,尚未立项制定国家标准。


2.9.地理信息数据质量控制


数据质量问题是关系到共享信息能否有效应用的重要问题。该标准描述地理数据质量的原理和建立有关数据质量的模型,定义数据质量元素,并提供数字形式地理数据集质量的评价过程框图,将数据质量评价结果报告作为元数据中数据质量信息的一部分。


确定数据质量评价指标和方法的难点在于数据质量的含义、内容、分类、分级、质量的评价指标等。不同类型地理数据(如矢量数据、栅格数据、影像数据、属性数据等)评价方法不同,不同专题对数据质量的要求也有很大差异,很难用统一的指标和方法进行评价,需要进行比较多的探索和试验研究。


就一般而言,数据质量用数据质量元素来描述。数据质量元素分为两类:数据质量的定量元素和数据质量的非定量元素。前者描述数据集满足预先设定的质量标准要求及指标的程度,提供定量的质量信息(表3)。后者提供综述性的、非定量的质量信息。


表3


数据质量元素 数据质量子元素 含 义


完整性 多余 数据集中有多余的数据


缺少 数据集中缺少应有的数据


逻辑一致性 概念一致性 符合统一概念模式规则


值域一致性 同在界定的值域范围内


格式一致性 数据存储与数据集物理结构、规定格式的一致性程度


拓扑一致性 数据集逻辑特征和拓扑关系的正确性


位置精度 绝对精度 数据集坐标值与可接受的值或真值之间 的接近程度


相对精度 数据集中要素相关位置与各自对应的、可接受的相关位置或真值之间的接近程度


格网数据位置精度 格网数据起始单元位置的值与可接受的值或真值之间的接近程度,分辨率大小


时间精度 时间的量测精度 数据集使用时间参照系统的正确性


时间的一致性 时间序列的一致性


时间的有效性 数据在时间上的有效性


专题(属性)精度 分类正确性 要素或属性相对于分类标准的一致性程度


非定量属性的正确性 非定量属性描述的正确性


定量属性的正确性 定量属性的精度



数据质量定量元素用定量的方法描述以下六个方面的内容:


l 完整性——描述要素、要素属性及要素关系存在或不存在。


l 逻辑一致性——描述数据结构(包括概念的、逻辑的或物理的数据结构)、要素属性和它们间的相互关系符合逻辑规则的程度。


l 位置精度——描述要素空间位置的精度。


l 时间精度——描述要素的时间属性和时间关系的精度。


l 专题(属性)精度——描述要素定量或非定量属性精度和要素属性分类正确性及它们间的相互关系。


l 用户定义(数据质量元素或数据质量子元素)——描述由数据生产者确定的数据集质量。


数据质量的非定量元素描述数据集非定量的质量内容,包括:


l 目的——描述生产数据集的原因和主要目的。


l 用途——描述数据集对于数据生产者和数据用户等的应用范围。


l 数据志——描述数据集的历史沿革,即数据集从获取、编辑到现状完整生命周期的有关描述。数据志包括两个独立的部分:数据源信息和数据处理步骤、重要处理事件(转换、维护)信息。


我国地理信息质量控制国家标准已经获得国家质量技术监督局批准立项制定,计划2001年底完成。


2.10.地理信息数据转换模型


地理信息数据转换标准是对地理信息数据进行无语义损失转换的实用标准,该标准规定空间对象模型标准和具有实际应用意义的地理信息数据转换格式标准。在地理信息数据转换格式标准中依据空间对象模型标准,规定矢量、栅格和影像数据的交换格式标准。


保证语义无损失是地理信息数据转换标准的关键。空间数据的语义包含多个方面,其中最重要的是空间数据表达和空间数据间的关系。


上述这些标准多为基础性通用标准,适用于各种地理信息系统或数据库。在这些标准的实施中,需要针对某一个具体系统或数据库的目标和特征,从基础性标准中提取部分或全部内容,并进行必要的扩展,形成专用的技术标准。同样,为了实现我国地理信息共享,应在现有国家标准的基础上,根据共享的特性形成一套基于通用国家标准的、能满足地理信息共享需求的实用标准,逐步推出一套结构化的标准,解决地理信息共享标准滞后的问题。


3. 统一的空间定位参照系统


空间参照系统是真实世界位置信息的描述,地球表面或接近地球表面的空间目标位置都可以用空间参照系统来描述。空间参照系统分为两类,即基于坐标的和基于地理标识的空间参照系统,其表述形式可以是一组坐标、标识符或代码。


世界各个国家在大地测量中,均采用某一个地球椭球代表地球。然而,选定某个地球椭球仅解决了椭球的形状和大小问题。要把地面大地网归算到该椭球面上,还必须确定它同大地体的相关位置,这就是所谓椭球的定位和定向问题。一个形状、大小和定位、定向都已确定的地球椭球叫参考椭球。参考椭球一旦确定,则标志着大地坐标系已经建立。


一个国家或地区在建立大地坐标系时,为使地球椭球面更切合本国或本地区的自然地球表面,往往需选择合适的椭球参数、确定一个大地原点的起始数据,并进行椭球的定位和定向。显然,不同的椭球参数构成不同的大地坐标系;相同的地球椭球参数,由于定位或定向不同(或定位、定向均相同),将构成不同的的大地坐标系;大地原点上不同的大地起始数据表明属不同的大地坐标系。


3.1.基于坐标的空间参照系统


基于坐标的空间参照系统是以地球为参照的坐标系统,它有两种不同的类型:一般情况的坐标参照系和特殊情况的复合坐标参照系。


一般的坐标参照系由一个基准和一个坐标系定义(图2)。基准可以是大地基准、垂直基准或除此之外的基准,我们称之为工程基准。


基准是一个或一组参数,是其他参数计算的基础和参照,基准定义了坐标系原点位置、数值范围和坐标轴的方向。大地基准给出了坐标系与地球的关系,可以用于二维或三维系统,它包括了对椭球体和本初子午线的定义。垂直基准包括高程基准和深度基准,给出了地球重力方向的高度与已知大地水准面的关系,大地水准面接近平均海面。


坐标系是一组说明坐标是如何赋值给点的数学规则,一般有5种类型:笛卡儿坐标系(非投影坐标系)、大地坐标系、投影坐标系、极坐标系和沿地球重力方向的坐标系。


复合坐标参照系是指描述三维空间位置的水平和垂直坐标系由不同的坐标参照系定义。假设垂直基准和沿重力方向的高度由坐标参照系2定义,由两个坐标参照系构成的复合坐标
我国基于坐标的空间参照系基准在《中华人民共和国测绘法》中明确规定“国家设立和采用全国统一的大地基准、高程基准、深度基准和重力基准”。目前全国统一的基准是“1980年国家坐标系”、“1985年国家高程系”和“理论深度基准”,1978年以前使用的是“1954年北京坐标系”、“1956年黄海高程系”和“理论深度基准”。在工作中常见坐标参照系还有美国国防部的“WGS84地心坐标系”(World Geodetic System 1984 geocentric reference system)和地方独立坐标系。


常见与常用的坐标系是大地坐标系和投影坐标系。大地坐标系是一种球面坐标系,坐标值用大地经度、大地纬度和大地高表示,当点在参考椭球面上时,仅用大地经度和大地纬度表示,即常用的地理坐标(经纬度)。投影坐标系是二维的笛卡儿坐标系,是地图投影用数学函数将大地坐标系转换为平面坐标系的结果。地图投影方法很多,一般要根据数据的用途、范围、变形或误差要求等分别选用等角、等面积或等距离的各种投影变换算法。


不同来源的空间数据配准的一项重要工作就是空间参照系的转换。转换有两种情况:


l 基准相同时,将一个坐标系的坐标变换为另一个坐标系的坐标。如1954年北京坐标系的地理坐标变换为1954年北京坐标系的某种投影坐标、同为1980年国家大地坐标系的一种投影坐标变换为另一种投影坐标等。


l 基准不同时,将一个基准坐标参照系的坐标转换到另一个基准坐标参照系的坐标。如从WGS84坐标系的地理坐标转换到1954年北京坐标系的某投影坐标系坐标。


我国基于坐标的空间参照系是属于复合坐标参照系,转换中如果涉及高程或深度值,则还应注意垂直基准的转换。


空间点的高程是以大地水准面为基准来建立的。当前我们还不能唯一地确定大地水准面,各个国家或地区均选择一个平均海水面来代替它,以便建立国家或地区的高程系统。因此,采用不同的平均海水面作基准就会产生不同的高程系统。


我国曾规定采用青岛验潮站求得的1956年黄海平均海水面,作为我国统一的高程基准。凡由该基准面起算的高程在工程和地形测量中均属于1956年黄海高程系统。


从1985年起,我国开始改用《1985年国家高程基准》,凡由该基准起算的高程在工程和地形测量中均属于1985年黄海高程系统。


3.2.基于标识的空间参照系统


使用地理标识的空间参照系统不是基于精确的坐标,而是建立在地理要素的位置关联基础上的。要素的位置关联可能是:包含(如政区)、量测值(如一条街道的长度)和模糊关联(如一个建筑物与另一个建筑物之间)。地理标识的形式是唯一标识要素的标识符或代码。例如:


——县级政区,地理标识符可以是“县名”和“政区代码”


——居民点,地理标识符可以是“居民地名称”


——地址,地理标识符可以是“地址名称”和“邮政编码”


——流域、河流或支流,地理标识符可以是“名称”和“代码”


基于地理标识的空间参照系统由以下属性描述:名称、主题、拥有者、使用范围和定位类型。


前面介绍的中华人民共和国行政区划代码、国家干线公路名称和编号、全国河流名称代码、中国山脉山峰名称代码等均属于基于地理标识的空间参照系统的依据。


4. 地理信息共享的公共平台


4.1.地理信息共享的空间载体 -- 基础地理信息


国家测绘局自80年代以来一直十分重视国家基础地理信息系统的研究、设计和开发建设。迄今,已先后建成国家基础地理信息系统全国1:400万、1:100万和1:25万数据库。1:5万和1:1万数据库尚在建设中。


国家基础地理信息系统数据库是我国权威的基础地理信息数据。为保证数据质量,国家基础地理信息系统数据库建设工程对全部生产、建库过程实行两级检查、一级验收、入库前检查和国家测绘局工程总验收。从而使得数据库的总体质量优良,无论数据的完整性和一致性,还是数据的位置精度和属性精度以及接边精度,均达到规定要求。国家基础地理信息系统数据库严格执行了已经颁布实施的各项国家标准和行业标准,并根据建库需要,补充制定了若干急需的临时标准,使得数据库标准化程度高,利用数据库中的各种信息分类与标识代码,不但便于在全国范围对任何区域、任何要素类型,或任何实体进行基础地理信息的查询检索,也便于与各种专题信息数据库连接,进行专题分析和专题制图,灵活方便,有利于信息共享。


国家基础地理信息系统是一个面向全社会各类用户、应用面最广的公益型地理信息系统。是一个实用化的、长期稳定运行的信息系统实体。该系统数据库是为适应多层次、多方位用户需求而设计的,是各种专题信息空间定位的载体,是地理信息共享的公共基础空间数据平台,不仅能为国家级应用部门包括为国务院各部委局提供快速有效的决策支持,而且能为省级机构和其他单位提供空间定位的依据。


国家基础地理信息系统数据库可以为我国地理信息共享提供良好的基础,各种不同专题的信息均能与其连接和迭加,从而促进各种专题地理信息数据在空间位置上的一致性,能够对不同专题信息进行比较分析或迭加综合分析。然而,国家基础地理信息系统数据库是针对广泛用户设计建立的通用基础地理信息数据库,其内容详细程度、数据组织方式、投影选择等,还需按照地理信息共享要求,对国家基础地理信息系统数据库进行必要的改造,使之成为适合地理信息共享的公共基础地理信息空间数据平台。数据共享是双方的或多方的,在确定国家基础地理信息系统数据库为公共基础平台时,也就意味着该数据平台具有一定的稳定性,在同时相的数据集成出现问题时,一般要还需要对各种专题地理信息数据库自身进行标准化改造,使之与公共基础平台配准。


全国1:400万、1:100万和1:25万公共基础平台的设计、内容、数据组织、分类代码等具有一致性、继承性。它们均采用地理坐标,用单精度的以度为单位的经度和纬度表示,可根据需要转换为其他投影。这样的设计可以满足地理信息共享各种不同专题对空间定位载体比例尺、内容详尽程度、空间位置精度等方面的共同需求和特殊需求。


全国1:400万公共基础平台已经成为参加中国地理信息共享示范各部门的一致选择,1:100万公共基础平台也普遍用于内容较为详尽数据库中,由于资料使用上的限制,1:25万及更大比例尺公共基础平台仅在内部系统中使用。全国1:400万、1:100万、1:25万和正在建设的1:5万、1:1万公共基础平台是实现我国地理信息共享的重要基础。


4.2.专题地理信息与基础地理信息数据配准


鉴于地理信息的多样性,各个部门根据本专业领域的特点和要求,各种专题图形信息所使用的原基础地理底图是多种多样的,专题属性信息是使用的统计单元可以是点、弧段或多边形,它们的精度、信息的详细程度参差不齐,对基础地理信息空间平台的要求不尽相同。并且,当将它们与基础地理信息空间平台数据迭加显示时,通常会出现图形要素空间位置关系不协调,甚至相互矛盾的现象,也可能产生专题属性数据无法与基础地理信息空间平台图形数据正确连接,甚至不能连接的现象。有时两者图形形状十分相似,却不相吻合,存在弧段及多边形形状误差。产生这些问题的原因有三方面:数据集的时间差异、数据集的定位精度差异和数据集中的错误。为实现专题信息与公共基础平台的集成,需要进行配准处理,即选择相同时间的数据进行配准;对专题信息本身进行标准化、规范化改造;根据专题信息精度、内容详细程度等特点,选择恰当的公共基础平台;进行图形空间位置关系协调和属性数据匹配处理等。


 


(1)已建专题信息图形数据库与公共基础平台的集成和配准处理


① 专题信息自身标准化改造


为实现地理信息共享,首先需对已经建立的专题信息图形数据库进行标准化改造,在时间一致、数据内容详尽程度和覆盖范围应满足共享要求时,专题信息的数据质量也应符合有关规定,分类代码也应执行有关国家标准或行业标准。此外,还应注意空间参照系统的匹配,如采用1954年北京坐标系或1980年国家大地坐标系。高程应采用1956年黄海高程系或1985年国家高程系。采用独立坐标系的,应给定该独立坐标系与国家统一坐标系的转换参数。凡采用某种地图投影者,需准确说明投影名称和全部投影参数,以便在进行集成和配准处理时使用。


② 公共基础平台选择和数据内容选取


专题信息图形数据库的比例尺差异很大,既可能是从1:1000万到1:1万系列比例尺的某一种,也可能是某一任意比例尺。已经建成的公共基础平台有1:400万、1:100万和1:25万三种。公共基础平台的选择与专题信息图形数据库的比例尺之间存在着对应关系。一般情况下,应当选择相同比例尺或更小比例尺公共基础平台作为专题信息的空间载体,如1:400万专题信息图形数据库应选择1:400万公共基础平台作为空间载体。但是,当专题信息图形数据库的平面位置精度要求能够得到满足时,亦可选用较大一级比例尺公共基础平台作为空间载体。如对于1:50万专题信息图形数据库而言,当平面位置精度要求较高时,选用1:25万公共基础平台缩小作为空间载体。当平面位置精度要求较低时,则可选用1:100万公共基础平台作为空间载体。依此类推。
无任何种比例尺公共基础平台,其数据内容均比较丰富,能满足同级地形图规范要求。相对于同级比例尺专题信息图形数据库而言,多数情况下显得过于繁杂,在确定选用某一级比例尺公共基础平台后,需要对其内容进行取舍。内容取舍的途径有:按数据层选取;利用基础地理信息数据分类代码按要素类型选取;利用标识码,诸如行政区划代码、河流名称代码或公路路线代码等选取特定的内容;利用上述三种方法的任意组合进行选取。例如,可以只选用县和县以上政府驻地、县级和县级以上行政区划界、经纬网三层数据;可以只选用地区和地区以上政府驻地、省界及国界、三级以上河流、经纬网等内容;可以选用指明的河流、公路、铁路和若干特定的城市等。以既能够满足作为背景信息的要求,又能保持显示图形的清晰性为限。


选取的公共基础平台数据经过重组形成新数据层,并重建拓扑关系。


③ 集成和配准处理


在将专题信息图形数据与经过选取处理的公共基础平台数据集成和配准前,需保证两者的平面、高程坐标系统统一,并转换成相同的投影。


将专题信息图形数据作为数据层与选取的公共基础平台数据迭加显示。删除专题信息图形数据中与公共基础平台数据重复的内容,如境界、河流、公路、铁路、地名等,上述内容完全用公共基础平台数据替代;检查修改专题信息图形,使之与公共基础平台数据,如境界、河流、道路等保持空间位置关系协调一致。


(2)已建专题信息属性数据库与公共基础平台的连接


专题信息属性数据库或统计数据库多数为空间定位型关系数据库,与公共基础平台图形数据通过连接项连接。连接项可以是经纬度或投影坐标、地名、行政区划代码,也可以是其他标识码。


连接前同样需要选择适合比例尺的公共基础平台图形数据,并对其内容进行选取等处理。当连接出现问题时,应找出原因,一般应对专题数据进行修改。


(3)拟建专题信息数据库与公共基础平台的集成和配准处理


专题信息数据库与公共基础平台图形数据配准和连接是一项十分重要、十分麻烦、复杂和费时的工作,集成和配准的质量难于保证。对于那些拟建而尚未建立数据库的专题信息,应当在数字化工作开展前,选用适当比例尺公共基础平台数据输出的模拟图形作为控制底图,转绘专题图形,经过协调处理后,将专题内容数字化,建立相应数据库,从而为两者的集成和配准奠定基础,提高配准的质量和速度。


(4)专题信息数据库与公共基础平台配准数据定位质量分级指标:


专题信息数据库与公共基础平台图形数据配准完成后,应当对配准的质量进行评价和分级,例如可以公共数据平台的基础地理信息数据集为衡量标准,将专题图形数据的定位质量分为6级。


等级指标 含 义


L1 与1:5万或更大比例尺精度的基础地理信息位置精度一致


L2 与1:25万比例尺精度的基础地理信息位置精度一致


L3 与1:100万比例尺精度的基础地理信息位置精度一致


L4 与1:400万比例尺精度的基础地理信息位置精度一致


L5 不满足1:400万及更大比例尺精度的基础地理信息位置精度,但符合自定义的位置精度


L6 无位置精度要求



5. 结语


若干年来,我国在地理信息标准方面已经开展了大量工作,制定或正在制定一批与地理信息相关的国家标准,是实现地理信息共享的有利基础。然而,无论从标准内容的覆盖面,还是从标准本身的系统性、一致性、先进性看,现有标准尚不能满足地理信息共享的需求,应当加大对地理信息标准研究的投入力度,加快所需各项标准的研制进程,加强与国际标准的接轨。


采用统一的空间参照系统是实现地理信息共享的前提之一,应当根据我国的有关规定,选择全国统一的大地基准和高程基准作为平面和高程控制系统。同时,适当选用一项或几项相关国家标准作为基于地理标识的空间参照系统依据。


全国1:400万、1:100万、1:25万和正在建设的1:5万、1:1万公共基础平台是实现我国地理信息共享的重要基础。各种已经建成的专题信息图形数据库和属性数据库与公共基础平台的配准处理问题应引起足够的重视,尽管该项工作有时十分复杂、十分困难。新建专题信息数据库应在设计阶段就注意解决这一配准问题,以免增加后续工作量。


以上讨论了对地理信息共享十分重要的地理信息标准、空间参照系统、专题地理信息与基础地理信息配准等问题,这些都是地理信息共享标准化环境不可或缺的组成部分,今后还需要进一步开展工作,以满足地理信息共享的需要。


 


参考文献


[1] 李玉恩、周思源、沈同,标准编制和审查人员教材,电子工业出版社,北京,1994


[2] 崔树安、常寿彭、张芬,标准化指南,辽宁科学技术出版社,辽宁,1991


[3] ISO/TC 211文件(N900 – N1035)


[4] http://www.fgdc.gov/


[5] http://www.opengis.org/


[6] 《中华人民共和国测绘法》,1992


[7] 何建邦、蒋景瞳、刘若梅,地理信息标准化研究与思考,地理信息世界,1998年第2期


[8] 刘若梅、蒋景瞳,空间数据基础设施建设中的地理信息标准化问题,《数字地球》,中国环境科学出版社,1999


[9] 蒋景瞳、刘若梅,国际地理信息标准化进展,《纪念中国测绘学会成立四十周年论文集》,1999


[10] 蒋景瞳,政府GIS与国家基础地理信息系统,《中国测绘》,No. 5, 1999


[11] 蒋景瞳,全国国土基础信息系统研究,《全国性资源与环境信息系统研究》,测绘出版社,1990


[12] 蒋景瞳、苏山舞等, 国土基础信息系统全国1:100万地形要素数据库设计研究,《全国性资源与环境信息系统研究》,测绘出版社,1990


[13] 蒋景瞳, NFGIS全国1:25万数据库设计和应用研究,《遥感信息》No.4,1999


[14] 蒋景瞳、刘若梅,国土基础信息数据分类与编码研究,《全国性资源与环境信息系统研究》,测绘出版社,1990


[15] 蒋景瞳、刘若梅,全国河流名称代码研究,《94’地理信息系统学术讨论会论文集》,1994


[16] 阎 正、蒋景瞳等,《城市地理信息系统标准化指南》,科学出版社,1997


[17] 蒋景瞳、刘若梅、贾云鹏,国际元数据标准的发展和研究现状,《中国地理信息元数据标准研究》,科学出版社,1999


[18] 刘若梅、蒋景瞳、贾云鹏,中国地理信息共享元数据标准实施,《中国地理信息元数据标准研究》,科学出版社,1999