当前位置:甜馍馍地理信息网 >> 地理信息系统GIS >> 知识体系 >> 正文 >>  [阅读资讯:关于土地信息系统建立过程中的数据质量问题的探讨]

关于土地信息系统建立过程中的数据质量问题的探讨

[ 来源:互联网 | 时间:2009年09月06日 | 收藏本文 ] 【

摘要:数据对土地信息系统(LIS)来说是至关重要的,数据质量的好坏是土地信息系统建设成败的关键。本文将对土地信息系统建立过程中有关数据质量问题进行探讨。
关键词:土地信息系统、数据质量、误差、分辨率、坐标变换、矢量数据、栅格数据、拓扑
一、前言
土地是人类的宝贵财富,是人类社会进行物质生产所必需的基本条件和自然基础。如何科学、合理地利用有限的土地资源,如何及时了解与掌握土地利用变化数量和空间特点,对于保持耕地总量动态平衡和土地持续利用具有十分重要的意义。
随着社会经济的日趋多样化,土地部门的业务工作及范围也在不断扩大,原有的靠手工操作,图纸管理的模式已经越来越不能满足高效率的需求。为强化土地管理,满足社会对土地资源信息更多、更细、更完善的服务要求,各土地管理部门纷纷加入信息化、数字化的改革大潮。特别是在市场经济条件下,因土地管理部门工作的严肃性、准确性、科学性和规范化要求,管理中任何规定的确定和变更都需要完成大量的信息收集、分析、综合、决策和评估等工作,土地管理也只有强有力的信息技术(IT)的支持下,才能做到真正的科学决策和管理。
土地信息系统(LIS)是地理信息系统的一个分支,是一种基于宗地[以宗地(地块)为单位]的计算机管理信息系统。是一种利用计算机技术及其属性数据进行采集、处理、管理、查询、分析、应用和维护更新的空间信息系统,是土地管理的现代化工具,是土地规划和管理定量化、科学化的方法、手段。但是,在土地信息系统的建设过程中,还存在许多问题,给土地信息系统的建设及发挥带来一定困难。这里仅对土地信息系统建设中的数据质量问题进行探讨。
二、对LIS数据质量的认识
数据是一种未经加工的原始资料,是客观对象的表示,它可以是数字、文字、符号、图像,数据是信息的具体表达形式。一个LIS系统包括空间数据、属性数据、空间数据之间的关系以及空间数据与属性数据之间的关联。
人们往往以为计算机为基础的信息系统的数据质量是可靠的,很少怀疑利用信息系统产生的分析结果在数据质量方面会有问题,但事实远非如此。在某些情况下,由于多种原因,计算机分析的结果甚至会比手工分析的误差更大。这里除软件、硬件的质量问题,计算方法上的问题,以及分类、编码、输入、操作的明显疏忽外,数据本身的质量是重要的原因。
众所周知,数据是LIS的“血液”,是组成系统的重要元素。数据质量的好坏是土地信息系统成功与否的关键所在;数据质量的高低优劣,都直接影响到土地信息系统的经济效益和社会效益,决定了系统应用价值的大小;数据的可靠,质量的好坏将直接影响到整个系统的成败。系统如果不能提供正确、可靠的信息,这个系统也就失去了存在的价值。数据质量的好坏是一个相对概念,并具有一定的针对性。衡量其好坏主要有以下几个指标:误差、数据的准确度、数据的精度和不确定性[1]。数据质量是数据整体性能的综合体现。
统而言之,数据的质量问题主要表现在两个方面:一是数据是否及时反映了现实世界;二是数据是否保持了一致性和完整性。
土地信息系统的数据量大,数据来源广,数据采集的任务重,在数据库建立过程中会出现许多人为和系统的误差,甚至还有可能产生数据错误,最后采集的数据无法准确反映规划和管理的实际状况,建立在此数据库基础上的系统往往也就达不到管理自动化辅助决策的目的,而只不过是“看看而已”的一种“摆设”罢了。
数据库(包括空间数据库和非空间数据库)是土地信息系统最基本、最重要的组成部分,也是投资比重最大的部分。数据质量的好坏,直接影响系统的功能和应用。不仅要根据技术规程衡量数据质量,还要从数据使用角度分析数据质量问题。数据质量通常是指数据的可靠性和精度,它主要用数据的误差来度量的。现就土地信息系统建立过程中的数据质量问题作进一步的探讨。
三、数据源质量的问题
土地信息系统的数据源指建库中所需要的各种数据类型的来源。它是土地信息系统最基本、最重要的组成部份。土地信息系统的数据源多种多样,主要包括有:地图,地图是系统最主要的数据源,因为地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别和属性可以用各种不同的符号加以识别和表示。土地信息系统其图形数据大部分都来自地图,土地信息系统的属性数据主要有地籍图、宗地图、土地详查图、土地利用现状图、行政区划图、专题图、乃至地形图等各种图件的矢量化地图数据。二是遥感影像数据,遥感影像数据是一个极其重要的信息源。通过遥感影像可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影像还可以取得周期性的资料,这些都为土地信息系统提供了丰富的信息。三是统计数据,包括土地的分类、面积、权属、分布及质量、等级状况、利用状况、非法占地等统计资料。四是实测数据,包括GPS点位数据、地籍测量数据等。五是数字数据,包括数字图形数据和属性数据。数字数据主要有地籍号、档案卷宗号、地类号、图号、手簿号、宗地界址点点号及坐标控制点坐标,宗地面积,面积中误差、年代、日期等等。属性数据包括图形、图像以外的各种文字、数字信息。其中文字信息主要是与宗地档案,文件档案组成相关的各种检索和查询信息(如:土地权利人姓名或单位各称、土地座落,文件档案的标题、发文机关、公文字号等等),以及土地登记、地籍调查、权属审核、登记发证各办公流程中的各种键盘输入信息。六是各种立法文件和文字档案,主要有地籍档案、文件档案等具有法律效力或需要经常查阅的原始文件材料,它们是土地信息的重要组成部分,在土地的规划管理中起着很大的作用。数据源质量问题指数据的采集和录入中可能产生的误差,建库所需的各种类型的数据的可靠性和精度。
从土地信息系统建立的过程来看,它的主要因素有:各种测量数据,地图和遥感数据等的误差;调查和统计造成的属性数据误差,以及文档数据的错误等,数字化前的预处理、手扶踀自动化的分辨率和矢量化精度。
1、遥感数据
地理信息系统、遥感和计算机辅助制图是现代地理学的重要技术手段。遥感作为一种获取和更新空间数据的强有力手段,能及时地提供准确、综合和大范围进行动态监测的各种资源与环境的信息,因此遥感数据是土地信息系统的一个重要数据源。
所谓遥感(RemoteSensing)就是遥远感知的意思,也就是不直接接触目标物和现象,在距离地物几公里到几百里、甚至上千里的飞机、飞船、卫星上,使用光学或电子仪器接受地面物体或发射的电磁波信号,并从图像胶片或数据磁带形式记录下来,传送到地面,经过信息处理,判读分析和野外实地验证,最终服务于有关部门的规划决策[2]。土地管理部门可以运用遥感技术快速获取现状空间的信息。
尽管遥感技术有很多好处,但因其自身特性,获取的遥感数据可能存在一些误差。如:不同的高度引起的问题,由于传感器的结构及稳定性产生的问题,对信号进行数字化产生的误差。传感器在航线、航向上出现的误差,大气辐射产生的误差,地形和地貌等因素产生的误差等等。在遥感资料的获取时,有些误差是可以控制的,有些则不可控。因此必须对原始数据进行预处理,包括利用地面控制对原始数据进行几何校正,图像增强和分类。对获取的遥感数据进行光谱校正,特征提取,自动识别分类、自动成图等处理。
2、测量数据
各种原始的测量数据是土地信息系统的主要来源之一。包括宗地的权属界线、位置、形状、数量、面积、各级行政界线、地形图测量等。由于人和环境的因素,测量数据不可避免地受到人为误差(对中、读数、平分等误差)、仪器、环境的影响。来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。碎部点误差除了继承了控制点的误差外,还受自身观测方法,观测精度和地界的人为判断,以及地物地貌的取舍等因素的影响。当然原始数据误差受观测仪器、观测者和外界环境三种因素影响。除此之外,还有测量数据的实时性以及数据老化,采集数据的密度不合理,或概括取舍不合理,选取测量规范标准不一致或精度等级不一致造成测量数据的不一致的影响。地籍要素是构建土地信息系统极为关键的一步,其测量数据的精度高低决定了系统功能能否得到正确和充分发挥。
从地籍测量成果的有效性和土地管理的可能性来考虑,为了保证各权属单元之间的界线清晰,边界无争议,并且双方都能接受而不损害他人和国家的利益,地籍测量要达到一定精度。因此,必须要有相应的数据采集方法作为保证。地籍要素的采集方法目前主要有两种,一种是传统的模拟式外业测图方法,另一种是野外全数字化数据采集方法。传统方法的主要作法是在地籍控制测量的基础上,用解析法测量出权属界址点坐标,以控制点或以界址点为基础施测成地籍图,要形成入库数据信息,则要通过对原图数字化来实现。用传统数据采集方法形成地籍要素数字信息其误差影响因素较多,主要误差来源为:测站点误差m1,量距误差m2,在测图板上描绘方向线误差为m3,刺点误差m4,数字化仪采点误差m5等。按有关专著论述,一般情况下,m1≈±0.12mm,m2≈±0.2,m3≈±0.1mm,m4≈±0.14mm,这四项误差为野外采集误差。数字化m5的影响因素比较复杂,误差产生首先与图形要素有关,要素本身的复杂程度对数字化精度有显著影响,数字化仪本身的精度更应引起重视。正常情况下,用常规数字化仪进行数字化时,精度一般可达到±0.13mm。综合上述得,地籍要素采集精度m采为:m采=±=±=±0.02mm按1:500比例尺来考虑,实地误差将达到±10cm,由此可见,按传统方法施测,则拟入库的地籍要素信息很难达到规定的±5cm的精度标准。
采用野外全数字化方法,界址点野外数据采集一般采用直接测定坐标法,即将全站仪或测距仪置于测站点上,对界址点上的移动棱镜进行水平角和距离测定,电子手薄记录计算。此种方法的主要误差来源为水平角测角误差mβ和测距误差mD,测角中误差角保守为±5″,测距误差主要来自移动棱镜偏离界址点位置误差,其偏离值按2cm考虑。测距平均边长取100m,按点位误差精度估算公式m2=来计算,则m≈±2cm,即便考虑测站误差和其他偶然的联合影响,点位精度也肯定在规定范围内,所以地籍要素信息数据的野外全数字化有利于提高界址点精度,从而保证地籍数据的质量。
3、调查、统计、文档数据问题
土地信息系统的建设过程中,涉及大量的调查统计数据,这些资料尚存在许多不足之处,为土地信息系统的建设带来了一定困难。
建立土地信息系统,必须首先进行土地基本信息的搜集,开展地籍调查工作,核实宗地权属,掌握土地利用状况,获得宗地位置、形状及其面积的准确数据,为建库奠定基础。现就地籍调查工作加以探讨,众所周知,权属调查的工作之一是填写地籍调查表。由于权属调查技术性强,工作量大,参与人员多且水平不同等原因,填写后的地籍调查表或多或少会出现下面一些问题。在填土地使用者名称时,单位本应填写全称,可出现了类似这样的情况:某林业局有3宗地,而在3份地籍调查表上出现了xx林业局、县林业局、林业局等名称。按这样的名称录入建立信息系统,将导致不能正确地自动的归户。在填写土地使用者性质时,本应该写“全民”或“集体”或“个体”或“个人”,而出现了“国营”或“国有”或“私营”这样的名词。在填写宗地四至时应说明权属界线所经地物名称及归属、位置、与誰接壤。但出现了东(南、西、北)至xx,而未填出接xx。且有的四至填写错误,如两宗地共用一堵墙时,则只能出现两宗都至墙中,或一宗至墙内另一宗至墙外,但填出了两宗都至墙外或墙内等情况。在填写界址标示处的界址线位置时也有类似错误,有的表填写字迹潦草,或使用简化字,让人难以辨认。有的内容还可以猜出,但户主的姓名、调查员、勘丈员的签名等内容实在难辩;有的表中该填的内容而未填,任意涂改。
共用宗的处理,一个地块被几个权属单位共同使用,而其间又难以划清权属界线,这样的地块称为共用宗。不少县(市)是这样处理的:有多少土地使用者就填多少份地籍调查表,表上的内容按各分宗填写。这样做的好处是所填的内容详细,调查表和土地登记申请书、审批表形成一一对应的关系。但其弊端也是显而易见的,其一较大地增大了填表的工作量,其二增大了复杂程度,在填写四至时,如遇一个土地使用者使用几个地块则不得不写清几个地块的四至;为填清界址指标,又得设置内部界址点,增加了宗地草图和地籍图的负荷量,填表时如不小心还会造成表与表之间的相互矛盾。为了和地调表统一,有的在形成宗地界址点成果表时,除了有宗地界址点成果表外,还有分宗的界址点成果表。如果内部界址点是在纸图上图解的,则将该宗地的宗地界址点和内部界址点和计算机展点后,会出现界址线混乱的情况。在土地信息系统建库时,这些内部点是不能当界址点录入进库的。如进库则在面积统计时,这种内部界址点所围成的区域的面积就被多统计了一次。
建立完备的信息系统,必须具备这样的条件:大比例的地形图或地籍图;野外测量的界址点数据;宗地的属性数据(土地登记申请书、地籍调查表、审批表等)。全省在进行大大规模的城镇地籍时,由于受当时的条件限制,自动化程度低,各作业单位作业水平的不同,或多或少出现一些问题。在建库时所发现的问题主要是界址点的坐标成果与地籍上的位置不吻合;相邻宗的同一界址点坐标不同;界址边长、宗地面积计算有误。某些县(市)为了进行土地登记,由于多方面的原因,在进行初始地籍调查时,只作权属调查,不作规范的地籍测量。为了计算面积,用皮尺或钢尺丈量界址边长及相关尺寸,用几何图形法计算出宗地面积,而不测址点坐标和地籍图。这样做不利于信息化的管理。4、图形数字化
影响数据质量的因素是多方面的,有相当一部分来自于建库过程中的数字化过程。建库过程中的数据质量,包括数字化前的预处理,纸张变形、手扶跟踪数字化精度或扫描数字化的分辨率和矢量化精度。
(1)数字化前的预处理
用于数字化作业的地形图(工作底图)一般采用聚酯薄膜图,其变形一般小于0.2‰。采用纸质图纸时,图纸的尺寸随湿度和温度的变化而变化,温度不变的情况下,温度由0%增至25%,则纸的尺寸可能改变1.6%。因为纸的膨胀率和收缩率不相同,即使温度回到原来的大小,图纸也不能恢复原来的尺寸。因此在数字化时要适当的比例因子,通过仿射变换进行几何纠正,以减小工作底图变形产生的位置误差,达到相应的精度。
对不同种类和比例的工作底图进行数字化时,应注意它的投影方式是否一致,比例是否匹配。对于不同投影方式应在数字化后及时变换为系统要求的投影方式。对于不同比例应将比例尺和精度记录到元数据中,以便估记由此可能产生的误差。
(2)跟踪数字化
手扶跟踪数字是一种自动化精度较低的数字化方式,其数字化精度也因操作员及其工作的疲劳程度而异,操作员的劳动强度较高。随着大幅面扫描仪的成本不断降低,扫描和矢量化技术不断完善,这种数字化方式可能成为自动扫描数字化的一种补充。
手扶数字化是从地形图输入空间数据的最广泛采用的输入方法。把地形图放置于数字化桌上,用手持设备,跟踪每一个地图特征、数字化设备精确量测鼠标的位置,产生数据形式的坐标数据。
影响跟踪数字化数据质量的因素很多;主要有:数字化底图中地理要素的宽度、密度和复杂程度对数字化结果的质量有着显著影响。数字化仪的分辨率和精度对数字化数据质量有着直接的决定性的影响。《地形图数字化规范》规定,数字化仪的分辨率不能小于每厘米394线(约1000dpi),精度不低于0.127mm(0.005英寸)。常见数字化仪在分辨率方面通常能满足要求,而在精度方面却有相当一部分不能达到要求。在选择数字化仪时要特别注意其精度指标,以满足LIS工程的需要。数字化操作员的技能与经验不同而引入的人为因素误差是不同的,由于操作员视力、操作习惯,熟练程度和疲劳程度的不同,最佳采样点位值判断,十字丝与目标点重合程度的判断会有一定程度的差异,影响数字化的质量。操作方式(如曲线采点方式和采点数目)也会影响数字化数据的质量。
假定各种误差影响符合误差传播规律,手扶跟踪数字化的综合精度应按下式求得:m数=±其中:m数表示手扶跟踪数字化的综合精度;m定表示工作底图定向误差,m仪表示数字化仪精度,m人表示人为因素误差。(3)、扫描数字化
扫描数字化用高精度扫描仪将图像等扫描并形成栅格数据文件进行处理,将之转化矢量图形数据。规范规定:图形定位控制点扫描误差不大于0.1mm,相对于工作底图,矢量化后的扫描点误差不大于0.15mm,线划误差不大于0.2mm。影响扫描数字化质量的因素除原图质量外,还包括:扫描精度、定向精度、矢量化精度损失等。
①扫描仪的分辨率和精度
扫描仪的分辨率和精度对扫描数字化质量的影响是至关重要的。因此,要根据具体情况选择适当的扫描仪。目前,大幅面扫描仪大致有,滚筒式(drum),平板式(flatebed),直进式(directfeed)3种。这些扫描仪能够输出一种或多种形式栅格数据文件(二值、灰度和彩色)。
滚筒式扫描仪精度较高价格较贵,能以较高的分辨率扫描AO或更大的图纸。
平板式扫描仪与滚筒式一样精度高、价格贵、分辨率很高,但一般幅面不会超过A1幅面。由于平板式扫描仪幅面小,扫描后多需进行拼接,从而增加了工作难度,引入了更多的误差源。LIS工程一般不选用这种扫描仪。

下一页
本文共 2 页,第  [1]  [2]  页

【推荐本文】 【打印本页】 【返回顶部

>> 相关文章:

● 上一篇文章:VC++6.0中利用OpenGL实现树木建模
● 下一篇文章:没有了
最新文章
推荐文章