陈少勤:如何建设通用地理实体数据仓库?

Posted 慧天地

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了陈少勤:如何建设通用地理实体数据仓库?相关的知识,希望对你有一定的参考价值。

点击图片上方蓝色字体“慧天地”即可订阅

陈少勤:如何建设通用地理实体数据仓库?

作者单位为浙江省测绘与地理信息标准化技术委员会)

为适应专业GIS需求,必须改进地理信息数据库的数据结构;为提高数据更新生产效率,必须建立面向对象的数据更新生产机制;为减少数据库多头更新造成的重复生产,必须改进数据更新技术,即先统一更新基础地理信息数据库,再分头共享于专业GIS或地图产品。而关键在于改进基础地理信息数据库的设计,建设新型的一库多用的通用型地理信息数据库,才能创新测绘生产与地理信息服务的技术体系,促进测绘与地理信息行业在新常态新形势下的转型升级。


地理信息术语

为便于行文叙述,本文就所用术语作专门定义如下:

  • 地理实体——现实世界中客观存在的地理现象。

  • 地理要素——将人类认知现实世界的地理实体概念在计算机系统中用矢量数据的形式表达的地理实体的数据对象。

  • 地理实体编码——笔者认为,地理实体在其形态保持不变的时间段内所拥有的空间方位的独占性。据此特性可知存在一种算法,能利用该时空特征为每个地理实体编制一个独立的唯一代码。则处在不同时空的地理实体必定具有不同的编码数值。

  • 通用地理实体——各部门、各行业GIS可以通用的并能达成一致描述的地理现象。

  • 框架要素——表达地图或GIS基本内容的地理实体,主要指地名、水系、道路、居民地、境界,地貌等。

  • 表征要素——地形图上强调表达的形状不同、特征各异的具有一定方位意义的地理实体。

  • 地理空间尺度——观察地理现象的空间范围的宽广程度。

  • 地理实体粒度——在特定地理空间尺度下观察地理现象形状所得的图形概括的详细程度。

  • 地理实体关系——地理实体之间的相关状态或性质,如构成关系、组合关系、邻接关系、联接关系、包含关系、从属关系、空间关系、拓扑关系和名称指代关系等。


地理信息数据库体系升级思路


一、现有基础数据库来自于地形图数字化,所采用的基础地理信息分类代码,本质上就是地形图符号的分类代码,主要适合于地图制图需要,并不切合各行业专业GIS应用的要求。要提高基础GIS的服务能力,必须充分顾及各行业专业GIS应用的基本要求。所以,对于应用需求大的通用性地理实体,应协调主要应用部门的认知差异,求得地理要素表达的最大公约数。尤其是对于有专门部门管理的框架要素——如水系、交通、地名、境界等,应积极评估采用相关主管部门技术标准的可行性,技术设计尽量执行所需标准,以提高数据的权威性。


二、目前,省级基础测绘主要还是以图幅为单位分区域地进行数据更新的生产模式,数据更新的服务也只能是周期性、批量式、成片性的整体提供,难以满足其他行业专业GIS应用要求及时提供面向对象的地理实体数据增量更新的需求。欲建立针对地理实体的面向对象的增量式数据更新生产模式,必先设计面向对象的地理实体的数据结构和数据库范式,才能支持以地理实体为单位的面向对象的增量式数据更新。


三、随着信息技术和互联网非同凡响的快速发展,各种专业GIS和网络地图越来越多。而这些产品各自独立建设的数据库和数据更新,同时也催生了大量重复性的数据采集和更新工作量。欲建立“一次数据更新,其他数据库都可以联动更新数据”的共享交换机制,必先建立标准化的可以通用的面向对象的地理实体数据仓库,为其他地图生产或GIS应用提供可灵活装配、定制、加工各种产品的地理信息的原材料、零配件和器材式的数据。


四、地图产生于人类迁徙途中记录地理发现的需要,故而带着与生俱来的风格——特别关注并记录具有明显形状特征的地理现象,尤其强调对具有方位意义的独立地物的突出表示。对GIS检索、统计和分析而言,更关注地理实体的属性、分布和相互关系等。在实用中不难发现,带有地形图古老基因特征的基础GIS,一个面是数据库里存在着大量繁杂的、离散的、且高度冗余的表征要素,另一方面是重要的框架要素及其属性信息严重不足。欲区别对待地图制图与GIS应用的不同需求,可将表征要素与框架要素按各自的实际需求分别设计不同的数据结构,在通用地理实体数据仓库分别建立框架要素与表征要素两大基本数据集,前者注重于满足高效的数据更新与共享交换,加上后者即可用于地图制图。


五、为能协调各部门各行业对地理实体的共同认知,并达成相互接受的最大统一的表达,使得所有参与共享交换的用户可以准确、及时获取标准化的地理实体更新数据,必须为每个地理实体赋予唯一标识,它可以是文字、图形、颜色、编码等形式,本文则专指“地理实体编码”。


新型数据库更新的信息化架构


建设新型基础测绘数据更新模式,需要改造现有的基础测绘生产模式和运行机制,全面重构信息化的测绘生产技术体系。笔者提出的信息化架构之宗旨是“新型架构内任何环节上发生的数据更新,都可以被该架构内需要与其保持同样现势性的其他节点联动更新”,如图1所示。纵向上支持来自各级基础测绘数据更新的多比例尺数据的级联更新,就是从小尺度的较小粒度地理实体到大尺度的较大粒度地理实体数据的级联更新;横向上支持来自所有用户更新数据的共享交换的协同更新,就是在架构下的任何GIS数据库或地图产品所做的数据更新,都可成为架构内其数据库或地图产品协同更新的数据源。


支撑架构运行的核心是“通用地理实体数据仓库”,它存储记录品种多样、规格齐全、内容全面、结构标准、广泛适用、不同粒度的框架性地理实体的数据资源。可为各种GIS数据库提供器材、零件、配件或部件,用以组合或构建更大更复杂更专业的数据集,并可支持专业GIS中局部单元的精准的数据替换和面向对象的数据更新以及要素质检的关系恢复和重构。


利用信息资源具有可复制、可共享的特性,设计以数据仓库为中心的地理实体数据的增量更新机制和共享交换机制。一是以基础测绘数据更新生产为主线,建立按要素分类的面向对象的从数据采集、编辑到提交(生产单位用于数据更新管理的数据库)的数据更新生产流水线,经由并行质量控制系统随行同步把关,再由数据预处理系统将数据导入通用地理实体数据仓库。生产线上仅针对实地发生变化的地理实体进行增量式数据更新,而不是将整个产品全面更新。更新数据存入数据仓库后,再按特定产品的组装规则开发数据抽取、转换和加载(ETL)工具软件更新基础地理信息数据库、基本比例尺地形图以及其他电子地图等产品。二是以地理信息数据共享交换平台为依托,发挥地理信息数据共享交换的优势,利用平台提供的数据前置交换系统,实现中心数据仓库与各专业GIS之间增量式的数据联动更新。


陈少勤:如何建设通用地理实体数据仓库?

图1 新型基础测绘数据更新架构设计图

通用地理实体数据仓库的结构



陈少勤:如何建设通用地理实体数据仓库?

图2 通用地理实体数据库架构图

本文摘自《测绘地理信息蓝皮书》之

《新常态下的测绘地理信息研究报告(2015)》


来源:国家测绘地信局测绘发展研究中心(版权归原作者及刊载媒体所有)

欢迎大家关注《慧天地》同名新浪微博

微博ID:慧天地_geomaticser

陈少勤:如何建设通用地理实体数据仓库?

荐读

点击下文标题即可阅读



编辑 /杨长龙  审核 / 王欠鑫  杨长龙

指导:万剑华教授

以上是关于陈少勤:如何建设通用地理实体数据仓库?的主要内容,如果未能解决你的问题,请参考以下文章

热文:如何搭建一个数据仓库

探索中小银行数据仓库建设之路

如何进行数据仓库的建设与实施

福建农信:探索中小银行数据仓库建设之路

数据仓库之数据模型

收藏,数据仓库建设与框架终于有人给讲明白了