2017年6月13日,第六届地理信息开发者大会(WGDC2017)在北京国家会议中心盛大开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过六个年头,如今成为全球最具前瞻性的跨界创新风向标。
此次大会以1+16的形式举办,汇集了国土资源、智慧城市、智能驾驶等多个领域的专家共襄盛举。其中国土资源峰会作为传统测绘行业的“重头戏”,邀请到了多位业内领导和专家到场支持。
峰会上,湖北金拓维公司总经理李三玉带来了题为《国土资源大数据应用与实践探讨》的精彩演讲,现场实录如下(未经本人确认):

各位领导、各位嘉宾、各位同仁大家下午好!下面,我为大家做一个国土资源大数据应用于实践探讨的一个分享。
主要从这几个方面:我们先讲这个之前,我们看一下我们在国土大数据这块,刚才前面的几位嘉宾已经讲了数据怎么进来的,数据怎么采集,怎么样处理,怎么样形成我们真正国土大数据。形成国土大数据以后怎么样去管理?怎么样去应用?怎么样去分析,怎么样去挖掘?这是一个很大的课题。我们国家从各个部委,一直从国务院到各个部委到各个省都做了不同层面上的,从政策角度去做的推进。
我们的新技术大家都知道,云计算、物联网包括大数据技术,现在已经是日益成熟,已经基本上可以落地。在这种情况下面,我们国土信息化的趋势,发生了几个改变,第一个,我们从原来的IT的技术驱动,到现在的数据驱动。第二个,我们从原有的,仅仅是对数据进行管理,我们原来建立各种各样的独立的系统,对数据信息进行管理,现在我们要对数据进行分析,进行挖掘。
原来我们是对单一的行业的应用,原来都是国土的地籍,房产的管理,还有农业、林业的都是分开的。我们现在是跨行业融合。我们还要在这里面还有关于城市的应急指挥,关于智慧城市里面的组织决策等等。现在都是跨界融合,我们看一下在这个跨界融合里面我们会有些什么样的需求?
先看看存在的问题。我们现在国土资源,大数据,它依赖于我们传统的、以前积累的系统。但是我们这些系统是个什么情况呢?是不同时期,采用不同的标准,由不同的厂商,基于不同的平台建立的这样一些不同的应用系统。这个不仅仅是信息孤岛,不仅仅是一个一个的信息的烟囱。怎么样去打破这个烟囱?打破这个孤岛,怎么样让这些数据发挥它的价值,这是我们现在面临的一个问题。
第二个问题,我们现在的数据,刚才前面讲了,不动产登记,我们要进行全国的联网,要接入一个统一的平台。我们马上要进行的三调。我们的这些数据,面向全国的这些数据集中到一起,我们不说全国,拿到哪一个省的数据集中到一起,我们现有的技术平台都存在很大的问题就是,性能很慢。包括你像这个里面,包括显示方式受到局限,我们现在要把一个省的数据要显示渲染出来,我们都是用什么?大家都知道,用切片的方式,但是切片存在很多问题。耗时比较长,同时切片比较耗存储。同时,切片,数据一旦发生更新的时候我们的切片必须要重新切。另外我们的空间分析很慢。
同时,由于大规模的地理信息数据在空间分析的时候很慢,现在大家都知道用过手机都知道,我们现在讲用户体验,互联网的APP这些产品要讲用户体验,但是我们作为政府信息化里面我们的用户体验一直都不是很好。因为我们的分析很慢,我们的一个空间的分析,一个叠加的分析,经常要一分钟,或者说十几分钟才出来结果。这样对我们的用户来讲是很难以忍受的。
所以说在这种情况下,比如我们要做一个审批,我们用分析直接支撑,很难提供这样的一些决策的支持。另外,我们现在面临的数据,都是多元异构的数据,这些数据里面有结构化的数据,有非结构化的数据,有空间数据,也有非空间数据。这些数据,作为传统的数据中心,它是一种什么方式,数据的堆砌,我们缺乏数据和数据之间的关联、融合。我们的空间数据和业务数据是两张皮,这是它的问题。
再一个我们的大规模,或者超大规模的多元异构的空间数据和已有的数据怎么样进行一体化的管理,怎么样进行共享交换,怎么样对它分析挖掘,这些都是很大的问题。这个问题不解决,我们前面讲过的数字城市,智慧城市基本上是空中楼阁。
我们看一下对于国土资源,大数据的需求,我们需要整合,需要我们解决刚才说的多元异构的数据进行整合,进行关联。我们对大规模的空间数据和业务数据,我们需要提供一体化的管理。对于大规模的空间数据我们需要快速的展现、分析。需要更全面的对这些数据进行模型化的指标体系,需要我们定制化,宏观和微观数据的一体化的分析、挖掘。
我们看一下在这个里面的一些解决方案。首先一点我们是通过并行计算解决方案,基于云计算的。传统的计时平台作为一个空间分析,它是怎么做呢?用CPU资源,内存资源,存储资源,它是串行方法在做。在云环境下面我们的数据,它首先对数据进行分块,在不同的计算结点通过分布式并行的方法,计算之后再合并形成新的结果。这样就能够大大的提高我们的性能。提升性能对比,我们可以看到,基本上随着数据规模越大,这个性能提升的幅度越大。大家可以看到我们的显示,包括分析都是这样的。
当10个G的时候,性能提升将近70倍,当数据达到近20G的时候,可以将近提升110倍的样子,这是性能提升。另外一个我们的解决方案,用规则引擎和流程搭建的方式解决,规则引擎,我们现在知道我们很多数据有很多来源,有很多数据类型,有不同的数据格式。在这个里面,不同的数据的输入,它还有不同的运算,而我们要做空间分析,要做数据库里面的字段进行关联等等。这些对数据的操作,我们可以把它想象成,对数据的操作就是我们的加减乘除,我们数据本身就是一二三四五,和加减乘除组合到一起就是新的一个一个的业务模型。在这个里面我们用规则引擎,将对数据的操作,把它最小化,一个一个的归成因子来进行管理。
在这种情况下面,我们得到一个新的模式的变革,我们采用这种方式,用规则引擎和流程搭建,与传统的软件工程的模式有很大的改变,这个改变在于,传统的软件工程的模式,变成了流程搭建的模式,过程的简化,原来通过需求,再设计再编码再测试,再交付。现在变成了需求、搭建、交付。大大的简化,响应的周期缩短了。另外一个很重要的优势就是用户可以自己交付,因为搭建他自己知道他自己的业务是怎么样的。它自己用流程搭建,用规则引擎,用系统,就可以得到它自己想要的一个模型。
这样有一个好处,需求的响应由原来的被动式,变成了现在的主动式的适应。由原来的穷举式响应变成了现在的函数式的响应,原来的需求发生变化,经常是软件的提供商,领导等一等,我们这个功能开发可能要一个星期的时间,你要给我一个星期的时间,如果时间再长一点,需要一个月,那是不是还要考虑一点费用的问题等等,现在不用了。现在就是,用这种主动式适应去解决这种未知的业务变化或者频繁变化的业务,能够使它快速响应。
另外一个我们的解决方案里面强调一点,模型化的指标体系,这个模型化的指标体系建立在刚才说的规则引擎上面。我们现在对于国土资源的大数据里面有几种类型的指标,一种类型是基本指标,基本指标就是我们面向国土常见的角色分析和应用的要求,能够反映总体的经济形势,国土资源开发利用和发展水平等内容这样的一些指标。
另外综合指标,综合指标,我们不能够简单的得到,我们需要通过一些分析,通过一些预算,由基本的指标结合各种复杂的运算得到的这样一些指标。
在这个里面,我们基于规则引擎,基于规则因子和应用模板实现业务的已有系统的快速灵活的搭建。我们可以搭建面向业务人员的,也可以搭建面向领导的等等。
这是它的一些像这样的一些建设用地规模分析,土地利用结构分析,等等有很多这样的指标。这个是建设用地用地规模的基本指标和用地的结构基本指标,用地布局的基本指标,在这个基本指标之上我们可以进行组合,组合成一些新型指标,用地结构的变化情况以及用地布局的趋势。形成真正意义上的建设用地的综合监管。以建设用地扩展看来我们其他的国土的业务同样,比如说我们扩展到房地产的供需需求的监管,我们养老服务业用地土地供应情况,耕地时空变化等等。这就是刚才讲的基本指标和综合指标的应用。
这是我看到的一些,用基本指标和综合指标进行分析以后一个形式分析,我们可以看到,我们2016年的建设用地延续上年的收紧趋势,现在下降了多少,我们的矿业权许可证持续下降,各种各样的形势分析,它的指标体系,这些分析基本上是一些综合指标。
另外就是我们的宏观微观一体化的数据分析。我们的数据挖掘分析,我们有不同的目标,不同的目的,不同的领导可能有不同的想法。在这种情况下我们基于规则的自定义的大数据的挖掘分析,可以通过可视化的搭建,完全复杂的模型,页面的定制化的操作,能够统一宏观和微观的数据分析挖掘的需求,提高终端展示的灵活性。这是简单的看一下一个小例子,比如说这是湖南省的,全省的用地的情况。
在这个地方,我们在不同的省,不同的市里面,比如这是怀化市的用地的情况,我们还可以继续赚到详细的用地信息,直到每个地块,这是宏观微观一体化的展现。
这是一个简单的案例分析。这是我们在湖南省地理信息公共交换共享平台,这里面详细的就不多讲了。它是一个数据总量已经达到350T。这是它的一些图层。这是我们刚才看到的,这是一个数据。这是各个市的指标情况,这个是地图服务,可以切换到一个指标服务,它每一个市,指标都在联动。这是怀化市的,我们现在看到的是怀化市的2006年到2016年之间的建设用地的变化情况。这个在图上可以对它进行一个快速的演变,进行时空的推演。这是它全市从2006年到2016年的建设用地的变化情况,可以看出全市经济发展状况,或者是它发展的重心在东南边。后面不再进行播放了。
简单的小结一下:我们整个国土资源大数据的应外,数据关联,融合是基础,大规模图属一体化是根本,高性能云GIS平台是保障,模型指标体系是关键,挖掘分析决策支持是出路。我们时空大数据中心高性能云IGS平台是国土资源大数据应用的必然选择,我的演讲就到这儿。谢谢大家!

{{item.content}}