分享
Scan me 分享到微信

郭晟:互联网地图-将大数据整合与服务解决方案结合起来

立德空间信息技术股份有限公司董事长郭晟以“互联网地图-实用的大数据整合与服务解决方案”为主题,在大会现场进行了精彩报告。

以下为立德空间信息技术股份有限公司董事长郭晟先生以“互联网地图-实用的大数据整合与服务解决方案”为主题,在大会现场的演讲内容(未经本人审核):

郭晟:尊敬的各位领导、各位专家、各位来宾:早上好!

泰伯网

刚才,几位院士、专家讲的都是非常高大上的题目,我从微观角度说一点,我的题目是“互联网地图--实际永远的大数据整合与服务解决方案”。包括三方面内容:一、政务大数据整合的瓶颈。二政务大数据整合的方法论。三、互联网地图提供的实用大数据整合技术路线。

一、政务大数据整合的瓶颈

目前,很多城市开展了相关的智慧城市建设工作,但是,我们的城市还不够智慧,这几张图片是令人心痛的,北京的雾霾,天津的大爆炸,深圳的垃圾坍塌,上海外滩的踩踏事件和武汉的“看海”,这是“十一”黄金周到处人满为患的景象。

为什么会出现这些现象呢?我们从技术角度分析的话,无非这样几个原因:第一,我们的智慧城市顶层设计,由于得不到大数据支持,所以,我们还是处于工程设计的阶段,难免头痛医头脚痛医脚,所以,出现城市水涝、交通拥堵、气象问题、环保问题就不足为怪了。第二,从目前的建设来说,统计数字表明60%以上投入到传统的IT设施上,就是投入在硬件上的占60%,对于软件的投入非常少。第三,我们没有一个大型的智慧城市仿真系统来支持我们的设计、管理、运营、服务。最大的问题还是在于数据本身,我们现在还是有很多信息孤岛,我们的决策也是碎片化的。以至于习总书记两次站出来说“要打通信息壁垒,构建全国信息资源共享体系。”10月6号,政治局学习会议上,习总书记强调“要以建设新型智慧城市为抓手,实现数据、技术和业务的融合”。智慧城市建设第一步一定要实现政务大数据的整合和开放,数据整合是智慧城市必须的数字基础设施,是经济有品质、可持续发展的发动机。

四年以前,立得空间率先在全国提出了智慧城市运行中心的概念。近几年以来,大家基本在顶层设计里沿用了类似的概念,智慧城市需要做运营中心,运营中心实际上需要政府首先在机制上作出保障,机制的保障非常重要,我们当初提出这样一个架构,城市的一把手、二把手一定要担任城市的首席运营官,这是类似于企业化的定义,叫COO。由几十个委办局负责信息化的领导、副局级干部担任联席会议的委员,以联席会议的方式对整个城市进行总体规划和顶层设计,参与整个城市建设、运营过程。在这几年的实践过程中,我们看到很多城市并没有支持就开始进行智慧城市的建设,所以,效果非常不好,我们后来也在挑选客户,如果有些客户的机制不到位,你跟他谈智慧城市和大数据整合,往往结果会是这个样子,蓝瘦香菇。

智慧城市顶层设计架构图,我们还是从微观角度指出几个需要突破的技术瓶颈,一是机制和制度设计方面;二是科学的标准和规范;三是政务大数据的整合;四是时空大数据平台的建设;五是云到端的运营实务体系的建设。当然,再说细一点,我们有很多技术细节问题,比如数据怎么采集、怎么整合、怎么管理、共享和发布?怎么保持持续的更新?

二、政务大数据整合的方法论

第一,简单的目录交换不是数据共享。现在很多城市为了交差,委办局做一个门户网站,把目录公开了,联成一个网络,认为这就是大数据了,其实这是很错误的做法。稍有技术常识的人都知道,不同规格和时效的数据是没办法进行整合和交换的,更头疼的是有些部门把自己的原始数据拿出来公开,没有用,我看了北京、上海信息公开多网站,我觉得这是迈出了很可喜的一步,在当年的技术阶段迈出的非常可喜的一步。

第二,用户需要使用的是“熟数据”,而不是“生数据”,美国其实也是这个情况,有时候把自己认为好用的数据提炼出来,对于其他用户来说,一个数据需要根据自己的应用场景进行定义,这就是数据整合的诀窍。

第三,不同机构、企业之间数据需要统一标准后才能实现共享与交换。比如一类有关人的数据和公安局、民政局关于人的数据,如果大家不统一到身份证这样一个标准上,大家不知道怎么整合数据。

第四,不能动态更新和实时评估的数据不具备交易的价值,很多部门还是按照传统IT项目来立项,申请一千万,把城市数据整合了,但是,没有考虑到后续的更新,更新准和机制也没有,所以,数据迅速的变成了冰箱里边的剩菜,慢慢的就没有价值了,这个问题也非常严重,很多很超前的企业没有考虑更新频次的问题。不能更新,不能实施评估。

第五,未经有效整理的政务数据商用价值差。

我们再把话题说回到大数据中心,我们的建议是这样的:第一,抽取各个部门所需要的共性数据,建立政务公共数据集。第二,总体规划,定义各部门统一的目录体系、数据标准、共享交换协议与质量标准。什么意思?包括地理信息、人口信息等很多信息都是重复建设,每个部门按照自己的标准定义,然后自己建设,这些数据到了后台不能交换,我们要抽取公共的数据,只有公共的数据才是可以拿来共享的,因为公共数据集有总体规划,需要统一定义各个部门的目录资源。第三,流程方面,首先要重建流程,确保大数据中心和各个委办局之间的分工和协作。第四,技术层面,把原来分散的IT孤岛设施全部整合到云端架构上来。第五,规范数据服务,负责数据质量和服务质量。

具体怎么干呢?我们也有一些困惑,很多城市说我们到底是做一个大而全的系统,还是做一个小而精的系统?不知道怎么办。大而全的系统这么构成的,搭建真正意义上的时空云平台,对数据进行建模、挖掘、仿真,做运营系统,叫智能应用,这样一个系统的建立是巨大的挑战。如果做一个小而精的系统又有什么问题呢?我们担心做来做去是不是在这个行业或者在这个区域里做成封闭系统,以及是不是影响不够大的问题。所以,我们应该一起探索“互联网+”的大数据整合与服务方式。互联网有什么好处呢?大家都有自己的结论,我引用互联网牛人说的牛哄哄的一句话,互联网有什么好处?天下武功,唯快不破。

三、互联网地图

第一,极简,按照用户需求设计,不增加无用的内容与功能。第二,追求及至体验,贴近生活,快速响应、界面时尚、无需培训。第三,功能强大,按需服务,因为是云端架构,大部分运算全部在云端完成,大部分内容推送也在云端,只需要在手机上操作。第四,整合大数据,无论你有多少数据,全部通过云端的分布式部署,可以无穷无尽的叠加内容。第五,数据新鲜。目前为止,互联网地图可以实现按天、按周、按月的分析。第五,以人为本,互联网大量收集用户体验数据,根据用户的喜好、兴趣、使用习惯这些反馈来进行快速的改进,我们非常喜欢互联网产品。第六,用户产生数据,UGC方式,比如6亿手机用户的数据,我们既是使用者,又是数据的生产者和贡献者,我们数据也传到云端,最后形成良性循环。互联网地图让我们做测绘的有一点郁闷,我们以前谈Web技术,但是,没有在手机端形成任何影响,出局了,目前为止,互联网地图是在移动端全面占有,并且现在正在向商用地图领域进发。

生产体系,通过移动测量和传统的测绘方式采集数据,但是,这些不够,我们还需要通过一些情报的技术采集来自于互联网、来自于传感器的数据,整合业务数据,最后全部扁平化的放到云端,利用云这套生产线完成整个数据采集、生产、整合与服务,所有数据整合完以后,变成可以被管理、可以被建模、可以被仿真、可以被用的数据,比如可以应用到各个场景,大家对数据采集非常熟悉,通过一些高端的移动测量装置,在街上也好,在空中也好,我们采集各种各样高精度的地理位置数据,很快的对这些数据进行处理,处理后,建立三维模型。模型可以用于很多仿真领域,应该谈大城市的仿真,这样才能解决李院士说的交通、环境、饮水问题。我们的路线是把大数据整合到三维平台上,叠加社会资源,然后建立很多应用仿真,支持各个领域的应用,比如交通、智慧城管、大旅游等等。

总而言之,我们通过互联网产生的情报系统,我们可以对数据进行有效的整合,互联网数据采集工作都是全自动化的,我们大概监控了三千多家网站,比如政府发布的官网,我们还监控了一些社会化公司发布的信息,比如做电商的,比如做地图的,比如做O2O社交的网站,我们实时监控,机器可以不休息,24小时在网上抓取有用信息,抓取以后自动进行比对,然后下达生产任务,把生产任务下达给各地分散的作业队,告诉你哪条路我们确认不了,你去确认,确认之后,放到云端进行处理,当然,云里面有很多技术,包括数据的自动采集、ETL机器,包括我国很多数据的建设是ETL,笼统地说,好象就是监控,其实建库并不是最主要的,建库还是属于传统IT小数据的概念,监控就是报表,就是数据库,大的概念不是这样的,比如6亿手机用户的信息怎么监控?没办法监控,ETL过程中一定要做机器的智能学习,这样的数据才是真正的大数据。

我们以前的生产平台都是以职工制定的工艺为基准,以后的生产平台全部是基于情报驱动的,一定要利用网端搜索爬虫技术来做,否则的话,你的系统就过时了,就被时代所抛弃了。我们会实现所有数据自动化采集、差分比对、自动成图、实时监控,形成能够按天、按月甚至按小时的更新,我听说谷歌有些更新可以按分钟了,当然,这肯定是趋势,手机上发出一个信息,第二分钟的可能时候被更新了,这个过程不需要人干预。

我们现在做的系统,比如早上起来我们发现交通局发布了一个信息,8点高架桥被开通了,我们可以在网上进行合适,何时候,我们把工作直接交给生产系统,生产系统安排计划,如果需要人工核实,我们就到现场核实一下,如果不需要人工核实,我们自动的排在生产线里。所有地图的逻辑导航链条,所有属性的配置,都是自动完成的,包括地图在手机端的渲染全部是自动化的。信息化测绘体系下传统测绘单位转型升级利器。

谈到怎么整合社会化大数据,假设你的地理信息空间库做好之后,其实本身就是时空平台,我们大量的考虑空间的问题,根据时间的排序,这本身就是时空平台。在这之后,后面整合人口数据、交通、医疗、教育等,这些工作变的非常简单了,我们需要做一些关联、配准,整个大数据在时空基准上配准。可滚动发展的大数据中心,第一,四大库整合。第二,公共数据库,我们说的具体一点,四大库、交通、房屋、环保、卫生、教育、医疗、养老、公共基础设施、政务公开等。政务控做完以后,以互联网地图的方式对外进行服务,总规和制作过程全部基于互联网地图,所以,发布变成非常简单的事情,也就是互联网公司干的事情,我们都可以干,把大数据整合、共享、开放、服务全部完成,所谓智慧城市一捉图,云端互动系统就建设完成了。在佛山整合了58个委办局的数据,在国内做的比较前沿。我们注重于满足政府、企业高端应用服务平台,目前为止聚焦了车联网商,目前为止平台上有两百多万台车,提供7×24小时在线服务,每天访问次数超过1亿多次。

传统IT架构的信息系统开发的弊端,一般IT项目都在10个月以上,做来做去,还是做一个烟囱,用不起来。我们想推荐的是云互联网+时代信息系统,就是从小处着手,第一步,搭云基础设施,其实不用搭,公有云直接接多现有的运营商云里。第二步,做一个资源池,或者某一楼数据,比如就是地理信息,比如就是人口数据或者法人数据,重要的是利用刚才的方法对数据进行聚类,然后做管理共享,这项工作很快可以做好,然后开放式的数据机开发环境,微信刚起来时候非常简单,语音通话和文本信息,用户从0开始到几万、一百万,最后到6亿,大数据资源池,不断通过用户累计形成自己的大数据,大数据形成之后,系统建立起来了,系统变成了平台,平台变成了生态,这就是我们所梦想的事情。我们做信息系统的时候,我建议以这样的方式来做比较靠谱,否则的话,大家都很累,做了以后,用户的思想跟不上,做的很焦灼。现在一定是“互联网+”的方式。

总而言之,如果这么干下去,各行各业应该是全面开花的结果,数据的提供者,无论是政府、企业,还是个人,会形成越来越大的开放数据集,在数据平台之上,可以建立我们的时空共享平台,在上面做交易、分析、存储,我们开发出来数据之后,上面会有一些开发者针对用户场景完成各种应用及服务的开发,最后是数据的使用者享受了数据的价值,获取了利益,并且他更喜欢这个系统,形成一个循环。我强烈建议我们要借助互联网企业成功的大数据模式,以滚动式发展,推动政务大数据的整合和运营体系,服务于我国新型智慧城市建设。

谢谢大家!

上午的精彩内容分享先到这里,下午我们继续!

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开