2017年6月13日,由泰伯网主办、主题为“空间大数据的崛起”的WGDC2017,在北京国家会议中心盛大开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过六个年头,如今成为全球最具前瞻性的跨界创新风向标。

13日下午,由四维图新主办的位置大数据峰会隆重召开。峰会上,世纪高通副总经理兼四维图新首席架构师石清华进行了题为“MineData企业级位置大数据平台”的精彩演讲。以下是现场实录:
石清华:各位领导,各位嘉宾,大家下午好!今天非常兴奋,也非常荣幸站在这里跟大家分享一下我们企业级位置大数据平台MineData。
说起大数据,这些年我们讲了很多,说了很多,做了也很多,我相信大家听到的可能更多,所以说我们今天不太想去讲大概念,我们只想讲一些小场景,我们希望通过这些小场景,能够让大家对MineData平台有一个比较具象化和场景化的认识,如果在这个过程当中引起大家一些共鸣,把一些场景化的设想能够投射我们自己的业务领域范围之内,今天我们发布会就取得了圆满成功。
这些年大数据已经发展得非常迅猛了,我们可以听到各种各样行业大数据的平台。我记得有一个图,现在已经更新到2017年版了。这个图比较详细的把我们大数据的行业进行了行业细分的划分,以及在每个行业细分行业里划分做的比较好的代表性的公司,我们的领域被划分在位置大数据这个领域里。我跟大家分享一下大数据过去、现在和未来可能的形态。
最开始的是纸质的时候,那时候信息化传播手段比较低,地图传播基本是靠纸,地图服务的领域也是几个比较专业的行业,比如说勘探、测绘、国防。再过了几年之后,我们发现在浏览器上有一些电子地图的诞生,那个时候比较方便,我们出门的时候打开浏览器,看看我去的地方在哪里。然后又过了一段时间,随着移动互联网的出现,基本上地图就是人手一套了,每个人手机里都是有地图的。
但是真正的节点发生在什么时候?有比较出名的几个事情,几年前出名的千团大战,打车烧钱大战,大家肯定还记得这个场景,那个传播的影响非常广。也就是从那个时候开始,地图真正服务于大家的生活,开始服务于各行各业,开始服务于我们生活类的、行车类、时政类的各种行业。那时候有一个说法,地图已经成为了O2O的一个入口。现在我们不管这个说法是否成立,但是我们最起码得到了一个事实,这个事实就是地图正式走入了大家的生活,已经开始给大家的生活进行全方位的服务。
这个事实一旦发生,就产生了一个信息爆炸的现象,也就是说在地图之上,地图已经不完全成为一个单纯的地图了,地图已经下沉为一个平台、一个载体,开始有很多人流的数据、人的轨迹的数据、车流的数据、车的轨迹的数据、企业的数据、物联网的数据,都纷纷带着位置标签,带着各种属性落在了地图之上,那时候地图正式进入位置大数据时代,所以地图和位置大数据是一脉相承的,是一个概念的不同阶段而已。我们之前说地图,现在说位置大数据,都是在说我们地理服务范围在不同阶段衍生一个不同的服务形态。
这个时候是什么时候呢?位置大数据正式的到来是什么时候?就是前几年,也就是现在,现在就是位置大数据爆发的时代。前面的视频上,大家已经了解的比较多,开始为各行各业进行服务。
我们再来想,这是地图和位置大数据的之前和现在,未来会发生什么?未来会发生什么导致我们一直在不断的去调整、思索我们的产品策略。大家都知道四维图新这几年发展是非常迅猛的,四维图新这几年收购了图吧,开启了自动驾驶、高精度采集,甚至我们投入了HERE 10%的股权,这代表了我们一直在思考地图的未来是什么,我们现在基本上有这么一个判断。随着我们不断的思考、不断的动作、不断的星座,在市场上不断的验证我们的想法,我们觉得对于未来来说,现在所有的地图的产品形象都是对未来地图产品形态的过渡。我们认为未来的地图可能会产生一个两极分化的趋势,首先是个人地图,个人地图现在还存在着大家的手机上,个人地图的使命依然没有变,个人地图依然要去解决我在哪里,我去哪里,我怎么去,我周边有什么的问题。但是这种问题的方法、解决的手段可能更加自动化,更加智能化,更加的AI。
现在有一个非常火爆的现象,不管我们上游的图商,还是下游的集成商,还是终端的厂商,都在做一个终极问题就是自动驾驶,我们认为自动驾驶是未来个人地图发展的中间形态,一个终端形态,最极致的一个形态。那时候的地图已经不再给人看的了,自动驾驶是给机器看的,什么时候发生我们还不敢预测,这个不是今天的重点,我们今天的重点是第二个形态变化,就是企业地图,地图开始为各行各业进行全方位服务的时候,各行各业就包括行车类、商业类、市政类,开始服务于各行各业的时候,那时候才是真正走入大数据的时代。也就是未来各行各业对于地图的需求将会更加专业化,将会更加高定制化。所以现在有企业地图存在吗?肯定是有但是我们现在简单来想,基本都是从当年TO C端研发过来各种各样的平台。我们所熟知的这些开放平台有什么不一样?包括国外谷歌地图,包括苹果地图,包括国内比较出名的厂商的地图,这些开放地图有什么不一样。因为同质化非常严重,是因为历史遗留问题,是因为现在大数据发展特别快,以至于我们来不及为企业单独定制一个行业化的地图,这个真正的动作还没有到来。
说到这里,可能大家就比较明白了我们的定位,我们的定位就是要解决企业地图的问题,解决企业大数据化、位置大数据化能力的问题。我们希望解决普适性比较高的问题,我们希望通过比定制化能力比较高的方式,通过我们积淀很长时间大数据的算法,让我们的客户在它的业务上更加聚焦得到大数据的解读,这是我们需要解决的问题,我们希望在这上面能够有所建树。
这是MineData大数据平台的整体素描像,如果想解决普遍性存在的问题的话,我们认为有几个关键问题要攻克掉。第一我们要有更多数据来支撑行业的业务,我们需要有更好的可视化的手段让行业的信息表达的丰富程度更加丰满,我们需要更多大数据分析的手段以及它的框架,让我们进行迅速位置算法的投产,从而在这上面定制起各行各业专业领域的解决方案。
我这样说大家没有一个特别场景化的认识,所以后面我花一点时间跟大家简单的说一下每个方面都是什么样的设想,以及每个方面的设想希望子模块做到什么样的定位。
首先是数据,这是出行大数据的概览和摘要。出行大数据只是我们数据仓库里一个大维度而已。比如刚才提到了,是一个老牌的图商,我们需要生产地图,把我们的导航电子地图生产出来。我们生产电子地图的时候就要去采集,我们要采集覆盖全国网络的采集能力,这是建设在全国有30多个基地的基础之上,每个基地都有一个车队,把这些信息采集出来并且存储上。有一个小细节,每个车上都有一到两个摄像头,每个摄像头每秒钟几(的速度不停地拍照片。
我们再反过来看,我们的照片数据存储是中国十多年城市变化宝贵的资料,我不是想强调数据量有多丰富,也不是想强调数据仓库有多么大多么全,我想强调的是这里是有问题的,照片资料数据是仓库里小维度,位置大数据是大维度,这些数据都整合到四维图新来了,四维图新现在有很多事业部,有很多分子公司,也有很多合作伙伴公司,也有很多投资公司,我们的数据都散落在这里,这里有一个问题,就是信息孤岛的问题。
我再给大家举一些例子,比如说政府现在强推大数据,我们已经不断出现大数据局,学校里出现了大数据研究院,各级政府和各个部门有大数据部门,这些要做什么。第一个要做的事情就是要有数据,上来碰到第一个难题就是我们要解决信息孤岛的问题。因为我们做过,所以我们明白,这是非常复杂的问题,我们之前花了很大的力气来解决这个问题。有一个类比,这个类比可能不太恰当。比如说我们政府有很多的数据,有公安大数据,市政大数据、金融大数据、物流大数据等等,但是这些口基本都是断裂的,这个口里还存在部、省、市、区、县等各层次的数据散落,所以数据信息孤岛的问题已经存在的非常严重了。
我们为了把我们的数据聚起来花了很大的工夫,之前大家一起在做一个事情,包括各行各业都在做这个事情,包括政府也在做这个事情,叫做“数据共享平台”。这个数据共享平台有这么一个动作,我建了一个平台,大家把数据定时的分别的把数据交上来。到现在再来看,好像没有起到当初的目的,我们的初衷并没有达到,是因为只要存在有人来交的这个动作,基本上都会有或多或少不对称的现象,最终导致我们就把数据聚集不起来。
四维图新也是一个很大的集团公司了,数据也散落很厉害。后来我们就换了一个概念,我们不再让人交上来,我们是自己去抽,去导流,数据在服务器上,服务器是在机房里,机房是在各个业务口里,各个业务口在各自的机房上健康的发展发展,我们就在机房里放在一个服务器,它的作用就是把数据引流出来,我们就建立一个三层网络,就是在所有业务口当中,我们把数据探针导流的方式出来,一个是业务非干扰式,第二种是自动化的,有很多探针进来,然后把数据汇聚到仓库里,把数据重新的进行融合、萃取,然后放到数据图书馆去。比如中药房,中药房每个抽屉上都写着是什么药,数据图书馆有一个虚拟墙,虚拟墙一些虚拟抽屉,然后写着是什么数据,写的比较详细。三层网络建完以后,它的数据从哪里来?还是从各个业务口来,每个业务口的数据抽上来自动的往上汇聚,这是一次间成,长期收益,不会存在人来交的动作,这是自动化的过程。第二是数据是自增长的,也就是今天是这个数据,一个月之后看到数据变多了,因为数据源泉是其他各自发展的事业单位,所以慢慢的形成了四维图新内部的数据生态,各方把数据汇总起来,然后反射到上面的数据图书馆上,图书馆又反射到其他业务板块里,让业务板块开发出更多的业务出来。
我跟大家说的这个数据蜂巢的生态不是讲内部?而是这套平台系统可以把它部署在我们合作伙伴当中去,可以部署到我们客户那边去,我们有凤巢,你们也有凤巢,两个蜂巢之间可以单向打通或者是双向打通。如果是单向打通,让你的数据在位置大数据方面保证数据的完备性和及时性。如果是双向打通的话,你的数据可以给我进行反哺,我的数据进行专业处理完以后再反哺回去。不仅是四维图新内部形成数据生态循环,并且和我们的合作伙伴一起形成了更加的生态循环的网络,所以这个对于未来来说是一个数据基石。并且这套系统对于我们MineData平台来上是一个数据基建的事情。
有了数据之后,第一个最直白的需求就是我要看各种各样的数据,并且我想看行业强化的地图。使用的方式比较简单,基本的产品设计理念是这样的。数据图书馆在这边,MineData平台在这边,如果我想看什么数据,把数据抽出来,把这个数据往上一倒就完了,我们叫做数据沙河,数据沙河在这个地图上就是一个图层,而这个图层可以随时定义化策略,我们可以打造成一个静态的,也可以打造成一个动态的,也可以打造成一个炫酷的。基本形成了一个企业地图定制化能力,但是这样还是不够的,因为我们现在展示的地图还有送达的屏幕非常多,比如说有大屏,有电视,有iPpad,所以我们在这方面提供了几个表现一致的引擎,我们希望能够做到并且现在已经做到了在一处配置其他多屏的表现效果是一致的。
做到这样我们认为还不够,因为我们想做到企业级的私有位置大数据服务,所以我们提供各种各样地图可视化的板块,比如各种轨迹跟踪图、火线点亮图、柱状图、热力图等等,基本形成了一个产品设计的目标,用我们的数据,用我们的工具来定制你自己的私有地图的方案,用你的数据加上我们的模板叠加出来你自己可视化的方案,形成你自己私有地图的解决方案之后,给它送到各个终端上。简单来说,MineMap就是把之前一个专业的复杂的配置工具,按照互联网的交互给它重构了,重新定义了,让大家用一个普通的视角,所见及所得就可以看到地图的展现方式。
后边还需要有大数据的分析能力,操作产品设计理念非常简单,数据在这里,把数据拿出来,选数据,配样式,出图。MineLab产品设计理念也非常简单,选数据、配算法、选模板、看结果就可以了。为什么要做一个算法集合呢?有这样一个场景,我们每年春节过节回家的时候,都会见到一个东西叫做人口迁徙图,春节之前返乡的人都返到哪里了,春节之后返京的人都从哪里来。我们从人口迁徙图可以看到某些城市的经济指标。
还有我们和万达合作了一个小东西,比如在北京石景山万达广场,来万达的人分别从哪里来的,作为购物中心黄金区是方圆十公里内的。可以分析到一些盲区,没有覆盖到的地方。
无论是人口迁移图还是商场来访图,对我们来说都是OD分析,从这里到那里的分析,对我们来说都是一个OD的原子算法,只不过OD原子算法套上不同的数据,在不同的场景里得到了不同业务的解读而已,这是整个MineData平台里最有想象空间的一部分。
对于科研机构,对于学术结构,对于研发机构,要做这种大数据分析最难的地方或者是最想要的地方是什么?是数据吗?是数据,但是也不完全是数据,是算法吗?是算法,也不完全是算法。最有魅力的地方是在于它提供了一个近似于真实的场景还原,我们用真实的历史数据,我们用真实的实时数据,配备长年累月真实的算法集合,去推断我们真实的业务情况。
我们去、做大数据分析的时候,往往都会采用抽样愈合验证系,往往在真实的场景里说之前的各种假设有很多没有想到的地方。所以位置大数据分析的时候,非常难的是一个真实场景的还原和它的提供,所以MineData它的使命和定位就在这里,虽然内置了一些算法集,提供了一个实验室,但是真实想完成的目的是提供一个真实场景的还原,在我们大数据分析业务的时候,让我们靠谱程度可以往上提高很多。
这是几个关键的组成部分,这个是MineData的组合部分,我们提供了能够进行各种高定制化、可视化的工具,我们提供了一个可以近似模拟真实环境的实验室,让我们的客户在此之上能够定制各种各样的行业化的方案。
怎么定制行业的方案呢?从历史讲到现在,从现在讲到未来,从MineData平台数据凤巢和M各个组织部分,最终目的想说这样的事情,我们做地图做了很多年,我们做了十几年,我们做位置大数据也做了很长时间,我们现在跟自己的人讨论位置大数据方案的时候,跟我们的客户在一起沟通产品设计的时候,我们做一个方案平台搭建的时候,往往都会把这些问题给它还原到这四个基本问题上,就是我们要做这个业务到底要用什么数据,进行什么算法,配备什么样的可视化,要解决什么样的业务解读,得到一个什么样大数据业务解读。MineData不再是一个单纯的平台了,不再是一个单纯的工具,它是站在搭建位置大数据方案的时候,或者站在位置大数据之上去构建行业方案的时候一种思考问题的方法,是一种设计模式。
比如我们在上学的时候,我们天天学设计模式,我们在工作中说我们的设计模式,在产品设计上、架构搭建上,方案论证上都在用我们的设计模式,这个设计模式是我们这么多年的经验总结。我们再去做位置大数据的时候,往往会回到这些问题上:要解决这个问题需要什么样的大数据解读,这个大数据解读需要什么样的可视化方案,要得到这种大数据可视化方案需要什么样的计算结果,这个结果用什么算法来支撑,这个算法的支撑需要什么数据的供应,正着说反着说都在问这四个问题。所以这次推出MineData大数据平台,我们不光是想把工具给大家,也不光是想把这个平台给大家,我们更多是想把我们在位置大数据上的一些经验、一些思考、一些对于问题分析的设计技巧都封装在这个平台上呈现给大家。我们光给平台是不够的,光给一些方案而不给出一些知其然而不知所以然也是不够的,我们要给出这个平台上我们所蕴含的设计模式,我们看到大数据各种各样业务问题的设计方式和方法论,所以这个跟我们的定位是有关系的。我们的定位依然是做to B。
这就是给大家分享MineData平台的所有事情,谢谢大家!

{{item.content}}