然而,随着行业的发展,大数据采集已然不是那么顺山顺水的事情。随之而来的还有一个日渐逼近的事实:新形势下的大数据采集,靠什么?
工欲善其事,必先利其器。采集这些TB级以上数据只是靠星罗棋布在全国各处的采集车和测绘员?或说靠的是对传统纸质版数据的矢量化梳理?显然不是。
那么大数据时代下,从二维到三维,数据采集,靠的到底是什么?时下对于这些数据的采集,可以归结为四种模式。而这四种模式,分为两种属性,一种是利用相关设备工具采取并搜集数据,我们称之为“采之有方”;另一种是无需自己具备采集设备,而是通过一些渠道或途径来变相得到这些数据的使用权,这里注重的是一种共享和互换意识,如行业巨头兼并小数据公司、直接购买数据等方式,我们称之为“取之有道”。
其一,自主采集,方式更加多样化,设备更加智能化。与以往相比,采集空间地理信息数据,其变化主要在采集方式与采集设备方面。一方面,现在逐渐形成了“自主采集+众包”、“自主采集+众包+购买”多种自主采集方式。今天的采集方式不再只是单独自主采集,也不再是对纸质版数据简单处理应用。比如,高德凭借其强大的LBS解决方案能力,与各城市的交管部门进行合作,获取更多交通信息权威数据,在自主采集大数据的同时还建立了众包模式的交通信息上报体系。另一方面,采集设备智能化,以往采集数据基本为单向采集,更多的是将数据搜集简单处理,而今,遥感设备拍摄获取影像数据,全方位三维地理信息采集车在采集过程中可以将所有大数据智能化处理并即时反馈。
其二,“双拼”模式,即具备采集空间地理信息能力的企业和另外一家需要这些基于空间地理位置数据的企业合作。这种模式,严格来讲应该是一种共享共赢的复杂模式。举例来讲,阿里巴巴和高德地图的合作就是这种双拼模式,对于阿里来讲,共享高德的空间地理位置数据完全就是依靠这么一个斥资入股的手段。高德地图有着规模最大的电子地图用户群,且高德具备独立采集空间地理信息的软件资质和硬件配套设施,阿里巴巴入股高德地图无非就是想把O2O业务更加智能化,让淘宝的线上产品准确地推销到指定地理空间所有的人群。甚或会通过定位消费者地理位置来进行数据分析,根据行为路径判定消费者需求进而针对性投放产品广告。
其三,政府主导实施方略,企业技术参与。这种模式目前主要应用于公共管理监测。这种模式下,数据的采集方略全靠一根指挥棒,而指挥棒就在政府手中,政府所需数据完全会根据公共服务需求来定向获取,而这一过程,数据公司又担当一个“芯片”的角色,因为数据获取的整个流程都需要数据公司来设计对应的系统和硬件设备。这些数据的采集旨在提升公共管理效能,而非商业化。比如,泰瑞数创科技公司应北京市政府公共管理需求,协同北京地理信息部门绘制了三维地理信息系统——智慧北京。系统充分利用航空遥感影像、政务信息图层、政务电子地图等数据。为北京市政府构建了一个全市域范围的真实三维城市场景,实现了全市三维环境下的数据共享服务。这些直观的三维立体可视化效果让政府在城市综合管理、应急指挥、领导决策、检测监控等多个领域变得更为精准高效。
其四,直接购买数据。在这种模式下,能用于交易的大数据,严格意义上来讲是经过处理筛选后具有商业价值或社会价值的基于地理位置来提供相关服务的数据,这种数据兼具海量性和多样性,其使用价值极高。在国内,最典型的案例当属中国图资市场的双雄——四维图新与高德地图。苹果公司为开展基于地理位置信息服务的相关业务,直接向高德购买中国地图的测绘数据。而诺基亚则向四维图新购买地理位置信息数据,有媒体称诺基亚仅就电子地图数据每年就要向四维图新支付至少4亿元费用。除此之外,2008年,谷歌公司推出“谷歌流感趋势”,其根据搜索引擎上与“流感”相关的字词句出现的频率进行信息数据挖掘和分析,将这些基于不同区域、不同地理位置反馈回来的数据进一步处理成可视化的流感图表和分布图,进而对有流感蔓延趋势的地域加强防护,有着很强的社会价值。政府对于这种数据基本可以无偿使用,像俄罗斯、美国、澳大利亚等国数年前已有先例可循,而国内目前并没有将这些基于不同空间、不同地理位置的数据作为参考依据。
宗其所有,大数据时代,数据变得快而泛,采之有方,集之有道是目前采集各类数据惯用的两种路径。(文|本刊编辑 李保旭)
注:本文为《3S新闻周刊》原创文章,如需转载请及时通过邮件告知:news@3snews.net。

{{item.content}}