分享
Scan me 分享到微信

高德软件部门总经理 李俊彪《LBS大数据——从理论到实践》

  主持人:下面有请高德软件有限公司政府与企业应用部门总经理 李俊彪作介绍!  李俊彪:大家都知道,LBS服务这些年来,发展非常迅猛,从我们角度看,LBS发展这么多年,也有很多服务,但是它解决最关键的问题

  主持人:下面有请高德软件有限公司政府与企业应用部门总经理 李俊彪作介绍!

  李俊彪:大家都知道,LBS服务这些年来,发展非常迅猛,从我们角度看,LBS发展这么多年,也有很多服务,但是它解决最关键的问题,应该还是这么几个问题,一个是我在哪儿,第二是我去哪儿,第三是我怎么过去,围绕这三个和比较主要的LBS服务方向,会有几类服务去应对主要的问题,一个是定位服务,我在哪儿,大家依靠的是定位服务,我去哪儿,这就是搜索推荐,对于怎么去,大家用得更多,这十几年也非常普遍了,就是导航。这个是LBS比较重要的解决的用户三类问题。

  在解决这些问题的过程中,用户使用这些服务的过程中,会产生很多的大数据,这些大数据同样面临的四个工作方向,我们怎么去获得这些海量数据?怎么样让用户贡献数据?这些数据怎么进行大数据挖掘,去获得更多的价值,面对很多个性化的数据,非结构化的数据,我们怎么进行存储和服务。这个是通过LBS产生的大数据,让它面临的几个工作方向。

  所有的提供给最终用户的,虽然大家看的是各种各样的服务,实际上还是以数据服务。我们用LBS最多的,就是我在哪儿,周边有什么,周边餐饮里面,有没有优惠活动,这也是一种数据。更别提我们导航过去,从A点到B点,本就需要依靠很丰富的基础服务网和道路规则属性,所以我们觉得LBS服务,归根到底是数据服务。所以从上面也可以看出,LBS服务最主要,最关键应该还是数据。下面我们也可以从刚才那几类主要服务里面,来看一看高德公司是怎样来去进行海量数据获取,以及用户空间数据和大数据挖掘的工作。

  第一,我们看定位,就是我在哪儿?这个一定需要你的定位服务,我们来看,如果你要实现定位服务,它所需要具备的基础设施就是种类繁多,数量极其大的,我们现在在移动终端,在手机上做定位,GPS是标配。我们还有更多的使用传统,比如在屋里,GPS进不来,那么怎么办?这时候的定位需要依靠基站和WIFI,更何况现在还在不断涌现新兴的定位技术,还有各种传感器的使用,所以将来这些在微观环境下的定位东西会越来越多,可能是十亿上百亿的规模,这些基础设施我们全采集齐了,也会有很好的应用。面对海量的数据,依靠企业的力量去采集,我觉得这个肯定达不到应用需求的,满足不了老百姓应用需求,所以大家都在想,要靠用户去贡献数据。实际上我们高德公司,在用户数据上,还是做了很多工作的。比如我们现在的定位,用定位去匹配,用手机自带的定位,这样的应用有很多,我们自己的导航和地图应用,如果再加上阿里的相关客户端应用,比如淘宝客户端,天猫客户端等等,所有这些我们现在每天定位的次数,实际上接近了百亿,在百亿上下。实际上百亿定位,相当于是用户在给我们空间数据,当然我们拿到数据以后,会反馈更用户,提供更好的服务。这是用户贡献数据,在定位的时候贡献更多的定位数据。

  比如我现在上面画两张图,这实际上就是一个定位分布图,大家可以看这个定位,红色的这张图,我们稍微思考一下,我们看这个定位图可能反映出我们国家人口分布,我们国家的经济分布,甚至大家再仔细看有点小,比如我们看台湾,有很多大陆人去台湾旅游,我们可以看在台湾我们的定位,普遍都是偏向在西北,实际上我们看地图能够看出来,西北从基隆、台北到高雄这些都是繁荣的地方,所以一个地方旅游的热点从一张图上也可以看出来。

  另外这张图可能我们想象的空间就更多了,比如在空间城里面,什么时间,在哪个区域,我们通过定位可以判断哪些是商业区,哪些是住宅区,再结合天猫淘宝消费数据就更有意思了,我们可以看到哪个区域,哪个时间消费什么产品最多,或者什么档次产品最多,把这些综合数据分析起来,可以为广大商业企业和政府提供帮助。这些是结合一些大数据分析挖掘的成果,实际上价值非常非常大的。我们公司内部来做一个事,做一个个人的输入输出的APP,我们把这个APP打开,我们今天一天经过的地位都可以定位,同时还可以进行编辑功能,我们编辑以后可以保存,可以发送给朋友,也可以共享给更广的范围。

  还有定位服务,可以对弱势群体进行监管,像这样的服务都是基于定位产生的价值应用。刚才说了我们怎么去,第一个是定位,然后怎么去,我到一个地方,这就需要一个导航服务,从导航来讲,它的基准数据也是海量的,这个是把几百个城市,目前的道路里程是四百多万公里,我们且不说在每条道路上,实际上还有很多属性需要我们去获取,比如说车道事故,它的交通规则,交通属性,所有这些实际上也是海量的数据。目前的导航,仅仅说你有一个导航数据还远远不够,大中城市现在拥堵情况一天比一天严重,所以现在高德公司我们做的导航,我们做的出行,都是要跟实时交通结合起来,说白了就是提供一个躲避拥堵的方案,从A点到B点不一定是走堵的路,是走最快的路,实时交通实际上更是海量的数据,实时交通高德有近百辆车贡献实时交通数据,像这些数据定位要求都很高,很多都是十秒一个定位,有这么多的车,每十秒定位一次,数据量是很大的。还有实时交通讲的就是实时,这么大量的数据,在几分钟内就要进行处理,不仅能采集到,还要把它进行处理,处理以后变成服务发布出去,所以这个对于导航来讲,有两方面产生大数据,一方面是道路常规的,还有是智能交通,这两方面结合起来,才能为用户提供比较好的出行体验。

  这是我简单截的一张图,大家可以看到,在一平方公里的地面上,就会产生这么多的数据,而且它的数据来源是不一样的。导航这么多数据,变化也很频繁,我们做了一个统计,因为我们每年一直到重大节假日之前,高德公司都会做一些提前规划和情报储备,根据我们现在的情报,十一以前,全国新开通的道路,将近三百条,就是在十一前,包括献礼工程的道路大概有三百多条,这还不包括平时可能每月每日都在开工的道路情况,一些低级别道路,或者临时的修复。可见实时性的内容非常多,实时性堵车更是,即使我们常规导航的路,也是处于经常变化,增加或者修改的状态中。所以对于这样的数据,一样我们必须要依靠大众的力量来去获取,所以高德也有一套比较完善完整的服务,贡献道路实时交通的数据,最主要的还是应用我们几亿用户,以及我们在行业很多的服务和合作伙伴,每天都可以不断给我们贡献稳定数据,通过稳定数据可以我们实现实时交通服务,另外通过对实时数据挖掘,我们可以发现已有的路网和交通规则的变化,所以这个是我们在导航服务里面用户贡献数据的一点点体会和做法。

  在导航当中大家也可以看到,我们地图服务里面,也会有交通事件,这个是跟新浪微博进行合作的,在新浪微博里的用户如果谈到交通事件和交通信息,在高德地图里都可以实时看到,这个数据获取还是比较准确的,所以这个是导航的数据贡献的一个体现。

  还有就是我们说到导航累计数据的挖掘,挖掘以后可以产生很多的成果,你可以形成实时交通,可以补充你的路网,可以在已有路网把交通规则完善补充,高德在前两个月,我们已经发布了两期全国主要城市拥堵指数,比如排名第一期第一是杭州,第二期是上海,这是我们结合我们实时交通技术和统计来源,通过自己的算法发布出来的,本来是想提供交通部门使用的,没想到惊动了地方政府,很多地方政府都来找我们,杭州政府甚至找到阿里巴巴去了,说为什么你们把我们排在第一,这是我们没有预料到的,当然我们也和政府进行了几轮切磋,对于它的城市交通规划,对于它的智能交通建设,他们也发现我们能帮他们做一些事情,所以现在也逐渐的接纳我们,这就是通过导航数据服务和累计数据挖掘带来的好处,现在不仅对老百姓,对政府也有帮助。通过数据挖掘,我们还可以形成打车指数,这个比较简单,因为我们实时交通很多的信息来自浮动车,浮动车最主要的是出租车,所以我们有出租车空载的状态和位置,通过现在数据和历史数据,可以形成在一个城市里,比如现在要打车去哪儿打,城市里面哪些是好打车的区域,通过现在的数据和历史数据挖掘都可以得出来。

  还有一个是我们我要去哪儿吃饭,去哪儿玩,去哪儿拜访客户,进行商务谈判等等,这个去哪儿更多的是在依靠搜索推荐。搜索推荐实际上推荐搜索的都是POI信息,POI信息也具备海量特性,全国达到上亿。这些上亿的信息需求,还有很多的POI,数以千万的POI,它的深度信息是被老百姓所关注的,是被公众所关注的,就像一个餐厅营业时间,消费水平,有没有包间,能不能停车等等,这是每个去这个小区吃饭的人都关心的,但是这些信息要靠实地去采,这个成本太高了。所以在这方面,这种深度海量信息获取,我们更多的是跟垂直行业合作,和相关的机构部门进行合作。还有一类是动态信息,大家知道生活类商家促销是经常性的,今天可能有一个特价菜,明天可能打五折,这些信息更没办法实地采集了,但是这样的信息,是老百姓最关注的,是每个用户最关注的,因为它实惠,比如我想吃又好又便宜的东西,这种实时动态信息非常关键,这些信息肯定不能完全依靠企业的自采。除了这些信息以外,虽然你有那么多合作,不是说数据拿过来就可以了,这些数据我们做完以后发现,不同公司对同一个POI,大家的名字都不一样,分类也不一样,所有这些不一样,差异化的地方,实际上就需要比如像我们这样的公司去做一些工作,去做一些排除,做一些相似度计算等等。通过这些工作,甚至我们要掺杂一部分人工的工作,目的就是把不同的优势企业,它的数据最后能够合并到一起,变成一个统一的服务来提供。所以POI数据,它面临的不仅仅是海量,当然更重要的是需要用户进行贡献,现在我们更多的采集方式,一个是用户直接反馈,用我们地图服务的用户大概超过3亿,就是手机上的用户,所以我们在我们手机上给用户提供一些入口。另外我们还有情报部门,他要时刻关注一些其他媒体,官方媒体,通过一些技术手段,来尽量获取一些信息。还有现在做的比较多的是众包,我们怎么样让地方的人给我们贡献东西,这些也是我们在如火如荼开展的一项工作。基于POI大数据挖掘,也会产生一些有意思的东西,形成一些商圈,和用户结合起来,这些都是通过大数据可以做出的。对于用户我在哪儿,我去哪儿,也可以结合POI挖掘出来。所有POI数据,怎么表现这是非常重要的事情,围绕这个问题,我们也开发了一个组件,就是云图,云图是构建在阿里云基础之的,通过APP方式,可以让用户很方便使用。云图有三个功能,一个是存储数据,二是检索数据,你存进去以后,可以产生高并发。三是显示数据,我们支持用户对自己的数据进行单独渲染和实时渲染,你怎么展示都没问题。我们还提供一个应用变现的功能,如果你是带O2O服务进来的,我们也欢迎你进入我们云服务里面去,如果有第三方的服务,有用户通过你的定外卖,收益我们会分给你一部分。

  我今天的演讲就到这里,谢谢大家!

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开