分享
Scan me 分享到微信

张弦:SOSO街景地图及平台策略

为期两天的2012地理信息开发者大会(简称:WGDC)在北京国家会议中心举行,在第二天的“三维可视化与虚拟现实”分会场,腾讯公司地图平台数据中心的总监张弦在会场发表了题为《SOSO街景地图及平台策略》的演讲。

  3sNews讯 为期两天的2012地理信息开发者大会(简称:WGDC)在北京国家会议中心举行,本次大会以“新技术、新模式、新商业”为主题,是地理信息领域最具影响力的技术性盛会,其宗旨是不断引领和促进地理信息技术的创新与变革。在第二天的“三维可视化与虚拟现实”分会场,腾讯公司地图平台数据中心的总监张弦发表了题为《SOSO街景地图及平台策略》的演讲。


 

  以下为文字实录:

  感谢3sNews使我们有机会在这里跟大家进行分享。

  刚才向总和前面的同事讲到了这些数据的采集方案以及实现的技术方法。对于像互联网应用来说,如果技术解决不了问题,或者发挥不了价值,这个技术就没有价值,或者说可能在遥远的未来才有价值。街景从2006年其实大家已经开始知道这个概念了,但是真正能够用起来,用得好,还差得很远。我们也是经过很多的分析论证,也是带有一些推测性质,去推断用户对于地图产品未来的一种需求,制定了我们产品的一个重要的分支特性,就聊一聊我们在这方面的思考,以及后面的一些展望。

  我讲一讲腾讯为什么考虑做街景?我们在做街景的过程中遇到的一些问题和付出的一些代价成本,然后讲讲我们街景和地图平台的一些策略。我们理解位置服务从古至今是人类最朴素的需求,现在无论是手机定位、地图还是GPS,其实都是在解决这个问题。这个问题最形象的看法,我们经常看电影,电影里面有一个魔术的水晶球,我们希望通过这个水晶球去看到这个世界。如果我们有了这样一个水晶球,其实我们就不再需要地图了。我们未来的地图能不能做到这一点呢?这正是我们一个产品努力的方向。我们希望我们的地图通过手机能变成一个水晶球,让用户通过这样一个延展性的工具,这样一个手机通过互联网这样一个网络连接,它能够实时的去访问这样一个真实的、丰富的、多变的世界。如果这样的话,它就产生无穷无尽的应用。在这一点上来说,它的诞生和移动互联网是等价的。

  在过去数百年的时间内,人类是借助指南针和图纸探索整个世界,这是非常痛苦的。位置服务对于大家来说都是非常迷茫的,如果能定位的话,可能也只能通过看看北斗七星,然后再参考一些简单的地图,但是这个地图是远远不够用的。随着GPS技术和GIS技术的到来,开启了电子地图时代,让地图成为数字化,并且诞生了像四维、高德这样的上市公司,创建了电子地图和导航地图时代。这个时代的特征非常明显,以电线面这种矢量化的,比较专业、抽象的符号,解决所有的位置问题。这些我理解就是,尤其是手机地图和这种免费的网络地图的推出,让公众能够免费享受到一些地图服务。这种服务现在来说仍然是很基础的,一个最典型的特征就是,我们统计过很多大量的数据,用户在使用地图的时候,他们仍然在使用最核心的功能,比如地图的浏览、搜索和导航,可能占到所有地图应用场景大概70%以上。有一个最基本的特征就是说,如果所有的应用都集中在最基本的应用的时候,就说明这是一个匮乏的时代。就好像如果我们每个人都为下一顿吃饭而发愁的时候,如果你吃饭的消费占了你个人消费的百分之五六十以上的时候,那一定是一个贫穷的时代。所以我认为我们现在的地图是属于匮乏的时代,我们需要大量的信息,它并不具有,只能勉强的解决我们定位以及到哪里去的问题,但是我们离水晶球这个梦想还差得很远。

  即使如此,在目前的电子地图以及API的形式上面,产生了各种应用,这个移动应用除了导航、电子地图、手机地图这些应用以外,是与地图本身相关联的,其他的应用,其实与地图本身的关系很弱。你说4Square是不是地图?其实我认为地图只是给它提供了一种核心技术,不算地图。大众点评算不算地图应用呢?我认为不算。还有很多签到的服务,真的是地图吗?我认为也不算是地图,只是地图的一个支撑,就像电池提供电能,在这种情况下,仍然反映出我们地图是处在一个匮乏时代,所能够提供的东西太少、太简单了。

  昨天听了陶闯博士的演讲很受启发,我感觉他也是帮我总结和提炼了这种思考的过程。我也是晚上修改了这个PPT,表达一下我的思想。我认为地图也是分为之上、之中、之下这三种概念,之下是基础设施,之中是一些数据本身,之上是一些真正为公众服务的一些应用。我们可以看到现在做到的就是通过GPS、AGPS来进行定位,通过无线网络进行访问。实际上我们还有未来更多的应用,离我们水晶球的梦想还有非常大的差距,比如我们希望室内的定位和导航,我们构建这越来越复杂的世界的时候,我们发现经常力不从心。北京南站我开车绕三圈,愣是没找到路口,北京机场,每次去的时候,我自己去接人都会再三的看地图,先把地图看得门清然后再去接人,我们面对这种复杂世界的时候自己都手足无措,我们的工具又不能帮助我们解决这些问题,这些问题肯定是需要解决的,只有解决了,我们才能生活得更舒适,而不是生活得更恐怕。所以这种室内定位肯定是未来技术上的一个必将实现的问题。我认为在未来的三五年之内,这个技术一定会解决这个问题。现在已经出现了四维定位的高度集成化的芯片,我没有使用过,更多的是实验室的产品,大家可以去网上搜索一下。还有高精度定位,我们现在定位的精度也就是10米、20米,再加上地图本身的偏差也就是20米左右,有时候准,有时候不准。我们希望我们的定位能够达到米级或者是分米级,这样的话能够解决的方式就更多。可以知道你在哪个路口的左侧或者是右侧,能解决更多的问题,这是定位层次的问题。

  我们还知道很多大量的地理世界的信息不能被收集,这种事情也是非常麻烦的,这是专业的图商都难以解决的问题。我们现在很希望打车的时候,这么一个小小的应用,我们现在都非常容易做到。其实现在北京每一个出租车的GPS装配率是百分之百。但是有了这个信息,本来是我们可以实现这种出租车的实时联网,但是实际上我们做不到。这里面整个产业链非常长,如果在此之上我们再考虑酒店、餐饮,所有的这些实时的鲜活的信息,我们都很难获得到。我们现在也已经有些突破了,比如说携程,你可以看到实时的房价,订酒店可能只需要花一分钟的时间就可以解决酒店的预定问题,可以了解价格、环境、房间数,这几个指标已经解决了你的大问题了。这个地图最重要的是要快速的解决问题。

  我理解互联网作为一个很重要的概念,现在都在说,在未来的5年之内,这个概念会分阶段的落地生根。比如像酒店宾馆、餐饮、公共交通系统、飞机航班、公交车、地铁,其实这些信号都可以被承载到我们的网络之上被用户所使用,已经接近我们水晶球的梦想,更近了一大步。再说地图之中,我们现在完成的地图是一种抽象的表达,点线面,点线面的问题,我们做过很多的演示,对于小众用户,甚至连学生都不算,我们再想一想五六十岁的人,从来没见过电子设备的人,他们在用这个地图的时候,他们有时候不明白,这个线到底是什么意思,他居然想不到这个线是个图,这就太恐怖了。即使在用的时候,也很难以把这种POI与这种路的空间关系转到实际的地理世界的空间关系。况且我们的表达又非常抽象,抽象到路左路右,路的哪个拐角,我们经常到了这个现实世界的时候,我们会围绕这个楼转一圈,然后找到这个入口。虽然这个点近在咫尺。但是可以说,我们现在用我们的导航图、电子地图的方法解决这个问题的时候成本非常高,困难非常大,而且用起来很难受。在此之上,我们还需要很多鲜活的信息,这种鲜活的信息不是说及时更新,而是说有一些比较及时性的数据,比如说停车场的车位,商场的这种数据,餐饮、住宿,就是我们日常生活中能够相关联到的信息,这些信息我们是不具有的。大众点评是提供了一个很好的评论信息,能够为你做很多决策。我们到一个地方找酒店的时候,你发现当你通过电子地图搜索,发现整个屏幕上全是酒店,这个时候你是晕的,他告诉你100个,不如告诉你3到5个可用的,你选择一下价位、环境和位置就不行了,告诉你100个,不如告诉你三五个,这种位置信息就是帮助我们做决策。鲜活信息更是没有,所以在这个时候,电子地图的应用是远远不够的,我认为未来的产业应该是现在产业的10倍以上。也就是说,我们现在产业整个的应该是20亿,我认为三五年之内,这个产业的可能性是200亿,这个200亿的概念和现在的搜索引擎是相当的。我们的地图现在是矢量化的,很专业。

  其实老百姓需要的东西是一个直观的,这种直观的东西就是说,我看到什么样的东西你就给我什么样的东西,我不希望和这个地图的应用之间有任何的差距。一个非常典型的启发就是iPhone,我们可以观察到,可能一个两三岁的小孩,甚至更小的小孩,拿着iPhone的时候不需要教,他甚至玩得比大人还熟练。也就是说它解决了人机界面非常简单的门槛,让之前的物理键盘变成了人的捏、拽、拖、滑的操作以后,你可以发现老人、小孩都可能用这个东西,用得非常顺利。也就是说,技术可能只是前进了一小步,解决了这样一个交互的问题,就是真实界面的问题。这个应用的人群就发生了一个数量级的变化。如果我们现在车载或者是专业地图的市场规模,我不知道这个数字,如果一年是百万量级的话,我认为如果解决了这个直观化和易用性问题的时候,应该是一个数量级的提升,甚至不止。大家可以看到,这是一个指数级的变化,这是地图之中,我们在这里面缺少的功课非常多。而地图之上我们可以看到,地图工具本身就是说导航、电子地图、手机地图,还有通过位置服务提供服务的一些应用,通过地图的API嵌入。还有我认为是未来的泛地图时代,我们的手机可以实时在线,每个人可以提供位置信号,这种位置信号可以用来做很多的运算,比如说解决实时交通的问题,解决你周边环境的问题,解决人所处的位置的问题。最后来说,已经打破了这种地图与物理世界之前单向的联系,我们之前的联系都是单向的,是通过专业的图商去采集数字化,交给用户,用户对这个地图是没有任何参与和贡献的。未来这个地图,一定是用户能够对这个地图有贡献,甚至是他成为地图的要素之一,他本身就是这个地图的一部分,我们现在是解决不了这个问题的,这个问题很遥远。我认为这个时代,随着手机互联网定义这些问题解决的时候,这些问题能够得到解决,也是必经之路。如果我们解决了这个问题,我认为我们可能离水晶球的梦想已经近了一大步了,通过这个手机,可以随时随地的访问我们这个地理世界,真实鲜活信息的时候,你自己不觉得很兴奋吗?

  基于这种思考,我们在这个基础之上做了一些工作。第一是贴近自然,我们可以看到这种航片,也是贴近自然的一步,但是这种卫星图片有一个很大的问题,仍然是解决不了这个问题。首先它是空中视角,以人的第一视角,是不知道的。如果我们每天都是靠飞行来解决交通问题的话,这个问题会得以解决,但是我们偏偏不是。我们再进行下一步尝试,2.5D地图,仍然是需要翻译的,我不希望我看到的东西是需要翻译的,我不希望动任何的脑子,这个时候用户要假设他非常笨,我也不喜欢看到这种东西,我不喜欢翻译,我理解这种成本是相当高的。还有就是我们通过这种建模实现接近3D效果的概念。这个我理解仍然是成本非常高,速度非常慢,可能我们很多公司号称有这个数据,但是真正有了,能拿出来够用的非常少,也就是勉强覆盖北京,或者是几个核心周边,作为一种技术的演示还可以,但是真正到民用化,这个阶段还差得非常远。

  在这个基础之上,我们的思考是只有街景这种技术是能够实现相对于刚才说的2.5D以及真3D的方法来说,能够快速的捕捉这个世界,是第一视角。捕捉速度很快,每小时40-60公里的速度,北京有4万公里的道路,大家除一下就是也许10辆车工作两个月就可以做到的。如果是这样的话,把这种大城市的问题全部解决,时间周期和成本来说,基本上不会是一个天价,但是基本上在目前的产业形式上还是能够支撑的,你有成本回报,成本才能够可控。2006年,谷歌推出了街景服务,但是在中国街景服务我理解虽然之前有很多原形产品我们都看了,做了很多的行业调研。大家在讨论过程当中,有时候会争谁是第一家,确实我们当时自己打了一个概念是首家高清地图。我们自己理解,我们确实应该某种意义上是首家,这种首家是真正可用的,而不是说访问的体验特别慢,只能够看图片,不能够和地图其他的应用整合在一块。

  在这种意义上,我们提出的地图才是一个真正的,可用的,就是它和搜索、导航、路径所有的这种应用,地图是无缝的整合在一块的,它的使用流畅度、网络速度、紧密整合度都很高,在这种情况下,我们认为这才是真正应该做的。到现在为止,我们实现的范畴仍然没有超过谷歌的技术范畴,确实比我们前进了有将近10年,那没有办法,我们也得生活下去,也要做我们能做的事情,我们也得往下做。我们只能说与它的差距越缩越短,未来可能会超越。其实也不是说不可以超越,我们有一些技术已经在做,也许我们推出产品的时候,大家发现我们在某些方面已经超越谷歌的技术了。

  我们没有说概念,也没有说技术,我们是在解决实实在在的问题。只有这样问题摆在面前的时候,才能真正的为公众服务。比如我们画一个大饼,其实这个用处不大。我们真正把这个东西推出来的时候,也才能真正解决我们很多的问题,这种问题也是通过我们各种媒体监控和媒体监测,通过关键词来搜索媒体的用户反映,还是发现很好。比如说我们搜索天安门的时候,以前给出的是下面这样一个地图,不错了,定在这个位置。我们现在是给出这样一个结论,我想这是很直观的。

  利用这种街景的数据,还可以构建这种3D的三维化信息,这种三维化信息,一种技术通过点来生成,另外一种技术通过技术本身、图像本身来生成,有距离信息,就有纹理特征,通过特征抽取与匹配,其实可以生成这种技术。这种视频是这种演示的效果,这种效果如果再把纹理贴回去,这个技术也许比现在通过这种人工建模的方法效率要大幅度提高,而且能够实现98%的全自动化。我们也在这方面进行尝试。在这个里面,我们在这个尝试过程中遇到了很多的问题,这些问题有些东西是我们自己解决的,有些是合作伙伴解决的。但是我作为整个项目的推动人,我对这个深有感触。因为这其中任何一个环节,它的不成功都会导致最终产品不能够成功,也会导致最终我们想服务的没有办法享受到我们的服务。比如说我们的合作伙伴解决不了这个问题,我们所有的技术平台只能够停留在概念层次。如果说我们的图像解决不了这些问题,那也就是说,你采回来也没有用。如果说我们前端的应用做不到很流畅,很快速,与其他的应用无缝的整合,也就是说我们的技术仍然没有应用。只有把整个全部流程全部打通的时候你的技术就是你的技术,只有打通的时候,我们的劳动力才有价值。我们刚才也提到了,像各种数据的采集,包括本身的采集过程,这种队伍的管理,其实也是很复杂的。当然这一块四维、高德其实很擅长。还有这种图像的处理,图像的缝合,模式识别,把这种二维场景的GPS,这种图像数据和图商的数据匹配,这是很复杂的过程。我们拿到这样一个数据之后,开始小看了这个事情,当我们拿到别人提供了几十个硬盘摆在我们面前的时候,我们发现是很恐怖的一件事情,这种图像基本上配比特别低。还有刚才提到的这种搜索和这种场景的匹配率相当低。其实我们在这个上面投入了很多的开发和人力来解决这个问题,真的是有了图像,有了坐标,有了底图,最后发现这两个融合的时候,还会发生,这是我们当时始料不及的,我们拿到这个数据之后发现太困难了。当然还遇到了隐私安全的问题,这是通过模式识别。现在业界最好的模式识别,比如说对于车牌如果是实验室里面的,实际上使用效率非常高,但是街景的东西有它的特殊性,它的光照、角度、环境,周边有配对的物体,有非常大的差异。这种差异性,让我们这种隐私处理非常困难。比如说车牌,我们最早的时候也只能达到50%都不到,但是经过我们很多的投资和努力,我们建立了大量的样本库,我认为这个样本库已经超过了任何一家商业的样本库,基本上一个月有数十万的样本速度在往上堆积,这种处理的分辨率已经达到了90%,但是人脸仍然很困难,经过很长时间的处理,我们现在能够达到百分之七八十。可能大家觉得,我们在看到这些东西的时候,觉得某些事情是很简单的,但是其实背后蕴藏的事情还有很多复杂的方面。

  我们的数据也是TB级的,现在好像是200TB了,还有数千台服务器在后台进行各种计算和运算,也是包括数据本身的海量管理,对于在线服务,还有大量的开发,也遇到了一个我们非常难以处理的政策性因素。我们的特色就是深覆盖,我们通过一些要求和订单式,要求我们采集的数据达到社会开放性路网100%覆盖,还有整合历史数据,市面上有的一些旧的数据我们也买,买了以后成为历史的时候它就很少,我们会推出时间轴这个功能。你会发现北京几年前和现在有什么区别,整合了这个高画质夜景和室内景,我们现在在现场推的只是800万像素,我们数据库里是8千万像素。

  像这种很庞大应用的时候,腾讯更多的是想扮演一个平台化的角色。就是把这种重点城市的首先覆盖到,通过一些公众的服务接口对外提供服务,所以腾讯更多应用的策略是做平台。在这个平台的过程中,与这些过程相关的一些我们都欢迎与我们合作。比如说这些技术,这种数据采集本身,还有最后应用本身,API本身,在这个过程中,任何一个环节觉得有希望跟我们合作的都可以与我们合作。我们不拒绝任何方式的合作,我们希望真正能够解决公众的问题,提供真正能够为公众服务的大平台。这是我们运营数据一段时间发现用户对这种需求的数据挖掘,比如说对于定位还有城市观光,路线规划,社交的大概感性认识。我们用API进行了一些尝试和开发,也欢迎更多的开发方式与我们合作。如果有志于和我们一块工作的同学可以跟我们联系。

  由于时间的关系,我就介绍到这里,谢谢大家!

  (以上内容根据速记整理,未经本人审核)

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐