分享
Scan me 分享到微信

武卫东:感知Telematics服务的灵云

为期两天的2012地理信息开发者大会(简称:WGDC)在北京国家会议中心举行,在第二天的“Telematics与车载智能终端”分会场,捷通华声语音技术有限公司总经理武卫东发表了题为《灵云——感知Telematics服务》的演讲。

  3sNews讯 为期两天的2012地理信息开发者大会(简称:WGDC)在北京国家会议中心举行,本次大会以“新技术、新模式、新商业”为主题,是地理信息领域最具影响力的技术性盛会,其宗旨是不断引领和促进地理信息技术的创新与变革。在第二天的“Telematics与车载智能终端”分会场,捷通华声语音技术有限公司总经理武卫东发表了题为《灵云——感知Telematics服务》的演讲。

泰伯网

  以下为文字实录:

  大家下午好!今天非常有幸,能跟大家一起探讨在智能人机交互技术与Telematics应用的一些研究。今天在我前面有两位都是从事语音行业的资深企业,也是很有幸第一次同台给大家展现国内目前在语音领域里几家技术的观点和意见。但是我想大家的目的是一样的,都是希望通过这样一个同台的交流,能够在语音技术包括交互技术上,在Telematics上有共同的发展。

  捷通华声是专注于语音识别和手写等技术的公司,目前经过十几年的发展,公司在语音行业和手写行业已经发展了上千家合作伙伴。目前,我们在语音技术市场已经有50%市场占有率,手写领域已经有30%几的市场占有率。同时公司不仅是在核心技术这块,我们在一些增值服务方面,公司这么多年我们也有与中国电信、中国移动、中国联通建立了很好的合作。比如中国电信CDMA的业务的合作。公司经过多年的发展,我们总结公司的使命和愿景就是我们希望通过智能人机交互技术能够切实的使人与机器的交流向人与人交流一样的简单起来。

  下面是我们在各地的一些分公司;这是一些有关键影响的事件。我给大家分享一下在这些事件中我们的语音合成技术所起的作用。第一个就是08年奥运会,我们参与了很多语音支撑服务平台的项目,而且这个项目在奥运会中实际的发生了作用。第二个就是高铁,目前为止全国高体站立有2、3百个捷通华声高铁百分之百的站厅使用了我们的技术,还有世博会的我们的语音识别系统的应用。还有广州亚运会的应用。因为捷通华声本身这些年我们在这个产业内建立了很多合作伙伴,我们一直做的技术都是在背后,可能大家在生活中会听到,比如银行或者呼叫中心听到过我们一些语音声音的播报,但是不知道是哪家公司。所以今天有机会跟产业界的同仁包括开发者有机会见面。

  (这个片子)是我们这些年在汽车的前装市场、后装市场、地图导航,包括手机终端这些厂商的一些导航应用厂家的合作伙伴案例。随着现在移动互联网包括云计算的发展,现在越来越多的设备比如手机也好、PAD也好,包括车载终端也好,等等这些设备,人跟设备之间的交互情况越来越多。人跟设备使用体验的要求越来越高。所以从捷通来讲,我们也是总结多年以来做智能人机交互技术方面的经验,包括在产业上的一些案例。我们也切实感觉到,如果说像过去的仅仅是提供一些核心技术,像提供一些SDK,大家开发,已经无法满足日益需要的人机交互的要求。所以在2011年捷通公司也是经过长时间的准备,我们推出了在国内第一个基于智能人机交互技术的全方位的云平台—灵云”。因为现在设备,包括智能设备,包括智能手机,我们也感觉信息量越来越大,要操作的东西越来越多,要找的东西越来越多。但是有时候感觉东西太多了,不知道怎么用。我们做这个灵云平台,希望通过灵云让人能够感知机器,同时机器也能够感知人,切实的让这些智能终端称之为智能。所以灵云是让机器和人之间能够感知,这是我们开发这个灵云平台的目的。灵云平台不仅仅是人机智能交互技术,其实还有一个一个RO系统,因为现在大家都提倡个性化,这个个性和如何体验?其实云服务、云计算,这方面提供了一个非常好的通道,一个平台。我们在灵云里设置了RO系统,把人的一些行为和喜好和需求,通过你在跟系统进行交互的时候,能够把它记录下来,总结出来。形成一个个性化的系统。比如说你喜欢经常听一听NBA的消息,通过语音的方式或者其他的交互手段,你经常喜欢的是体育类的消息,这样后台可以在RO系统里,把你的喜好记录下来。将来会经常的把有关这方面的消息给你从灵云互联网上根据搜索,给你提供方便。

  包括出行的时候可能经常有一些常去的地方,这样也会把你今后常去的地方的信息点,包括周围的一些服务等等记录下来,推送给你。这样给人带来一些个性化的变化,这个平台实际上就是灵云平台的核心点。

  灵云的架构:这个平台的作用已经整合了,包括今后我们还会整合更多的成熟的核心人机交互技术的能力。比如说手写识别、包括机器翻译、人脸识别、指纹、笔迹鉴定,我们灵云平台都完全了整合。我们灵云平台发布的时候,我们今后会把类似像脑波识别,为此还有一些争议,其实现在脑波识别在美国加州已经有一些地方在进行,当然这样的技术还有待成熟,但是想我类似这样的技术都是人和机器能够交互的技术。我们捷通华声公司除了自己拥有的核心技术放在上面之外,我们还会建立广泛的合作,把这些真正能够解决人们生活、工作中能够提升人们的好的感知技术整合在一起,让大家分享,让大家去用。

  刚才讲了在我们的生活中人机交互技术无处不在,刚才大家也听到了云本身就像自来水一样,随时开的。现在人机智能交互技术已经渗透到人的各个环节。比如我们现在灵云提供的,识别、合成、手写包括OCR等等这些技术,机械翻译、指纹,这些技术目前从核心上来讲,很多地方特定领域已经有了很成熟的应用。在今后,比如我们开发者做这方面的工作的时候应该有更夺得创意和想法,能够利用这些技术服务我们生活的各个方面。

  其实灵云的应用也是非常广泛的,包括交通、金融、电信、能源这些行业都可以有广泛的应用。

  中国的Telematics服务。说实话我对Telematics服务这块,我们不敢在众多的专家和朋友中间“卖弄”,我们感觉Telematics服务作为一个新兴事物,现在已经有很多东西开始影响人们的生活。但是还有空间。我们认为真正一个好的东西能够达到好用和易用这个水平,还是要有一些关键地方的突破。这个关键地方的突破在哪儿,其中有一点我们认为是,现在能提供的人机交互的感知能力相关。因为苹果公司,乔布斯的伟大在于他把人的需求挖掘出来了。实际上从计算信息时代从键盘鼠标到多点触控,到现在的发展,人们感觉到不仅仅是设备,或者是一个应用,更大的是一种感知,人对这个设备使用的快感的影响。所以开玩笑的讲有时候苹果的设备2岁的小孩子不用教他,让他玩他就能玩儿,这很有意思。这是人潜能当中存在的需求被挖掘出来了。那么靠什么,实际上人机交互技术起着非常关键的作用。

  Telematics服务里面可以在导航方面利用这些人机交互去做比如做位置的搜索、路线的导航、路况信息的播报,也可以在服务方面做一些呼叫中心的服务、包括车况、防盗的监控。资讯方面,从整个车载终端角度来讲,车载终端相当于是一个跟人相关的功能化中心。这个中心可以集结很多来自于移动互联网,包括各种各样生活资讯的信息。从手段方面,比如车内打电话或者发短信等等这些都可以利用人机交互技术去实现。

  我刚才在台下听王总讲结构化思路的时候我也非常认同,我们在接触一些国内和国外的车厂方案的时候,他们也说,说你们的手写能不能提供,我们后来给他提供方案他们觉得技术不错,但是应用太过复杂。后来他们提出来,开着车的时候,只要换档的时候加一个触屏是可以写东西的,或者加强一个手势可以做一些简单处理,甚至比人说话还方便。甚至包括车的安全,比如能不能加一些人脸、或者指纹,等等这些东西不是我们提出来的,实际上目前应用方面来讲,切切实实是我们行内的很多同仁、一般技术的牛人提出来这样的设想。我们觉得这个确实有它可挖掘的空间。

  智能助手—小唐龙:语音识别大家在理解SIR的时候,大家觉得语音识别真力求这个“小唐龙”,华人圈里第一个做语音识别的人,我们曾经拜访过,也交流过,也算是一个泰斗机的人物,他说现在看到的SIR有点太热了,因为首先第一现在还没有来中国,可能中国语言太复杂了。捷通华声公司这么多年发展我们是脚踏实地的往前走,因为有些应用不可能达到技术的高度。这个观点我同意70%,在语音交互这个领域应用中,其实语音识别所起的作用不足30%,这一点来讲,刚才我看到王总也提了一些思路,我也非常认同,这个观点不是我的观点,这是观点是我发现大家都有这样的说法。在实际应用实践中,其实应用和技术之间的连接如果是简单的硬连接,往往有时候达不到实际好的效果。语音识别按照自然语言理解,实际上99年IBM就推出了一个语音识别,你正常说话就能做的很好。大家觉得语音识别能解决很多问题,但是事实上语音识别的应用你要把它用到一个特定的环境下,特定的语境下用特定的方式才能使用这个技术,如果把这个技术用到各种领域有可能这个美丽的泡影还会倒推十年。我相信同行大家这样的认识。我们当时做的时候也意识到这点了,所以我们是把人工智能、语音识别和各种人机交互手段来共同解决这个问题。我们小唐龙能够做到人的体验的高度,我们做一些应用的时候,尤其是在一些领域进行应用的时候,因为捷通华声商业模式业务模式中我们提供技术你去用,但是经过十年甚至是十几年的验证,我们在传统的CPI行业,上了这么多的语音识别,到现在没有看到一家真正的脱离开人的方式,完全以语音方式实现的项目。甚至很多项目上了就下来了。所以我们做“小唐龙”的时候,希望在端上能给大家展现一个新的应用。

  我们“小唐龙”有九个变身,一个是汽车龙,我们希望跟专业的融合。另外就是导航龙,其实汽车龙和导航龙是一个龙,能够结合导航类的和车内娱乐的一些应用。简单演示一下“小唐龙的案例”。这是自然语言的识别,不是基于语言的识别。实际上现在通过智能的人机交互技术,真正能够完成“一步式到位”。

  我的演讲就到这里,谢谢大家!

  (以上内容根据速记整理,未经本人审核)

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开