分享
Scan me 分享到微信

“图灵机器人”探寻人机交互,我们离人工智能还有多远?

要想真正基于自然语言识别的能力创造入口价值,就一定离不开广泛用户的参与,并从海量数据的分析挖掘中的自主学习,以及从纵向对垂直领域的做精做深到横向的多领域拓展。

  “图灵机器人”发布,强调人工智能

  经过为期半年多的内测,11月7日下午,3sNews曾经采访的虫洞语音助手团队召开了产品新闻发布会,宣布开放他们的最新产品“图灵机器人”,从产品名就能看出团队在向身为“计算机科学之父”和“人工智能之父”的阿兰·麦席森·图灵致敬。

  在会上,图灵机器人创始人俞志晨表示,他们在开发运营虫洞语音助手两年半的时间中逐渐认为,做好语音和语义识别技术并不是一个目的,它是人机交互的一种方式,而他们最终的目标是要把技术跟更多的软件和硬件去做融合,在形成整合服务的基础上,形成人机之间的智能交互,并构建“人工智能”的入口。

  因此图灵机器人也不是字面上理解的“机器人”,而是要将自然语言识别技术(包括对语音和语义的识别)和更多的产品进行连接的平台,其平台中为开发者提供有快速直接的嵌入工具,而平台核心的引擎是由团队基于底层打造的深度问答系统“DeepQA”作为支撑,俞志晨强调DeepQA是和目前世界上公认的人工智能程度最高的问答系统IBM Watson是平行的,而团队也正朝着Watson的方向努力。

泰伯网

“图灵机器人”发布会现场,创始人俞志晨作演讲

  那么,DeepQA现在来看到底能做些什么?联合创始人韦克礼同时也是DeepQA的主要技术负责人在发言中首先表示,从自然语言识别到实现智能化的人机交互目前看来主要有三个方面的难点。

  其一是中文语言需要通过“切词”、“断句”来识别一句话的含义。这就需要产品要有足够的智慧来学习越来越复杂的语句。

  其二是中文方言的多样化。口音问题一直以来都是语音识别的一大挑战。

  其三是在一个对话情境中人机之间对话的上下文衔接问题。做到这一点才能让人觉得“我真正是在跟机器人交流”,而不是在给机器下一道命令。

  而图灵机器人DeepQA的出发点就是为了解决这些问题。过去以来,普遍用于构建机器智能的方法是:针对每一项识别的内容,都需要把支持某一个现象的所有数据提取出来建立相应的规则和模型;这种做法相对稳妥,但人力成本过高,也非常耗时,同时更让人感觉人工智能是用人工成本来堆叠的。

  而DeepQA主张的是抛开人力成本,实现“自主学习”,即告诉机器一个现象,让机器自己来挖掘现象背后的关联数据作为“证据”,自建规则和模型,这种方法其本质还是“语义归类”。比如不少南方人在表达“我想喝牛奶”时,因为口音的关系经常会说成“我想喝‘刘’奶”,这时候DeepQA就得分析句子,并结合上下文语境,通过搜集数据来论证这就是“喝牛奶”的意思,从而给出一个确定的结论。

  韦克礼提到,图灵机器人的DeepQA内核目前已经对2000多万条有出入的表达方式进行纠错和识别,从整体上看这种自主学习能有效提升整体的语言识别能力。这也意味着,图灵机器人幕后将更依托于强大的计算资源、海量的词句来强化人工智能。截至发布会召开,DeepQA云端数据库已经储备了约75亿条规模的语料库和约15亿条的知识库。

  随着图灵机器人的开放,对于开发者来说,他们可以将DeepQA接入到自己的PC端软件、智能硬件、App或微信服务号中,获得内核的各种能力。此外,DeepQA也允许开发者在图灵机器人平台上构建类似私有云一样的自有知识库,为开发者能在所在垂直领域更加有针对性地编辑独有的知识和信息库,以更好地服务用户。

  目前,基于语音和语义识别,图灵机器人的API开发者用户已经达到1.5万,覆盖从智能硬件到软件的各种产品,累计调用请求达到67亿次,另外团队也拥有了稳定的大客户群,为中国电信、海尔、HTC等品牌,在人机交互领域提供关键的支持。一方面,自然语言识别技术的入口价值逐步显山露水,另一方面,这种趋势也给智能化的人机交互提供了契机。

  语言识别推动人工智能进入培育期

  所以,更重要的是图灵机器人在多领域的快速普及和渗透能让DeepQA快速学习并变得更加聪明,其终极目标一定是合众行业领域之力培育出接近终极的人工智能。“机器人的本质是取代人类重复、机械、繁琐性的劳动,未来会有越来越多的体力和脑力劳动将被机器人取代。”俞志晨在演讲中强调了他的这一观点。

  实际上,IBM的Watson已经做到了一些比较理想的成果。如今的Watson已经在客户服务领域、金融行业和医疗行业取得了阶段性的突破,例如在医疗领域将基因组数据、医疗数据、临床学知识和Watson系统结合,来帮助医生针对肿瘤、癌症病患出具治疗方案等。此时的Watson不仅仅是一个简单的人机聊天平台,更依托背后的数据分析能力来实现更严肃的互动和交流。而这一切的基础,还是源自对语言的理解和不断的机器学习来媲美人类大脑。

  除了图灵机器人和IBM的Watson,市场中的其他语音和语义识别技术团队也正通过各自的角度切入到对人工智能的探索和培育。

  像微软的“小冰”和“小娜”,前者从情感角度出发通过鼓励人机交流培养机器的“情商”,后者则通过实实在在帮助用户处理工作和生活中的流程,让自身更有“智商”。苹果公司的Siri从诞生之初就是人工智能计划的一部分,虽然还没有开放,但基于全球市场庞大的用户基数,苦练内功Siri也有相当的功底。相对而言,谷歌公司的Google Now依托搜索、海量数据和开放的核心战略,也让这款产品成为人工智能强有力的入口。在国内,既有像科大讯飞这样有着约15年历史的老牌语言识别技术提供商选择了转型开放来推动服务的智能化,也有在百度大脑计划之下,百度公司通过语言识别、图像识别等技术来构建机器的“思维”能力。

  对人工智能的研究的历史已经超过了半个世纪,可以明确的是,在当前阶段互联网和移动互联网的氛围创造了对人工智能更好的试验场。而要想真正基于自然语言识别的能力创造入口价值,就一定离不开广泛用户的参与,以及从海量数据的分析挖掘中的自主学习,另外则是从纵向对垂直领域的做精做深到横向的多领域拓展。

  客观来看,各家产品距离真正的“人工智能”还差得很远,但对很多产品来说,比如像图灵机器人今天能做到开放,并且在一个相对初级的阶段里,与合作伙伴共同完成了一个个人机交互的案例,其实已经朝着人工智能这个方向迈了一大步。而到底我们何时才能迎来人工智能从量变到质变,最权威的专家也不会给出一个明确的答案。

  这正像俞志晨在图灵机器人发布会的个人演讲中有意向媒体和观众传递的一种心情:忐忑。在决定召开发布会后,团队上下都感受到了转型为平台级技术提供者的巨大压力,因为做人工智能的时间链很长,其中还要和包括IT巨头在内的诸多竞品直接较量。图灵机器人团队现在能做的,就是尽可能从团队自身出发,努力去完善核心引擎DeepQA的能力以及其他产品体验上的各种细节,以应对新时代下人工智能培育期所遇到的各种挑战。(文|陈启临)

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐