分享
Scan me 分享到微信

机器决定人们浏览的网络内容:AI如何改变网络

AI机器人如何掌握你的网络浏览方式

 
        图片:伦敦的萨默塞特宫中,Big Bang Data展览的一个展台。

  华盛顿日报上周提到了谷歌在搜索中运用了越多越多的知识框——在搜索结果顶部出现的插入框,目的是在传统超链接的无限页面的顶部展示与人们兴趣相关的仿真陈述(factoid ),以缩短搜索过程。用户越来越多地使用移动端或语音访问网页,这些系统的目的就是,让用户尽可能快地得到诸如“一磅多少盎司”或“谁是爱沙尼亚总统”一类问题的答案。但是,之前的搜索引擎只是给用户一大堆链接去遍历,而知识框的目的就是,通过应用自然语言的进展,让机器真正理解用户的问题,能够提供用户寻找的实际回复。

  根据华盛顿日报,谷歌每月1000亿搜索量中约有三分之会显示仿真陈述,也就是说在我们与世界信息接入的过程中,这些仿真陈述的作用越来越大。交际连续体中bot的崛起,比如工作工具Slack,社交通信Facebook 的bot,这些都意味着,机器将解读世界上的知识,而历史性的关键词搜索概念将会被逐步取代。

  任何一个花点时间搜索网页或者浏览社交媒体的人可能都会了然于心,网络世界上虚假和误导性的信息泛滥不绝,从经典那个地球是平的的论调,月球登陆的假消息,到危险的医疗错误信息,以及引起真实种族暴力的假流言,否认大屠杀这样阴险的狡辩。尽管这些事情很容易被大家关注,然而访问抵抗谣言的网站如Snopes.com的流量如此之少,也就是说太多在线社区还是容易轻信谣言。

  多数时候,可能对一个非专家用户来说,并不清楚通常可接受的答案是什么。比如,有人在网上搜索一种需要医治的情境,但可能会找到有数十个看似权威的网站,提供着大量且相互矛盾的建议,其中有些网站甚至可能会推荐危及生命的家庭治疗方式。

  这些年来我亲眼看到,即使是在神圣的学术殿堂,有些有博士学位的(有时两个博士学位)的全职教授,在自己狭窄的专业领域有几十年的经验,但却多次地在研究其他领域的东西时发生错误,包括基本的操作,以及分辨事实和虚构信息等。

  华盛顿邮报在感叹知识框的兴起时,引用了维基百科基金会研究主管的话,说这个趋势“破坏了人们辨别信息的能力,最终会影响人们发布多种意见的能力。而这是我认为我们真正需要为社会去研究和处理的事情。”然而,这一理想的说法的假设是,人们本来擅长事实查证,擅长推理他们专业以外的有时复杂甚至是高度技术性的信息,以及擅长分析海量信息源中的大量矛盾信息。但是我常常发现的是,即使对学术界的人来说,将一个问题转化成搜索结果,并理解哪些网站最有可能提供合理的答案都很困难。

  正如华盛顿日报所说,谷歌与业界知名的Mayo Clinic合作,保证其医疗提问能够与医学界已有的最佳理解相一致。更有趣的是,谷歌将食物配料的搜索与美国农业部提供的营养事实连接到一起(可以搜索下“cheddar cheese(切达芝士)”看看有什么结果)。想象下,如果去搜索最近的提供不健康食物菜单的餐馆,结果不仅有如何去这些餐馆,而且会有关于这些物品不健康的总结评论,以及经常吃这些东西对健康会有什么影响。这会是已饱和的健康和健身技术领域下一个逻辑举措吗?

  那么,一个人可能会说,这些知识面板的出现(相应的总结性答案由语音搜索得出)有很大潜力廓清在线错误信息的迷雾。想象一下,正如逆行时提供交通警报一样,谷歌会在有人搜索流行的谣言时自动展示来自Snopes的条目。

  当然,当其他人为我们做决定时,可能会因为意见不同而出现分歧,特别是科技公司想要在全球范围内定义权威性概念时,谷歌上周提到这点。甚至包括医疗搜索也会出现,比如有某宗教信仰的从业者不鼓励人们使用现代药,或者一些特别倾向于某些品牌药品的人可能会非常反对西方医疗界的共识是指定情境下最佳的治疗方式。

  最初人们认为“社交化搜索”有潜力将取代早期的传统搜索引擎的通用性,根据你的社交关系定制搜索结果,但传统搜索引擎则给世界上的每个搜索者都会提供同样的一套结果。这个前提是说,比如某人搜索华盛顿“最好的”泰国餐厅,比起大众形成的互联网上的共识,或者这个城市著名美食评论家的观点,他可能会更相信好朋友的推荐。当今的搜索引擎越来越个性化,在大量历史数据中使用了深度学习技术,将每个搜索结果个性化,让用户被搜索引擎“了解”而受益,算法学习到用户的喜好随时间的变化,让用户在不同的时间看到不同的结果。

  这就引起一个有趣的问题,我们是不是不会为每一个搜索争取一个“正确”的答案,而是致力于给用户提供可用信息的“通知摘要”?这种情况下,对于单个权威性答案的搜索,比如“今晚的地铁是什么时候结束的”这样的问题,可能会用传统的回复方式。但当一个问题没有大众普遍接受的答案时,或者在专业领域都存在分歧,或者更简单的说,它本身就没有绝对答案的(比如某市“最佳”餐厅),这时搜索引擎则会给用户提供主要的一些观点及其各自的来源,以供用户选择。其中至少要做到的是,给定信息的来源,并尽可能突出说明,这点应成集成到信息回复中。因为每个搜索结果代表的网站已经成为搜索显示的标准化组成部分,这样也可以鼓励用户认真地思考他们使用的信息。

  或者,鉴于现代搜索的个性化水平,那么未来的搜索引擎和智能代理有没有可能学习用户的兴趣,然后自动地回复这样的结果:比如说用户更喜欢厚匹萨,希望花费少于40美元,30分钟内送到,搜索引擎和智能代理就可以直接使用这些信息决定“最佳”的披萨餐厅,这种方式类似于社交搜索服务利用用户社交网络的集体领域知识以学习最佳的仿真陈述(factoid)。这种情况下,系统可能会展示出每种它认为与用户有关的特点,并会使用这些特点过滤搜索结果,因此用户意识到了这种假设的机制,就可以对其更改(比如说庆祝朋友生日时调整开销花费,以更正式地准备。)

  最后要说的是,有一点是很明朗的,在过去的半个世纪中,简单的关键词搜索以及无限的可滚动结果页面曾定义了计算机时代。但它将会被新的未来取而代之。机器将会越来越多地为我们过滤信息,对我们应该了解什么样的世界的信息,做出前所未有的更多的决定。这些智能系统有巨大的能量和潜力,很有可能改变我们消费世界上的信息的方式,以及与其交互的方式,但也会引发关于未来如何设计系统的诸多困惑。而且,计算机越来越多地管理我们的信息消费,我们那些尚未被数字化的社会历史的财富,也将会迅速地被数字化,并被搬到自动化霸主麾下,让人们使用。去迎接未来那个由计算机介导的信息世界吧。

     如果您对您所在行业有很深认知,也想在我们的平台上说点什么,我们欢迎您来投稿!

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐