分享
Scan me 分享到微信

微软殷皓:“大数据”整合是一个非常重要的理念

从微软的角度来说,我不能说什么是最好的商业模式,但是“大数据”对我们现在已经制订的这样一个秩序实际上给了我们更多的空间来重新思考创造新的价值。

  今天也很荣幸有这个机会和大家一起分享一起关于“大数据”方面的经验。

  今天我从广州番禺那边赶过来,坐的是高铁,其实这里面就有一个大数据的思考。比如说高铁故障的每一次发生,可能我们都看不到太多的规律,但是如果我们把它作为一个趋势,长期的数据积累,说不定就能够发现很多隐性的问题,从技术的角度,我们可以发掘出更多的商业价值,怎么提升我们在业务上的能力,这是很有意思的。

泰伯网
微软大中国区企业服务部首席技术官 殷皓

  那么今天我是从技术的角度来谈一下大数据,在座可能很多都是商务上的英雄,我希望是能够给大家带来一些思考。

  从微软的角度来说,我不能说什么是最好的商业模式,但是“大数据”对我们现在已经制订的这样一个秩序实际上给了我们更多的空间来重新思考创造新的价值。

  我们经常遇到几个问题,客户问什么是“大数据”,或者是“大数据”有多大,或者说为什么要做“大数据”,有什么价值。这样我们简单的回顾一下,最多是想通过这次分享能够给大家一些思考。

  首先我们看一下现在的市场,发生在我们周围的市场,现在我们看到很显著的一个趋势,是一个信息的大爆炸,我个人有两个手机,一个是我们公司代表性的WIN5,另外一个就不说了,但是我有我自己的PAD,我有我的笔记本,这每一个实际上都是一个终端,每一个终端都在产生数据。而且我现在越来越觉得我是无时无刻互联的终端,我会发微博,会看facebook,我所在的地方产生的地理信息,也是一个数据。这个数据被谁在用?也是无时无刻都在使用着,有可能是移动在使用,也可能是美国的监控在使用,也不一定。

  信息的爆炸,导致了信息量的爆炸,从人类的历史开始到八十年代积累的数据还不及我们现在的数据,我们产生的数据量非常非常巨大,现在在物联网的时代有一个新的趋势,比如说经常谈到物联网,物联网给我们带来了一个新挑战,什么挑战呢?传统我们和互联网的交互或者是人和机的交互,通常是为了传达一个思想。在物联网时代,经常看到的是自动形成的交互,自动形成的数据处理,那么我们就会针对十倍、百倍、千倍的设备,或者说无时无刻产生的数据,这就是我们的数据的挑战,这么大量的数据里面,真正从里面挖掘出多少价值,其实是非常有限的。

  那么使这些事情整合在一起,我们能够有这个计算能力,有这个可靠性、可用性,来帮助我们做这样的一些分析,一直到今天才刚刚开始,谈到云,谈到廉价的存储,谈到廉价的计算能力,大数据的一个非常根本的目的,就是有非常大的存储,非常大的计算能力,能够帮助我们横向扩展我们需要做的技术。

  我们看一下传统的数据。从非常传统的ERP、管理系统,它产生的是非常结构化的数据,比如说一个联通的客户的名字等,那么我们就到了一个互联网的时代,比如说WEB2.0,对我们数据本身有一个非结构化的描述,到了现在,我们谈到“大数据”,产生的数据有一个特点,就是数据对数据的本身没有特别的描述,可能是一个照片,可能是一段声音,里面的特性,像刚才吴总谈到的,是理性。我们经常谈到一个产品,我去ATM取钱,我的图象被ATM记录下来,这个里面可以抓取到很多的信息,比如说我戴了帽子,让摄象头看不到,这个是否马上会产生出一个预警,让我们想到这可能是一个犯人。

  我们经常谈到金融,金融的行业里面,对客户的分析,我传统的CRM可能分析的是客户的消费行为,从里面可能有数据挖掘来看这个客户是否好客户。但是从另外一个角度看,他的消费行为和罚款行为是不是一个好的客户,到了一个什么样的节点,他就变成了坏客户,可能就是还不起房子了。在此之前,如果他经常拖欠,对于银行来说,可以产生利息的收入,反而是好客户。对于客户的衡量标准,可能有不同的纬度,传统的纬度以外的东西也可能是好的东西。影象、传感的数据、音乐,这里面包含的种种信息,其实对大数据来说,里面都有价值可以挖掘。

  那么我经常用一个实际的案例来描述什么是大数据。我不知道在座的各位有没有看到过这个游戏,如果这里有腾讯的嘉宾的话,谢谢你们,我也狠狠的玩了一把,但是玩的级别不高。QQ饭店,好象是这个游戏的名字。当我们看到这个游戏的时候,很有意思的一点,它的赚钱的模式,赚升级的模式,取决于饭桌的位置,但是通常我们对一个饭桌的描述,如果通过一个显性的数据,描述可能是圆的桌子、方的桌子,可以坐几个人。但是很有意思的一个数据,一个隐性的数据,比如说这个饭桌离我的厨房的距离,影响到上菜的速度。或者是服务员拿的这个单之后,要花多少钱走到记帐收单的地方,把单收到厨房里做,把菜拿出来服务客户。当然这些游戏来面都体现了规则,但是在真正的业务模式里面,我们在饭店里面看有些桌子翻台快,有些慢,如果饭店想多赚钱的话,怎么缩短服务的时间,比较服务的效率。它通过分析的手段,就不是通过显性数据达到,通过隐性的数据、环境的数据。这实际上是一个非常典型的“大数据”的应用案例,虽然是游戏,但是真正非常直观的反映出了大数据可以帮我们做什么样的事情。

  在这个时代里面,我们也看到了一系列的问题,比如说社交媒体,或者是实时数据的处理,或者是更加高端的趋势的分析,通过这种趋势的分析来判断未来会发生什么状况。这里面有几个例子。我们有一个客户,为某一个非常知名的高端的汽车品牌做了一个分析,分析的是美国的社交网络facebook,包括新的一些社交网络,他想分析的是什么呢?如果我想投钱给一批人,让他来影响社交平台对他公司的影响,需要投多少。第一步通过“大数据”做了一个分析,把这些数据做了分析之后,他发现对这个汽车品牌真正产生影响的,比如说你发一个微博,然后就被转,从美国的facebook里面进行分析之后找出12个人,这12个人发出的微博,这12个人影响了美国的媒体,这样的话可以帮助他们来更加集中他们的投入。只要搞好和这12个人的关系,可能影响的就是几百万,甚至几千万的人。

  实时也使一个很有意思的场景,用微软做一个案例,3、4年前,4年前,我们用一个实时处理引擎,在微软网站上做的,一部分客户可以用这个引擎,一部分客户用不到。我们选了一个情人节,在一部分人有了实时的引擎,根据用户在网站上实时的点击,实时推送广告,这个逻辑很简单,当你进入我们网站的时候,点击一次情人节花的广告,我把整个网站的页面都变成了推送花的广告,如果点击几次都是玫瑰花,我就尽量把版面都变成推送的是玫瑰花。之后我们发现用这组引擎的广告推送率比没有用这个引擎的高了29%。我们现在的网站经常会看到对实时的分析,比如说你点一次车,车的网页,可能马上会看到接下来的广告都会变成和车有关的,如果你点击的某一个品牌,可能你会感觉到接下去广告的投放都会在同类车里面,这实际上都是实时的数据处理、实时的数据分析在后端。[page]

  趋势的分析其实也很有意思。有一个场景,我们也会谈到,大家也比较熟悉,有一个小药片伟哥,伟哥在临床实验的时候就是一个长期趋势的分析,但是趋势分析里面,最初的分析目的并不是我们经常谈到的用途,而是用于心脏疾病,但是后来伟哥很成功。但是随着时间的推移,伟哥又有一个用途,是对新生儿血管疾病有非常大的疗效。所以通过长期的趋势分析、挖掘,里面经常可以看到一些新的价值、新的元素,往往是一个天翻地覆的价值的体现。

  在“大数据”的时候,我们对数据的思考,可能要对数据进行细分和整合,更重要的是把不同数据整合在一起,这里面有一个很有意思的,就是传统数据分析的基础是取决于我对这些数据绝对的拥有权,现在“大数据”时代,云服务的时代一个新的理念把我的数据变成服务,当数据都变成服务的时候,可以整合在一起,形成新的价值。这种整合可以发生在公司和公司之间,也可以发生在部门和部门之间,这些都是取决于用这些数据的地方。

  有一个案例,前一段时间有一个客户做了这样一个数据挖掘的工作,他想看历年的油价对汽车销量的影响,两年或者三年的长期的影响。通常我们传统的模式,可能先要把油价的数据买过来,然后把汽车销售的数据买过来。在这个案例里面,分析人既没有数据的拥有权,也没有钱买这些数据。但是恰巧壳牌把他历年的数据作为服务推了出来。汽车公司把这些数据也作为服务推送出来,他把这两个服务整合在一起,就变成了他自己的数据,然后他把这些数据卖给了汽车厂商,卖给了油厂。

  数据服务,我们有很多的数据,实际上这些数据是一个金山,当我们把它作为一个服务推送出去的时候,可以让更多的人帮我挖掘这些数据的价值,而不仅仅是我自己在挖掘这里面的价值。把数据做成服务,有一个更大的作用,整合是一个非常重要的理念。

  这里面我想简单的谈几个有意思的关于“大数据”要考虑到的地方,就是数据分析的结果是有时效性的。比如说我们经常谈到中国趋势,分析某一个场景。比如说焦化厂、石油厂,可能要监控有害气体是不是会造成事故。而这个实时的数据分析,它的有效性精到几秒,在几秒做出判断,过了几秒可能就失去了价值,事故就已经发生了。

  同样在非常大的决策层的分析,有可能也是显性的抓手,但是这种分析可能时间更长。比如说微软公司今年决定,像吴总刚才说的,PC的时代过了,公司要转型,这个决策性的分析造成了决策的转变,这个可能是几年的决定,它的时效性可能是5年,或者是10年。

  不同的分析,不同的范围,数据的细度都有自己的一个时效性,而这个时效性从这个方面帮助我们要思考一下这个数据到底有多少价值。

  这边我想提一个从技术的方面来讲传统BI和“大数据”的不同。传统的BI我知道有什么框架,所以我是有先入为主的态度来进行分析。“大数据”是当我把数据存入到系统的时候,我对这个数据没有定义,不知道这个数据来自哪里,甚至不知道这里面有什么数据。和“大数据”的对话,实际上是一种探索,在探索的时候去发现这里面有什么架构体系和什么价值,在分析的时候找出里面的架构和逻辑。最有意思的一个地方,也就是它对整个行业有一个憧憬。现在越来越多的公司开始建立一个角色,叫做CBO,有这样一个人来宏观的看待数据的价值和潜力,这也代表了很多公司越来越多的重视到数据会产生的价值。

  这是个非常典型的大数据数据分析实施的场景。我为什么用这个图来给大家看一下呢?这个主要是看怎么整合产生新的价值。传统的模式是PM的方式把数据抓起,到一个平台上,然后再分析,但是这个分析可以给我产生出一个模型,可以通过大数据的方式把显性的东西抓取出来,比如说一个饭店影响销售的可能不仅仅是座位的翻台,可能是今天的天气,或者是这里是不是有一个论坛,可能有额外的来宾,这些都是显性的数据影响到销售和模型。但是根据实时的数据发生的状态,我可以影响这个模型。

  这边给大家一个案例,有一个非常知名的快餐连锁公司,是一个美国的品牌,我们和他们也做了很多合作方面的探索,他们为“大数据”的利用就是这样的一个模式的翻版,而且非常有效。这个公司的经营理念是让客户尝到最热、最新鲜的食品,比如说打个比方,如果炸薯条,这个薯条做完10几、20分钟就不想吃了,他希望你来买单的时候,你来订的时候,有刚好炸好的薯条。但是如果每一次都是客户来了我再去做这个食品,那一定来不及。所以这个公司做了一件什么事情?把历史的数据、门店的销售,根据时间,根据天气,根据可能发生的各种因素,整合成不同的销售模型,这个销售模型会指导,今天在八点,或者是某一个时间点,你应该开始做多少食品,或者把多少食品做成半成品。整个后台和厨房一直根据这个模型来实时的准确。前端根据客户的流量,实时的跳出这个模型,实时的根据现在后面的储备、前端客户的流量,把历史数据和实时数据整合在一起,来主导运作。所以这个公司每一个门店的销售要超过竞争对手将近30%,损耗是非常低的。同样,客户相对来说对他的服务比较满意。这是一个非常有意思的整合。

  最后我想和大家分享一下,也是我们历年做“大数据”中看到的一个东西。“大数据”中做数据分析,它的回报在一个传统的模式实际上是一个优化的过程,我可以在数据中抓住的价值,最明显的我已经抓住了,但是从数据的挖掘来面,越多的数据,越多的分析,逐渐的得到的回报越来越小,越来越小,所以一定有一个点会给你最佳的回报,就是你的投入,但是云存储、云计算给了我们一个平台。但是“大数据”给了我们一个机会,就像刚才谈到的伟哥这个产生,在第一期“大数据”的回报是越来越小,但是论证这个药是不是适合心血管疾病,而且到了一个节点,它已经发现这不是最好的心血管的药。但是英文大数据突然发现有一个额外的价值,这是完全反过来的,不是原有的线给它的回报,所以这是很有意思的现象。

  在这里面想表达的一个意思,就是当我们在看待“大数据”的时候,很大程度从两个方面,一个是传统的数据分析的模式,另一方面可能我们要从持续的投入可能会有一个非常好的产品。什么时候会产生这个产出?是一个未知,所以大数据里面有很多的探索和不确定性,但是给了我们一个很大的思考空间。

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开