经历这几年的发展,人们已经基本走出对大数据与云计算技术概念的了解阶段,取而代之的是有越来越多的政府和企业用户,开始结合自身的行业发展需要,积极主动地借助“云”的力量来解决行业业务中的各类大数据问题。但随着实践的加深,一些问题也随之显露,并突出地表现在使用云计算技术的用户、云计算服务提供商,以及整个数据共享环境中,这些在一定程度上,制约着云计算行业应用整体的发展。

可用来分析的大数据并不好找
在2012年至2013年这段时间里,看到了数据挖掘与分析的巨大前景,人们对融入大数据并接触云计算技术的渴望愈发强烈。当时,全国各地政府部门率先部署和大数据有关的发展战略;与此同时,一些行业中的IT企业也在结合大数据的“4V”标准,评判接入云计算技术的可行性。他们率先积极与云计算服务商进行对接,一时间形成了广泛的跨界交流与探讨,并在理论方面率先取得了一些进展。
尽管这些用户对大数据和云计算技术有了初步的了解,在相关的工作中也保持着很高的热情度,但是在做完预算,制定了采购相应的云计算资源清单后,双方突然发现在业务内部或部门中,并没有适合的大数据任务可以放在云端进行相应的计算。因为在用户手中的数据来源多样,数据形态上也过于繁杂,对于怎样把这些数据规整到一个计算系统中,形成某一类云计算项目,则暂时摸不着头脑。
就像云计算在城市管理中的应用潜力是巨大的,每天都会通过摄像头等各种传感器向信息中心传来TB级的数据,这其中有各类参数、图片、声音、视频等结构化与非结构化的数据,如何把冗余无效的数据清洗,建立起价值数据的关联,并组成相应的计算模型放在云计算中心,其实就是一个个亟待攻关的难题。
这一方面就需要熟悉行业业务的管理者,通过加强深化对业务的了解,并善于就行业出现的问题总结出一些规律性的内容,为大数据挖掘及分析处理制定成熟的方案;另一方面,则需要那些了解云计算的开发人员,在充分理解这些业务规律的基础上,将这些规律转化为计算机逻辑关系和计算模型,通过放在云端不断实验,最终获得比较准确的分析结果。但问题在于,这些需要双方不断地交流与配合,整个过程往往持续很长时间才能达成理想的结果。
云端安全仍为用户质疑和警惕
云计算安全问题仍然是目前制约云计算发展的重中之重。美国Gartner公司在其编写的《云计算安全风险评估》中列举了七大安全项目,其中包括了优先访问权风险、管理权限风险、数据处所风险、数据隔离风险、数据恢复风险、调查支持风险、长期发展风险,它们基本上涵盖了云端数据流通与操作过程的方方面面。
云计算在国内已经出现了一些积极的进展,例如,云计算服务商通过构建自己的一套安全体系已获得国家司法部门用户的认可,作为云端服务的用户,他们将各类案件的证据储存在云端,在需要的情况下,随时抽调或进行关系化的数据分析和处理。但从当前来看,虽然云计算服务商们将不断确保他们的客户数据安全性,对于真正落实保障云端数据的安全,所有的服务商都不能给出一个肯定的答案。
相对的,无论是政府部门还是行业企业,这些客户面对着数据共享和交互的过程,仍然都保持着对云端信息数据安全的质疑和警惕。大多数云计算服务商在提供相关解决方案的时候都会遇到一个比较典型的情况,那就是客户会默认不能把财务或人力资源方面的敏感数据放到云计算平台中,因为他们会认为这些数据至关重要,一旦放在云端,出现了泄漏、丢失和篡改的问题,都会造成不可挽回的严重后果。
另外,在云计算的模式体系下,一些数据甚至完全不再保存于各部门管理者本地的计算机或服务器中,这极大加剧了部门管理者对信息安全性的不安。所以这些管理人员通常会三令五申要求云计算服务商加强对云端数据库的访问控制和加密,确保信息和数据的安全。综上云架构本身的安全性对所有行业来说,仍然存在着巨大的挑战,而一旦出现了安全问题,对云服务商而言将是一次重创性的信用危机。
依然突出的数据孤岛问题
随着云计算技术不断地在各领域中深入,无论是对于国家政府部门,还是对于企业,这些用户都希望通过数据在行业之间的打通和分享,创建一种全新的交互模式,并且在其中实现对跨行业、跨部门的数据综合体进行挖掘,进而形成更大的社会价值与经济价值。
然而当人们尝试实践打通行业间或不同部门间的数据时,他们会发现这里存在的矛盾相当尖锐,且并非像在理论阶段中思考的那样简单易行,因为数据孤岛问题依然是影响云计算技术发挥其效率的一大瓶颈。
由于数据分散于不同的行业,在不同的信息数据管理制度或保密政策下,由不同的部门、不同的人所掌握,甚至数据的格式也不尽相同,这些因素给数据贴上了“强独立性”的标志,给数据的互联互通造成了极大的障碍。
比如银行数据如果不能跟互联网数据相结合,那么云计算至多只是在处理银行自己内部的基本业务;另外,像汽车保险数据如果无法和驾驶员在驾车过程中产生的历史行为数据结合起来,就只能是在空谈这些前沿的汽车商业保险产品。所以,最不理想但却比较常见的情况是,许多数据可能仍然还停留在最小的组织内部,甚至分别被不同的人所掌握,从而极大地限制了云计算技术本身应当发挥的效率。(文丨本刊编辑 陈启临)

{{item.content}}