分享
Scan me 分享到微信

张敏:看超算技术如何崛起于地理信息

  6月10日,北京国家会议中心,以构筑地理信息新生态为主题的2015年全球地理信息开发者大会 (WGDC)在此拉开帷幕。WGDC自2012年起开始举办,四年时间里,伴随着中国地理信息产业的快速发展,WGDC已经成为位置与

  6月10日,北京国家会议中心,以“构筑地理信息新生态”为主题的2015年全球地理信息开发者大会 (WGDC)在此拉开帷幕。WGDC自2012年起开始举办,四年时间里,伴随着中国地理信息产业的快速发展,WGDC已经成为位置与空间领域最具影响力的技术创新盛会。

泰伯网

  在会上,华浩博达(北京)技术有限公司副总裁张敏进行了以“超算技术引领地理信息大数据”为主题的演讲。张敏指出,地理信息大数据面临着系统集成度低、行业跨度大,采编效率低、人海战术成本高,海量数据处理难、效率跟不上等诸多问题。以下为演讲实录。

  张敏:非常感谢3sNews给我们这样一个平台,在我演讲之前,我觉得百感交集,因为也是在3sNews平台,在第一届的地理信息开发者大会,我们参加了唯一一届的创业大赛,也获得了唯一的一个冠军。四年以后的今天,我站在这里,带着我们超算平台的发展历程,带着我们共同的经验,来向大家分享我们的痛苦与快乐。今天很多老总和业界精英都在提倡自己的理念,我觉得用非常简单的四个词,首先是跨界,第二个大数据,第三个创新,第四个就是变革。

  其实所有人讲这个问题的时候大家都在回避一个问题,就是困难。所有人在我们系统建设的时候有没有困难?当你面对大数据的时候,有没有困难?我相信困难到处都是,而且制约着我们地理信息的发展。所以,我的汇报题目是“超算引领地理信息大数据”。如何去解决?我从三个方面:第一、我把问题提出来,我经历过所有的空间地理信息大数据的问题。第二、我们华浩超算平台的应用和如何去解决的。第三、我们提出的系统的解决方案。

  地理信息大数据的问题什么?首先,系统的集成度低,行业跨度大。大家知道我们从地理信息数据的采集开始起,要历经飞行器,甚至卫星,到数据下载、传输,以及多数据成果的制作,测绘的加工,再到系统的管理、应用,再到三维的呈现,它是一个很长的技术链条。包括我所经历过的,我们地理信息测绘行业它的采编过程,我认为非常低,因为它主要的利用方式就是人海战术,利用大量的人力完成地理信息最原始的信息的采集。那么,海量数据,我曾经碰到过这样一个需求,在我们的国土行业,它要将一个接近400G的影像做一个地理加密,做一个投影转换,怎么办呢?先把400G切成3G、4G,然后一点点的转,转完了之后再合。怎么能把效率跟上呢?集成度的问题。

  地理信息是否能够与测绘来集成?我们的测绘能不能跟地理信息真正意义上的融合在一起?影像、矢量、三维是我们目前最常用的信息的接受体,如何将这些数据真正意义上集成在一起,地理信息平台是否能真正的与我们的高性能计算结合在一起,建立我们的超算中心?我参加过很多的超算中心,我们国家的,可以说大量的超算中心现在是在建虚拟机,要么就在闲置。它的应用在哪里?我们的数据又那么多,为什么我们不能去用他们呢?

  最后,我们的生产分析发布的时限,辅助决策的集成问题。我在一个智能城市的大会上提过这样一个观点,什么叫智慧城市?首先,你要解决你的数据从生产到辅助决策的整个流程的一个通路问题,如果你的生产赶不上,数据没有办法进入到应用系统,谈何智慧呢?这些都是我们最直接的问题。

  可以说我跑遍了大江南北,我们国家北到黑龙江,南到海南岛,西到西藏,东到东部地区,可以说大部分我们的生产制作的过程多以人工采编为主。当然,我们的质量也是无与伦比的,也在国际上也是享有非常高的声誉,完全靠人海战术,还有很多测绘行业,很多测绘单位,他们尽可能的,甚至挖空心思讲用什么样的软件进行组合,达到生产效率最高,达到最优质的成果出来。最后我们所有的作业员他们在经历过自己在计算机面前,端了一杯茶,慢慢的去等待它,我们人在等计算机的过程,这个过程非常的多。最后就是我们分布式的单机作业,这种模式其实也是非常非常的落后。

  总结一下,海量数据的问题,文件大了,软件干不了。超过4G的文件,十几G的文件,甚至上百GB的文件,软件可能就崩溃了。用户多了,系统干不了,一上线,上百人整个系统不干活了。信息多了,数据库用不了,很多在用的过程中,查询一年来累计的轨迹,这种信息如果在数据库里的记录数多了,数据库也不干了。采集多了,生产也干不了,我们国家的卫星在逐步的上天,但是我们有将近40%到60%的数据我们抛弃了它,我们没有去用它,为什么?因为我们生产干不了。决策分析多了,时间等不了。这个我相信大家也能非常直观的去理解,为什么决策分析那么多,计算机算不过来,实时性达不到,时间不等人。这些都是问题,为什么大家不去思考思考这些问题呢?

  华浩博达我们的超算平台就是以这样的背景,就是以这样的需求为目标,以它为导向来完成我们的完备的遥感专业处理,智能的可视化,海量的数据存储管理,以及高性能计算辅助的GIS制图和分析以及三维的快速可视化。对这种我们的从卫星遥感到航空遥感,到无人机数据处理,到建设我们的超算的中心级别的信息的快速处理和生成,甚至是更加快速的,什么快速呢?实时化的快速,来为我们的应用系统提供这样的数据服务。

  在这里,我们也一直在提倡我们的超算中心级别的数据生产服务。而且我可以告诉大家,当我提到超算的时候,我相信在场的很多朋友肯定是第一反映就是超算,无外乎就是接一个超算中心。我想告诉大家的是,超算在我们的华浩超算平台里,它不仅仅是超算中心,您身边的一台计算机,我们仍然可以把它变成超算,为什么?给大家举个例子。我应该说是在美国,他们有一种芯片技术,这个芯片他们有一个内核的软件编程,国外做到了8KB的大小,这样的芯片在制成8KB的核心以后,它的检测速度,装在导弹上的检测设备的检测的频率非常之高,但是它一旦变成出口,出口以后,它把这个核心改成了24K。整个的频率和效率就下降了,整个的硬件到软件的体质就开始下了一个层次,别人想超越它就会变得非常困难。

  华浩超算解决的是什么?挖掘计算机内部潜在的计算的潜力和能力,让我们的计算机真正意义上的得到发挥,得到计算。它是计算机众多资源利用的聚合的结果,而且我们现在已经做到了将“软件+硬件”结合的一个深度的产物。而且构建在我们华浩超算的集成平台上,相比较常规的协同式群体,比如很简单,我有100个任务,把100个任务放到一百台计算机上运行,得到的结果就是提升100倍,但是事实上远远没有简单。我们超算的思想,它的架构的设计就远远比协同式的群体要高非常多倍。

  最后,大数据的处理,我们有哪些优势?高效的计算和输出,我们曾经对比过同类的软件,可以说哪怕利用了GPU,甚至利用网络群体加速的环境条件下,相同的处理和算法,我们的速度仍然有巨大的优越性。第二、我们有强大的实时可视化的人机交互,在测绘行业我们一直在做这样一件事情,测绘是个技术门槛非常高的活,那是为什么?是因为它的计算非常的复杂,它的专业性非常强,为什么?你有了这个数据,但是你看不到结果,你需要设置参数,让它算出结果,我不是这个专业的人,怎么知道这个参数对不对呢?我给你一条途径,有了原始影像,设上参数,马上让你看到结果,马上让你看到你离真实的坐标差多少,我能让你实时的看到,这是完全颠覆了我们传统的这种生产模式,完全颠覆了我们脑海中的思维惯性,这个功能目前在我们群体内的应用非常广泛,甚至有很多大学老师利用我们这个平台研究他的新的算法,算法合不合适,只需要看一看,评判一下马上就可以去优化我的算法。所以说,它对于整个的算法的提升,对于整个的平台的开发有着非常重要的意义。

  第三、完整的地理信息框架。可以超算从来不担心效率问题,从来不担心用户的问题,从来不担心并发的问题。所以,它从数据的采集、处理、入库管理,甚至包括我们曾经也跟业界的老大的软件,ArcGIS软件比较过单纯的影像入库的操作,在同样的环境下,同台机器说,我们的效率能够超越它3倍,4倍,甚至达到5倍。还有两点,这个意义非常大,我们能够很好的去支持我们的国产卫星,很好的支持高分辨率下的无人机的数据处理。这两点它是真正意义上能够解决我们空间地理信息行业大数据的数量和成本问题。因为大家知道,我们这个地理信息做的就是地理信息数据,如果地理信息数据我们过去的难,获取的少,后面的系统我们只能在作秀。如果你的信息足够多,比如大家知道我们国家在建公安的PIGS,据我的了解,举一个技术人员的了解,很多的地方它的地图甚至是三年前的地图,它为了更新一次地图,需要花费上百万的经费,需要花费更多的代价,然后还要进行软件的升级,软件的更新等等一系列的过程,很痛苦。

  这是我们在全国的DEM生产当中的一些做法,这个影像是我们国家的资源危机,提取高精度DEM成果上,可以做到自动化非常高,效率可以达到每井生产只需接近15分钟的时间。这个是在超算环境下实现大数据的增量更新,可以利用变化检测的方式来高精度的区分我们的影像变化,精度非常高,中间经过了大量的计算。无人机,我们现在已经很轻松的能够做到更清晰的影像的处理。快速情报侦查,主要有一批数据,没有任何关系,拿来在20分钟之内拼成一张完整的大图。基础测绘,应该说是我们地理信息行业测绘最难的环节了,我们生产这样一个片子,只需要不到40分钟,一台计算机。另外,我们在其他的卫星上做了很多尝试,包括NPP、FY-3等卫星,我 将它的处理速度由原来的46分钟,提高到目前的3分钟,直接进入它的应用系统,进入火灾的在线监测。

  另外,我们的雅安地震,这个当时是被动的,我们并不知道,在一个很特殊的环境下,利用了我们的软件进行快速的正射影像的生产,生产的数据量50DB,生产的时间比拷出的时间要短。这是我们的生产效率,我相信这个效率我拿出来,还是比较引以为豪的,而且我相信应该在业界还是响当当的,我有这个信心。

  我们可以解决什么问题?首先,我们可以将数据生产和业务系统结合在一起,实现具备空间地理信息的监测能力,这就是有非常典型的一点,所有现在目前的算法全是在我们的开发环境当中,全是我们国产的,全是我们独立自主研发的。真正意义上跟我们的超算,跟我们的硬件体系架构结合在一起以后,就可以为我们提供更多的能力,包括数据生产的能力。比如你要做一个监测的系统,它要实时的,带上无人机,带上遥感,我可以试试的将这些数据拿过来做自生产,实现我的监测。这种需求就可以变成现实。另外,利用超算的能力,我们可以提供更多星源更多时像的地图产品数据更新的服务。最后,利用超算技术,它甚至可以为我们提供实时在线的高复杂性的分析服务,我们借助了WMS的标准实现这种高复杂性的分析服务,而且是实时在线。举个例子,我可以让我们的系统在比如说0.01秒之内,来完成对全国千万个PY点的绘制,甚至对它的序列分析,甚至在一秒钟之内完成对它的序列分析等等。

  那么,在一体化方面,我们实现了四个方向。首先,地理信息与测绘的一体化,实现采集与应用一体化。影像、矢量、三维的数据质量的一体化实现数据同构。加速超算与地理信息的平台进行一体化,够可以实现在超算平台下的地理信息平台。生产、辅助发布一体化,实现我们真正意义上的辅助决策,智慧的一体化。

  最后,做一下总结,华浩超算平台是我们公司贡献给行业的一套结构完整,功能完备的大数据的支撑平台,也是一套集新兴的基础测绘,地理国情监测、应急辅助决策为核心的地理信息大数据服务平台,也为我们提供二次开发,最后希望我们同仁多多指导和关注,谢谢大家!

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

下一篇

1

泰伯APP
感受不一样的阅读体验
立即打开