谷歌Immersive View，看起来很美

从时空信息专业角度来看，其所提供的的能力与实景三维中国的建设要求相去甚远。

在刚刚过去的I/O大会中，谷歌地图团队又推出了全新的功能—Immersive View。该功能基于人工智能技术，通过手机屏幕可沉浸式浏览感兴趣城市的实景信息，可叠加渲染实时路况、天气情况等，并能够浏览建筑物内部（餐厅、酒店）布局信息。该功能引起业界强烈反响，被Ars Technica 评价为：“谷歌地图的终极图形模式”。一时间各路新闻、专家、自媒体纷纷下场进行宣传，赞扬之声一片，吃瓜群众也跟着激动万分。

但是，谷歌这次推出的Immersive View真的如部分媒体所说的一样，是“下一代地图”或“地图的终极图形模式”吗？笔者对此持怀疑态度，主要原因如下。

首先，从发布会上展示的效果来看，的确酷炫，城区的光影、建筑物的色彩、以及叠加了天气因素后带来的氛围感，呈现出了电影级大片的感觉，大幅提升了C端用户的视觉体验，同时，用户可以利用这项技术提前对目的地进行更逼真的感性体验。但除此之外，这项技术还能带来什么样的应用场景？尤其是存在大量需要测量、空间规划、地物监测类场景的企业侧和政府侧，如果仅是提升了视觉效果，那对企业用户、政府用户产生的价值很小，还需要进行深入观察和展开想象，识别出有价值的使用场景。经过过去多年的技术演进和市场进化，单纯靠一个酷炫的IoC大屏就忽悠一个项目的时代已经过去了，客户现在的要求更加的实际和具体，结果的可视化仅仅是一个基本要求，可视化的效果是一个加分项，不是决定项，真正需要是如何支撑好客户业务发展，解决客户的实际问题，应该是面向业务帮助客户构建系统，而不是面向领导，如果仅是为了领导视察时呈现一个美观的界面大屏，大可不必。

其次，以NeRF为核心的神经网络建模，实际上就是用深度学习的方法完成3D渲染工作，目前的技术对算力的要求还很高，举个例子，0.55平方千米的城区，就需要1.1万核时的算力，折合差不多2万人民币/平方公里，显然，仅仅是渲染部分的成本就超出了行业目前的接受能力。同时，为了加速渲染，谷歌使用了谷歌云端的Immersive Steam技术，在云端利用大算力完成渲染，然后推视频流到端侧，满足了效率和多平台适配的需求，但带来了多少的成本增加，还需要更多的信息进行判定。那么，现在要回答的问题是，是否有必要仅仅为了视觉效果的提升，承担如此大的附加成本？过去两年多来，在疫情的影响下，全球经济均受到了不同程度的影响，如何将有限的资金用好，是政府客户、企业客户最关心的问题，如果将大量的资金投入在逼真但不真实的视觉效果提升上，对自身业务的提升作用不大的情况下，笔者认为是得不偿失的。

再次，还有一个最核心的问题，盈利模式是什么？众所周知，谷歌是一家以广告收入为主的美国上市公司，获取流量是其商业成功的核心，而地图是获取流量的一个重要入口，因此过去很多年，谷歌在此领域进行了重资产投入，今年亮相的Immersive View视角，更是以视觉效果为核心，牢牢抓住了个人用户眼球，从而确保流量源源不断，最终保证广告收入和股价继续提高，实现整体的商业闭环。那么，其他类型的企业，是否有必要也深度投入到该项技术中呢？尤其在互联网企业大幅裁员，最终客户收缩投资的大环境下，现在大举跟进，在成为技术的先驱时，是否也同时会成为市场的先烈呢？这一点对于技术型的企业来讲，尤其是需要慎重对待。

总的来说，谷歌作为技术的先行者，利用其深厚的数据积累和资金，为用户呈现出了一个效果逼真、技术满满的产品，为行业未来的发展提供了一种可能，非常有借鉴意义。但目前，Immersive View仅仅是提升了视觉效果，并且还需要投入大量资源，盈利模式也尚不清晰的情况下，行业、企业、最终用户都需要保持清醒，切莫盲目跟风，还是应该聚焦在为企业和客户创造价值，选择正确的技术和方式，解决客户的关键需求。

实景三维中国建设是当前行业里最热、最重要的建设项目，尤其是在2022年2月24日自然资源部办公厅印发了《关于全面推进实景三维中国建设的通知》后，各种新闻、会议、研讨、文章、产品层出不穷，热度持续升高。一方面，说明了市场和社会对实景三维中国建设的高度关注，另一方面也说明了还存在很多的争议和问题需要澄清和解决，在这个过程中，需要行业内各方积极参与，在争论和协作中逐步统一认识，对关键技术进行突破，才能有效支撑实景三维中国建设稳步有序的开展，最终取得成功。笔者暂时不在这里详细讨论实景三维中国所需要的核心技术和关键问题，借谷歌发布新技术的机会，想先谈谈谷歌这次推出的Immersive View技术能否助力实景三维中国建设，对实景三维中国建设有多大的作用？

实景三维中国建设是一项非常重要、复杂、有难度的工作，囿于篇幅有限，无法进行详细的分析和阐述，笔者本次仅尝试从需求角度对此展开分析，希望能够窥得一二。从部里发布的《实景三维中国建设技术大纲（2021版）》来看，大纲明确提出了6个提升要求，即：

1. 从“抽象”到“真实”。这里的真实，不是显示效果的逼真，而应是结果的真实，包括在正确的位置、显示对应时点地物实体的真实样貌，包括形状、色彩、材质等；

2. 从“平面”到“立体”。这里的立体，不是人眼看起来立体，也不是把地物简单的按高度拉高，而是真正构建三维立体模型，以立体的三维模型表达立体的空间。

3. 从“静态”到“时序”。不能仅是呈现不同时间、不同季节的场景视觉效果，而应是呈现不同时间地物实体的形状、色彩等的变化。

4. 从“按要素、分尺度”到“按实体、分精度”。实体不仅是建筑实体，还应包括地形、山体、水体、道路、边坡、沟渠等实体，并且能满足不同的精度要求。

5. 从“人理解”到“人机兼容理解”。重点说明一下机器理解，不是调用接口能够显示视觉化结果、能够与其他数字化产品融合显示就是机器理解，这个观点是错误的。正确的理解应该是机器可以理解实体本身、以及实体与实体之间的关系，从而能够在时间和空间上对整个空间内的实体进行分析。

6. 从“陆地表面”到“全空间”。顾名思义，地上、地表、地下均是实景三维中国的建设范畴。

从这6个提升要求来看，谷歌提出的Immersive View仅仅是实景三维中国建设所需要的技术之一，其重点解决了可视化效果的问题，看起来逼真但不真实，美观但不客观，可以说部分实现了“真实”；至于时序、实体、精度、全空间，由于目前提供的信息有限，并没有看到相关的内容；人机兼容理解角度，谷歌本次发布了ARCore Geospatial API，主要用于导航和游戏领域，在空间分析领域，也没有看到相关的介绍。

综上，Immersive View的确是一项非常创新的技术手段，结果和效果吸引了大量C端用户关注，但从时空信息专业角度来看，其所提供的的能力与实景三维中国的建设要求相去甚远，几何建模仍是行业内的关键方向，未来，或可作为提升可视化效果的手段，引入Immersive View技术。

目前，笔者认为，还是应该重点解决大空间尺度下的不同视角、不同数据源、不同空间下的大规模平差、空地匹配、自动单体化、模型轻量化、安全可靠等关键问题。在这些领域，我们国家的科学家、研究院、测绘单位、企业等已经进行了多年的研究，并且已经有了大量领先的国产化技术和软件用于实景三维中国的建设，在这一点上，完全可以实现完整的国产自主可控，以我为主，借鉴优秀技术，构建我国在空间信息领域的核心技术和产品。