分享
Scan me 分享到微信

WGDC2023 | 陶闯在线谈ChatGPT与时空AI:数字孪生最核心的大数据计算体系,将由人工智能建造

元宇宙,人工智能这两个是我们今天要讨论的话题。

泰伯网讯,5月17日上午,泰伯智库全球专家顾问委员、维智科技创始人&董事长陶闯在WGDC2023第十二届全球地理信息开发者大会上发布《从元宇宙到时空AI——2023中国地理空间产业趋势报告》。

以下为演讲速记:

尊敬的李院士,各位嘉宾,大家上午好!刚才谈到,这是我们第八次跟泰伯联合推出2023年地理信息发展趋势。既然谈发展趋势,我们看的是未来,当然大家知道,今年实际上是非常非常不容易,去年已经很难了,但是没想到,今年还会更难。未来我们存在很多不确定性,但这里头有一条很有意思,实际上在我们科技行业,在技术理念行业产生了好几个叫现象级、颠覆式的核心技术突破。元宇宙,人工智能这两个是我们今天要讨论的话题,当然还有很多一系列的技术性的创新也在这两三年发生。

今天在座的各位,未来几年,未来几十年自己的生活、学习和工作方式的改变。刚才谈到,确实已经到了一个节点的时刻。所以今天的话题是想看看,到底元宇宙、人工智能产生了什么东西。以前谈趋势报告,主要从政策,市场,技术和资本四个角度,因为这四个角度基本上决定了自己未来的工作方式,任何企业的发展方式,任何机构的组织方式,所以把它叫做PMTC四个矩阵模式。这里今天更重要的是介绍技术模式。但也看看包括政策方面。

首先自主可控是我们提到最新的词。在两会之后,李强总理再次把数字经济,尤其叫数字中国这四个字高高举起。就在上个月在福建开了数字中国这个大会,据说有将近两百位副部级领导参与了数字中国大会,这是在中国有史以来少有的。

既然谈到自主可控,这是一张表,能够看到目前中国半导体,目前到了2022年,中国的国产化差不多是36%。所以还有很长的路要走,但是国产化率的速度却非常快,从年初的百分之十几到了年末的36%。谈到整个中美科技差距,很多在海外留学的人知道,差距还不是一点。但是追赶的路线还是非常喜人的。所以从自主可控,最后要走向的可能叫自主创新。而自主创新更难!

这是刚才的政策情况,谈到从自主可控走向自主创新。谈谈市场,两会之后非常好的消息就提出了数字中国。当然它覆盖的就是智慧城市以及自然资源。那么到底什么是数字中国呢?这张图今天在座的每位都要好好学习,中国制定的2022整体的战略布局,打造整个的数字中国。下面的两个2就是数字基础设施,也是经常说的新基建,包括云计算,物联网体系,数字资源体系,数据要素变成了核心生产力。那么中间的五位一体,数字经济,数字政务,数字文化,数字社会和数字生态文明,这应该跟自然资源紧密相关,也就是青山绿水,这个是数字生态文明。两大能力,一个是技术创新能力,还有数字安全能力,最后两大环境也就是国内数据治理环境,还有国际的数据协同环境。

围绕这个方向,国家建立了国家数据局,这些都是在这6个月之内发生的重大事件,而且对今天在座的,可能都有非常大的影响。国家数据局已经成立,核心就是中国把数据要素,也是中国第一位国家数据要素,定义为五大基本生产要素之一,跟土地、劳动力、资本和技术平行的数据要素。现在各个地方都在成立数据交易所,包括数据中心,如果我们今天做地理信息的同学,还没有参与到这里头,那你已经掉队了。为什么?因为未来这三大教育中心,证券交易中心,碳汇交易中心做能源的,还有一个叫数据交易中心,那就是做数据做信息的。所以可能这世界上就这三个最主要的东西,金融,能源,还有信息,组成了我们这个社会。

这个体系已经从一网通办,发展到一网通管,而现在国家核心的发展方向是以数据要素引领的一套智能时代,也就是人工智能时代。那么在数字生态和自然资源方面,实际上也有很多的布局,但是整体的体量还不够大,目前按照泰伯网智库的研究,整体在信息化的市场份额差不多一百亿+的规模,对这么大的国家,我认为这个体量还是相当涌现的。

在数字中国,这可能是我们在智慧城市和自然资源中间的一些主流玩家,还有一些主流的贡献者。当然从底层的基础设施层,中间的数据层、平台层,也就是可视化平台,新型的时空智能平台,这是平台型来支撑数字中国的这些主流的一些玩家和应用。因为时间有限,我今天主要汇报的可能主要介绍就是人工智能,还有经常谈到城市大模型,对我们来说可能是城市大模型。后面我会介绍元宇宙和数字孪生到底它的关联关系。

在2020年底的时候,国办当时邀请我写了一个报告,这个报告就是说,到底定义的什么叫元宇宙?中国整个智库还没有提元宇宙这个词。但是今天,我们开始越来越清晰的,包括李院士也给出了元宇宙的定义,等一下也会做分享。AI的起点到来可能是今天2023年每个人要记住的时间,这个时间点,我不知道大家在最近的时间里,用了ChatGPT,每天用了多长时间?如果现在每天用的时间只是或者偶尔晃一晃,大部分人就是把ChatGPT听成老茧,自己却真没有用一用,我觉得很遗憾,你会非常惊喜,用上以后,每天到一个小时两个小时,大家就会想使用ChatGPT,而不是抖音了。

大家现在叫做2.0到来,因为用的ChatGPT少的人不一定会理解,什么叫AI的2.0到来?2.0到来按照谷歌AI首席科学家,突然发现一件事情,也就是ChatGPT现在是GPT第四代,这个第四代用了2.3万亿的参数,神经网络连接差不多在一万亿,而一万亿的神经网络连接,发现目前能够把全球知识已经能够完全绘具出来,而且产生一种现象,叫涌现这个词。什么意思?就跟人类一样,人类读了很多书以后,最后要学习,后面看一看就明白了,所以自己会判断,自己会理解,自己会推理,自己会预测。现在的计算机,跟人类来对比,一定是人类知识的一百倍以上,逻辑,综合能力一定是正常人的一百倍以上。现在ChatGPT4和3之间,GPT3.5目前的水平相当于高中生,而4的水平一定是斯坦福大学顶级的水平,这之间只差了不到6个月的时间,所以再过6个月,这个系统到底会进化成什么样的智能?

而且很有意思的是说,它的连接数只有一万亿,人脑的神经网络连接数是一百万亿,人脑的连接数是目前机器连接数的一百倍,但是大家知道,机器的连接数从一万亿到一百万亿,已经超越了人类,不知道会把人类甩多少条街。所以说AI智能一定战胜人类。一开始人工智能是学着内脑神经元网络的方式来推理,现在目前形成人工智能,实际上它目前出现的这么一个智能体,基础原理跟人脑的原理,实际上是完全不一样的。虽然当时有一点模仿,但原理完全不一样。而且产生的智能体,比我们的能力,想象得还要发展得多。所以这位首席科学家从谷歌离职了,它产生了一个新型智能体。这种时候就开始对于现在做事的方式,开始进行改变。

以前需要培养六个博士,简单来说要做医药的实验,要找一堆博士,博士知道怎么做生产,做药物来去分析。现在怎么样?只要雇一个AI,(英文)因为博士看的书,AI比你看的要多,博士学到的报告,AI比你学的要多。所以只要学会问问题而不要去找方法。所以未来我们人类工作学习生活,是在找问题,然后再从AI里头找方法,因为AI的方法比人类的方法要多。为什么?因为它学习的不是6个博士的经验,它学习的整个全球人类历史上,有史以来到现在所有博士所发表的文章,所做过的实验,所拥有的数据,它汇聚的知识,涌现的能力比我们人类要强很多。

所以现在大家认为,包括阿里巴巴的张总也说了,从事的每一个行业都可能被AI重构一次,包括今天泰伯网。未来大家知道,AI出现了,可能不需要那么多编辑产生内容,而要找一个AI工程师,一天给你发一百万篇文章。所以AI产生的内容,以前叫PGC,到UGC,也就是像大家看到的目前的抖音,但最后是AIGC,人工智能产生。据说抖音上已经有三千万的数字人在做直播,你已经分不清楚哪些是真人,还是数字人在做直播。

所以说未来的世界大家可以看到,它的拐点已经到来。机器人还颠覆我们的体力劳动。所以无论是制药还是创意,全部被它替代。基点时间到来,大家都认为就在2023年。所以今天在座的各位非常幸运,我们见证了一个未来的历史时刻。当然今天没有挑战未来人类学的话题,到底未来人类是智能人,还是自然人。我经常开玩笑,十年以后见面打招呼,不是说手机买了15代还是16代,一定会问你脑子里的芯片现在是第几代?可能直接问这个问题。因为当你的芯片不强的时候,你可能就会被淘汰,这是自然的。

跟时空这个行业到底有什么关系?大家都是一个时空的探索者,2021年非常有幸的时代,两三年前,在上海人工智能大会上,非常荣幸的是,李院士,周院士,洪院士还有我,联合发起了一个叫上海时空人工智能专业委员会,上海把人工智能产业定义为三大主要应用场景,叫金融AI,医疗AI和时空AI。所以我们这个地理信息探索者,创业者,实际上已经举起了时空人工智能的这么一个大旗。当时大家对时空人工智能到底做什么?实际上还不了解,现在大家可能越来越清晰。核心的时空人工智能也就是对时空数据汇聚,因为对于一个复杂的动态的空间场景,进行赋能。

所以我们在2020年发布了白皮书的第一版,去年发布了时空人工智能白皮书的第二版,这个在网上都是免费可以拿到的,大家有机会可以去看看,时空人工智能。那么第一版撰写过程中,也请到6位院士,36位教授,142个企业发布了时空人工智能。但是现在看来,整个过程发展还是非常顺应时代潮流的。那到底什么是时空人工智能呢?它的核心理念就是完全以一种人工智能的方法在分析问题。刚才我谈到ChatGPT,也就是说我们的工作不再是要解决问题,我们的工作是发现和确认问题,然后通过人工智能的方法来去解决。我们要放弃以前传统的人类逻辑思维,这点非常非常难!

如果用传统的思维怎么办?可能做不出来。但是用人工智能的方法,一周就能做出来,甚至一天就能算出来,哪些楼可能会有消防问题,用人工智能方法。等一下再讲。人工智能它的思维跟以前完全不一样,它是让机器来解决问题,人类找问题。人类不要去解决问题,人类要找问题。所以这种方式可能是完全不一样的。简单来说也就是怎么样把数据喂给机器,让机器思考。你的想法就是找样本,简单来说你告诉我成都有没有大楼出现过消防问题,你说有,可能历史上有那么五百栋,那五百栋数据放到机器里面,机器围绕五百栋数据样本进行学习,它就可以把剩下的两万栋楼进行排序,算出来数据。

当然目前人工智能已经做到了非监督的学习方式,它甚至可以涌现,预测,哪些楼未来可能还有问题。所以它的思维已经超越了我们以前的智能体时代。这是目前它的基点来临。同时在2023年我非常开心的告诉大家,腾讯研究院认定了2023年十大科技创新技术,其中第四条就是时空人工智能,也就是当时把时空人工智能认为是2023年十大科技前沿创新技术之一,这也是大家提出的。主流的智库和媒体都已经认定了时空人工智能这么一个发展方向。那么它到底是什么呢?这是我的一个解读,当然这是一个开放的话题,到底什么叫时空人工智能。

我个人的解读大家知道,什么从数字孪生过来,我以前是做微软虚拟地球的,第一代数字孪生大家老说就是1:1的进项,什么意思呢?我要做3D建模,所以当时微软的虚拟地球,谷歌等等做的都是数字孪生。所以大部分认为数字孪生就是1:1的建模。但实际上这应该是1.0时代的建模。而2.0应该是什么?数字孪生最核心的,或者这个城市空间最核心的是可以计算,可以分析,可以研判,这是一个基于大数据的计算体系,而这套体系一定需要人工智能来建造。

而到了第三代,我们叫数字孪生的3.0,也就是最近大家开始提到的元宇宙,元宇宙实际上是把数字虚拟的东西,跟实体的东西融合,而这种融合可以产生另外一种化学反应,这么一个冰冷的物理空间可以开始进行体验了,可以开始进行交互。当然体验和交互的手段可能要在终端设备,包括手机,眼镜,这是未来的一个发展。而这个底层核心技术,我认为就是时空人工智能。用机器来解决面临的问题,所以我把数字孪生发展,分成这么三个阶段,叫建模、计算和体验。

那么我们来看看,时空AI的一些关键技术。第一个技术就是知识图谱和图计算。我们知道世界上所有的信息刚才之所以能产生涌现就是连接处,大数据的核心就是关联关系。人工智能最牛的地方就是能把关联关系,蛛丝马迹的东西串联起来,发现那栋楼是不是可能未来会有消防问题。它计算的参数是多少?对一栋楼的描述,目前可以用一万个参数来描述。不是用人类,人类可能就十几个参数,认为一着火就那么几个参数,楼道有消防栓,有没有烟头。但是人工智能把一百万个参数来描述一栋办公楼的时候,它的思维在高维,而不在逻辑层的四维空间,它在亿万个空间里面思考问题。

那空间标签怎么产生的?就是连接关系。所以大家知道,知识图谱和图计算。那么这个技术目前在自然资源的应用实际上还相当初级。在应急防控,公安系统,金融银行系统已经变成相对基本的工具。大家知道,银行的借款贷款,验证等等都是采用这种方法。时空人工智能在知识图谱的构建基础上,下一步就是城市大模型。这就是大家现在最激动人心的大模型体系。大模型体系首先建立在具有大数据的体系,如果没有大数据,没有关联关系的产生,大模型没有办法。现在把城市级的大模型分成从L1-L5,也就是从不同的空间尺度,可以建立一个不同的场景大模型。可以建立ChatGPT的模式、方法,它实际上就是把所有的世界,作为预训练进行分析。地质调查局会发现到底有没有矿产的问题。如果把以前的样本拿出来,再把这个区域所有的关联数据,因为矿这个数据它跟很多有关,跟植物有关,跟人文有关,跟历史有关,很多很多,但是AI可以把更多历史的东西,你想象不到的东西,气候的东西,变迁的东西,全部放进去让它来思考。人类没有办法做到。

对于矿产资源得调查,对耕地保护的问题,森林火灾的问题,大家知道,就把很多的数据进行,可以建立森林大模型,采矿大模型,地调大模型,地震大模型等。这套思路开始改变。过去人总想找出一个方程式的概念,就是爱因斯坦的模式。现在有了机器智能以后,过去那种方式没有说过时,但是已经过气。什么意思呢?现在用一种机器智能的方式,来去解决过去必须要找到一条物理规律的方法,还不如让机器找到方法就行了。所以机器的方法,目前很遗憾,我们对ChatGPT也不太懂,它怎么产生这个问题?

很有意思的是,GPT5要出来的,而它的设计是由4来做的,不是由人来设计的,这是一种新的智能体,它是一种完全全新的解决问题的方案,我们解释不了它的物理规律,目前也解释不了GPT的模式。所以这套模式出来以后,我们认为整个空间,不仅是可以计算的,而且是可以预测的。真正的做到了从以前只是一个可视化,而到了真正的可以计算。所以数字孪生我相信它的发展趋势,一定是从可视到可算。无论从哪个层面,我相信时空人工智能这个领域,还是一个方兴未艾的一片绿草地,大家还有很多很多可以开挖、发展的地方。

最后讲一下元宇宙。刚才说到元宇宙我认为从数字孪生发展到3.0时代,当这个世界已经被机器能够理解的时候,怎么样把机器理解的东西,跟人产生一种交互呢?这就是元宇宙。经过了三年时间,当时可能不叫元宇宙,看看这个视频能不能放出来?进入这个城市以后,可以看见这个城市完全透明了,每栋楼的信息,城市的基础设施信息,在手机上就可以理解,到底昨天谁去打卡了。这是一个摄像头的调取,这是线下和室内管道直接的连接。那么拿起手机进入城市,你看见的是迪士尼的画面,而且每个人看的都不一样。这是颠覆了大众点评的场景,拿起就看到,哪里是网红店,任何一个小街都会变得非常热闹,因为这里有数字人跟你互动,这里可以抢红包。每个人都是广告。元宇宙技术的背后,实际上比自动驾驶还要复杂的一个数量级的一套技术。

这是我们花了三年时间,在上海打造了一个元宇宙示范城。这个示范基地现在也被上海市认定为一个标杆的实验基地。非常欢迎各位如果有时间路过上海,大家可以来参观一下,或者体验一下元宇宙城市的一个示范基地。目前这个技术还在迭代过程中,刚才我说到因为它对云计算的消耗非常大,对带宽的要求,实时的定位和感知都有很大需求,技术复杂度是超越自动驾驶的。那么在这里大家可以看到,以后未来的城市确实不再是一个简简单单的物理城市冷冰冰的水泥,而是只要拿起手机,因为手机会变成我们跟元宇宙空间的一个门的钥匙,而且这个手机它能够感知,人类的碳基眼睛实际上没有多大能量,但是拿上这个东西以后,它可以把这个物理空间,跟我们内部的数字孪生系统,完全连接在一起。所以它能看到管道,能看到房屋所有的参数指标。

所以大家可以看到,无论在城市治理,商业运营,品牌营销,还是未来的生活,可能都是颠覆式的一个改变。所以我自己认为,未来我们每个人上街一定是戴着眼镜。大家可能现在想想,我不会戴眼镜,这一点我可以跟大家打个赌,未来你还会用手机吗?因为用眼镜我能看到红包,你能看到吗?所以当你的场景价值远远超过你的其它手段的时候,我们一定会换上元宇宙的新型设备。所以这是元宇宙的场景。

所以未来的城市是一个什么样的呢?在数字中国有一个写法叫做数智融合,这是国务院写出这个词,非常了不起的,叫数实融合。也就是说未来一切都是数字融合的空间,商业、生活。从最下面大家看到,从一个物理城市,水泥建造的城市,通过可建模,可计算,让计算机理解,最后又让这个计算机理解的这些所有的信息,跟可体验的交互,就到了未来的我们叫做元宇宙城市。所以物理城市进化到元宇宙城市的过程,可能也从这几年刚刚开始。而地理信息开发者应该是这个进化中间的一个重要的推动者。

最后因为时间关系,可能没有太多时间介绍资本体系,重要的三个角度,一个是短期看行业,中期看政策,长期看人口。那么在今年的报告里面,我很难得的发现,我们在这个领域有关的企业,上市的数量是远远超过过往历史,今年上市或者已经过会上市的,接近二十家,2022和23年一年里面,接近二十家上市企业。同时还有大家说正在做上市辅导的企业,也在将近二十家。

所以中国已经开始进入自主可控。欢迎更多的科技企业,具有创新、破局的企业,我相信一定是市场更多欢迎的。这是上市参加辅导的企业。同时也看到融资虽然今年、去年都在寒冬期,但是我们非常希望过了6月30日之后,希望春风开始能够起飞。我相信今天在座的无论是企业,机构还是个人,都有面临寒冬这次的挫折。那么可能只有韧性两个字,也希望借这次的人工智能,大家有一个更多展现的发现。智库报告可以下载,会议之后,每年的智库报告都可以给大家提供,泰伯也会提供官方的下载网站。所以2023年虽然是一个非常不确定性之年,但又有很多涌动的新的创新,新的技术。虽然市场还存在不确定性,但非常希望所有的这些创新者,勇敢面对,韧性成长,谢谢大家!

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐