傅盛对话清华教授沈阳:中美大模型PK和释放AI“超能力”

傅盛对话清华教授沈阳:中美大模型PK和释放AI“超能力”
2024年03月07日 12:21 财经新媒体

“最强AI模型”一夜间易主。

3月4日晚,OpenAI最大对手之一Anthropic推出自研大模型Claude的第三代版本,按能力由弱到强分别包括 Claude 3 Haiku、Claude 3 Sonnet和 Claude 3 Opus,其中Claude 3 Opus在14个性能指标下超越GPT-4、谷歌Gemini等一系列模型。

从Gemini、Sora到Claude 3,2024年仅过去两个月,AI大模型仿佛成了“科技赶海”圣地。

海外巨头奔跑在一个快速迭代的道路上,不会完全停下等待大家追赶,混战愈演愈烈。

根据国际数据公司IDC预测,全球AI计算市场规模将从2022年的195亿美元增长到2026年的346.6亿美元。其中,生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。

大模型的竞争,当下被看作是国家间竞争最重要的科技高地之一。

自2023年3月,百度率先发布文心一言,国内各科技巨头、高校、研究院等纷纷发布自研大模型。从数量看,国内大模型发布数量与美国差距不大,但就影响力而言,国内大模型并未产生全球现象级爆款。中美大模型竞赛下,大模型江湖已分成两大分支。参数派追求“更大更强的AI能力”,应用派主张将“足够的AI能力”投入可变现的商业应用场景。

人们渴望中国产生ChatGPT式革命性应用背后,是中国AI大模型产业新一轮机遇和挑战。

日前,《财经》新媒体与猎豹移动董事长兼CEO、猎户星空董事长傅盛,清华大学新闻学院教授、博士生导师沈阳进行了一场对话,沈教授也是国内研究人工智能、大模型的前沿学者之一。我们从中探讨了三大问题:中美AI大模型的差距是扩大还是缩小了?走出追赶GPT-4的目标,国产大模型新机会在哪儿?AI如何重构人类世界?

以下为访谈节选。(为方便阅读,作者进行了文本优化):

“事物一旦确定,

可以通过加班解决,

美国人应该比不过中国人”

《财经》新媒体:两位如何看中美之间的AI大模型差距,中国有何优劣势?

傅盛:这一轮大模型的出现,与其说是技术积累的胜利,不如说是技术信仰的胜利,更可以说是走差异化路线的胜利。基于人工智能的同一根基,中美的大模型差距没有那么大,中国在算法上略逊一筹,在应用上更好一点。OpenAI选择了一条差异化的路线,从AI技术路线上走出了一个新分支,从这个角度说,中国在这条路径上晚了一两年时间。

此外,OpenAI这条路是否一定能走通,就算走通了是不是唯一道路,今天业内还在讨论。因为千亿以上参数大模型的算力消耗十分惊人,所以,已经有人在考虑能不能用更小的参数,甚至一些应用领域不需要这么高的技术,而满足生产生活的需要,这就是今天开源的这一块。目前中国更切实际的做法是:少数企业去复刻OpenAI,更多企业在小参数下做应用。可能平民化的东西更有市场,更能改变世界。

沈阳:从0到1的创新,大多数是个别人或者少数人的创新。个人觉得在不确定性中的创新,美国强于中国,而事物一旦确定,如果可以通过加班解决,美国人应该比不过中国人。所以,在比较确定的人工智能某些板块,中国跟美国的差距会缩小;在不确定性的板块,差距可能会拉大。

比如,比尔·盖茨认为当前生成式人工智能已经接近极限。但是如果再加100倍算力,可能还会有新的智能涌现,也可能会让机器变傻了,这种不确定性方面中国要追赶美国存在难度。但是,中国现在已经做了百亿、千亿参数的模型,也有很多应用场景,如果把模型用到各行各业,凭借中国在中低端制造业全世界第一的地位,肯定比美国更深入。

《财经》新媒体:AI大模型是全球科技竞争的焦点,也是中美科技博弈和战略竞争的必争之地。在AI大模型不断迭代的当下,两位焦虑吗,该如何理性思考?

傅盛:中国社会经过几十年发展,已经从野蛮生长期进入真正追求创新的范式转换,但很多思维方式还未转变,这是中国社会的焦虑。我个人焦虑是因为当时猎豹抓住很好的机会出海,变成上市公司,并开始投资AI。但没想到由于国际形势变化,公司在美国的很多业务受到影响,那时候你要做创新,大本营却在失火。

到2023年,我反而不太焦虑。一方面是发现一定要从自己内心寻找力量,另一方面是大模型出现后,公司专注在这条线上做出Orion-14B百亿参数大模型。我也相信大方向一旦确认,不是只有拼算力才能做成。今天已经非常明显,在现有技术框架下,很多人在追求参数越小越有智能,这条路也走得通,其实我们对算力的需求也不需要那么快。

沈阳:焦虑一方面是美国制造的卡脖子等问题;另一方面是从近代史以来,中国人普遍有要做世界第一的梦想。但是大家要心态平和下来,因为第一不是完全靠追赶就能追过来的,是需要在放松情况下具备创造性和想象力,第二只要follow别人就行了。

《财经》新媒体:目前全球已经出现很多AI大模型应用,中国还没看到像Midjourney这类应用火爆全球。问题主要出在哪儿,什么时间节点可能会出现这类国产产品?

傅盛:硅谷对AI的信仰比我们强,中国的技术风向在过去几年转了很多,一会元宇宙,一会AI,大家总是相信好像砸钱就能砸出来,没砸出来就说明这件事不行。我觉得很多创新是从应用生长出来,今天应该重新去思考,相信从用户端出来的、小团队熟悉的路径。

沈阳:Midjourney主要因为它是闭源,所以算法没有公开。互联网有个特征,只要有开源算法,大家水平基本就一致。如果没有开源算法,技术创新扩散的速度就比较慢。所以在某些非文本领域,像图像类、决策智能等,闭源公司刚开始会走得更快一些。

从教育角度看,技术产品的多元性来自技术思想的多元性。在高校里面,如果大家想法都不是这么完全一样,同时技术思想的多元性可以得到资金保障,硕士、博士离开高校时很容易就具备多元化产品的设计和创新能力。所以希望技术思想的多元性在社会的宽容度高一些,这样才会有比较蓬勃的技术产品发育土壤。同时任何一个技术思想变成产品,都需要大量能容忍风险的资金和资本保障,这一点其实在2018年后比较弱了。

“OpenAI的最大竞争对手

有时不是其他AI公司,

可能是微软”

《财经》新媒体:傅总聊到过一个话题“什么是OpenAI的阳谋”,当你把合同、财务、业务数据等公司机密都传给ChatGPT时,或许并未意识到每一次使用ChatGPT,都是在帮OpenAI提升模型智商。正如GPTStore的发布,可能会让众多初创公司一夜暴毙。两位如何看数据让渡的话题,不想让渡的情况下是不是也有一些机会,两个路线哪种可能走得更远?

傅盛:科技发展环境一直存在中心化和去中心化的博弈,出现一个很大的平台想要拿到更多数据,然后更多草根出来反抗。过去十几二十年间,大公司的平台化能力越来越强,包括谷歌、Facebook的数据自我迭代都很强。但在大模型时代,会出现很多私有化大模型,个人也许可以让渡数据,但作为企业,会因顾及数据丢失风险、法律问题等不太容易让渡。

硅谷很多较大的公司现在都在自己训练大模型,如果训不了就让别人帮它私有化,不会用公网的大模型,因为对中大型企业而言法律安全第一。而GPTStore未来能不能通过个人开发者贡献更多能力?也许多少会让OpenAI长得更大一点。但GPTStore在企业端可能不会有太大发展。考虑到财务数据泄露等风险,比如我们,在对内部员工使用类似GPTStore的大模型服务上,也有严格限制。我认为GPTStore更多面对个人和特别小的开发者,中大型公司不太需要或者会非常有限度地使用。

沈阳:中国人对数据的利用跟欧美人思想观念不太一样,中国人可以让步比较多的个人隐私用于公共治理,欧美在文化上不太具备。此外,集中化的互联网运营模式效率更高,但完全去中心化给人的感觉是更加自由。

整个大模型部署目前至少有三种形态,一种形态是用公共的,任何数据都可以往上放;第二种形态是用私有云部署;第三种形态是完全离线,在内网里单独运行。在中国,第三种形态会有很大需求量。所以不同厂商的需求不太一样,这种多样性造成整个互联网生态的多样性。

另一方面,OpenAI的最大竞争对手有时不是其他AI公司,而可能是微软。因为微软的云服务收入很高,可能微软部署To B的这些应用,就把这部分业务拿走了。目前OpenAI在C端市场比较强劲,但它面临一个巨大挑战,一旦原来有流量的互联网巨头开发出跟GPT-4或者未来GPT-5性能相近的产品,流量可能就天然被吸收过去。像剪映上的一些人工智能功能,其实对很多小型创业公司影响很大,在这一点上生态博弈比较复杂。

《财经》新媒体:沈教授提到微软可能是OpenAI的最大竞争对手,怎么看二者的竞合关系?

傅盛:大模型和云有很大不同,云是规模越大单位成本越低,大模型是参数越高单位成本越高。我认为企业私有化模型会是主流,除数据安全外,私有化一个百亿参数大模型的成本也低很多。微软现在用OpenAI的功能满足需求,等需求慢慢摸清后,用个几十亿参数模型可能就替换掉了。

沈阳:微软是股东,但它也赚这个市场的钱。Windows系统在全球有十几亿台的装机量,一旦大家都用上微软的人工智能助手,其实就不需要到GPT-4的原始网站上进行访问了。其次,微软自己也想干高性能的、参数不太大的大模型里的小模型。这种情况下从微软角度思考, GPT-4也算它一条腿,还可以有一些平替方案。

这也是人类的两个AI大模型路径。第一,人类需要极端聪明的大模型。现在人类有很多难题没解决,比如怎么治疗癌症,怎么治疗艾滋病,怎么把量子计算核聚变搞定,这些必须要比现在智能程度高很多的人工智能才能彻底解决。人类一定会向对万亿、十万亿、百万亿的大参数模型努力。我们最近做过分析,超过爱因斯坦后还有十多级的智商提升空间,所以这是大方向之一。

第二,一定是让世界上多数人都能用得起的AI。它一定是推理成本尽可能低,但也可以通过模型跟模型之间交流,甚至可以从巨无霸模型里吸收一些养分,然后低成本地进行服务。这两条道路,都需要非常优秀的公司来做。

“AI可以把所有现象输进去,

不需要给它中间桥梁,

它就能把这个桥梁架出来”

《财经》新媒体:您怎么看AI对世界的重构,哪些领域可以最先实现比较好的AI大模型商业模式?

傅盛:今天各行各业已经统一到计算这个尺度。为什么说2023年是科技奇迹年,AI的出现一定会变成所有科学底层的东西,它不是一个独立的垂直分类,可能重构物理学,甚至重构所有科学,可以用端到端的计算完成整个范式的重构。

比如“F=ma”是牛顿第二定律公式,我们是把很多现象总结出一个公式,再推到更多的现象,本质是提炼压缩再淡化。我们为什么要中间这个“F=ma”,因为我的脑子只能接受一个比较简单的规则。但是今天AI可以把所有的现象输进去,不需要给它中间桥梁,它就能把这个桥梁架出来。

在很多领域,比如天气预报大模型,以前中间有很多公式,每个公式都是一次信息流失。但今天谷歌的天气预报大模型把中间公式省略了,中间有一些人类可能看不懂的规则,但就能得出更好的天气预报。DeepMind之前也是用蛋白质预测模型,结果快速预测蛋白质结构,破解了生物学难题。

沈阳:人工智能有一个特点,就是权威、全知和全概率,所以我最近提了一个哲学观点,叫任意有。只要脑子里想得到的知识和体验,告诉AI后它能描画出来,这就是任意有。所以我们会看到AI创造了一个新的意感世界,把人类认知扩展非常多,每个人把自己的认知外包给AI,相当于每个人都可以外挂一个buff,这是这个时代非常幸运的地方。

原来的哲学理念叫天人合一,我们最近谈的叫天人智一,就是天、人、人工智能三合一,回归到人本身能力的提升、生活状态的改善,关注特别多的是人如何在AI帮助下培育自己的超能力。我们特别期待的是如果有一个AI,它有具身智能,像人一样感知整个天地宇宙的一些参数,这时它能不能自发地发现物理规律和定律。如果能够发现甚至超越爱因斯坦的思考,人类文明程度可能会提升一大截。比如能做到对暗物质能源的利用,获得比核聚变更强大的能源,有没有可能就可以穿越到其他星系,这种可能性我们现在不能排除。在研究人的超能力培养过程中,我们希望有了AI后人类能做以前不能做的事,而不仅仅是量的变化。

从落地角度而言,我最近不太研究简单任务,比较关心的是复杂任务的AI替代,这对生产力提升比较有帮助。在AI教育,简单任务替代,包括绘画、文本对答、翻译等领域,个人觉得至少有40%以上的生产力提升。我一直提倡我们能不能未来缩短工作时间,能不能对下岗人员提供一些社会制度保障,这样会进一步促进AI发展。

《财经》新媒体:两位都提到AI的预测功能很强,但傅总也曾提到AI目前很难推测出人们下一句话要说什么。如何理解这其中的差异?

傅盛:在大语言模型里体现出的语言推理能力与人相比尚有差距,语言的确存在着高度抽象和压缩的特点,我觉得这可能是今天人类智慧最后一点遮羞布,这方面AI可能还需要更强大,但这条路径它完全做得到。另外,在小数据量下做推理,比如画某一对象时它没见过就很难画,但人却可以通过想象力去画。以自动驾驶为例,最难的是突然出现一个从没见过的事情,人可以刹住车,AI就蒙了。所以特斯拉用图像的核心是可以不去依赖实际路况,而是生成很多数据,让AI学。

AI真正的优势是数据广度比任何一个人高很多,这种广度下开脑洞之类可以做得很好,因为它见的比人多,基本数据化的内容比人强。

沈阳:我现在经常用AI画各种各样的杯子,但没有真正用上一个我自己用AI设计的杯子喝茶,也就是说在真实世界里面做出一个杯子其实挺难,因为有各种物理学的限制。人类应用AI的过程中,面临的最大一个挑战是把AI已经设计出来的东西,转换成真实世界里能解决真实问题的东西。比如化合物抗生素,我们用AI可以找很多可能性,但哪一种能帮助解决癌症问题,可能需要大量实验。我们就需要用AI把过程压缩到最短,让尽可能多的人快速享受到AI带来的福祉。

《财经》新媒体:2024年对AI应用有何展望?

傅盛:第一,第一波真正的AI大模型应用端落地,一定是以企业应用为推进,以私有化大模型为核心。第二,超越OpenAI这件事2024年在中国肯定不会发生,但中国企业可以在应用端走出不一样道路。第三,CEO能不能用好AI是企业竞争力的关键。

沈阳:第一,我在2023年跟AI聊天超过1万次,2024年我定个小目标,看能不能借助AI本身跟AI聊天超过100万次,然后能产出新东西给大家。第二,我们认为2024年是多模态大应用元年,AI视频生成是团队要做的一个重点。第三,我们基于AI的多学科诊疗系统正在申请医学伦理审查,通过后可以直接进入一些医学场景做实验,期待能在医院中帮到医生和病人。第四,思考如何用AI给更多人科普,也希望2024年有更多人使用AI,提升大家的生产力。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部