【本期话题】今年以来,国内生成式人工智能赛道逐渐火热。国内互联网科技企业几乎“全员下场”,有技术背景的创业公司也纷纷加入,并纷纷发布大模型产品。半年过去,实际落地成果如何?大模型中,“开源模式”和“闭源模式”之间有何异同?决定“谁是中国最好的大模型”的关键因素,是钱和算力吗?本期对话:AI技术专家、百川智能创始人王小川。


(资料图)

最近半年,国内人工智能赛道持续升温。互联网科技企业几乎“全员下场”,既有传统巨头、大平台如百度文心一言、阿里通义千问、腾讯混元大模型;也有科大讯飞、商汤等人工智能领域的老玩家,还有诸多相关背景的创业公司,发布了通用或垂直领域的大模型。据不完全统计,国内发布大模型的企业已经接近百家。

半年过去,国内“百模大战”能看出哪些端倪?怎样看待关于大模型“开源”和“闭源”模式的争论和前景?决定“中国最好大模型”的关键,是钱和算力吗?怎样看待普通人的“人工智能替代焦虑症”?

本期节目,我们对话百川智能创始人兼CEO、原搜狗创始人、清华大学计算机学科顾问委员会委员王小川

“百模大战,胜负未定”,400亿模型参数是“质变”量级

面对眼下“百模大战”的局面,王小川认为,判断最好大模型的通用标准有三点:(1)模型参数量;(2)测试效果;(3)Chat产品体验。用这三个标准看,国内的通用大模型还没有跑出胜负。王小川说:“从现象来看大家都下场做,每个有技术理想的企业都尝试,所以现在显卡的资源不够用,很难做评价。我从两点来看——不管是十家、百家、千家,最后一定要看两件事,一是能否拿出足够好的AGI(通用模型),比肩GPT4,这件事情大家有相应的距离,我们也没做到。往下看今年内有哪些企业能达到3.5甚至逼近4的能力;二是能否做出超级应用来,大模型很烧钱,应用场景中间是否有超级应用,也有困难,这两个事情还看不清。”

业内的普遍观点是,大模型的发展周期包括三个阶段:(1)以模型和数据为核心的技术驱动阶段;(2)模型产品落地阶段,这个阶段,预计400-500亿参数量级将是产品间拉开“质变”的量级。前面说的“百模大战”,就是指这个阶段;(3)用户驱动阶段,即消费者或企业对此认可、收益并买单。

众所周知,大模型烧钱。但在这场赛跑中,“钱”是否是决定胜负手的最关键因素?创业公司的机会在哪?王小川认为:“关于创业这件事情,我们跟美国不太一样,美国通用大模型、闭源模型的头部几家其实已经定下来了,OpenAI有ChatGPT,Google有一张门票,美国做开源大模型已经没有悬念,投资人也不会再去投。但是中国谁能做最好的大模型,现在并没有结论,有一个大家争取的机会,而且还不一定落在大厂里面。我觉得钱是非常重要的,但最终决定能力的还是人才团队,尤其包括个人能力和组织能力。我认为钱和组织能力应该是关键环节。大厂钱多,人多,算力多,但组织效率不一定够好,创业公司组织效率可能好,也可能不好,现在无法确定大厂小厂到底最后谁能取胜。做应用也是,中美的应用生态也不同,美国有了大模型,可以独立做应用,中国想做应用,发现没有好的模型,支撑就不够,变成了创业公司要一手做模型,一手做应用,这样来看就非常有悬念。”

“开源”与“闭源”,并不是竞争关系

通用大模型分闭源和开源,前者如OpenAI的GPT、谷歌的palm等;后者如Meta(Facebook)的LLaMA、微软Turning-NLG等。二者可以通俗理解为IOS和安卓系统的区别。开源可以促进共享、交流,避免垄断,并集思广益,推动人工智能发展;闭源则倾向于保护知识产权,提高优质公司核心竞争力,更好地保障系统质量和安全。

但王小川认为,不同于IOS和安卓,大模型在C端消费者和B端企业都要落地应用,因此并不矛盾。“今天我们讨论开源、闭源,它本身不代表2C(消费者),不像安卓、IOS用户只能二选一。而从2B(企业)的角度,开源、闭源都需要。我们认为,未来80%的企业可能都会用到开源模型,拿出去优化,开源模型可以做得非常小巧,尤其在很多场景里并不是拿去做数学题。今天让GPT4做数学题也是半吊子,大家拼能力可以,但是实操中,开源模型在很多地方是非常好用的——不同场景需要不同的储备,二者不是竞争关系,而是在不同场景互补。我们更关心的是2C(消费者)怎么做,2B(企业)怎么做,而不是把问题停留在开源、闭源的探讨里面。”王小川说。

普通人缓解“AI焦虑”,建议:行万里路,与机共舞

大模型技术日新月异,“人如何与AI共存”成了各年龄段、各行业的热议话题。对此,王小川的答案是“与机共舞,行万里路”。王小川说:“这是个特别好的问题,大家都关心,年纪大的关心孩子,年纪轻的关心自己的职业发展。这两个答案都会比较一致——‘坐在电脑面前的工作,最后都可能会被瓦解掉’。画个图,机器可以比你画得好,写个文案,机器可能比你写得好。”

“我认为需要‘行万里路’,走出去,跟世界有相应的接触,对于小朋友而言,是鼓励他走出去跟其他小朋友一块玩,在互相磨合当中得到的成长会高于在电脑或书本上得到的知识。成年人的工作也是,更多的工作不应是在电脑面前完成,在电脑面前的时间越长,被取代的可能越大。大模型会取代什么人?不用大模型的人。像我4月10号发了一封邮件,就是模型给我的建议,我问ChatGPT‘我想招优秀的人,该怎么办’,模型给我八条建议,其中第一条就是把想法写下来、发出去,和大家聊一聊,我就这样做了。所以,今天的大模型不是像搜索一样给你提供信息,它是给予你How to do的建议。因此,人要想‘我想成为什么人’,然后跟大模型聊‘我如何成为这样的人’。”

(作者:央广经济之声评论员、商业文化节目《远见》制作人 王思远)

推荐内容