今日凌晨,OpenAI 刚刚公布了其大型语言模型的最新版本 ——GPT-4。
(资料图片仅供参考)
GPT-4 可以更准确地解决你的难题,多模态的 GPT-4 还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈(当前公开版 ChatGPT 基于 GPT-3.5)。当然,正如大家所猜测的那样,微软 New Bing 的聊天功能确实基于 GPT-4。
根据 OpenAI 的介绍,GPT-4 具备四大特点:
1. GPT-4 可以理解图表含义并作出进一步的计算。
2. GPT-4 擅长标准化考试。
3. GPT-4 可以给出更加精确的回答。
4. GPT-4 可以理解一些情感因素并作出反应,例如“幽默”。
除了介绍网站,OpenAI 还提供了描述 GPT-4 功能的技术性论文,以及详细描述其局限性的系统模型 Card。
图源:OpenAI
OpenAI 计划通过 ChatGPT 及其商业 API 为用户提供 GPT-4 的文本功能支持,但目前还需要等待。
IT之家这里需要提醒一下,GPT-4 目前仅 ChatGPT Plus 账号可用,可选 GPT-4 模式进行对话,每 4 小时限制发送 100 条消息。
收费方面,大约 750 个单词的提示收取约 3 美分的费用,约 750 个单词的响应则收取 6 美分(就是问和答的区别)。
图源:OpenAI
OpenAI 声称,ChatGPT-4 比迭代前的 GPT-3.5“更大”,这意味着它接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。
该公司声称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。
就任务而言,GPT-4 的表现比前辈更好,它可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达 32768 个标记(约 25000 个文本单词),从而实现比前辈更长的内容创建或文本分析。
OpenAI 承认,该公司使用了微软云计算平台 Azure 来训练其模型,微软已经向 OpenAI 投资了数十亿美元。OpenAI 以竞争为由,没有公布具体的模型大小或用于训练它的硬件等细节。
官方表示,GPT-4 错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。
例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相比之下,GPT-3.5 在律师考试中的得分一般都是倒数 10% 左右。当然,它们考个研究生还是没问题的。
图源:OpenAI
当然,AI 毕竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它在很多场景下的能力都不如人类。
据称,该模型仍然存在编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏见、幻觉和敌意回复等。
在一次随意的谈话中,GPT-3.5 和 GPT-4 之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4 比 GPT-3.5 更可靠、更有创造力,并且能够处理更多细微差别的指令。”
同时,GPT-4 也将作为 API 的一部分提供,该 API 允许程序员将 AI 集成到自己的应用程序中。
不过,有关注人工智能的人士表示,类似 ChatGPT 之类的人工智能可能会导致商业模式上的风险。
专家认为,一些 AI 公司急于推出未经测试、不受监管且不可预测的技术,可能会欺骗用户,给出错误的信息。
由于设计上就是为了生成令人信服的措辞,人工智能语言模型经常会提供错误答案。而且这些模型要用网络上的信息和图像接受训练,也学会了模仿人类偏见。
OpenAI 研究人员在一份技术报告中写道,“随着 GPT-4 和类似的人工智能系统被广泛采纳”,它们“会强化固有见解”。
OpenAI 前研究员、开源人工智能公司 Hugging Face 政策总监艾琳・索莱曼 (Irene Solaiman) 认为,这种技术进展的速度需要全社会对潜在问题及时做出反应。
而推特和特斯拉的双料老总马斯克看到 OpenAI 的突飞猛进,现在也急眼了。他在推特平台上发文称:人类还能做什么?我们最好使用 Neuralink(来对抗人工智能)!
截图自推特 @Elon Musk
此外,他还回复了网友关于 GPT-4 内测的帖子,称他个人十分关切这个新算法,也认为这个新的人工智能看起来很有意思。
但马斯克关于 GPT-4 和 Neuralink 的评论引发群嘲,不少网友讽刺他的这条脑机广告更恐怖一些。相比于人工智能机器人取代人类,在大脑里植入设备似乎更让人头皮发麻。