随着 ChatGPT 的火热出圈,生成式 AI 认知大模型技术在全球掀起了人工智能的新浪潮。而围绕认知大模型的类 ChatGPT 技术或也在不断涌现。

就在今天下午,科大讯飞举办了讯飞星火认知大模型成果发布会,并推出了推出面向教育、办公、车载等行业的解决方案。


(资料图)

作为类 ChatGPT 的认知大模型产品,讯飞星火在大规模知识库、自然语言处理、个性化学习、多模态交互以及可定制性等方面有着独特优势。在产品发布之际,IT之家也实际测试体验了讯飞星火的对话交流能力。大家可以先感受一下讯飞星火是否足够聪明。

讯飞星火实测,理解能力出色,可用性较高

在体验时,IT之家从内容生成能力、逻辑理解能力、专业知识能力以及生僻问题理解能力等四个方面对讯飞星火做了实际测试。

首先在内容创作和生成能力上,IT之家先让讯飞星火写一篇关于鲁迅《孔乙己》的课文,讯飞星火果然能完整地帮我写出来。

代码生成方面,小编以“提取 0 到 100 中所有质数”为例,让讯飞星火写一段代码。它首先很快给出了 Python 语言的算法代码,同时在代码下方。还对算法的思路做了简单介绍,很贴心。

接着小编直接说“换成用 C++ 语言来写”,它又很快给出了用 C++ 语言实现的代码,非常方便。

逻辑理解能力方面,小编首先找了一个经典的过河问题来询问讯飞星火。题干比较长,而且有点复杂,可以看到,它能很快地将题目意思理解,然后把过河的步骤一条一条地梳理出来。

逻辑能力没问题,那么语言理解能力呢?小编又找了一段话进行测试,可见下面这段绕口令一样关于“意思”的段子,讯飞星火准确理解了每个“意思”代表的含义。

专业知识能力上,小编首先让它帮我解释一下量子计算,可以看到它能够以相对简明的方式将量子计算的概念给解释出来。

接着小编又问了一个进阶一些的问题,讯飞星火给出了一段不明觉厉的思考过程,不过最终输出的答案是 2000 焦耳,正确的答案小编查到应该是 1000 焦耳。

在生僻问题测试中,小编首先问了一个《王者荣耀》游戏中鲁班这个英雄的特点是什么,讯飞星火很准确地回答了出来。

接着小编又问“《荒野大镖客:救赎 2》中亚瑟・摩根是哪个帮派的?”这次的回答中,讯飞星火基本意思回答正确了,但是“Van der Linde”翻译应该是“范德林得”帮,讯飞星火答成了让人一脸懵的“圣胡安帮”。

整体体验下来,小编的感受是,讯飞星火对于中文语言语义的理解和逻辑思维的理解能力上目前是非常出色的,测试时给他在语言或逻辑上设的“坑”,大部分都能成功避开,这个理解能力相较于国内其他一些认知大模型产品还是比较有优势的。

并且讯飞星火对于生成结果的语音朗读功能是个加分项,这让我们看到它在更多终端、场景上应用的前景。

当然,当前内测阶段,讯飞星火也表现出了不足,主要是知识库的储备和语料库的更新速度上,还有可以进步的空间,一些稍专业或偏门的问题,讯飞星火也会给出错误的回答。当然,这些不足,是可以随着知识库、语料库的丰富而得到解决的。

数十年技术积淀,讯飞在认知大模型上的“天然优势”

根据发布会上科大讯飞董事长刘庆峰的介绍,讯飞是在去年 12 月开始启动认知智能大模型的专项公关,而在短短 5 个月左右的时间里,讯飞星火就能呈现出目前这样基本成熟,让人倍感惊艳的产品形态,这背后,其实还是要得益于科大讯飞在大模型源头核心技术上超过十年的储备和沉淀。

2011 年,科大讯飞就承建了语音及语言信息处理国家工程实验室,并提出“让机器像人一样能听会说”的理念。要知道,认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。

2014 年科大讯飞推出“讯飞超脑计划”,明确提出:让机器像人一样能理解会思考。2022 年这一计划又升级为“讯飞超脑 2030 计划”。

还有在 2017 年,科大讯飞承建认知智能国家重点实验室。也就是从这一年起,科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了 96.3% 参加考试的医生,并且在 SQuAD 机器阅读理解中全球首次超过人类平均水平。

刚刚过去的 2022 年在 OpenBookQA 科学知识推理中,单模型也超过人类平均水平。

正是因为有这样的技术积淀,我们看到这次讯飞星火认知大模型表现出的让人惊讶的语言、语音理解能力和逻辑思维能力。特别是对于中文用户来说,这一点很重要,因为类似 ChatGPT 等这样的大模型并没有对中文语境的习惯和特点做针对性的训练,因此往往会出现一些让人啼笑皆非的答案。

而不夸张的说,AI 语音、语言理解是科大讯飞的传统强项,像 ChatGPT 这样的认知大模型,对于讯飞来说是存在天然优势的。

通用型人工智能,首先得用起来

过去,人工智能技术虽然也比较火热,但论应用,更多还是在专业领域,而 ChatGPT 带动认知大模型的火热,让 AI 真正从“专用”迈向了“通用”,这无疑是 AI 发展的一个重要里程碑。

当然,无论是专用,还是通用,前提得是“用”起来,才能真正发挥 AI 技术对社会生活带来的变革能力。相较于其他认知大模型,讯飞星火显然是提前一步将“应用”纳入了规划范畴。

星火认知大模型从最初的开启立项,其就是基于“1+N”架构来建设的,其中“N”就表示多个领域的内容,也就是应用。在发布会上,讯飞就公布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。

比如说在教育领域,大模型就在和讯飞 AI 学习机结合,让 AI 学习机 T20 系列可实现中英文作文类人批改,这个批改过程是实时的,层层点评,高效精准,更可实现写作思路启发,利用 AI 润色技术生成片段优化参考和写作建议提升。

比如在办公领域,大模型也在和讯飞智能办公本结合,可以根据手写要点自动生成会议纪要,助力办公效能进一步提升。

在汽车领域,大模型则可以和智能座舱结合。目前科大讯飞已为数千个车型提供业界领先的智能语音交互服务,而与讯飞星火认知大模型结合后,这种人机交互再上一个新的台阶,实现更自由、更拟人化地沟通,让汽车驾驶更智能、更安全、更有乐趣……

除了这些具体领域的应用,科大讯飞还为讯飞开放平台新增了星火认知大模型,已经开放了 560 项 AI 能力,并聚集了超过 500 万生态合作伙伴,相信在它的加持下,讯飞星火认知大模型会不断完善,持续应用在社会的各行各业,让 AI 不仅是极客炫技的工具,而是踏踏实实能帮助人们生活工作的工具。

如果在讯飞星火上问它“你为什么叫‘星火’”,它首先就会告诉你,星火,来源于“星星之火,可以燎原”。这是科大讯飞对 AI 技术和业务的目标,也是他们对 AI 产业发展的信念。

而讯飞星火,对于科大讯飞来说,也许就是星火燎原过程中,第一团燃烧成势的火焰。

也期待它成为将我们的 AI 理想照进现实的那团火焰。

推荐内容