(报告出品方/作者:民生证券,吕伟)
1二十年磨一剑,星火大模型开启讯飞新纪元
年5月6日,科大讯飞发布星火大模型以及首批教育、办公、汽车、数字员工四大应用场景,大模型及产品全面超预期。纵观历史,科大讯飞的发展历程就是人工智能的发展历程的浓缩,科大讯飞年首次发布“讯飞超脑计划”由NLP开始转向AI,近十年的AI探索为科大讯飞在AI数据、技术、应用场景等领域铸就深厚护城河,丰富应用场景是讯飞大模型快速落地的差异化优势,国家级的优质数据为讯飞大模型持续领先提供保障。
1.1超前瞻布局+坚定技术投入是讯飞大模型的坚固壁垒
1.1.1科大讯飞年首次推出“讯飞超脑计划”布局大模型AI
人工智能发展分为感知智能、认知智能、运动智能三个阶段,科大讯飞的发展历程就是人工智能的发展历程的浓缩,科大讯飞年就已经突破感知智能阶段,开始布局认知智能。人工智能发展历史超60年,简化来看分为三个阶段,早期人工智能是感知智能阶段,是指AI能听会说、能看会认,这一阶段对应讯飞NLP系列产品(如讯飞听见、讯飞输入法等);人工智能当前处于认知智能阶段,即AI能理解会思考,ChatGPT正是这个阶段最显著的标志。科大讯飞由刘庆峰于年与中国科学技术大学合作成立,天生的科研国家队背景使得公司在短短十几年内就已经突破了人工智能的感知智能阶段,走向认知智能。
年“讯飞超脑计划”是科大讯飞走向认知智能的开端,也是星火大模型AI的雏形。年首次发布讯飞超脑,训练AI直到可以进行语言理解、知识表示、联想推理、自主学习。讯飞超脑发布之初,就选择使用深度神经网络、大数据和涟漪效应三大技术路径,其中深度神经网络就是当前各类大模型AI算法的基础,大数据和涟漪效应后来不断发展为数据标注、无监督学习等大模型AI必备技术,同时对讯飞超脑的训练也使得公司长期布局算力储备。通过对技术路径的拆解,我们认为,科大讯飞年推出的讯飞超脑为公司后续大模型AI数据、算法、算力三大基础打下良好基础,这也是讯飞能够快速迭代推出星火大模型的主要原因。
1.1.2纵观过去十年,科大讯飞AI持续投入之路清晰:
1)教育、医疗等领域的专属模型(小模型):参考OpenAI的发展史,大模型研发的前提是对小模型的研发、训练、应用等已经足够成熟,OpenAI创立之初的产品也仅为游戏领域的垂直小模型,在完全摸透小模型的研发、落地后才不断扩大参数量最终形成亿参数的大模型GPT3。与OpenAI一样,科大讯飞超脑计划首先瞄准垂直领域的小模型,拥有中大量小模型成功落地景研,其中以教育和医疗领域的专属模型最为成功,如教育领域AI阅卷在全球获得了很多奖项,作文的评价首次达到专家水平,年有12个省的高考在作文打分上用到了科大讯飞的技术;全球第一个人工智能通过国家执业医师资格考试。
2)NLP领域不断自我突破:NLP作为大模型AI语义理解的基础,科大讯飞持续刷新NLP技术上限。年斯坦福大学发起的国际著名的SQuAD机器阅读理解比赛中,让机器在英文阅读理解中首次超过了人类平均水平;年在艾伦研究院组织的OpenBookQA科学常识推理比赛中,单模型首次超过了人类平均水平。据年5月6日讯飞大模型发布会,公司官宣根据现在的测试结果,讯飞AI的语义理解能力在国内可测的现有系统中遥遥领先,跟ChatGPT相比仅有细微差别。中英文的文本生成能力,如果5分是满分,ChatGPT是4.48分,讯飞的星火模型已经达到4.29分。
3)Transformer算法有长期持续积累:现在大模型都是基于Transformer算法,如OpenAI的GPT、谷歌的Bert等。科大讯飞的语音识别、图文识别、机器翻译这些任务都是在Transformer的框架上实现的,并且达到了比较好的水平,公司的开源预训练模型在Github上比第二名超出一倍,体现出算法长期积累优化的优势。
1.1.3展望未来十年,星火大模型厚积薄发构建中国顶级AI生态
以年“讯飞超脑计划”和“1+N”认知智能大模型专项攻关计划为转折点,讯飞星火大模型将在在相关国家级平台的支撑下统筹前期所有资源储备实现厚积薄发。年初,公司推出讯飞超脑计划,争取在让懂知识、会学习、能进化的通用人工智能技术,以机器人的实体形态或虚拟形态能够进入到每一个家庭,开启大模型AI的研发进程;年底,在ChatGPT成功落地的启示下,公司迅速进行了相关的技术和研发体系的验证,确定公司具备整建制的研究团队,以及关键技术上具有非常良好的积累,完全可以重现OpenAI的智慧涌现,因此启动了智能大模型的“1+N”专项攻关,“1”是星火大模型,“N”是把大模型在各个领域的落地,包括教育,办公、汽车、人机交互以及医疗等。仅仅5个月之后,年5月6日,科大讯飞就已经完成了星火大模型以及在教育、办公、汽车、数字员工等多个领域的落地,大模型和应用快速落地体现出科大讯飞大模型AI的厚积薄发。
星火生态已经开放合作,不仅有类似OpenAI+Plugin的插件体系,还有OpenAI没有的各类落地场景。科大讯飞从年开始就推出了AI星火营孵化AI应用,年起星火生态全新推出,公司会把AI能力开放给各领域的开发者来使用,截至年5月6日,已经有多万的实名认证的开发者、多万的合作伙伴,同时已有36个行业、超家企业达成了合作的明确意向,并且还在源源不断地增加之中。星火生态不仅支持如同OpenAI+Plugin的插件生态体系,还能够为开发者提供海量的AI落地场景,以科大讯飞