讯飞星火认知大模型V2.0升级发布会现场。科大讯飞供图
国内“千模大战”下,谁是最聪明的大模型?近日,《麻省理工科技评论》中国最新发布的大模型评测报告给出了答案。
(资料图片)
报告显示,在8个一级大类的600道题目的测试和盲评中,讯飞星火认知大模型V2.0在6个大类中得分率排名第一,在此次评测中表现突出,以81.5分(百分制计)的成绩登顶,荣获“最聪明”的国产大模型称号。
代码生成和补齐能力大提升
8月15日,讯飞星火认知大模型V2.0升级发布会在合肥召开,科大讯飞董事长刘庆峰、研究院院长刘聪重磅发布代码能力和多模态能力升级,同时发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品。
“代码是大模型硬碰硬的能力,代码数据能提升认知大模型的‘智慧’,代码能力是认知大模型聪明程度的重要标志。”刘庆峰说,代码能力也是构建和链接数字世界的有效手段,可以大幅降低数字经济的创业门槛和成本,不用个个都是编程高手,只要发挥自己的想象力、基于对应用场景的认知,就可以提升开发效率、实现相关创业。
此次讯飞星火V2.0对代码能力进行5个维度的升级,包括:代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
现场演示中,使用Python(计算机编程语言)画红色的心形线、用代码生成小游戏等,对讯飞星火来说都不在话下。
根据认知智能国家重点实验室构建的代码的真实场景使用测试集,星火V2.0在代码生成和补齐维度上已经超过了ChatGPT。根据计划,讯飞星火代码各维度的能力将在今年10月24日超越ChatGPT,明年上半年对标GPT-4。
多模态能力全方位升级
拍了美图想“秒速”发一个图文并茂的朋友圈?张嘴就想画出脑海里突发奇想的图画?只要输入一段文字,一键就想生成声情并茂的小视频?
这些功能,讯飞星火V2.0全部可以实现。“讯飞星火V2.0在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。”刘庆峰表示,讯飞星火的多模态能力在业界可测的大模型中明显领先。
在现场真机实测环节,星火大模型现场“读图”,生成人物、风景等各类照片,生成班级手抄报,不仅能根据古诗词“作画”,还能进行虚拟人短视频的生成。“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频”,主持人话音刚落,伴随着舒缓的背景音乐,一个身穿民国风格的女生站在不断切换的秋天美景前开始缓缓朗诵,“立秋是中国二十四节气之一......”引得阵阵掌声。
“多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。”刘庆峰强调,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域,它可以从真实世界获得越来越多的数据,在产品终端有学习、训练和提升,包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。
“多模态能力也是科大讯飞既定的人工智能技术长期战略。”最近3年,科大讯飞已在多模态领域获得了17个国际权威评测冠军,2022年初,讯飞就已发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的“讯飞超脑2030计划”,让懂知识、善学习、能进化的机器人走进每个家庭。
本次发布的讯飞星火V2.0,相较于前代版本,多模态能力有了全方位升级,比如,能够进行视频创作的讯飞智作2.0,听指令就能秒画图画,只要输入一段语音或文字,就能生成声情并茂的小视频;帮助教师设计教学活动、一键生成课件的星火教师助手,可生成互动教学课件,大大提升老师的备课效率;面向学生口语练习的星火语伴2.0,除了能够进行主题对话、虚拟人对话,口语模考和情景交流,还可通过AI实现真人式陪练。
赋能企业优势明显
近日,奇瑞汽车将召开新品发布会。这是奇瑞汽车首款搭载讯飞星火认知大模型的产品,也是讯飞星火赋能科技创新的又一生动案例。
此前,安徽羚羊工业互联网平台在讯飞星火认知大模型的加持下,依托AI+大数据助力企业研、产、供、销、服、管等多场景的智能化转型与供需匹配,助力企业在生产制造、设备运维、售后维修、客户服务等环节降本增效提质。“用户可以随意表述自己的问题,讯飞星火可以通过理解,进行回应。这使得供需对接更加简洁、透彻。”羚羊工业互联网股份有限公司副总裁金晖说。
此外,讯飞星火已经同美亚光电、荣事达、马鞍山博望工业园等龙头企业及园区展开深度合作。截至目前,讯飞星火开发者行业分布中排名第一的是“企业服务”,“说明大模型真正开始赋能到刚需应用中。”刘庆峰表示,认知大模型在赋能企业、赋能科技创新方面的优势十分明显,未来,讯飞星火将进一步发力,全力支持安徽科技创新。
携手华为共建人工智能生态
8月15日的发布会上,科大讯飞与华为强强联合发布星火一体机,同样备受关注。
“星火一体机”是国产软硬件一体化的私有专属大模型解决方案,可提供对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,开箱即可使用,提供从底层算力、AI框架、训练算法、推理能力、应用成效等AI能力。刘庆峰表示,国产大模型只有基于中国自主创新的算力底座才有未来。有了这些能力,就可以使得每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。目前,讯飞星火已完成的在金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。
在安全可控方面,科大讯飞和华为已在联合攻关算力卡脖子的问题。科大讯飞拥有自研大模型训练平台,具备训练和数据闭环全流程设计、大模型训练和推理一体化设计、大规模异构算力兼容、支持混合云架构易拓展等优势,华为基于昇腾AI基础软硬件的高算力AI芯片、高性能算子库、多卡高速互联、分布式存储等优势,“我们正在跟华为一道打造面向超大规模大模型的训练国产算力的集群,形成集群化的优势。”刘庆峰说。
在对外合作领域,科大讯飞一直保持开放态度,从今年5月6日讯飞星火V1.0发布之后,截至目前,讯飞开发者平台新增开发团队数量达到70多万,同比增长282%,在讯飞星火中目前已有4109个助手开发者团队开发出7862款星火助手。
■ 本报记者 汪永安