讯飞汽车:星火多语言大模型发布 助力更智能的汽车走向世界
2024-10-27 08:00:40
10 月 24 日,在第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节开幕式上,科大讯飞面向汽车领域,发布了讯飞星火汽车端侧大模型,并首次展示了星火多语言大模型在汽车座舱上的应用。 一、星火座舱一周年发布 自去年 1024 开发者节发布以来,讯飞星火智能座舱跟随星火大模型完成多次迭代,具备了复杂语义理解、内外部信源打通、多模态交互等众多领先能力,能够准确理解驾乘人员需求意图并提供快速响应服务,「双商在线」解决各类问题,极大地提升了驾乘体验。 自去年 1024 开发者节发布以来,讯飞星火智能座舱跟随星火大模型完成多次迭代,具备了复杂语义理解、内外部信源打通、多模态交互等众多领先能力,能够准确理解驾乘人员需求意图并提供快速响应服务,「双商在线」解决各类问题,极大地提升了驾乘体验。 (第二代 AION V 搭载讯飞星火大模型) 在星火大模型带来的全新交互框架中,人车交流的应用范围与价值回馈得到了全面提升。日均人车交互次数,从前大模型时代的 7 次,爆发增长到目前的 18 次,带动了讯飞汽车语音产品全年交互次数,突破了 127 亿次。 当前,奇瑞、广汽、长城、长安、大众、江淮等多家头部汽车品牌均选择讯飞星火大模型作为旗下主力车型的座舱智能化配置。 (长城魏牌全新蓝山搭载讯飞星火大模型) 二、星火汽车端侧星火大模型升级 随着座舱算力的持续提升,以及科大讯飞芯算融合方案的不断优化完善,本次发布会推出了汽车端侧星火大模型。 传统云端大模型,拥有参数多、算力强等优势,但高度依赖网络传输,响应延迟存在天生短板。在全新的端云一体架构中,科大讯飞充分发挥自身语音交互技术领先优势,根据座舱场景,深度裁剪优化端侧模型,将车内终端首次响应时间缩短至 40ms 的同时,识别能力相较于云端大参数模型的衰减不足 1%。在端云融合的新模式下,大模型对于复杂问题的响应时间,也将大幅缩减到 1.3S,更接近真人自然交互体验。 随着座舱算力的持续提升,以及科大讯飞芯算融合方案的不断优化完善,本次发布会推出了星火端侧语音交互全链路大模型。 传统云端大模型,拥有参数多、算力强等优势,但高度依赖网络传输,响应延迟存在天生短板。在全新的端云一体架构中,科大讯飞充分发挥自身语音交互技术领先优势,根据座舱场景,深度裁剪优化端侧模型,将车内终端首次响应时间缩短至 40ms 的同时,识别能力相较于云端大参数模型的衰减不足 1%。在端云融合的新模式下,大模型对于复杂问题的响应时间,也将大幅缩减到 1.3S,更接近真人自然交互体验。 (端侧大模型与云端大模型效果对比) 凭借科大讯飞领先的 AI 工程实施能力,星火端侧语音交互全链路大模型,提供多种尺寸的模型,灵活部署各类 AI 能力,全面适配国内外主流座舱芯片方案。 今年四季度,奇瑞、广汽、长城等品牌的多款车型,将搭载讯飞星火端侧语音交互全链路大模型上市交付。! (奇瑞星途星纪元 ET 将升级星火端侧大模型) 三、星火座舱大模型加速走向世界 随着中国新能源智能汽车出海步伐的加快,多语言车载语音需求持续爆发增长。科大讯飞 2024 年多语言车载语音产品交付量预计将超过 100 万套。[1] 受限于海外市场规模小,语种分布碎片化,当前出口车型语音产品尚未接入大模型,座舱交互体验远不如国内车型。针对这一情况,科大讯飞董事长刘庆峰在本次发布会上带来了星火多语言大模型,在既有的中英文之外,新增了法语、德语、日语、韩语、俄语、阿拉伯语、西班牙语及葡萄牙语八种主要的国际语言,整体效果达到了 GPTchatgpt-4o 96% 的水平,完全满足各类终端实际应用需求。 (多语言大模型整体效果达到 GPT-4o 96% 水平) 「如果中国的大模型厂商都只做中文,全球没有第二种选择,我们就必然会被锁在中国范围之内。我们不光是要把这 8 个已经开放的语种能力不断提升,对标全球最好的水平,还要针对真实应用场景做到全球最好,并且不断扩大我们的语种范围,我们一定要代表中国给世界提供第二种选择。」科大讯飞董事长刘庆峰表示,将持续投入多语言大模型,在全球市场上,继续推动中国汽车智能座舱的产品优势。 (奇瑞海外车型采用讯飞多语言车载语音) 目前中国汽车出海品牌十强中,有八家采用了科大讯飞多语言车载语音产品,多家国际车企也已将科大讯飞多语言产品纳入到全球供应链体系中。随着多语言大模型的上车,全世界更多的车主,将有望享受到来自中国的智能座舱的科技普惠。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;
3.作者投稿可能会经我们编辑修改或补充。