10月24日,科大讯飞发布星火大模型V3.0,七大能力持续提升,整体超越ChatGPT,医疗领域超越GPT-4。星火3.0升级启发式对话、AI人设功能,能够打造更个性化的AI助手。
同期,以“释放想象力•智能新出行”为主题的2023科大讯飞智能汽车新品发布会在合肥举行,会上,科大讯飞发布了基于讯飞星火V3.0的座舱、音效、智驾三大方向的产品升级。
一、讯飞星火+座舱:赋能人车交互体验跃升
星火座舱OS包括星火汽车助理和星火场景应用两大部分,将语音与视觉模态深度融合,让识别更精准,语音合成MOS>4.6,大模型业务贯穿支持十轮以上的上下文语义继承,新增的实时检索能力打破大模型认知边界,时新信息即时查询,为用户带来更自由、更智能、更自然的人车交互体验。借力大模型赋能,星火座舱OS打造了多个沉浸式的使用场景,并支持自定义,一句话生成复杂场景,触达200+车控动作。星火汽车APP围绕用车场景打造的多样化大模型车端应用,如用车顾问、儿童故事、口语陪练、心灵SPA、旅行伙伴等等,将大模型能力托身于众多实用小场景,为用户带来可感知的、能用好用的AI超能力。
星火座舱域控是智能化AI新底座,拥有丰富成熟的接口能力,面向行业输出兼容核心AI算法的“核心板”,基于全栈的座舱AI算法和结合芯片的异构算法优势实现芯算融合,SOC算力消耗降低10%,并与国内厂商深度合作,大幅度提升国产平台的渲染效果。星火座舱域控旨在以更少的资源、更短的开发周期实现差异化产品创新。
在硬件层面,iFlySound Plus24ch功放硬件平台使用高性能浮点DPS,拥有最高2GHZ*2的高速音频处理加速器和128通道数字音频处理能力,可以获得高达24bit 96kHz的HD Audio支持,并且兼容未来E-E架构,拥有超强的硬件扩展能力和音频推动能力,性能超越当前市面上大部分主流硬件设施。同时,科大讯飞还在保证性能的前提下有效降低了硬件的尺寸和重量,实现“小型化轻量化”。
在软件算法层面,科大讯飞核心技术自主研发,当前已具备3D环绕、声场分区、ICC、响度补偿、主动降噪、虚拟音效、多音区交互、高拟真主动声浪、车内交流偿、低品质音源修复、场景增益控制、声场分区、车载K歌和大模型音效等多个全自研的高阶音效算法,并推出基于持续丰富的声音库、声浪库、音效库、功能库的订阅模式。
大模型的理解、推理、表达和多模态知识学习等能力给自动驾驶带来了更多新的技术思路,基于讯飞星火认知大模型,科大讯飞带来了两款高性价比的行泊一体智驾解决方案——智驾STD和智驾PRO,配备增强型高速NOA(HNOA)、记忆行车和记忆泊车等功能,让汽车驾驶更安全,更智能,更有乐趣。
科大讯飞行泊一体智驾解决方案通过强大的AI算法研发能力、高效完整的数据闭环云平台、深厚的工程技术能力,打造车云一体的智驾研发体系。大模型利用海量数据以及驾驶领域知识的强化,可以用于自动驾驶场景数据以及驾驶策略的生成,并支持以交互的方式增强对基础驾驶模型的理解。科大讯飞自研了从深度学习训练到模型调优量化、模型推理部署的全栈工具链,并打造了智驾应用开发框架和中间件,确保系统稳定,支撑跨平台算法快速移植。自研4D重建与自动标注系统有效提升了标注的效率和质量。
同时,科大讯飞讯飞在生态方面也保持着的巨大优势,除了基于讯飞自研的儿童教育、K12教育、音娱资源、听见会议以及讯飞翻译五大自建生态资源外,讯飞星火大模型赋能的智能座舱已经与支付宝、咪咕、腾讯音乐、喜马拉雅、高德、火山引擎、雷石、能链、喜泊客等九家企业开展了深度生态合作,积极建立车主全旅程运营服务链条,满足车主多元化需求,提供高效、便捷的车载场景体验,此外,科大讯飞智能座舱还与百余家企业生态积极合作,力求以丰富全面的软件生态赋能智能座舱,助力中国汽车产业智能化的发展。
进入智能化的下半场,大模型“上车”正在重新定义人机交互与相关服务生态,继5月6日正式发布以来,讯飞星火已在汽车领域取得了丰富的成果,当前,讯飞星火已与包括奇瑞、广汽、长城、长安在内的几十家车企和合作伙伴强强联手,构建汽车AI星火生态。后续,科大讯飞将继续落实大模型在汽车领域的深度运用,与广大合作伙伴共同推动中国汽车产业智能化的颠覆式革新。
地址:北京市丰台区五圈南路30号院1号楼D座3层302室 邮编:100160 电话:010-63429223 E-mail:autoreview@caam.org.cn
《汽车纵横》杂志社有限公司 京ICP备05030302号-2