<汇港通讯> 新一期百度(09888)AI DAY 上,文小言宣布完成品牌焕新与功能升级。除品牌视觉形象焕新外,文小言聚焦模型开放与功能创新,支持多模型融合调度,升级全新语音大模型、图片问答、AI 生图生视频等多项能力,为用户带来更智能、更高效的 AI 体验。
全新语音大模型支持方言对话、复杂知识问答及随时打断等场景,用户可进行语音知识问答或趣味角色扮演。图片问答功能让用户可以通过拍摄或上传图片,以文字或语音提问直接获取深度解析。
百度 AI 产品创新业务负责人薛苏强调:「AI 的未来不再是单纯的技术参数比拼,而是如何通过多模型协同,真正为用户创造价值。文小言希望通过开放生态,整合顶尖模型能力,做出更强大、更简单的AI 产品。」
百度语音首席架构师贾磊透露,该模型是百度在业界首个推出、基於全新互相关注意力(Cross-Attention)的端到端语音语言大模型。在语音场景满足一定交互指标下,大模型调用成本比行业平均降低50%-90%,推理响应速度极快,将语音交互等待时间压缩至1秒左右,极大提升了交互流畅性。同时,在大模型加持下,实现了流式逐字的 LLM 驱动的多情感语音合成,情感饱满、逼真、拟人,交互听感也得到极大提升。 (BC)
#百度 #AI
新闻来源 (不包括新闻图片): 汇港资讯