WAIC前线|声网发布新版对话式 AI 引擎,集成声纹识别、数字人与视觉理解功能
7月28日消息,2025世界人工智能大会(WAIC)上,声网正式发布其新版对话式 AI 引擎,该版本新增声纹识别、数字人与视觉理解三项核心功能,实现从“能说话”到“能理解、能共情”的跨越式升级,进一步拓展对话式 AI 在多模态交互中的边界。
据介绍,新版引擎引入声纹识别功能,可精准识别个体声音特征,有效区分多说话者并屏蔽背景噪音,为多用户并发对话提供技术支撑。
数字人能力方面,声网支持接入如商汤等主流方案,赋予 AI 拟人化表情与动作,适用于虚拟客服、教育陪伴等情境对话场景。
视觉理解功能则令 AI 能“看懂”用户环境与图像信息,支持拍照识图与实时手势识别,实现“所见即所说”。
在WAIC现场,声网同步展示了一系列搭载该引擎的 AI 硬件,包括 AI 毛绒宠物“芙崽 Fuzozo”、家庭陪伴机器人“赋之 EBO Air 2 Plus”,以及集成双屏/单屏对话式 AI 开发套件的玩具与教育终端,覆盖从儿童教育到智能陪伴的多样场景。(袁宁)
1、广州发布登革热、基孔肯雅热定点收治医院信息表,基孔肯尼亚与登革热
2、滦河发生2025年第1号洪水 为今年大江大河首次编号洪水
3、具身智能机器人不够智能?聆动通用CEO季超:“大小脑结合” 是破局关键