搜狗推“唇语识别”功能:垂直场景准确率达90%
发布时间:2021-11-21 16:31:32 所属栏目:交互 来源:互联网
导读:今天,搜狗推出新一代人机交互唇语识别,顾名思义,就是能识别人的唇部动作,来解读说话者所说的内容。 搜狗表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。 在非特定人开放口语测试集
今天,搜狗推出新一代人机交互——“唇语识别”,顾名思义,就是能识别人的唇部动作,来解读说话者所说的内容。 搜狗表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。 在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率。在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。 未来唇语识别技术可以辅助语音交互及图像识别,日常周围噪音过大或不便发声的场所更加适用,既能保证识别准确性和稳定性,也可以保证说话内容的私密性。 此外,唇语识别技术可以帮助公安人员获取无声视频中重要的讲话信息,还能帮助先天性听障人群。 ![]() (编辑:上饶站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |