破解“听音识人”秘诀,科大讯飞也来挑战不可能!

您所在的位置:网站首页 挑战不可能听音识人完整版 破解“听音识人”秘诀,科大讯飞也来挑战不可能!

破解“听音识人”秘诀,科大讯飞也来挑战不可能!

2023-08-04 21:29| 来源: 网络整理| 查看: 265

所谓声纹识别,就是将声音信号转换为电信号,在利用计算机进行识别的技术。简而言之,就是通过声音辨别说话人身份的技术。与人脸、指纹和虹膜识别相比,声纹识别有着诸多优势。相较于虹膜与人脸识别,声纹语料收集方式更自然,无须进行眨眼、摆动脸部等特定动作,不受光线或隐私等特定场景的约束,人们接受度更高;相较于指纹,声纹是非接触式的,因此可以应用于远程操作,通过电话、APP 等渠道传达语音到后台进行识别,使用成本低而且方便快捷。

基于此,随着技术的不断发展与成熟,声纹识别在各个场景的应用可谓是“遍地开花”,智能家居、安全防护、刑侦破案......从发展前景来看,声纹识别市场潜力巨大,前景可观。如今,在声纹识别需求日益增长的时代,国内外相关企业竞相崛起,国外有 Nuance、VoiceVault、PhoneFactor 等,国内也有科大讯飞、厦门天聪、上海电虹等。

语音识别与声纹识别

谈到科大讯飞声纹识别技术,很容易联想到科大讯飞声名远扬的语音识别技术。确实,科大讯飞语音转写、讯飞输入法等工具实用性强、功能强大,但它们都属于语音识别,与声纹识别不是一回事。

语音识别是为了识别语音的内容,并将其转换成相应的文字,而声纹识别的目的是为了识别说话人的人份,属于生物识别技术的一种。两者之外,还有一种语义识别技术也容易混淆,语义识别是为了理解与反馈语音识别出来的内容含义,智能语音助手、同声翻译机用的都是这类技术。

三种技术中,科大讯飞熟练掌握了语音识别技术,中文语音识别率遥遥领先。而语义识别技术,科大讯飞还处于攻坚阶段。去年科大讯飞“AI 同传造假”丑闻,就是因为自身语音识别技术不过关,用人类同声传译辅助 AI,最后落下话柄。至于声纹识别,科大讯飞才刚刚开始,暂时还无法准确判断其技术成熟度,只能通过技术特点分析优劣。

声纹识别和语音识别在原理上一样,都是通过对采集到的语音信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断。科大讯飞在语音特征与模型上有着丰富的经验,中文语音信号分析处理能力在国内也是首屈一指。在实验室环境下,科大讯飞声纹识别准确率不会差。问题在于实际生活中,声音嘈杂多变,信噪比低,部分语音时长短,非常影响声纹识别精度,科大讯飞声纹识别技术究竟如何,还有待实际检验。

丰富的应用场景

科大讯飞的技术虽然没成熟,但是声纹识别市场上扬趋势明显。登录建行手机银行,开启声纹验证即可轻松转账支付,目前,声纹识别已经在金融领域投入使用。除此之外,声纹识别在智能家居、智慧教育、社保验证、防电信诈骗等领域有着广泛的前景。

比如智能家居,声纹识别技术可以通过“听声识人”区分不同说话人身份,再通过系统设计出针对不同人的个性化服务,让智能家居设备享受更轻松、更个性、更安全的产品体验。再比如社保验证,我国针对离退休人员,每年至少需要进行一次生存状态验证,并以此为依据进行养老金的发放。部分高龄老人行动不便,亲临现场验明正身困难重重。声纹确认技术具有远程操控属性,社保局通过预装声纹身份认证系统,就可对领养老金者开展远程身份认证,既方便又省事。

此外,近些年电信诈骗也呈井喷趋势,不法分子通过伪装诈骗钱财的行为屡见不鲜。而通过声纹识别技术,可以进行执法和诈骗预警。科大讯飞一直将防电信诈骗作为主要研究方向,自去年以来,科大讯飞一直在测试推广防止电信诈骗的系统,听到疑似诈骗分子的声音就能自动挂断电话,同时通过特征参数提取,为公安机关侦破电信诈骗案件提供协助。

日常生活中,我们时时刻刻都在传达着各种信息,声音信息则是其中重要的一部分。而声纹识别技术作为声音信息的拓展,也将在各种场景发挥独特的作用。未来,声音注定将在我们的科技生活中扮演越来越重要的角色,伴随着人类在人工智能时代继续前进......

图源:IT之家、36氪、天天心理、知乎、网易返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3