成果信息
本系统将语音信息智能处理技术(说话人识别/语种分类/关键语音检索等)运用到话音的处理与分析中,实现了一种鲁棒的、快速、高效的语音智能处理系统。 技术特点: 非语音滤除:准确度95%以上; 处理速度:说话人识别/语种分类:5万个通话/天/主流配置单线;关键语音索引:5000个通话/天/主流配置单线;关键语音检索:实现秒级对于千小时数据的检索; 通道自适应:广泛适用于PSTN/GSM/CDMA/卫星ADPCM/IP等各种编码及通道,通道敏感度低; 语种范围:世界主要语种及国内主要方言,并支持新语种扩充; 关键语音检索方式:支持索引的动态增量更新,检测结果可及时反映索引的变化,并支持关键词文本扩展。多种检索输出结果排序形式(可靠度、时间、音频文档相关度等)。 )
背景介绍
现实生活中存在大量的电话语音,无论是民用还是国家安全应用, 都迫切需要分析这些电话语音. 手工分析整理这些电话则面临着成本高、劳动强度大、标准难以统一、可信度受到局限等缺陷.目前语音信号的处理和理解基本还是依赖于人听, 这种失衡已经成了语音信息利用的瓶颈。目前主要的课题集中于音频信息的检测与识别等方面,需要研究语音关键词检测、说话人识别、语种识别、固定音频检测等特种语音技术。)
应用前景
该系统已在全国多个省市的广播电视、安全监测等领域得到成功应用。相关产品在多次产品技术评测中取得第一名的成绩,产品的应用性能得到各用户单位的广泛好评。)