潇湘科技要素大市场怀化分市场

您当前位置：技术交易 >

说话人识别/语种分类/关键语音检索技术与系统

行业类别：软件产品

所处阶段：规模化生产阶段

持有单位：中科院自动化所

转让方式：技术转让,技术许可,技术入股,

转让价格：面议

预约服务

成果信息

本系统将语音信息智能处理技术（说话人识别/语种分类/关键语音检索等）运用到话音的处理与分析中，实现了一种鲁棒的、快速、高效的语音智能处理系统。技术特点：非语音滤除：准确度95%以上; 处理速度：说话人识别/语种分类：5万个通话/天/主流配置单线；关键语音索引：5000个通话/天/主流配置单线；关键语音检索：实现秒级对于千小时数据的检索；通道自适应：广泛适用于PSTN/GSM/CDMA/卫星ADPCM/IP等各种编码及通道，通道敏感度低；语种范围：世界主要语种及国内主要方言，并支持新语种扩充；关键语音检索方式：支持索引的动态增量更新，检测结果可及时反映索引的变化，并支持关键词文本扩展。多种检索输出结果排序形式(可靠度、时间、音频文档相关度等)。 )

背景介绍

现实生活中存在大量的电话语音，无论是民用还是国家安全应用, 都迫切需要分析这些电话语音. 手工分析整理这些电话则面临着成本高、劳动强度大、标准难以统一、可信度受到局限等缺陷.目前语音信号的处理和理解基本还是依赖于人听, 这种失衡已经成了语音信息利用的瓶颈。目前主要的课题集中于音频信息的检测与识别等方面，需要研究语音关键词检测、说话人识别、语种识别、固定音频检测等特种语音技术。)

应用前景

该系统已在全国多个省市的广播电视、安全监测等领域得到成功应用。相关产品在多次产品技术评测中取得第一名的成绩，产品的应用性能得到各用户单位的广泛好评。)