(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210279908.5
(22)申请日 2022.03.22
(65)同一申请的已公布的文献号
申请公布号 CN 114373448 A
(43)申请公布日 2022.04.19
(73)专利权人 北京沃丰时代数据科技有限公司
地址 100160 北京市丰台区汽车博物馆东
路6号3号楼1单 元2层201
(72)发明人 刘磊
(74)专利代理 机构 北京路浩知识产权代理有限
公司 11002
专利代理师 聂俊伟
(51)Int.Cl.
G10L 15/02(2006.01)
G10L 15/26(2006.01)G10L 15/06(2013.01)
G06F 40/30(2020.01)
审查员 王雨辰
(54)发明名称
话题检测方法、 装置、 电子设备及存 储介质
(57)摘要
本发明提供一种话题检测方法、 装置、 电子
设备及存储介质, 该方法包括: 基于待检测的语
音数据, 获取目标语音块; 输入目标语音块至话
题检测模型, 获得话题检测模型输出的检测结
果。 本发明提供的话题 检测方法、 装置、 电子设备
及存储介质, 基于待检测的语音数据生成目标语
音块, 通过将目标语音块输入至话题检测模型进
行优化处理, 通过对目标语音块进行自动语音识
别后, 获得对应的语音离散表征与文本内容, 通
过对文本内容进行自然语言处理后, 融合语音离
散表征进行话题 检测。 能够在 进行语音自动识别
得到文本内容, 并进行自然语言处理的同时, 补
入语音离散表征信息, 避免语音信息丢失, 在一
定程度上提高话题检测的识别准确率。
权利要求书2页 说明书12页 附图2页
CN 114373448 B
2022.06.14
CN 114373448 B
1.一种话题检测方法, 其特 征在于, 包括:
基于待检测的语音数据, 获取目标语音块;
输入所述目标语音块至话题检测模型, 获得 所述话题检测模型输出的检测结果;
其中, 所述话题检测模型是基于样本文本数据、 所述样本文本数据对应的标注话题、 样
本语音数据以及所述样本语音 数据对应的标注话题训练得到的; 所述样本文本数据包括领
域语料和通用语料;
所述话题检测模型, 用于对所述目标语音块进行语音识别, 得到语音离散表征和文本
内容, 将所述文本内容的自然语言处理结果与所述语音离散表征融合后, 进行话题检测, 获
取所述检测结果;
所述话题检测模型包括语音识别层、 主题词识别抽取层和话题检测层;
其中, 所述语音识别层用于对所述目标语音块进行语音识别; 所述主题词识别抽取层
用于对识别出的文本内容进行主题词抽取; 所述话题检测层用于基于所述语音识别 层和所
述主题词识别抽取层的输出内容融合后, 进行话题检测;
所述输入所述目标语音块至话题检测模型, 获得所述话题检测模型输出的检测结果,
包括:
将所述目标语音块输入至所述语音识别层中, 得到语音表征和文本表征;
将所述文本表征输入至所述主题词识别抽取层中, 得到主题词集;
将所述语音表征、 所述文本表征和所述主题词集输入至所述话题检测层中, 得到检测
结果;
所述将所述目标语音块输入至所述语音识别层中, 得到语音表征和文本表征, 包括:
分别利用第 一语言模型和第 二语言模型, 结合声学模型对所述目标语音块进行量化操
作, 获取第一语音表征和第二语音表征;
分别利用所述第一语言模型和所述第 二语言模型, 结合声学模型对所述目标语音块分
别进行文本识别转换, 获取对应的第一文本表征和第二文本表征;
其中, 所述第 一语言模型是基于所述领域语料训练 的语言模型和所述通用语料训练 的
语言模型融合得到, 所述第二语言模型是基于所述领域语料的音节训练的语言模型和所述
通用语料的音节训练的语言模型融合得到;
所述将所述文本表征输入至所述主题词识别抽取层中, 得到主题词集, 包括:
将所述第一文本表征和所述第二文本表征, 分别进行主题词的识别抽取, 并合并成主
题词集;
接收用户输入的主题文本, 并将所述主题文本添加至所述主题词集中;
其中, 所述第一文本表征为语音转换文本的转换结果, 所述第二文本表征为语音转换
音节的转换 结果。
2.根据权利要求1所述的话题检测方法, 其特征在于, 所述第 一文本表征包括第 一目标
表征和第一 候选表征, 所述第二文本表征包括第二目标表征和第二 候选表征。
3.根据权利要求2所述的话题检测方法, 其特征在于, 所述将所述语音表征、 所述文本
表征和所述主题词集输入至所述话题检测层中, 得到检测结果, 包括: 将所述第一语音表征
和所述第二语音表征, 以及所述第一目标表征、 所述第一候选表征、 所述第二目标表征、 所
述第二候选表征和所述主题词集输入至所述话题检测层中, 进行话题检测, 获取所述检测权 利 要 求 书 1/2 页
2
CN 114373448 B
2结果。
4.一种话题检测装置, 其特 征在于, 包括:
语音分块模块, 用于基于待检测的语音数据, 获取目标语音块;
话题检测模块, 输入所述目标语音块至话题检测模型, 获得所述话题检测模型输出的
检测结果;
其中, 所述话题检测模型是基于样本文本数据、 所述样本文本数据对应的标注话题、 样
本语音数据以及所述样本语音 数据对应的标注话题训练得到的; 所述样本文本数据包括领
域语料和通用语料;
所述话题检测模型, 用于对所述目标语音块进行语音识别, 得到语音离散表征和文本
内容, 将所述文本内容的自然语言处理结果与所述语音离散表征融合后, 进行话题检测, 获
取所述检测结果;
所述话题检测模型包括语音识别层、 主题词识别抽取层和话题检测层;
其中, 所述语音识别层用于对所述目标语音块进行语音识别; 所述主题词识别抽取层
用于对识别出的文本内容进行主题词抽取; 所述话题检测层用于基于所述语音识别 层和所
述主题词识别抽取层的输出内容融合后, 进行话题检测;
所述话题检测模块包括语音识别单 元、 自然语言处 理单元和话题检测单 元, 其中:
所述语音识别单元, 用于将所述目标语音块输入至所述语音识别层中, 得到语音表征
和文本表征;
所述自然语言处理单元, 用于将所述文本表征输入至所述主题词识别抽取层中, 得到
主题词集;
所述话题检测单元, 用于将所述语音表征、 所述文本表征和所述主题词集输入至所述
话题检测层中, 得到检测结果;
所述语音识别单元, 具体用于分别利用第一语言模型和第二语言模型, 结合声学模型
对所述目标语音块进行量 化操作, 获取第一语音表征和第二语音表征;
分别利用所述第一语言模型和所述第 二语言模型, 结合声学模型对所述目标语音块分
别进行文本识别转换, 获取对应的第一文本表征和第二文本表征;
其中, 所述第 一语言模型是基于所述领域语料训练 的语言模型和所述通用语料训练 的
语言模型融合得到, 所述第二语言模型是基于所述领域语料的音节训练的语言模型和所述
通用语料的音节训练的语言模型融合得到;
所述自然语言处理单元, 具体用于将所述第一文本表征和所述第二文本表征, 分别进
行主题词的识别抽取, 并合并成主题词集;
接收用户输入的主题文本, 并将所述主题文本添加至所述主题词集中;
其中, 所述第一文本表征为语音转换文本的转换结果, 所述第二文本表征为语音转换
音节的转换 结果。
5.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运
行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至3任一项所
述话题检测方法。
6.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机
程序被处 理器执行时实现如权利要求1至 3任一项所述 话题检测方法。权 利 要 求 书 2/2 页
3
CN 114373448 B
3
专利 话题检测方法、装置、电子设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:52:26上传分享