安全公司报告
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111554796.1 (22)申请日 2021.12.17 (65)同一申请的已公布的文献号 申请公布号 CN 114238605 A (43)申请公布日 2022.03.25 (73)专利权人 北京斗米优聘科技发展 有限公司 地址 100085 北京市海淀区信息路甲28号 12层C座12 A-2E (72)发明人 王志光 杨羽  (74)专利代理 机构 北京航信高科知识产权代理 事务所(普通 合伙) 11526 专利代理师 刘传准 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01)G06F 40/242(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 10/10(2012.01) 审查员 梁健 (54)发明名称 一种智能语音客服机器人自动对话方法及 装置 (57)摘要 本申请提供了一种智能语音客服机器人自 动对话方法及装置, 属于数据处理技术领域。 该 方法包括将获取的用户语音数据转换为字符序 列; 基于训练好的意图神经网络模型, 确定所述 字符序列对应的包含意图关键词及实体关键词 的期望值; 根据所述期望值匹配给定的树状流程 中的当前话术节点的下一个话术节 点分支, 并将 这些关键词填充在所述话术节点分支对应的指 令信息的槽位中; 根据用户的所述指令信息确定 需要对话的文本语 言; 将所述文本语 言转换为语 言, 并输出给用户。 本申请能够提高语音自动对 话的智能性。 权利要求书3页 说明书8页 附图2页 CN 114238605 B 2022.11.22 CN 114238605 B 1.一种智能语音客 服机器人自动对话方法, 其特 征在于, 包括: 将获取的用户语音数据转换为字符序列; 基于训练好的意图神经网络模型, 确定所述字符序列对应的包含意图关键词及实体关 键词的期望值; 根据所述期望值匹配给定的树状流程中的当前话术节点的下一个话术节点分支, 并将 这些关键词填充在所述 话术节点分支对应的指令信息的槽位中; 根据用户的所述指令信息确定需要对话的文本语言; 将所述文本语言转换为语言, 并输出 给用户; 其中, 将获取的用户语音数据转换为字符序列之后进一 步包括: 根据所述字符序列确定各词语出现的次数; 根据各词语及其出现的次数填充与所述意图神经网络模型训练时所采用的训练输入 向量维度相同的计算输入向量, 其中, 所述计算输入向量中的每一维度对应于标注字典中 的一特定词语, 每一 维度的数值对应于该特定词语在用于进 行计算的字符序列中出现的次 数。 2.如权利要求1所述的智能语音客服机器人自动对话方法, 其特征在于, 将 获取的用户 语音数据转换为字符序列包括: 将所述用户语音数据转换为离 散数字信号; 通过预加重提高 高频特性; 提取语音的MFC C特征信息; 将所述MFC C特征信息通过声学模型和语音模型转换为字符序列。 3.如权利要求1所述的智能语音客服机器人自动对话方法, 其特征在于, 所述标注字典 基于以下步骤获取: 以高频模式对在指定领域中用户的多条真实输入的语句进行BIO标注, 所述高频模式 是指BIO标注过程中, 以给定词典中的所命中的最长的单词进行 标注; 根据高频模式提取的准确字典, 标记出其 他低频模式 中的POI信息; 进行CRF模型训练, 识别POI信息, 加入到标注字典中。 4.如权利要求1所述的智能语音客服机器人自动对话方法, 其特征在于, 所述意图神经 网络模型通过以下步骤训练: 获取样本数据, 所述样本数据的每一条样本包括输入语料及输出期望值; 根据输入语料 所包含的词语及其出现的次数构建输入向量; 构建神经网络模型, 所述神经网络模型包括 4层; 通过构建二次代价函数并对其进行迭代优化, 确定输入向量的各维度的权重及偏置, 其中, 二次代价 函数包括: 其中, y(x)为输出期望值, a为实际输出, x=w1x1+w2x2+...+wnxn+b, x1~xn为输入向 量的各维度值, w1~w n为各维度值对应的权 重, b为偏置 。 5.一种智能语音客 服机器人自动对话装置, 其特 征在于, 包括:权 利 要 求 书 1/3 页 2 CN 114238605 B 2语音识别模块, 用于将获取的用户语音数据转换为字符序列; 语言理解模块, 用于基于训练好的意图神经网络模型, 确定所述字符序列对应的包含 意图关键词及实体关键词的期望值; 对话管理模块, 用于根据所述期望值匹配给定的树状流程中的当前话术节点的下一个 话术节点分支, 并将这些关键词填充在所述 话术节点分支对应的指令信息的槽位中; 语言生成模块, 用于根据用户的所述指令信息确定需要对话的文本语言; 语音合成模块, 用于将所述文本语言转换为语言, 并输出 给用户; 所述自动对话装置还 包括预处 理模块, 所述预处 理模块包括: 词语统计单 元, 用于根据所述字符序列确定各词语出现的次数; 输入向量填充单元, 用于根据 各词语及其出现的次数填充与 所述意图神经网络模型训 练时所采用的训练输入向量维度相同的计算输入向量, 其中, 所述计算输入向量中的每一 维度对应于标注字典中的一特定词语, 每一 维度的数值对应于该特定词语在用于进行计算 的字符序列中出现的次数。 6.如权利要求5所述的智能语音客服机器人自动对话装置, 其特征在于, 所述语音识别 模块包括: 数据转换 单元, 用于将所述用户语音数据转换为离 散数字信号; 高频处理单元, 用于通过 预加重提高 高频特性; 语音提取 单元, 用于提取语音的MFC C特征信息; 字符序列生成单元, 用于将所述MFCC特征信 息通过声学模型和语音模型转换为字符序 列。 7.如权利要求5所述的智能语音客服机器人自动对话装置, 其特征在于, 所述标注字典 基于以下模块 生成: 高频模式标注单元, 用于以高频模式对在指定领域中用户的多条真实输入的语句进行 BIO标注, 所述高频模式是指BIO标注过程中, 以给定词典中的所命中的最长的单词进行标 注; 低频模式标注单元, 用于根据高频模式提取的准确字典, 标记出其他低频模式中的POI 信息; 模型训练单 元, 用于进行CRF模型训练, 识别POI信息, 加入到标注字典中。 8.如权利要求5所述的智能语音客服机器人自动对话装置, 其特征在于, 所述意图神经 网络模型通过以下模块训练: 样本获取单元, 用于获取样本数据, 所述样本数据的每一条样本包括输入语料及输出 期望值; 输入向量构建单 元, 用于根据输入语料 所包含的词语及其出现的次数构建输入向量; 神经网络构建单 元, 用于构建神经网络模型, 所述神经网络模型包括 4层; 训练单元, 用于通过构建二次代价函数并对其进行迭代优化, 确定输入向量的各维度 的权重及偏置, 其中, 二次代价 函数包括: 权 利 要 求 书 2/3 页 3 CN 114238605 B 3

.PDF文档 专利 一种智能语音客服机器人自动对话方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种智能语音客服机器人自动对话方法及装置 第 1 页 专利 一种智能语音客服机器人自动对话方法及装置 第 2 页 专利 一种智能语音客服机器人自动对话方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:39:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。