(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210308618.9
(22)申请日 2022.03.28
(65)同一申请的已公布的文献号
申请公布号 CN 114490994 A
(43)申请公布日 2022.05.13
(73)专利权人 北京沃丰时代数据科技有限公司
地址 100160 北京市丰台区汽车博物馆东
路6号3号楼1单 元2层201
(72)发明人 侯晋峰 肖立鹏
(74)专利代理 机构 北京路浩知识产权代理有限
公司 11002
专利代理师 周磊
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/30(2020.01)(56)对比文件
CN 112365892 A,2021.02.12
CN 109543 005 A,2019.0 3.29
CN 112100349 A,2020.12.18
CN 113918698 A,202 2.01.11
审查员 杨春颖
(54)发明名称
对话管理方法及装置
(57)摘要
本发明提供一种对话管 理方法及装置, 该方
法包括: 获取目标信息; 将目标信息输入对话管
理模型, 获取对话管理模型输出的目标信息对应
的响应信息; 其中, 目标信息, 为在与用户进行本
次对话的过程中, 用户本轮对话输入的信息; 对
话管理模型, 是基于样本信息以及样本信息对应
的样本响应信息进行训练后得到的; 对话管理模
型, 用于基于目标信息更新本次对话对应的对话
状态表示, 并基于更新后的对话状态表示生成目
标信息对应的响应信息; 对话状态表 示为一维向
量。 本发明提供的对话管理方法及装置, 能在无
需人工定义的情况下, 实现对人机对话状态的自
动维护, 能基于一维的对话状态表示, 提高计算
速度, 能实现更高效、 更准确和成本投入更低的
对话管理。
权利要求书3页 说明书13页 附图2页
CN 114490994 B
2022.06.28
CN 114490994 B
1.一种对话管理方法, 其特 征在于, 包括:
获取目标信息;
将所述目标信 息输入对话管理模型, 获取所述对话管理模型输出的所述目标信 息对应
的响应信息;
其中, 所述目标信 息, 为在与用户进行本次对话的过程中, 所述用户本轮对话输入的信
息; 所述对话管理模型, 是基于样本信息以及所述样本信息对应的样本响应信息进行训练
后得到的;
所述对话管理模型, 用于基于所述目标信息更新所述本次对话对应的对话状态表示,
并基于更新后的对话状态表示生成所述目标信息对应的响应信息; 所述对话状态表示为一
维向量; 本次对话中已收集到的信息以及还需收集的信息, 基于所述对话状态 表示确定;
所述对话管理模型, 包括: 自然语言理解子模型、 对话状态更新子模型、 对话决策子模
型和自然语言生成子模型;
相应地, 所述将所述目标信息输入对话管理模型, 获取所述对话管理模型输出的所述
目标信息对应的响应信息, 包括:
将所述目标信 息输入所述自然语言理解子模型, 获取所述自然语言理解子模型输出的
所述目标信息对应的语义信息;
将所述语义信 息和所述目标信 息输入所述对话状态更新子模型, 由所述对话状态更新
子模型基于所述语义信息和所述目标信息, 对所述本次对话对应的对话状态表示进行更
新, 进而获取所述对话状态更新子模型输出的所述更新后的对话状态 表示;
将所述更新后的对话状态表示输入所述对话决策子模型, 获取所述对话决策子模型输
出的所述目标信息对应的应答策略;
将所述应答策略和所述目标信 息输入所述自然语言生成子模型, 获取所述自然语言生
成子模型输出的所述响应信息;
所述对话状态更新子模型, 包括: 数据查询单 元和对话状态更新单 元;
相应地, 所述将所述语义信息和所述目标信息输入所述对话状态更新子模型, 由所述
对话状态更新子模型基于所述语义信息和所述目标信息, 对所述本次对话对应的对话状态
表示进行更新, 进而获取所述对话状态更新子模型输出 的所述更新后的对话状态表示, 包
括:
获取所述本次对话中的历史交互信息, 并将所述语义信息输入所述数据查询单元, 由
所述数据查询单元基于所述语义信息进行数据查询, 进而获取所述数据查询单元输出的查
询结果;
将所述历史交互信息、 所述查询结果和所述目标信息输入所述对话状态更新单元, 由
所述对话状态更新单元基于所述历史交互信息、 所述查询结果和所述目标信息对所述本次
对话对应的对话状态表示进行更新, 进而获取所述对话状态更新单元输出的所述更新后的
对话状态 表示。
2.根据权利要求1所述的对话管理方法, 其特征在于, 所述将所述更新后的对话状态表
示输入所述对话决策子模型, 获取所述对话决策子模型输出的所述目标信息对应的应答策
略, 包括:
将所述查询结果和所述更新后的对话状态表示输入所述对话决策子模型, 由所述对话权 利 要 求 书 1/3 页
2
CN 114490994 B
2决策子模型基于所述查询结果和所述更新后的对话状态表示, 生成所述应答策略, 进而获
取所述对话决策子模型输出的所述应答策略。
3.根据权利要求1所述的对话管理方法, 其特征在于, 所述将所述应答策略和所述目标
信息输入所述自然语言生成子模型, 获取所述自然语言生成子模型输出 的所述响应信息,
包括:
将所述查询结果、 所述应答策略和所述目标信息输入所述自然语言生成子模型, 由所
述自然语言生成子模型基于所述查询结果、 所述应答策略和所述 目标信息, 生成所述响应
信息, 进而获取所述自然语言生成子模型输出的所述响应信息 。
4.根据权利要求1至3任一所述的对话管理方法, 其特征在于, 所述将所述目标信息输
入对话管理模型, 获取所述对话管理模型输出 的所述目标信息对应的响应信息之后, 还包
括:
获取所述用户对所述本次对话的反馈信息;
基于所述反馈信息更新所述对话管理模型。
5.一种对话管理装置, 其特 征在于, 包括:
数据获取模块, 用于获取目标信息;
对话管理模块, 用于将所述目标信息输入对话管理模型, 获取所述对话管理模型输出
的所述目标信息对应的响应信息;
其中, 所述目标信 息, 为在与用户进行本次对话的过程中, 所述用户本轮对话输入的信
息; 所述对话管理模型, 是基于样本信息以及所述样本信息对应的样本响应信息进行训练
后得到的;
所述对话管理模型, 用于基于所述目标信息更新所述本次对话对应的对话状态表示,
并基于更新后的对话状态表示生成所述目标信息对应的响应信息; 所述对话状态表示为一
维向量; 本次对话中已收集到的信息以及还需收集的信息, 基于所述对话状态 表示确定;
所述对话管理模型, 包括: 自然语言理解子模型、 对话状态更新子模型、 对话决策子模
型和自然语言生成子模型;
相应地, 所述将所述目标信息输入对话管理模型, 获取所述对话管理模型输出的所述
目标信息对应的响应信息, 包括:
将所述目标信 息输入所述自然语言理解子模型, 获取所述自然语言理解子模型输出的
所述目标信息对应的语义信息;
将所述语义信 息和所述目标信 息输入所述对话状态更新子模型, 由所述对话状态更新
子模型基于所述语义信息和所述目标信息, 对所述本次对话对应的对话状态表示进行更
新, 进而获取所述对话状态更新子模型输出的所述更新后的对话状态 表示;
将所述更新后的对话状态表示输入所述对话决策子模型, 获取所述对话决策子模型输
出的所述目标信息对应的应答策略;
将所述应答策略和所述目标信 息输入所述自然语言生成子模型, 获取所述自然语言生
成子模型输出的所述响应信息;
所述对话状态更新子模型, 包括: 数据查询单 元和对话状态更新单 元;
相应地, 所述将所述语义信息和所述目标信息输入所述对话状态更新子模型, 由所述
对话状态更新子模型基于所述语义信息和所述目标信息, 对所述本次对话对应的对话状态权 利 要 求 书 2/3 页
3
CN 114490994 B
3
专利 对话管理方法及装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:21上传分享