(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210726186.3
(22)申请日 2022.06.23
(71)申请人 未鲲 (上海) 科技 服务有限公司
地址 200120 上海市浦东 新区自由贸易试
验区陆家嘴环路13 33号15楼
(72)发明人 翟永青
(74)专利代理 机构 深圳市沃德知识产权代理事
务所(普通 合伙) 44347
专利代理师 高杰 于志光
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/23(2019.01)
G06F 40/216(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
(54)发明名称
知识库的优化方法、 装置、 电子设备及存储
介质
(57)摘要
本发明涉及人工智能技术, 揭露了一种知识
库的优化方法, 包括: 获取目标用户的最新提问
语义和历史问答记录语义; 根据原知识库对所述
最新提问语义进行答案匹配, 当 匹配到所述最新
提问语义的语义答案时, 获取所述目标用户的语
义满意度, 根据所述语义答案和语义满意度对所
述原知识库进行数据更新, 当无法匹配到所述最
新提问语义的语义答案时获取预设网页的网页
答案; 获取所述目标用户的网页满意度, 根据所
述网页答案和网页满意度对所述原知识库进行
数据更新, 完成对所述原数据库的优化。 此外, 本
发明还涉及区块链技术, 数据列表可存储于区块
链的节点。 本发明还提出一种知识库的优化装
置、 电子设备 以及存储介质。 本发明可 以提高知
识库的优化效率。
权利要求书3页 说明书11页 附图3页
CN 115048501 A
2022.09.13
CN 115048501 A
1.一种知识库的优化方法, 其特 征在于, 所述方法包括:
获取目标用户的最新提问和历史问答记录, 分别对所述最新提问和所述历史问答记录
进行语义分析, 得到最 新提问语义和历史问答记录语义;
根据原知识库对所述最新提问语义进行答案匹配, 判断是否能从所述原知识库匹配到
所述最新提问语义的语义 答案:
当匹配到所述最新提问语义的语义答案时, 将所述语义答案发送给所述目标用户, 获
取所述目标用户关于所述语义答案的语义满意度, 根据所述语义答案和语义满意度对所述
原知识库进行 数据更新, 完成对所述原数据库的优化;
当无法匹配到所述最新提问语义的语义答案时, 根据所述最新提问语义获取预设网页
的网页答案;
根据网页答案来源和所述历史问答记录语义对所述网页答案进行评分, 选取评分最高
的网页答案作为 最优结果发送给 所述目标用户;
获取所述目标用户关于所述网页答案的网页满意度, 根据 所述网页答案和网页满意度
对所述原知识库进行 数据更新, 完成对所述原数据库的优化。
2.如权利要求1所述的知识库的优化方法, 其特征在于, 所述所述获取所述目标用户关
于所述语义 答案的语义满意度, 包括:
获取预设的语义期望问卷的问卷框架, 根据 所述语义答案对所述问卷框架进行问题类
型配置, 得到一级语义期望问卷;
对所述一级语义期望问卷进行页面组件配置, 得到二级语义期望问卷;
对所述二级语义期望问卷进行功能按 钮的配置, 得到标准语义期望问卷;
将所述标准语义期望问卷推送给所述目标用户, 当用户完成所述标准语义期望问卷
后, 得到所述语义 答案的语义满意度。
3.如权利要求1所述的知识库的优化方法, 其特征在于, 所述根据 所述最新提问语义获
取预设网页的网页答案, 包括:
根据所述预设网页的统一资源定位符得到所述预设网页的页面;
逐个对所述页面进行网页结构分析, 得到所述页面的页面结构;
生成所述最新提问语义的语义标签, 根据预设的捕获器、 所述页面结构和所述语义标
签获取预设网页的 的网页答案 。
4.如权利要求1所述的知识库的优化方法, 其特征在于, 所述根据网页答案来源和所述
历史问答记录语义对所述网页答案进 行评分, 选取评分最高的网页答案作为最优结果发送
给所述目标用户, 包括:
设置所述的网页答案来源的网页重要性;
生成所述历史问答记录语义的语义重要性, 根据 所述网页重要性和所述语义重要性构
建多个重要性的判断矩阵;
利用预设的权重计算公式逐个计算所述判断矩阵的权重, 选取所述判断矩阵的权重中
的最大权 重值为最大特征根;
将所述最大特征根对应的网页答案作为最优结果, 将所述最优结果发送给所述目标用
户。
5.如权利要求1所述的知识库的优化方法, 其特征在于, 所述根据网页答案来源和所述权 利 要 求 书 1/3 页
2
CN 115048501 A
2历史问答记录语义对所述网页答案进 行评分, 选取评分最高的网页答案作为最优结果发送
给所述目标用户, 包括:
分别生成所述网页答案来源的网页评分指标和所述历史问答记录语义的语义评分指
标;
利用所述网页评分指标和所述语义评分指标生成标准评分指标, 计算所述标准评分指
标的平均数、 标准差;
根据所述平均数、 标准差计算所述标准评分指标的变异系数, 利用所述变异系数逐个
对所述标准评分指标进行权 重计算, 得到每 个所述标准评分指标的指标权 重值;
利用所述权重值计算网页答案的答案适配度, 选取所述答案适配度最大值为目标适配
度, 将所述目标适配度对应的网页答案作为 最优结果发送给 所述目标用户。
6.如权利要求1所述的知识库的优化方法, 其特征在于, 所述根据 所述网页答案和网页
满意度对所述原知识库进行 数据更新, 完成对所述原数据库的优化, 包括:
对所述网页答案和所述网页满意度进行 数据清洗, 得到网页数据;
根据预设的置信度规则筛选出所述网页数据中置信度低于预设的置信度阈值的网页
数据作为目标网页数据;
将所述目标网页数据更新到所述原知识库, 完成对所述原数据库的优化。
7.如权利要求1至6中任一项所述的知识库的优化方法, 其特征在于, 所述分别对所述
最新提问和所述历史问答记录进行语义分析, 得到最新提问语义和历史问答记录语义, 包
括:
对所述所述最新提问和所述历史问答记录进行分词处理, 得到最新提问分词和历史问
答分词;
统计所述最新提问分词中每一个分词的最新提问分词频率, 选取所述最新提问分词频
率大于预设最新提问频率阈值的最新提问分词为最新提问关键词, 将所述最新提问关键词
中每一个词语转换为 最新提问词向量;
统计所述历史问答分词中每一个分词的历史问答分词频率, 选取所述历史问答分词频
率大于预设历史问答频率阈值的历史问答分词为历史问答关键词, 将所述历史问答关键词
中每一个词语转换为历史问答词向量;
将所述最新提问词向量拼接为最新提问向量矩阵, 并确定所述最新提问向量矩阵为所
述最新提问的最新提问语义, 将所述历史问答词向量拼接为历史问答向量矩阵, 并确定所
述历史问答向量矩阵为所述历史问答的历史问答语义。
8.一种知识库的优化装置, 其特 征在于, 所述装置包括:
语义分析模块, 用于获取目标用户的最新提问和历史问答记录, 分别对所述最新提问
和所述历史问答记录进行语义分析, 得到最 新提问语义和历史问答记录语义;
语义答案模块, 用于根据原知识库对所述最新提问语义进行答案匹配, 判断是否能从
所述原知识库匹配到所述 最新提问语义的语义 答案:
语义满意度模块, 用于当匹配到所述最新提问语义的语义答案时, 将所述语义答案发
送给所述 目标用户, 获取所述 目标用户关于所述语义答案的语义满意度, 根据所述语义答
案和语义满意度对所述原知识库进行 数据更新, 完成对所述原数据库的优化;
网页答案模块, 用于当无法匹配到所述最新提问语义的语义答案时, 根据所述最新提权 利 要 求 书 2/3 页
3
CN 115048501 A
3
专利 知识库的优化方法、装置、电子设备及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:45:05上传分享