(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210360718.6
(22)申请日 2022.04.07
(71)申请人 科大讯飞股份有限公司
地址 230088 安徽省合肥市高新区望江西
路666号
(72)发明人 王永灿 丁克玉
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 王云晓
(51)Int.Cl.
G06F 3/023(2006.01)
G06F 40/274(2020.01)
G06F 40/30(2020.01)
(54)发明名称
一种整句联想方法、 装置、 设备及存 储介质
(57)摘要
本发明提供了一种整句联想方法、 装置、 设
备及存储介质, 其中, 整句联想方法包括: 获取目
标输入文本, 目标输入文本为由第一用户输入的
满足整句联想触发条件的文本; 将目标输入文本
与预先构建的联想资源库中的联想资源进行语
义匹配, 其中, 联想资源库包括能够满足多用户
通用输入需求的通用联想资源集 以及满足第一
用户的个性化输入需求的个性化联想资源集; 根
据目标输入文本与联想资源库中的联想资源的
语义匹配结果, 从联想资源库中确定目标输入文
本对应的联想候选。 本发明提供的整句联想方法
可实现整句联想, 相比于基于词进行联想, 联想
内容更长, 用户输入效率更高, 用户体验更好。
权利要求书3页 说明书16页 附图5页
CN 114637411 A
2022.06.17
CN 114637411 A
1.一种整句联想方法, 其特 征在于, 包括:
获取目标输入文本, 所述目标输入文本为由第 一用户输入的满足整句联想触发条件的
文本;
将所述目标输入文本与预先构建的联想资源库中的联想资源进行语义匹配, 其中, 所
述联想资源库包括能够满足多用户通用输入需求的通用联想资源集以及满足所述第一用
户的个性 化输入需求的个性 化联想资源集;
根据所述目标输入文本与 所述联想资源库中的联想资源的语义匹配结果, 从所述联想
资源库中确定所述目标输入文本对应的联想候选 。
2.根据权利要求1所述的整句联想方法, 其特征在于, 所述联想资源库中还包括所述第
一用户对应的相似个性 化联想资源集;
所述第一用户对应的相似个性化联想资源集基于输入习惯与所述第一用户的输入习
惯匹配的第二用户对应的个性化联想资源集构建; 其中, 所述第一用户对应的相似个性化
联想资源集 为所述满足所述第一用户的个性 化输入需求的个性 化联想资源集。
3.根据权利要求1或2所述的整句联想方法, 其特征在于, 所述联想资源库中的每条联
想资源包括联想上句和联想下句;
所述将所述目标输入文本与预先构建的联想资源库中的联想资源进行语义匹配, 包
括:
针对所述联想资源库中的每条 联想资源:
确定所述目标输入文本与 该条联想资源中的联想上句的语义相似度, 或者与 该条联想
资源中的联想下句的语义相关度; 确定出的语义相似度或语义相关度作为所述目标输入文
本与该条联想资源的语义匹配结果。
4.根据权利要求1所述的整句联想方法, 其特征在于, 所述通用联想资源集基于多个用
户的历史输入文本构建;
基于所述多个用户的历史输入文本构建通用联想资源集, 包括:
从所述多个用户的历史输入文本 中获取若干上下句对, 获取的每个上下句对作为一条
候选通用联想资源, 以得到若干条候选通用联想资源;
以在所述多个用户的历史输入文本中出现的频次为筛选依据, 从所述若干条候选通用
联想资源中筛 选出通用联想资源, 得到若干条通用联想资源;
基于所述若干条通用联想资源, 构建通用联想资源集。
5.根据权利要求4所述的整句联想方法, 其特征在于, 所述基于所述若干条通用联想资
源, 构建通用联想资源集, 包括:
将所述若干条通用联想资源中语义重复的通用联想资源删除;
由剩余的通用联想资源组成通用联想资源集。
6.根据权利要求1所述的整句联想方法, 其特征在于, 所述个性化联想资源集基于所述
第一用户的历史输入文本构建;
基于所述第一用户的历史输入文本构建个性 化联想资源集, 包括:
获取指定时间段内的所述第一用户的历史输入文本;
从所述指定时间段内的所述第一用户的历史输入文本中获取出现频次大于预设频次
阈值的上 下句对, 获取的每 个上下句对作为 一条个性 化联想资源;权 利 要 求 书 1/3 页
2
CN 114637411 A
2基于获取的个性 化联想资源, 构建个性 化联想资源集。
7.根据权利要求2所述的整句联想方法, 其特征在于, 确定输入习惯与 所述第一用户的
输入习惯匹配的第二用户对应的个性 化联想资源集, 包括:
确定所述第一用户对应的个性化联想资源集与若干第二用户分别对应的个性化联想
资源集的语义相似度;
根据所述第一用户对应的个性化联想资源集与若干第二用户分别对应的个性化联想
资源集的语义相似度, 从所述若干第二用户分别对应的个性化联想资源集中, 确定输入习
惯与所述第一用户的输入习惯匹配的第二用户对应的个性 化联想资源集。
8.根据权利要求7所述的整句联想方法, 其特征在于, 确定输入习惯与 所述第一用户的
输入习惯匹配的第二用户对应的个性 化联想资源集, 还 包括:
基于所述第一用户的位置信息, 以及若干第二用户的位置信息, 从若干第二用户中筛
选出与所述第一用户处于预设范围内的第二用户;
所述确定所述第一用户对应的个性化联想资源集与若干第二用户分别对应的个性化
联想资源集的语义相似度, 包括:
确定所述第一用户对应的个性化联想资源集与筛选出的第二用户对应的个性化联想
资源集的语义相似度。
9.根据权利要求2所述的整句联想方法, 其特征在于, 基于输入习惯与 所述第一用户的
输入习惯匹配的第二用户对应的个性化联想资源集构建所述第一用户对应的相似个性化
联想资源集, 包括:
将输入习惯与所述第一用户的输入习惯匹配的第二用户对应的个性化联想资源集中
具有敏感信息的个性 化联想资源和/或语义重复的个性 化联想资源删除;
由输入习惯与所述第一用户的输入习惯匹配的第二用户对应的个性化联想资源集中
剩余的个性 化联想资源组成所述第一用户对应的相似个性 化联想资源集。
10.根据权利要求1所述的整句联想方法, 其特 征在于, 还 包括:
根据所述联想候选的来源和/或所述联想候选对应的语义匹配结果, 对所述联想候选
进行排序, 以便将排序后的联想候选向所述第一用户进行展示。
11.一种整句联想装置, 其特征在于, 包括: 输入文本获取模块、 语义匹配模块和联想候
选确定模块;
所述输入文本获取模块, 用于获取目标输入文本, 所述目标输入文本为由第一用户输
入的满足整句联想触发条件的文本;
所述语义匹配模块, 用于将所述目标输入文本与 预先构建的联想资源库中的联想资源
进行语义匹配, 得到所述联想资源库中的联想 资源对应的语义匹配结果, 其中, 所述联想资
源库中包括能够满足多用户通用输入需求的通用联想资源集以及所述第一用户对应的满
足所述第一用户的个性 化输入需求的个性 化联想资源集;
所述联想候选确定模块, 用于根据所述联想资源库中的联想资源对应的语义匹配结
果, 从所述联想资源库中确定所述目标输入文本对应的联想候选 。
12.一种整句联想设备, 其特 征在于, 包括: 存 储器和处 理器;
所述存储器, 用于存 储程序;
所述处理器, 用于执行所述程序, 实现如权利要求1~10中任一项所述的整句联想方法权 利 要 求 书 2/3 页
3
CN 114637411 A
3
专利 一种整句联想方法、装置、设备及存储介质
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:46:26上传分享