安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210395173.2 (22)申请日 2022.04.15 (71)申请人 华南理工大 学 地址 510640 广东省广州市天河区五山路 381号 (72)发明人 詹志辉 高敏 陈春华 张军  (74)专利代理 机构 广州市华学知识产权代理有 限公司 4 4245 专利代理师 黄卫萍 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9536(2019.01) G06Q 50/00(2012.01) G06F 16/36(2019.01) (54)发明名称 一种基于多任务学习和知识图谱增强的项 目推荐方法 (57)摘要 本发明公开了一种基于多任务学习和知识 图谱增强的项目推荐方法, 其中, 项目包括图书、 电影、 音乐、 商品。 相较于传统的项目推荐方法, 本发明引入知识图谱, 缓解了数据稀疏、 精度不 高等问题。 本发明设计一个推荐模型EMKR, 它使 用一种多任务学习共享单元关联推荐模块和知 识图谱嵌入模块。 在推荐模块中, 使用两部分建 模策略, 用注意力机制捕捉用户行为模式, 并引 入辅助向量扩展用户和项目的潜在 表达能力; 在 知识图谱嵌入模块, 区分了不同关系的重要性, 使用图卷积网络挖掘知识 图谱丰富的多关系语 义。 最后, 交替训练EM KR, 使用训练好的模型进行 推荐。 本发 明公开的项目推荐方法具有较好的性 能, 尤其在稀疏的推荐场景 下, 效果显著提升 。 权利要求书4页 说明书8页 附图2页 CN 114817712 A 2022.07.29 CN 114817712 A 1.一种基于多任务学习和知识图谱增强的项目推荐方法, 其中, 所述项目包括图书、 电 影、 音乐、 商品, 其特 征在于, 所述项目推荐方法包括以下步骤: S1、 数据准备: 获取用户评分项目的历史记录, 构造用户项目的隐式反馈矩阵 其中M是用户的个数, N是项目的个数, 索引号为m, 的用户对索引号为n的项目有 正向的偏好, m=0,1, …,M‑1, n=0,1, …,N‑1, 则矩阵Y的第m行、 第n列数值为1, 否则为0; 同 时, 构造知识图谱G={(head,relation,tail)|head,tail∈E,relation∈R}, 知识图谱的 基本单位是三元组(head,relation,tail), 其中, head是头实体, tail是尾实体, relation 是头实体指向尾实体的关系, E是头实体和尾实体构成的实体集合, 实体集合E大小为P, R是 关系集合, 关系集 合R的大小为 Q; S2、 使用交替训练的方式训练推荐模型, 推荐模型简称为EMKR; 其中, 所述EMKR包括推 荐模块、 知识图谱嵌入模块和L个多任务学习共享单元, 简称SU; 其中, 所述推荐模块包含顺 序连接的L个特征提取层和一个预测层, 第l个特征提 取层简称为RSLayerl, 其中, l=0,1, …, L‑1; 所述知识图谱嵌入模块包含顺序连接的L个特征提取层和一个预测层, 第l个特征提取 层简称为KGLayer l; SU关联RSLayer l和KGLayer l, 实现两个相关向量的特 征共享; S3、 使用训练好的EMKR预测用户 ‑项目对的得分, 根据得分返回用户的推荐列表, 具体 如下: 给定一个用户, 计算给定用户对所有项目的得分, 将分值按照 从大到小排序, 排位越 靠前的越应该优先推荐给用户。 2.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特 征在于, 所述 步骤S2中, E MKR的推荐模块执 行一种 两部分建模策略, 所述两部分建模策略首先为索引号为m的用户初始两个d维向量 为索引号为n的项目初始两个d维向量 其中, 是该用户在RSLayer 0的上下文向量, 用于捕捉用户的历史行为, 是该用户在RSLayer 0的辅助向量, 用于扩展用户的表达能力; 该项 目在RSLayer 0的上下文向量, 用于捕捉知识图谱中的有用信息, 是该项目在 RSLayer0的辅助向量, 用于扩展项目的表达能力; 其中, 是该用户在RSLayer l的完整向量, 是该项目 在RSLayer l的完整向量。 3.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特 征 在 于 , 所 述 步 骤 S 2中 , 将 两 部 分 建 模 策略 应 用到 所 有 特 征 提 取 层中 , 即 其中 是索引号 为m的用户在RSLayer l的完整向量, 是索引号 为n的项目在RSLayer l的完整向量。 4.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特 征在于, 所述步骤S2中, 每一个项目都与知识图谱中相应的头实体对应, 并且EMKR统一了项 目和相应头实体的索引号, 即索引号 为n的项目对应知识图谱中索引号 为n的头实体。 5.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特 征在于, 所述步骤S2中, 为G中的头实体、 关系、 尾实体初始一个d维向量表示, 分别记为 其中, 是索引号为i的头实体在KGLayer 0的初始向量, 是索引号为o权 利 要 求 书 1/4 页 2 CN 114817712 A 2的关系在KGLayer 0的初始向量、 是索引号为j的尾实体在KGLayer 0初始向量, i=0,1, …, P‑1, o=0,1,…,Q‑1, j=0,1, …,P‑1。 6.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特 征在于, 所述 步骤S2中, 推荐模块的RSLayerl的计算过程如下: 首先, 采样索引号为m的用户的cnt个历史点击项目, 设该用户的历史点击项目的索引 号为index_k, k=0,1, …cnt‑1, index_k∈{0,1, …,N‑1}; 然后, 使用注意力机制得到该用 户在RSLayerl+1的上下文向量, 注意力机制的计算公式如下: 其中, βk是第k个历史点击项目的注意力得分, Wβ是用于计算注意力得分的一个可训练 的参数矩阵, 是索引号为index_k的项目在Layer  l的完整向量, αk是使用公式(2)计 算的归一化注意力得分, αk取值的范围是(0 ,1); 当l=L ‑1时, 公式(3)得到向量 是推荐模块的特征提取层输出的索引号为m的项目的上下文向 量。 7.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特 征在于, 所述步骤S2中, EMKR的知识图谱嵌入模块的KGLayerl使用神经网络中的全连接FC() 提取关系的潜在特 征, 计算方式如下: 其中, 是索引号为o的关系在KGLayerl的向量, 是该关系在KGLayerl+1的向量, W、 b 分别是用于实现全连接的参数矩阵和 偏置向量, 由模型训练更新, ReLU()是用于实现全连 接的激活函数; 当l=L ‑1时, 公式(4)得到向量 是知识图谱嵌入模块的特征提取层 输出的索引号 为o的关系向量; 同时, EMKR的知识图谱嵌入模块的KGLayer l使用Hop个图卷积网络层计算头实体的邻域 向量; 令hop=0,1, …Hop‑1, 第hop个图卷积网络层的计算过程如下: 首先, 采样索引号为i的头实体的Ns个邻域三元组, Ns个邻域三元组中, 邻域尾实体的 索引号为tail_s, 邻域关系的索引号为rel_s, s=0,1,...,Ns ‑1, tail_s∈{0,1, …,P‑1}, rel_s∈{0,1, …,Q‑1}, 使用公式(5)计算第s个邻域关系对该头实体的重要性 其中, 是索引号 为rel_s的关系在KGLayer l的向量; 然后, 使用公式(6)计算归一 化重要性 取值的范围是(0,1):权 利 要 求 书 2/4 页 3 CN 114817712 A 3

.PDF文档 专利 一种基于多任务学习和知识图谱增强的项目推荐方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多任务学习和知识图谱增强的项目推荐方法 第 1 页 专利 一种基于多任务学习和知识图谱增强的项目推荐方法 第 2 页 专利 一种基于多任务学习和知识图谱增强的项目推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。