专利 一种基于多任务学习和知识图谱增强的项目推荐方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210395173.2 (22)申请日 2022.04.15 (71)申请人华南理工大学地址 510640 广东省广州市天河区五山路 381号 (72)发明人詹志辉　高敏　陈春华　张军　 (74)专利代理机构广州市华学知识产权代理有限公司 4 4245 专利代理师黄卫萍 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9536(2019.01) G06Q 50/00(2012.01) G06F 16/36(2019.01) (54)发明名称一种基于多任务学习和知识图谱增强的项目推荐方法 (57)摘要本发明公开了一种基于多任务学习和知识图谱增强的项目推荐方法，其中，项目包括图书、电影、音乐、商品。相较于传统的项目推荐方法，本发明引入知识图谱，缓解了数据稀疏、精度不高等问题。本发明设计一个推荐模型EMKR，它使用一种多任务学习共享单元关联推荐模块和知识图谱嵌入模块。在推荐模块中，使用两部分建模策略，用注意力机制捕捉用户行为模式，并引入辅助向量扩展用户和项目的潜在表达能力；在知识图谱嵌入模块，区分了不同关系的重要性，使用图卷积网络挖掘知识图谱丰富的多关系语义。最后，交替训练EM KR，使用训练好的模型进行推荐。本发明公开的项目推荐方法具有较好的性能，尤其在稀疏的推荐场景下，效果显著提升。权利要求书4页说明书8页附图2页 CN 114817712 A 2022.07.29 CN 114817712 A 1.一种基于多任务学习和知识图谱增强的项目推荐方法，其中，所述项目包括图书、电影、音乐、商品，其特征在于，所述项目推荐方法包括以下步骤： S1、数据准备：获取用户评分项目的历史记录，构造用户项目的隐式反馈矩阵其中M是用户的个数， N是项目的个数，索引号为m，的用户对索引号为n的项目有正向的偏好， m＝0,1, …,M‑1， n＝0,1, …,N‑1，则矩阵Y的第m行、第n列数值为1，否则为0；同时，构造知识图谱G＝{(head,relation,tail)|head,tail∈E,relation∈R}，知识图谱的基本单位是三元组(head,relation,tail)，其中， head是头实体， tail是尾实体， relation 是头实体指向尾实体的关系， E是头实体和尾实体构成的实体集合，实体集合E大小为P， R是关系集合，关系集合R的大小为 Q； S2、使用交替训练的方式训练推荐模型，推荐模型简称为EMKR；其中，所述EMKR包括推荐模块、知识图谱嵌入模块和L个多任务学习共享单元，简称SU；其中，所述推荐模块包含顺序连接的L个特征提取层和一个预测层，第l个特征提取层简称为RSLayerl，其中， l＝0,1, …, L‑1；所述知识图谱嵌入模块包含顺序连接的L个特征提取层和一个预测层，第l个特征提取层简称为KGLayer l； SU关联RSLayer l和KGLayer l，实现两个相关向量的特征共享； S3、使用训练好的EMKR预测用户 ‑项目对的得分，根据得分返回用户的推荐列表，具体如下：给定一个用户，计算给定用户对所有项目的得分，将分值按照从大到小排序，排位越靠前的越应该优先推荐给用户。 2.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法，其特征在于，所述步骤S2中， E MKR的推荐模块执行一种两部分建模策略，所述两部分建模策略首先为索引号为m的用户初始两个d维向量为索引号为n的项目初始两个d维向量其中，是该用户在RSLayer 0的上下文向量，用于捕捉用户的历史行为，是该用户在RSLayer 0的辅助向量，用于扩展用户的表达能力；该项目在RSLayer 0的上下文向量，用于捕捉知识图谱中的有用信息，是该项目在 RSLayer0的辅助向量，用于扩展项目的表达能力；其中，是该用户在RSLayer l的完整向量，是该项目在RSLayer l的完整向量。 3.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法，其特征在于，所述步骤 S 2中，将两部分建模策略应用到所有特征提取层中，即其中是索引号为m的用户在RSLayer l的完整向量，是索引号为n的项目在RSLayer l的完整向量。 4.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法，其特征在于，所述步骤S2中，每一个项目都与知识图谱中相应的头实体对应，并且EMKR统一了项目和相应头实体的索引号，即索引号为n的项目对应知识图谱中索引号为n的头实体。 5.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法，其特征在于，所述步骤S2中，为G中的头实体、关系、尾实体初始一个d维向量表示，分别记为其中，是索引号为i的头实体在KGLayer 0的初始向量，是索引号为o权　利　要　求　书 1/4 页 2 CN 114817712 A 2的关系在KGLayer 0的初始向量、是索引号为j的尾实体在KGLayer 0初始向量， i＝0,1, …, P‑1， o＝0,1,…,Q‑1， j＝0,1, …,P‑1。 6.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法，其特征在于，所述步骤S2中，推荐模块的RSLayerl的计算过程如下：首先，采样索引号为m的用户的cnt个历史点击项目，设该用户的历史点击项目的索引号为index_k， k＝0,1, …cnt‑1， index_k∈{0,1, …,N‑1}；然后，使用注意力机制得到该用户在RSLayerl+1的上下文向量，注意力机制的计算公式如下：其中， βk是第k个历史点击项目的注意力得分， Wβ是用于计算注意力得分的一个可训练的参数矩阵，是索引号为index_k的项目在Layer l的完整向量， αk是使用公式(2)计算的归一化注意力得分， αk取值的范围是(0 ,1)；当l＝L ‑1时，公式(3)得到向量是推荐模块的特征提取层输出的索引号为m的项目的上下文向量。 7.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法，其特征在于，所述步骤S2中， EMKR的知识图谱嵌入模块的KGLayerl使用神经网络中的全连接FC() 提取关系的潜在特征，计算方式如下：其中，是索引号为o的关系在KGLayerl的向量，是该关系在KGLayerl+1的向量， W、 b 分别是用于实现全连接的参数矩阵和偏置向量，由模型训练更新， ReLU()是用于实现全连接的激活函数；当l＝L ‑1时，公式(4)得到向量是知识图谱嵌入模块的特征提取层输出的索引号为o的关系向量；同时， EMKR的知识图谱嵌入模块的KGLayer l使用Hop个图卷积网络层计算头实体的邻域向量；令hop＝0,1, …Hop‑1，第hop个图卷积网络层的计算过程如下：首先，采样索引号为i的头实体的Ns个邻域三元组， Ns个邻域三元组中，邻域尾实体的索引号为tail_s，邻域关系的索引号为rel_s， s＝0,1,...,Ns ‑1， tail_s∈{0,1, …,P‑1}， rel_s∈{0,1, …,Q‑1}，使用公式(5)计算第s个邻域关系对该头实体的重要性其中，是索引号为rel_s的关系在KGLayer l的向量；然后，使用公式(6)计算归一化重要性取值的范围是(0,1)：权　利　要　求　书 2/4 页 3 CN 114817712 A 3

专利 一种基于多任务学习和知识图谱增强的项目推荐方法

专利一种基于多任务学习和知识图谱增强的项目推荐方法