安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210468316.8 (22)申请日 2022.04.29 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 檀彦超 李龙飞  (74)专利代理 机构 北京恒博知识产权代理有限 公司 11528 专利代理师 侯世俭 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) (54)发明名称 一种标签分类方法、 装置、 存储介质及电子 设备 (57)摘要 本说明书公开了一种标签分类方法、 装置、 存储介质及电子设备, 其中, 方法包括: 获取项目 标签矩阵, 所述项目标签矩阵包括多个项目、 多 个标签以及各个项目与各个标签之间的对应关 系, 基于所述项目标签矩阵中的所有标签获取标 签嵌入向量集合, 基于双曲空间模型, 采用所述 项目标签矩阵和所述标签嵌入向量集合, 对所述 所有标签进行层级分类处理, 以得到标签分类函 数。 权利要求书2页 说明书13页 附图4页 CN 114880473 A 2022.08.09 CN 114880473 A 1.一种标签分类方法, 所述方法包括: 获取项目标签矩阵, 所述项目标签矩阵包括多个项目、 多个标签以及各个项目与各个 标签之间的对应关系; 基于所述项目标签矩阵中的所有标签获取 标签嵌入向量 集合; 基于双曲空间模型, 采用所述项目标签矩阵和所述标签嵌入向量集合, 对所述所有标 签进行层级分类处 理, 以得到标签分类函数。 2.根据权利要求1所述的方法, 所述基于双曲空间模型, 采用所述项目标签矩阵和所述 标签嵌入向量 集合, 对所述所有标签进行层级分类处 理, 以得到标签分类函数, 包括: 基于庞加莱模型, 采用所述项目标签矩阵和所述标签嵌入向量集合, 对所述所有标签 进行层级分类处 理, 以得到分类构造函数; 基于所述项目标签矩阵和所述标签嵌入向量集合, 获取标签有关嵌入向量和标签无关 嵌入向量; 基于洛伦兹模型, 将所述标签有关嵌入向量和所述标签无关嵌入向量相结合, 以生成 标签相似度衡量 函数; 基于所述分类构造函数和标签相似度衡量 函数, 生成标签分类函数。 3.根据权利要求2所述的方法, 所述基于庞加莱模型, 采用所述项目标签矩阵和所述标 签嵌入向量 集合, 对所述所有标签进行层级分类处 理, 以得到分类构造函数, 包括: 基于庞加莱模型, 采用所述项目标签矩阵和所述标签嵌入向量集合, 对所述所有标签 进行层级分类处 理, 生成树状层级分类结构; 对所述树状层级分类结构进行分类感知正则化处 理, 生成分类构造函数。 4.根据权利要求3所述的方法, 所述基于庞加莱模型, 采用所述项目标签矩阵和所述标 签嵌入向量 集合, 对所述所有标签进行层级分类处 理, 生成树状层级分类结构, 包括: 基于庞加莱模型, 采用所述项目标签矩阵和所述标签嵌入向量集合, 将所述所有标签 分为至少一个标签级别, 其中, 每 个标签级别中包 含至少一个标签集 合; 基于所述至少一个标签级别和所有标签集 合生成树状层级分类结构。 5.根据权利要求4所述的方法, 所述基于庞加莱模型, 采用所述项目标签矩阵和所述标 签嵌入向量 集合, 将所述所有标签分为至少一个标签级别, 包括: 基于庞加莱模型和所述项目标签矩阵、 所述标签嵌入向量集合, 采用表征感知评分函 数, 获取第一标签级别的第一标签集 合中各标签的表征分数; 获取所述第一标签集 合中表征分数高于 评分阈值的至少一个第一标签; 采用自适应聚类算法, 将所述至少一个第一标签分为至少一个第二标签集合, 所述第 二标签集合为所述第一标签集合的子集合且从属于第二标签级别, 所述第二标签级别为所 述第一标签级别的下一个标签级别。 6.根据权利要求2所述的方法, 所述基于所述项目标签矩阵和所述标签嵌入向量集合, 获取标签有关嵌入向量和标签无关嵌入向量, 包括: 基于所述项目标签矩阵和所述标签嵌入向量矩阵, 获取项目有关嵌入向量、 用户有关 嵌入向量、 项目无关嵌入向量和用户无关嵌入向量; 基于所述项目有关嵌入向量和所述用户有关嵌入向量生成标签有关嵌入向量, 基于所 述项目无关嵌入向量和所述用户无关嵌入向量 生成标签无关嵌入向量。权 利 要 求 书 1/2 页 2 CN 114880473 A 27.根据权利要求2所述的方法, 所述基于洛伦兹模型, 将所述标签有关嵌入向量和所述 标签无关嵌入向量相结合, 以生成标签相似度衡量 函数, 包括: 基于洛伦兹模型, 将所述标签有关嵌入向量和所述标签无关嵌入向量相结合, 生成初 始相似度函数; 采用大间隔最近邻居分类算法, 基于所述初始相似度函数生成标签相似度衡量 函数。 8.根据权利要求7所述的方法, 所述基于洛伦兹模型, 将所述标签有关嵌入向量和所述 标签无关嵌入向量相结合, 生成初始相似度函数, 包括: 获取所述有关嵌入向量的有关权 重, 获取所述无关嵌入向量的无关权 重; 基于洛伦兹模型以及所述有关权重和所述无关权重, 将所述标签有关嵌入向量和所述 标签无关嵌入向量相结合, 生成初始相似度函数。 9.一种标签分类装置, 所述装置包括: 矩阵获取模块, 用于获取项目标签矩阵, 所述项目标签矩阵包括多个项目、 多个标签以 及各个项目与各个标签之间的对应关系; 嵌入向量获取模块, 用于基于所述项目标签矩阵中的所有标签获取标签嵌入向量集 合; 分类函数获取模块, 用于基于双曲空间模型, 采用所述项目标签矩阵和所述标签嵌入 向量集合, 对所述所有标签进行层级分类处 理, 以得到标签分类函数。 10.一种计算机存储介质, 所述计算机存储介质存储有多条指令, 所述指令适于由处理 器加载并执 行如权利要求1~8任意 一项的方法步骤。 11.一种电子设备, 包括: 处理器和存储器; 其中, 所述存储器存储有计算机程序, 所述 计算机程序适于由所述处 理器加载并执 行如权利要求1~8任意 一项的方法步骤。权 利 要 求 书 2/2 页 3 CN 114880473 A 3

.PDF文档 专利 一种标签分类方法、装置、存储介质及电子设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种标签分类方法、装置、存储介质及电子设备 第 1 页 专利 一种标签分类方法、装置、存储介质及电子设备 第 2 页 专利 一种标签分类方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:46:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。