安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210480342.2 (22)申请日 2022.04.28 (65)同一申请的已公布的文献号 申请公布号 CN 114969249 A (43)申请公布日 2022.08.30 (73)专利权人 江苏四象软件 有限公司 地址 225000 江苏省扬州市经济技 术开发 区扬子江中路186号智谷大厦B座8层 804-806 (72)发明人 韩岭 蔡进 胥传龙 李明 (74)专利代理 机构 武汉华强专利代理事务所 (普通合伙) 42237 专利代理师 康晨 (51)Int.Cl. G06F 16/33(2019.01)G06F 16/9535(2019.01) G06F 40/30(2020.01) 审查员 刘芳 (54)发明名称 数据挖掘系统及数据 挖掘方法 (57)摘要 本发明涉及数据挖掘领域, 具体涉及数据挖 掘系统及数据挖掘方法, 通过对用户的访问行为 数据的挖掘; 确定用户的购买迟疑程度以及计算 用户对已购目标产品的倾向程度; 基于已购目标 产品的倾向程度、 购买迟疑程度以及支付时间长 度, 计算任意两两用户的行为差异性, 得到不同 类别的用户群体; 同时引入用户群体中任意两用 户的历史设定时间内对已购目标产品的查询次 数以及滑动速度构成的用户行为向量 以及对应 的评价特征码, 计算任意两两用户之间的邻域距 离, 基于各用户对应的所有邻域距离, 并计算该 用户的偏向程度, 进而获取各用户群体中偏向程 度最大与最小对应的状态向量, 确定推送的产 品。 即本发 明的方案能够为网购平台的优化提供 依据。 权利要求书2页 说明书8页 附图1页 CN 114969249 B 2022.12.20 CN 114969249 B 1.一种数据 挖掘方法, 其特 征在于, 包括以下步骤: 获取用户在已购目标产品的网购过程中的访问行为数据; 所述访问行为数据包括浏 览 记录总时间、 已购目标产品对应页面的停留时间、 已购目标产品的支 付时间长度; 将所述停 留时间与浏览记录总时间的比值作为用户的购买迟疑程度; 根据所述支付时间长度、 停留时间以及购买迟疑程度, 计算用户对已购目标产品的倾 向程度; 基于已购目标产品的倾向程度、 购买迟疑程度以及支付时间长度, 计算任意两两用户 的行为差异性, 基于各 行为差异性对所有用户进行划分, 得到不同类别的用户群 体; 获取各用户群体中的各用户在历史设定时间内对所述已购 目标产品的查询次数以及 滑动速度, 基于所述查询次数以及滑动速度, 构建用户行为向量; 对 各用户群体中的各用户 对已购目标产品的评价内容进行数据挖掘, 得到评价关键词, 对所述评价关键词进行编码 得到评价特征码; 基于各用户群体中的任意两两用户的评价特征码和用户行为向量, 计算任意两两用户 之间的邻域距离, 基于各用户对应的所有邻域距离, 并计算该用户的偏向程度; 将各用户群 体中的最大偏向程度与最小偏向程度组成状态向量; 对所有用户群体的状态向量进行跟踪, 计算设定时间段内用户群体的状态稳定性, 确 定状态稳定性差的前M个用户群体, 根据该M个用户群体的评论情况, 在平台页面 随机投放 热评指数高的已购目标产品的评论, M大于等于2; 状态稳定性 为: 其中, t为当前 时刻, N为设定时间段, 为用户群体在设定时间段N内的第i ‑1个状 态向量, 为用户群 体在设定时间段N内的第i个 状态向量; 根据该M个用户群体的评论情况, 在平台页面随机投放热评指数高的 电影的评论的具 体手段为: 1) 基于设定时间段N内的用户群体的状态稳定性, 找到当前稳定性差的前M个用户群 体, 从M个用户群 体的评论中随机 选取M个评论; 2) 影评平台构建快速点赞/踩的机制, 针对M个评论, 让已购票评价后的用户进行点赞/ 踩, 因此根据点赞和踩的数量 , 获取评价的热评指数: ; 所述偏向程度的获取过程为: 将其中任一用户对应的邻域距离按照从小到大排序, 选 取前k个邻域距离; 将前k个邻域距离之和作为该用户的偏向程度; 邻域距离为:权 利 要 求 书 1/2 页 2 CN 114969249 B 2其中, 为用户p的影评特征码, 为用户q的影评特征码, 为用户p的用户行为向量, 为用户q的用户行为向量, 为哈希特征表示的历史特征码之间的向量夹 角相似度, 为购票行为的相似距离, 是一种L2 距离。 2.根据权利要求1所述的一种数据 挖掘方法, 其特 征在于, 所述 倾向程度为: 其中, 表示当前用户购票的支付时间长度, 表示当前用户当日在电影介绍 页的停留时间, 表示当前订单购票的购买迟疑程度。 3.根据权利要求1所述的一种数据 挖掘方法, 其特 征在于, 所述对已购 目标产品的评价内容进行数据挖掘是通过基于词袋模型的分词处理进行 的。 4.根据权利要求1所述的一种数据挖掘方法, 其特征在于, 所述行为差异性的获取过程 为: 1) 根据任意两用户对应的支付时间长度、 停留时间以及购买迟疑程度, 采用余弦相似 度算法, 确定该两用户的相似度, 进 而获取两用户的不相似度; 2) 将已购目标产品的倾向程度的差异 的绝对值与不相似度的乘积作为两用户的行为 差异性。 5.一种数据挖掘系统, 包括存储器和处理器, 其特征在于, 所述处理器执行所述存储器 存储的用于实现如权利要求1 ‑4中任一项所述 一种数据 挖掘方法的程序。权 利 要 求 书 2/2 页 3 CN 114969249 B 3
专利 数据挖掘系统及数据挖掘方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:50:52
上传分享
举报
下载
原文档
(704.6 KB)
分享
友情链接
CCSP OSG 云安全专业认证 第三版 中文.pdf
SY-T 6662.2-2020 石油天然气工业用非金属复合管 第2部分:柔性复合高压输送管.pdf
GB-Z 22553-2010 利用重复性、再现性和正确度的估计值评估测量不确定度的指南.pdf
DB50-T 1279-2022 民用醇基液体燃料应用技术规程 重庆市.pdf
GB-T 1311-2008 直流电机试验方法.pdf
GB-T 38646-2020 信息安全技术 移动签名服务技术要求.pdf
ISO 21511 2018 Work breakdown structures for project and programme management.pdf
专利 一种知识图谱构建方法、装置、电子设备及存储介质.PDF
DB34-T 4145-2022 政务数据目录 核心元数据 安徽省.pdf
GB-T 35277-2017 信息安全技术 防病毒网关安全技术要求和测试评价方法.pdf
GB 12676-2014 商用车辆和挂车制动系统技术要求及试验方法.pdf
GM-T 0056-2018 多应用载体密码应用接口规范.pdf
中国联通 5G专网安全技术白皮书.pdf
GB T 17902.1-2023 信息技术 安全技术 带附录的数字签名 第1部分:概述.pdf
专利 针对APT攻击的安全编排与自动化响应方法、装置及系统.PDF
T-QLKZSH 4—2023 橇装式加油装置管理规范.pdf
JR-T0124-2014 金融机构编码规范.pdf
DB42-T 2040.1-2023 大球盖菇生产技术系列规程 第1部分:桑枝大球盖菇 湖北省.pdf
GB-T 17747.2-2011 天然气压缩因子的计算 第2部分:用摩尔组成进行计算.pdf
GB-T 20834-2014 发电电动机基本技术条件.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(704.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。