(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210186780.8
(22)申请日 2022.02.28
(71)申请人 智汇 (中山) 信息技 术有限公司
地址 528400 广东省中山市中山火炬开发
区岐濠路108号峰景花园商铺19卡之
一
(72)发明人 朱玲
(74)专利代理 机构 北京广技专利代理事务所
(特殊普通 合伙) 11842
专利代理师 安琪
(51)Int.Cl.
G06K 9/62(2022.01)
G06F 40/30(2020.01)
G06F 40/205(2020.01)
G06F 16/33(2019.01)G06F 11/36(2006.01)
(54)发明名称
一种软件开发行为 监控系统
(57)摘要
本发明属于软件开发技术领域, 公开了一种
软件开发行为监控系统, 软件开发活动采集模块
利用自然语言处理技术对软件开发过程的软件
开发活动参数解析和特征词提取, 并基于
word2vec实现软件 开发活动参数日志向量化, 然
后基于K‑means聚类算法对向量化后的软件开发
活动参数聚类; 参数选取调整模块采用网格探测
参数选择算法对聚类的软件开发活动参数进行
粗略网格搜索, 逐渐减少步长, 搜索到最佳参数
对, 反复进行轴向探测和模式移动, 得到最优软
件开发活动参数组合; 软件开发活动参数处理模
块用于对软件开发活动参数的进行存储、 查询和
下载、 审计, 并对审计处理的软件开发活动参数
的行为数据信息进行显示。 为软件开发提供技术
支持。
权利要求书3页 说明书9页 附图2页
CN 114511039 A
2022.05.17
CN 114511039 A
1.一种软件开发行为 监控系统, 其特 征在于, 所述软件开发行为 监控系统包括:
软件开发活动采集模块利用自然语言处理技术对软件开发过程的软件开发活动参数
进行解析和特征词提取, 并基于word2vec实现软件开发活动参数日志向量化, 然后基于K ‑
means聚类算法对向量 化后的软件开发活动参数进行聚类;
参数选取调整模块采用网格探测参数选择算法对聚类的软件开发活动参数进行粗略
网格搜索, 逐渐减少步长, 搜索到最佳参数对, 反复进行轴向探测和模式移动, 得到最优软
件开发活动参数组合;
软件开发活动参数处理模块用于对软件开发活动参数的进行存储、 查询和下载、 审计,
并对审计处 理的软件开发活动参数的行为数据信息进行显示。
2.如权利要求1所述的软件开发行为监控系统, 其特征在于, 所述软件开发活动 参数包
括: 拖拽性请求特 征、 项目特 征、 开发人员特 征;
所述拖拽性请求特征包括: 行数改变量、 文件数改变量、 提交数、 评论数、 测试数改变
量;
行数改变量为: 拖拽式请求改变的行数; 文件数改变量为拖拽式请求更改的文件数; 提
交数为一个拖拽式请求内的提交数; 评论数为讨论和代码审查评论; 测试数改变量为在一
个拖拽式请求中测试改变的行 数;
所述项目特征包括: 开放问题数、 观察者数、 分支数、 团队大小、 测试行数覆盖、 项目历
史、 接收请求 率、 开发人员特 征;
开放问题数, 一个代码库的开 放问题数;
观察者数, 一个代码库的观察 者数;
分支数, 一个代码库的分支数;
团队大小, 核心团队的活动人员数量;
测试行数覆盖, 项目的测试覆盖;
项目历史接收请求 率, 这个项目成功接收请求的历史数据;
所述开发人员特 征包括: 前期请求 提交数、 历史提交请求成功率;
前期请求 提交数, 在被审核请求 提交前, 特定的开发者 提交的请求数;
历史提交请求成功率, 在被审核请求之前, 该开发者的历史请求 合并成功率。
3.如权利要求1所述的软件开发行为监控系统, 其特征在于, 所述利用自然语言处理技
术对软件开发过程的软件开发活动参数进行解析和特 征词提取包括:
3.1获取待处理软件开发活动参数, 基于知识特征词向量分布从词级别和句子级别进
行待处理软件开发活动参数的整合;
3.2基于注意力机制对整合的软件开发活动参数进行处理, 得到待处理自然语言的语
义特征;
3.3根据待处理自然语言的语义特征, 利用多层感知机进行软件开发活动参数的分类
处理, 提取出解析和特 征词。
4.如权利要求1所述的软件开发行为监控系 统, 其特征在于, 所述基于K ‑means聚类算
法对向量 化后的软件开发活动参数进行聚类具体包括以下步骤:
步骤一, 将所有提取的解析和特征词的软件开发活动参数, 存储在软件开发活动参数
集合D中, 其中D={x1,x2,...,xm}, xj表示第j个解析和特征词 的软件开发活动参数(j=权 利 要 求 书 1/3 页
2
CN 114511039 A
21,..,m), m表示总的解析和特 征词的软件开发活动参数的总数;
步骤二, 随机选取k个解析和特征词的软件开发活动参数, k为要划分的簇的数目, 将解
析和特征词的软件开发活动参数位置坐标作为初始均值向量{ μ1, μ2,..., μk}, 其中μi,(i=
1,...,k)表示每 个解析和特 征词的软件开发活动参数簇的均值向量;
步骤三, 确定第i个解析和特 征词的软件开发活动参数簇的集 合Ci。
5.如权利要求1所述的软件开发行为监控系统, 其特征在于, 所述参数选取调整模块采
用网格探测参数选择算法对聚类的软件开发活动参数进行粗略网格搜索, 逐渐减少步长,
搜索到最佳参数对, 反复进行轴向探测 和模式移动, 得到最优软件开发活动参数组合包括:
5.1对软件开发活动参数进行粗略网格搜索, 逐渐减小步长, 根据对学习精度的估算,
直至搜索到一个学习精度最佳的软件开发活动参数对;
5.2在最佳软件开发活动参数对附近, 进行进一步的模式探测搜索, 并规定初步步长,
进行轴向搜索, 寻找有利于函数值的下降的方向;
5.3从目标出发, 沿着寻找到的有利方向进行加速模式移动, 取得使目标函数有利的
点;
5.4如此反复进行轴向探测与模式移动, 并检验学习精度, 直到得到一个学习精度最高
的软件开发活动参数组合, 该参数对即为 最优软件开发活动参数组合。
6.如权利要求1所述的软件开发行为监控系统, 其特征在于, 所述软件开发活动 参数处
理模块用于对软件开发活动参数的进 行存储、 查询和下载、 审计, 并对审 计处理的软件开 发
活动参数的行为数据信息进行显示, 具体包括:
软件开发活动参数接收模块, 用于接收所述参数选取调整模块所收集的最优软件开发
活动参数组合; 并进行存储, 同时还供相关人员对存储的软件开发活动参数 的行为数据信
息进行查询和下 载;
软件开发活动参数审计模块, 用于对所述存储的软件开发活动参数的行为数据信 息进
行审计处 理, 并供相关开发人员查看审计处 理后的软件开发活动参数的行为数据信息;
软件开发活动参数显示模块, 用于对审计处理后的软件开发活动 参数的行为数据信 息
进行显示。
7.如权利要求6所述的软件开发行为监控系统, 其特征在于, 所述接收所述参数选取调
整模块所收集的最优软件开发活动参数组合; 并进行存 储具体包括:
根据最优软件开发活动参数文件中的最优软件开发活动参数文件信息判断文件系统
中是否存在对应的目标配置文件; 所述最优软件开发活动参数文件信息包括预先建立的、
与配置文件对应的数据存储结构, 所述数据存储结构将 配置文件区域分为最优软件开发活
动参数地址描述区和最优软件开 发活动参数存储区具体包括: 根据所述文件头信息读取所
述目标配置文件的最优软件开发活动参数地址描述区, 并获取所述目标配置文件的各个当
前最优软件开发活动参数信息 。
8.如权利要求7所述的软件开发行为监控系统, 其特征在于, 根据 所述最优软件开发活
动参数名称及各个所述当前最优软件开发活动参数信息判断所述目标配置文件中是否存
在对应的最优软件开发活动参数, 若存在, 则判断与所述最优软件开发活动参数对应的当
前最优软件开发活动参数信息中记录的当前最优软件开发活动参数大小与所述最优软件
开发活动参数大小是否一致, 若大小一致, 则根据所述起始地址和所述最优软件开发活动权 利 要 求 书 2/3 页
3
CN 114511039 A
3
专利 一种软件开发行为监控系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:47:35上传分享