安全公司报告
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111491204.6 (22)申请日 2021.12.08 (71)申请人 东北大学 地址 110819 辽宁省沈阳市和平区文化路3 号巷11号 (72)发明人 高天寒 贾启振 董傲霜 赵琪珲 (74)专利代理 机构 沈阳东大知识产权代理有限 公司 21109 代理人 李在川 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/26(2012.01) G06F 40/205(2020.01) G06F 16/35(2019.01) G06N 5/02(2006.01) (54)发明名称 一种融入辅助知识进行刑期预测的方法 (57)摘要 本发明公开一种融入辅助知识进行刑期预 测的方法, 方法首先抽取法律文书样例数据集中 事实描述、 涉案法条和刑期结果, 并针对法律文 书样例数据集分布不均匀的问题, 对法律文书样 例数据集中样例较少的种类进行数据补充; 接着 将抽取的涉案法条作为辅助知识和事实描述部 分进行融合, 并根据刑期结果设置预测标签; 然 后进行数据增强处理, 以去除噪音数据; 最后搭 建ERNIE_DPCNN 混合网络模型, 对模型进行训练、 校验和评估, 并实现对刑期的预测。 本发明不仅 解决了数据集分布不均匀影响刑期预测结果的 问题, 还提高了刑期预测的便捷性、 准确性和高 效性。 权利要求书2页 说明书7页 附图3页 CN 114239939 A 2022.03.25 CN 114239939 A 1.一种融入辅助知识进行刑期预测的方法, 其特 征在于, 包括如下步骤: 步骤1: 获取法律文书样例数据集, 使用python语言中的工具包, 调用json.loads()方 法将法律文 书样例数据集中事实描述、 涉案法条和刑期结果抽取 出来并保存在新文件中; 步骤2: 针对法律文书样例数据集分布不均匀的问题, 对法律文书样例数据集中样例较 少的种类进行 数据补充; 步骤3: 将步骤1抽取的涉案法条作为辅助知识和事实描述部分进行融合, 实现对补充 后的数据集进行辅助知识的融合; 步骤4: 对融合后的数据集进行数据增强处理, 以去除噪音数据; 并将数据集随机划分 为训练集、 测试集和校验集; 步骤5: 搭建ERN IE_DPCNN混合网络模型, 并对搭建好的模型进行训练、 校验和评估; 步骤6: 加载步骤5中评估合格的ERNIE_DPCNN混合网络模型, 输入法律文书样例对刑期 进行预测, 将预测结果中概 率最高的结果作为 最终刑期预测结果。 2.根据权利要求1所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述步 骤2的方法如下: 步骤2.1: 从网站下载法律文书数据, 并将法律文书数据分为文书头部、 指控内容、 辩护 意见、 事实描述、 判决内容和文 书尾部六个部分; 步骤2.2: 设计抽取模板, 分别对法律文书数据中的事实描述部分和文书尾部部分进行 抽取; 步骤2.3: 将抽取的事实描述部分和文书尾部部分进行融合, 组成训练数据, 对法律文 书样例数据集进行补充操作。 3.根据权利要求2所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述步 骤2中的抽取模板分为事实描述部分抽取模板和文 书尾部部分抽取模板; 所诉事实描述部分抽取模板分为前置模板和后置模板两个部分, 中间用正则表达 式将 两个模板进行拼接, 在匹配时同时匹配前置模板和后置模板; 所述文书尾部部分抽取模板仅由前置模板拼接正则表达式而成, 在匹配时直接匹配到 法律文书末尾。 4.根据权利要求1所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述步 骤3的过程如下: 步骤3.1: 对涉案法条进行截长补短操作, 并对 事实描述部分进行长度统一操作; 步骤3.2: 将涉案法条和事实描述部分进行拼接操作, 形成预测文本; 步骤3.3: 根据刑期结果设置预测标签Label, 并将其作为预测值, 组成的 “预测文本预 测值”作为模型输入数据。 5.根据权利要求4所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述对 涉案法条进行截长补短操作的方法为: 将法条处理成长度为100的数据, 若法条长度不满 100则用“[PAD]”补充, 若法条长度超出100则直接截长; 所述 “[PAD]”的作用是, 当数据长度 不满足所需要求时, 作为补充数据进行填充。 6.根据权利要求4所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述步 骤3.2中对涉案法条和事实描述部分进行拼接时采用 “[SEP]”进行两部分的分割。 7.根据权利要求4所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述根权 利 要 求 书 1/2 页 2 CN 114239939 A 2据刑期结果设置预测标签Label的方法如下: 刑期分为有期徒刑1年及以下、 1 ‑2年、 2‑3年、 3‑4年、 4‑5年、 5‑6年、 6‑7年、 7‑8年、 8‑9 年、 9‑10年、 10年以上、 无期徒刑共十二种刑期预测结果, 将这十二种刑期预测结果用预测 标签Label 来表示, 所述 Label的数值 为整数0‑11, 与十二种刑期预测结果相对应。 8.根据权利要求1所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述步 骤4中的噪音数据包括标点符号、 乱码、 空行、 英文、 停用词、 时间内容、 人名和机构名。 9.根据权利要求1所述的一种融入辅助知识进行刑期预测的方法, 其特征在于, 所述步 骤5的过程如下: 步骤5.1: 模型参数初始化, 包括ERN IE模型参数初始化和D PCNN模型参数初始化; 步骤5.2: 将步骤4得到的训练集输入ERNIE模型进行数据集的向量化即实现训练后的 语言表征; 步骤5.3: 将向量化后的数据集输入DPCNN模型进行计算, 并将ERNIE_DPCNN混合网络模 型输出结果输入Softmax分类器中进行分类得到每个类别刑期预测结果的概率值, 便完成 对模型的训练; 步骤5.4: 采用校验集作为校验数据, 用于训练模型的超参数; 步骤5.5: 采用测试集对 模型进行测试, 并对测试 结果进行评估。权 利 要 求 书 2/2 页 3 CN 114239939 A 3
专利 一种融入辅助知识进行刑期预测的方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 23:42:56
上传分享
举报
下载
原文档
(687.1 KB)
分享
友情链接
T-SHSSW 002—2024 长江口咸潮入侵应急监测技术导则.pdf
GB-T 22838.11-2009 卷烟和滤棒物理性能的测定 第11部分:卷烟熄火.pdf
NB-T 20547—2019 核电工程爆破监测技术规程.pdf
GB-T 16275-2008 城市轨道交通照明.pdf
GB 17354-1998 汽车前、后端保护装置.pdf
奇安信 中国数字城市网络安全运营现状分析报告 2022.pdf
T-SSCE 0001—2021 关于团体标准 轴力自动补偿钢支撑技术规程 报批稿 的批复.pdf
DB42-T 1946-2022 工业锅炉燃油燃气燃烧器节能等级评价方法 湖北省.pdf
DB31-T 616-2023 泵系统节能改造技术规范 上海市.pdf
T-SCGS 313002—2023 医用内窥镜 内窥镜荧光摄像系统影像质量评价规范.pdf
GB-T 8960-2015 涤纶牵伸丝.pdf
GB-T 38626-2020 信息安全技术 智能联网设备口令保护指南.pdf
T-ZJCX 0019—2022 鼻腔护理液.pdf
GB-T 29242-2012 信息安全技术 鉴别与授权 安全断言标记语言.pdf
aigc安全研究分享.pdf
TB-T 3481-2017 铁路低压母联备投自动转换开关电器.pdf
TB-T 30004-2021 铁路货物装载加固技术要求.pdf
GB-T 35075-2018 燃气燃烧器节能试验规则.pdf
OWASP AI大模型应用网络安全治理检查清单 LLM_AI_Security_and_Governance_Checklist 2024.pdf
GB-T 4741-1999 陶瓷材料抗弯曲强度试验方法.pdf
交流群
-->
1
/
3
13
评价文档
赞助2元 点击下载(687.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。