(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210448566.5
(22)申请日 2022.04.27
(71)申请人 中国人民大 学
地址 100872 北京市海淀区中关村大街59
号
(72)发明人 徐君 俞蔚捷 孙忠祥 董振华
陈旭 许洪腾 文继荣
(74)专利代理 机构 北京中创阳光知识产权代理
有限责任公司 1 1003
专利代理师 尹振启
(51)Int.Cl.
G06F 40/194(2020.01)
G06F 40/274(2020.01)
G06F 40/30(2020.01)
G06F 40/117(2020.01)G06N 3/08(2006.01)
(54)发明名称
一种基于逆向最优运输模型的可解释司法
案例匹配方法及系统
(57)摘要
本发明实现了一种基于逆向最优运输模型
的可解释司法案例匹配方法。 方法由三个模块构
成: 司法要素提取模块针对输入的案例对, 以两
个案例、 案例中每个句子司法要素标签和人工标
注的句子对齐标签作为模块输入, 输出案例中所
有句子的司法要素标签预测; 候选解释生成模块
以所述司法要素提取模块提取的两个案例的司
法要素作为输入, 以模型预测的候选解释作为输
出; 匹配模块以司法要素提取模块预测的结果以
及所述候选解释生成模块生成的候选解释作为
输入, 输出案例匹配与否的预测已经与该预测对
应的候选解释作为最终解释。 该方法实现了预测
提供两个方面的解释并提升模型预测的准确率
的技术效果。
权利要求书3页 说明书8页 附图1页
CN 114818648 A
2022.07.29
CN 114818648 A
1.一种基于逆向最优运输模型的可解释司法案例匹配方法, 其特征在于: 由三个模块
构成:
司法要素提取模块针对输入的案例对, 以两个案例(X,Y)、 案例中每个句子司法要素标
签rX,rY和人工标注的句子对齐标签
作为模块输入, 采用逆向最优运输过程, 模型根据
学
习案例句子之间的 “运输代价 ”, 输出案例中所有句子的司法要素标签预测
其中
分别表示案例X和Y中匹配的司法要素和不匹配的司法要素,
候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素
作为输
入, 以模型 预测的候选解释
作为输出, 其中i表示 候选解释的数量, 候选解释生成模块输出
分别作为标签0的解释和标签1的解释;
匹配模块以所述司法要素提取模块预测的
以及所述候选解释生成模块生成的候
选解释
作为输入, 将
视为查询, 候选解释
作为文档, 分别计算
与
匹配得分, 输出得分较高的解释以及该解释对应的匹配标签, 若
的得
分较高, 模型输出结果为两个案例匹配, 以及作为案例匹配理由的候选解释
若
的得分较高, 模型输出结果为两个案例不匹配, 以及作为案例不匹配理由的候选
理由
即为输出案例匹配与否的预测以及与该 预测对应的候选解释作为 最终解释。
2.如权利要求1所述的一种基于逆向最优运输模型的可解释司法案例匹配方法, 其特
征在于: 所述最优运输过程首先对于司法案例匹配的场景中, 对于任意两个案例 μ、 ν 分别视
为一个均匀分布, 即
其中1D表示D维全1的向量, 两个案例之间的最优 运
输方案为:
其中
表示任意联合分布, 其中的句子满
足边缘分布为μ和ν;
为代价矩阵, c(xm,yn)表示两个句子之间的差
异;
之后, 采用逆向最优运输试图从
中学习鲁棒性更强的代价矩阵C: 给定最优运输方案,
即人工标注, 求 解代价矩阵, 即案例中句子的差异情况:
s.t.A*(C)=argminAEn( μ, v)<A, C>+γ<A, logA>其中KL表示句子对齐标签
和运输方
案A*之间的KL散度, 最终建模C为两个子矩阵的线性组合:
C=Cs+∈Cr
其中Cs是两个案例句子级别的语义相似度矩阵, 使用神经 网络计算句子向量相似度; Cr
是两个案例句 子级别的要素相似度矩阵, 使用神经网络对案例中的句 子进行分类, 区分司
法要素和非司法要素, 再比较两个句子是否属于同类司法要素; ∈是平衡系数;权 利 要 求 书 1/3 页
2
CN 114818648 A
2在训练过程中, 司法要素提取模块学习代价矩阵C中的参数; 在测试过程, 司法要素提
取模块根据C进行正向最优运输, 根据最优运输方案确定案例中句子的对齐情况, 并提取司
法要素标签预测
3.如权利要求2所述的一种基于逆向最优运输模型的可解释司法案例匹配方法, 其特
征在于: 所述司法要素提取模块, 作为最小化模型预测的和人工标注的句 子级别对齐程度
之间的损失
以及在构建Cr时模型对每个句子司法要素分类预测和人工标注之间的损失
的损失函数
可以写成:
其中,
是模型在构建代价矩阵C时预测案例中每个句子司法要素标签与真实标签之
间的交叉熵损失:
其中δ(r,k)=1如果r=k否则为0;
是模型逆向最优运输损失, 优化代价矩阵C和对应
的最优运输方案矩阵:
4.如权利要求3所述的一种基于逆向最优运输模型的可解释司法案例匹配方法, 其特
征在于: 所述候选解释生成模块最小化模型生成的和人工标注的自然语言解释之间的差
异, 损失函数
是微调预训练语言模型的损失:
5.如权利要求4所述的一种基于逆向最优运输模型的可解释司法案例匹配方法, 其特
征在于: 所述匹配模块最小化模型预测的和人工标注的案例匹配标签之间的差异
损失
函数
可以写成:
其中
是模型对于 案例匹配关系的预测与真实标签之间的交叉熵损失:
6.如权利要求5所述的一种基于逆向最优运输模型的可解释司法案例匹配方法, 其特
征在于: 所述训练过程 具体为: 基于训练数据集
批量大小n1,
n2,n3、 平衡系数∈,γ、 学习率 η1, η2, η3数据, 设计算法流 程:
对于所述司法要素提取模块的训练, 重复如下过程: 从训练数据集
中采样小批量数据
预测(Xi,Yi)的司法要素标签
计算
构造C,Cs,Cr,使用权 利 要 求 书 2/3 页
3
CN 114818648 A
3
专利 一种基于逆向最优运输模型的可解释司法案例匹配方法及系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:46:00上传分享