专利 一种基于逆向最优运输模型的可解释司法案例匹配方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210448566.5 (22)申请日 2022.04.27 (71)申请人中国人民大学地址 100872 北京市海淀区中关村大街59 号 (72)发明人徐君　俞蔚捷　孙忠祥　董振华　陈旭　许洪腾　文继荣　 (74)专利代理机构北京中创阳光知识产权代理有限责任公司 1 1003 专利代理师尹振启 (51)Int.Cl. G06F 40/194(2020.01) G06F 40/274(2020.01) G06F 40/30(2020.01) G06F 40/117(2020.01)G06N 3/08(2006.01) (54)发明名称一种基于逆向最优运输模型的可解释司法案例匹配方法及系统 (57)摘要本发明实现了一种基于逆向最优运输模型的可解释司法案例匹配方法。方法由三个模块构成：司法要素提取模块针对输入的案例对，以两个案例、案例中每个句子司法要素标签和人工标注的句子对齐标签作为模块输入，输出案例中所有句子的司法要素标签预测；候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素作为输入，以模型预测的候选解释作为输出；匹配模块以司法要素提取模块预测的结果以及所述候选解释生成模块生成的候选解释作为输入，输出案例匹配与否的预测已经与该预测对应的候选解释作为最终解释。该方法实现了预测提供两个方面的解释并提升模型预测的准确率的技术效果。权利要求书3页说明书8页附图1页 CN 114818648 A 2022.07.29 CN 114818648 A 1.一种基于逆向最优运输模型的可解释司法案例匹配方法，其特征在于：由三个模块构成：司法要素提取模块针对输入的案例对，以两个案例(X,Y)、案例中每个句子司法要素标签rX,rY和人工标注的句子对齐标签作为模块输入，采用逆向最优运输过程，模型根据学习案例句子之间的 “运输代价 ”，输出案例中所有句子的司法要素标签预测其中分别表示案例X和Y中匹配的司法要素和不匹配的司法要素，候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素作为输入，以模型预测的候选解释作为输出，其中i表示候选解释的数量，候选解释生成模块输出分别作为标签0的解释和标签1的解释；匹配模块以所述司法要素提取模块预测的以及所述候选解释生成模块生成的候选解释作为输入，将视为查询，候选解释作为文档，分别计算与匹配得分，输出得分较高的解释以及该解释对应的匹配标签，若的得分较高，模型输出结果为两个案例匹配，以及作为案例匹配理由的候选解释若的得分较高，模型输出结果为两个案例不匹配，以及作为案例不匹配理由的候选理由即为输出案例匹配与否的预测以及与该预测对应的候选解释作为最终解释。 2.如权利要求1所述的一种基于逆向最优运输模型的可解释司法案例匹配方法，其特征在于：所述最优运输过程首先对于司法案例匹配的场景中，对于任意两个案例 μ、 ν 分别视为一个均匀分布，即其中1D表示D维全1的向量，两个案例之间的最优运输方案为：其中表示任意联合分布，其中的句子满足边缘分布为μ和ν；为代价矩阵， c(xm,yn)表示两个句子之间的差异；之后，采用逆向最优运输试图从中学习鲁棒性更强的代价矩阵C：给定最优运输方案，即人工标注，求解代价矩阵，即案例中句子的差异情况： s.t.A*(C)＝argminAEn( μ， v)＜A， C＞+γ＜A， logA＞其中KL表示句子对齐标签和运输方案A*之间的KL散度，最终建模C为两个子矩阵的线性组合： C＝Cs+∈Cr 其中Cs是两个案例句子级别的语义相似度矩阵，使用神经网络计算句子向量相似度； Cr 是两个案例句子级别的要素相似度矩阵，使用神经网络对案例中的句子进行分类，区分司法要素和非司法要素，再比较两个句子是否属于同类司法要素； ∈是平衡系数；权　利　要　求　书 1/3 页 2 CN 114818648 A 2在训练过程中，司法要素提取模块学习代价矩阵C中的参数；在测试过程，司法要素提取模块根据C进行正向最优运输，根据最优运输方案确定案例中句子的对齐情况，并提取司法要素标签预测 3.如权利要求2所述的一种基于逆向最优运输模型的可解释司法案例匹配方法，其特征在于：所述司法要素提取模块，作为最小化模型预测的和人工标注的句子级别对齐程度之间的损失以及在构建Cr时模型对每个句子司法要素分类预测和人工标注之间的损失的损失函数可以写成：其中，是模型在构建代价矩阵C时预测案例中每个句子司法要素标签与真实标签之间的交叉熵损失：其中δ(r,k)＝1如果r＝k否则为0；是模型逆向最优运输损失，优化代价矩阵C和对应的最优运输方案矩阵： 4.如权利要求3所述的一种基于逆向最优运输模型的可解释司法案例匹配方法，其特征在于：所述候选解释生成模块最小化模型生成的和人工标注的自然语言解释之间的差异，损失函数是微调预训练语言模型的损失： 5.如权利要求4所述的一种基于逆向最优运输模型的可解释司法案例匹配方法，其特征在于：所述匹配模块最小化模型预测的和人工标注的案例匹配标签之间的差异损失函数可以写成：其中是模型对于案例匹配关系的预测与真实标签之间的交叉熵损失： 6.如权利要求5所述的一种基于逆向最优运输模型的可解释司法案例匹配方法，其特征在于：所述训练过程具体为：基于训练数据集批量大小n1, n2,n3、平衡系数∈,γ、学习率 η1, η2, η3数据，设计算法流程：对于所述司法要素提取模块的训练，重复如下过程：从训练数据集中采样小批量数据预测(Xi,Yi)的司法要素标签计算构造C,Cs,Cr,使用权　利　要　求　书 2/3 页 3 CN 114818648 A 3

专利 一种基于逆向最优运输模型的可解释司法案例匹配方法及系统

专利一种基于逆向最优运输模型的可解释司法案例匹配方法及系统