(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111547859.0
(22)申请日 2021.12.16
(71)申请人 中国建设银行股份有限公司
地址 100033 北京市西城区金融大街25号
(72)发明人 柯颖 林廷懋 王周宇 吴磊
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
代理人 张宁 臧建明
(51)Int.Cl.
G06Q 10/10(2012.01)
G06F 40/295(2020.01)
G06F 16/25(2019.01)
G06F 16/2455(2019.01)
(54)发明名称
单据数据处 理方法、 装置及设备
(57)摘要
本申请提供一种单据数据处理方法、 装置及
设备, 涉及数据处理技术, 该方法包括: 获取多个
待处理单据数据; 多个待处理单据数据包括第一
节点的第一单据数据和第二节点的第二单据数
据, 第二节点为第一节点的上位节点; 在预设的
规则库中, 利用预设的规则引擎获取多个规则表
达式; 规则库包括多个规则表达式, 规则引擎为
执行规则表达式的程序; 基于待处理单据数据与
规则表达式的对应 关系, 通过与每一待处理单据
数据对应规则表达式对每一待处理单据数据进
行数据处理, 得到审核结果信息。 本申请的方法,
通过规则引擎自动调用规则库中的规则表达式,
并通过规则表达式对待处理单据数据进行数据
处理, 形成自动化的审单流程, 极大提升了审单
的效率和准确率。
权利要求书3页 说明书13页 附图4页
CN 114219443 A
2022.03.22
CN 114219443 A
1.一种单据数据处 理方法, 其特 征在于, 包括:
获取多个待处理单据数据; 其中, 所述多个待处理单据数据包括第一节点的第一单据
数据和第二节点的第二单据数据, 所述第二节点 为所述第一节点的上位节点;
在预设的规则库中, 利用预设的规则引擎获取多个规则表达 式; 其中, 所述规则库包括
多个规则表达式, 所述 规则引擎 为执行规则表达式的程序;
基于待处理单据 数据与规则表达 式的对应关系, 通过与每一所述待处理单据 数据对应
规则表达式对每一所述待处 理单据数据进行 数据处理, 得到审核结果信息 。
2.根据权利要求1所述的方法, 其特 征在于, 获取多个待处 理单据数据, 包括:
通过命名实体识别方法和正则匹配方法, 确定第一节点的第一单据数据的数据信息,
其中, 所述数据信息包括单据名称和单据值;
基于预设的单据名称与上位节点之间的对应关系, 在预设的数据库中确定与 所述第一
单据数据的数据信息中单据名称对应的上位节点为第二节点; 其中, 所述第二节点具有第
二单据数据的数据信息;
将所述第二节点的第 二单据数据的单据值, 替换为所述第 一节点的第 一单据数据的单
据值, 得到更新后的第二节点的第二单据数据。
3.根据权利要求2所述的方法, 其特征在于, 所述单据值包括审核要素、 以及所述审核
要素对应的要素值。
4.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括:
获取多个单据名称;
确定每一单据名称对应的上位节点, 根据每一单据名称、 以及每一单据名称对应的上
位节点, 生成单据名称与上位节点之间的对应关系, 并将所述对应关系存 储于数据库中。
5.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括:
获取多个规则文本; 其中, 所述 规则文本包括单据名称、 单据值、 以及算子名称;
根据所述单据名称与上位节点之间的对应关系, 确定每一单据名称对应的上位节点;
根据所述单据名称、 所述审核要素、 以及所述算子名称, 生成与所述上位节点对应的规
则表达式。
6.根据权利要求5所述的方法, 其特征在于, 根据 所述单据名称、 所述审核要素、 以及所
述算子名称, 生成与所述上位节点对应的规则表达式, 包括:
基于所述单据名称、 所述审核要素、 以及所述算子名称, 通过机器翻译方法对初始的预
训练语言T5模型进行训练, 得到用于生成规则表达式的转换模型;
通过所述转换模型, 转换得到与所述单据名称、 所述审核要素、 以及所述算子名称三者
对应的规则表达式。
7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 在预设的规则库中, 利用预设的
规则引擎获取多个规则表达式之后, 还 包括:
将所述规则表达式转换为预设语言的规则表达式; 其中, 所述预设语言的规则表达式
用于通过 所述规则引擎进行运行。
8.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括:
基于标准语法信息和算子名称, 通过预设语言生成与规则表达式对应的解析器, 并生
成用于执行所述解析器的规则引擎; 其中, 所述算子名称用于表征计算逻辑和解析逻辑, 所权 利 要 求 书 1/3 页
2
CN 114219443 A
2述标准语法信息用于表征关于所述 算子名称的语法信息 。
9.一种单据数据处 理装置, 其特 征在于, 包括:
获取数据单元, 用于获取多个待处理单据 数据; 其中, 所述多个待处理单据数据包括第
一节点的第一单据数据和 第二节点的第二单据数据, 所述第二节点为所述第一节点的上位
节点;
获取规则单元, 用于在预设的规则库中, 利用预设的规则引擎获取多个规则表达 式; 其
中, 所述规则库包括多个规则表达式, 所述 规则引擎 为执行规则表达式的程序;
处理单元, 用于基于待处理单据数据与规则表达式的对应关系, 通过与每一所述待处
理单据数据对应规则表达式对每一所述待处理单据数据进行数据处理, 得到审核结果信
息。
10.根据权利要求9所述的装置, 其特 征在于, 所述获取 数据单元, 包括:
确定第一单据数据模块, 用于通过命名实体识别方法和正则匹配方法, 确定第一节点
的第一单据数据的数据信息, 其中, 所述数据信息包括单据名称和单据值;
确定第二节点模块, 用于基于预设的单据名称与上位节点之间的对应关系, 在预设的
数据库中确定与所述第一单据数据的数据信息中单据名称对应的上位节点为第二节点; 其
中, 所述第二节点具有第二单据数据的数据信息;
替换模块, 用于将所述第二节点的第二单据数据的单据值, 替换为所述第一节点的第
一单据数据的单据值, 得到更新后的第二节点的第二单据数据。
11.根据权利要求10所述的装置, 其特征在于, 所述单据值包括审核要素、 以及所述审
核要素对应的要素值。
12.根据权利要求10所述的装置, 其特 征在于, 所述装置还 包括:
获取单据名称单 元, 用于获取多个单据名称;
存储关系单元, 用于确定每一单据名称对应的上位节点, 根据每一单据名称、 以及每一
单据名称对应的上位节点, 生成单据名称与上位节点之间的对应关系, 并将所述对应关系
存储于数据库中。
13.根据权利要求12所述的装置, 其特 征在于, 所述装置还 包括:
获取规则文本单元, 用于获取多个规则文本; 其中, 所述规则文本包括单据名称、 单据
值、 以及算子名称;
确定上位节点单元, 用于根据所述单据名称与上位节点之间的对应关系, 确定每一单
据名称对应的上位节点;
生成规则单元, 用于根据所述单据名称、 所述审核要素、 以及所述算子名称, 生成与所
述上位节点对应的规则表达式。
14.根据权利要求13所述的装置, 其特 征在于, 所述 生成规则单 元, 包括:
训练模块, 用于基于所述单据名称、 所述审核要素、 以及所述算子名称, 通过机器翻译
方法对初始的预训练语言T5模型进行训练, 得到用于生成规则表达式的转换模型;
生成模块, 用于通过所述转换模型, 转换得到与所述单据名称、 所述审核要素、 以及所
述算子名称三 者对应的规则表达式。
15.根据权利要求9 ‑14任一项所述的装置, 其特 征在于, 所述装置还 包括:
转换单元, 用于在预设的规则库中, 利用预设的规则引擎获取多个规则表达 式之后, 将权 利 要 求 书 2/3 页
3
CN 114219443 A
3
专利 单据数据处理方法、装置及设备
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 04:40:26上传分享