安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111600032.1 (22)申请日 2021.12.24 (71)申请人 复旦大学 地址 200433 上海市杨 浦区邯郸路2 20号 (72)发明人 颜波 谭伟敏 李吉春 林青  (74)专利代理 机构 上海正旦专利代理有限公司 31200 代理人 陆飞 陆尤 (51)Int.Cl. G06T 5/00(2006.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于自建数据对的胃镜图像去模糊算 法 (57)摘要 本发明属于医疗图像处理技术领域, 具体为 一种基于自建数据对的胃镜图像去模糊算法。 本 发明算法包括: 对于胃镜视频的处理、 制作胃镜 清晰图‑模糊图训练样本以及胃镜去模糊算法的 训练。 具体而言, 首先收集一定量的胃镜视频, 对 其中的数据进行清洗; 然后收集医生的标注, 对 每一帧的清晰或者模糊进行标注, 并对 “指导模 型”进行训练; 再用采用全部为清晰图的视频段, 合成清晰 ‑模糊肠镜图片数据对; 最后用清晰 ‑模 糊肠镜图片数据对, 训练肠镜去模糊算法。 实验 结果表明, 本发 明算法对于肠镜模糊图片的模糊 去除具有很好的效果, 具有很强的应用价 值。 权利要求书2页 说明书5页 附图2页 CN 114359082 A 2022.04.15 CN 114359082 A 1.一种基于自建数据对的胃镜图像去模糊算法, 是食管内镜视频帧序列质量分类算 法, 利用医生对于清晰模糊判断经验, 指导去模糊网络的优化, 而且利用插帧与时间域融合 的方法, 构建胃镜清晰 ‑模糊图像对加以训练; 具体步骤如下: (1)数据收集与清洗: 收集一定量的胃镜视频, 对其中的数据进行清洗, 即剔除视频中 含有气泡、 没有内容、 失去焦距、 内容混乱的胃镜无效视频帧; (2)标注与训练D ‑Net: 由专业 医生对经过清洗的、 所有有效视频帧进行分类, 医生认为 清晰的图片标记 为0, 医生认 为不清晰的图片标记 为1; 然后, 使用分类网络ResNet ‑34, 利用 标注的数据, 训练该分类网络, 对单张输入胃镜视频帧是否清晰, 进行分类, 该网络记作D ‑ Net, 符号记作 ψ; (3)模糊‑清晰图像对的生成: 从所有的有效视频帧内, 抽取医生标注为清晰的视频帧, 然后保留时间域连续 帧超过阈值THRESH帧的片段, 获得总数为P个全清晰视频片段; 设第i 段视频记作 其中1≤i≤P, Mi为第i个视频片段总帧数; 使用DAIN算 法, 在原来两帧之间插9帧, 即10倍插帧, 此时生成的第i段插帧后视频表示 为: 其中, Fj=F′j×10为原始清晰帧; 第i段视频中选择清晰图片集 合为: 即对原视频Vi首尾3帧抛 弃; 其对应的模糊图 图片集合记作: 其生成方式是, 对于原视频Vi中某帧Fj+3, 在其插帧后视频Vi′中对应的时刻上, 对空间 域相邻的视频帧相加取平均, 其计算式如下: 其中, k为哑变量, L为空间域的长度; 同时, 求得Si,j帧所对应的运动先验信息GT_ Diffi,j: GT_Diffi,j=Si,j‑Si,j‑1, 即视频的第j帧与第j ‑1帧直接相减; 最终, 获得训练数据三元组为: 即每个训练样本包括模糊胃镜图、 清晰 胃镜图及其 运动先验信息; (4)构建卷积神经网络: 采用改进的SimpleNet算法模块, 即对其中的残差模块、 感受野 多样性模块做出改进, 得到轻量残差块与简单多感受模块, 以获得更好的速度提升; 并且, 在第二个降采样层之后独立出两层卷积层预测的三通道 运动先验信息PRED_Dif, 然后 将其 送入第一个上采样层级联; 该胃镜去模糊卷积神经网络简记作DTM ‑Net; (5)训练: 利用训练数据三元组对卷积神经网络模型进行训练; 其损失函数如下: 权 利 要 求 书 1/2 页 2 CN 114359082 A 2其中, 为预测结果Pred与清晰图GT之间的L1损失, 为预测的三通道运动先 验信息PRED_Dif与实际的三通道运动先验信息 GT_Diff的L 1损失, 为由D‑Net提供的 含有医生判断的先验信息指导去模糊网络的损失, 简称为 “医生指导损失 ”, 其计算式为: 其中, ψ代表D ‑Net网络, Pred为算法输出去模糊结果图, GT为清晰图, cj、 hj、 wj分别为D‑ Net的第j层卷积层特征的通道数、 高度与宽度, J为医生指导损失所采用的D ‑Net卷积层的 集合; λ1, λ2, λ3为权重系数; (6)测试与使用: 给定模糊的输入图Input, 将其输入至经过训练的DTM ‑Net中, 得到输 出图Pred, 即为模糊去除的结果。 2.根据权利要求1所述的胃镜图像去模糊算法, 其特征在于, 步骤(3)中所述阈值 THRESH取为25; 空间域的长度L 根据经验, 在集 合{47,49,51,5 3,55}中随机取 得。 3.根据权利要求1所述的胃镜图像去模糊算法, 其特征在于, 步骤(4)中所述内容, 改进 后的轻量残差模块采用两层卷积以加快其 运算速度, 计算如下: Out=Conv 2D(ReLU(Co nv 2D(I,W1)),W2)+I; 其中, I为输入信号, W1、 W2分别为第一层卷积与第二层卷积的权值; Conv2D为卷积操作, ReLU为激活函数。 4.根据权利要求1所述的胃镜图像去模糊算法, 其特征在于, 步骤(4)中所述改进后的 简单多感受模块, 能够在参数量没有增加且没有 可变性卷积的参与下, 获得更大的感受野, 进一步有利于模糊的去除, 其计算如下: fuse=Co ncat((Conv 2D(I,WD1),Conv2D(I,WD2), Out=Conv2D(ReLU(fuse),W1) 其中, WD1为膨胀率为1 的膨胀卷积, WD2为膨胀率为2的膨胀卷积, 为卷积核大小为i ×j的卷积; Co ncat为特 征按照通道维度级联的操作。 5.根据权利要求1所述的胃镜图像去模糊算法, 其特征在于, 步骤(5)中所述训练, 超参 数设为: 学习率为0.0001, 训练批大小为8, 权值衰减为4e ‑8; 学习率衰减, 每训练1500轮次, 学习衰减为原来的 共训练5000轮次。 6.根据权利要求1所述的胃镜图像去模糊算法, 其特征在于, 步骤(5)中所述权重系数 取为: λ1=1, λ2=0.01, λ3=0.1。权 利 要 求 书 2/2 页 3 CN 114359082 A 3

.PDF文档 专利 一种基于自建数据对的胃镜图像去模糊算法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自建数据对的胃镜图像去模糊算法 第 1 页 专利 一种基于自建数据对的胃镜图像去模糊算法 第 2 页 专利 一种基于自建数据对的胃镜图像去模糊算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:57:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。