专利 一种基于自建数据对的胃镜图像去模糊算法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111600032.1 (22)申请日 2021.12.24 (71)申请人复旦大学地址 200433 上海市杨浦区邯郸路2 20号 (72)发明人颜波　谭伟敏　李吉春　林青　 (74)专利代理机构上海正旦专利代理有限公司 31200 代理人陆飞　陆尤 (51)Int.Cl. G06T 5/00(2006.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于自建数据对的胃镜图像去模糊算法 (57)摘要本发明属于医疗图像处理技术领域，具体为一种基于自建数据对的胃镜图像去模糊算法。本发明算法包括：对于胃镜视频的处理、制作胃镜清晰图‑模糊图训练样本以及胃镜去模糊算法的训练。具体而言，首先收集一定量的胃镜视频，对其中的数据进行清洗；然后收集医生的标注，对每一帧的清晰或者模糊进行标注，并对 “指导模型”进行训练；再用采用全部为清晰图的视频段，合成清晰 ‑模糊肠镜图片数据对；最后用清晰 ‑模糊肠镜图片数据对，训练肠镜去模糊算法。实验结果表明，本发明算法对于肠镜模糊图片的模糊去除具有很好的效果，具有很强的应用价值。权利要求书2页说明书5页附图2页 CN 114359082 A 2022.04.15 CN 114359082 A 1.一种基于自建数据对的胃镜图像去模糊算法，是食管内镜视频帧序列质量分类算法，利用医生对于清晰模糊判断经验，指导去模糊网络的优化，而且利用插帧与时间域融合的方法，构建胃镜清晰 ‑模糊图像对加以训练；具体步骤如下： (1)数据收集与清洗：收集一定量的胃镜视频，对其中的数据进行清洗，即剔除视频中含有气泡、没有内容、失去焦距、内容混乱的胃镜无效视频帧； (2)标注与训练D ‑Net：由专业医生对经过清洗的、所有有效视频帧进行分类，医生认为清晰的图片标记为0，医生认为不清晰的图片标记为1；然后，使用分类网络ResNet ‑34，利用标注的数据，训练该分类网络，对单张输入胃镜视频帧是否清晰，进行分类，该网络记作D ‑ Net，符号记作 ψ； (3)模糊‑清晰图像对的生成：从所有的有效视频帧内，抽取医生标注为清晰的视频帧，然后保留时间域连续帧超过阈值THRESH帧的片段，获得总数为P个全清晰视频片段；设第i 段视频记作其中1≤i≤P， Mi为第i个视频片段总帧数；使用DAIN算法，在原来两帧之间插9帧，即10倍插帧，此时生成的第i段插帧后视频表示为：其中， Fj＝F′j×10为原始清晰帧；第i段视频中选择清晰图片集合为：即对原视频Vi首尾3帧抛弃；其对应的模糊图图片集合记作：其生成方式是，对于原视频Vi中某帧Fj+3，在其插帧后视频Vi′中对应的时刻上，对空间域相邻的视频帧相加取平均，其计算式如下：其中， k为哑变量， L为空间域的长度；同时，求得Si,j帧所对应的运动先验信息GT_ Diffi,j： GT_Diffi,j＝Si,j‑Si,j‑1，即视频的第j帧与第j ‑1帧直接相减；最终，获得训练数据三元组为：即每个训练样本包括模糊胃镜图、清晰胃镜图及其运动先验信息； (4)构建卷积神经网络：采用改进的SimpleNet算法模块，即对其中的残差模块、感受野多样性模块做出改进，得到轻量残差块与简单多感受模块，以获得更好的速度提升；并且，在第二个降采样层之后独立出两层卷积层预测的三通道运动先验信息PRED_Dif，然后将其送入第一个上采样层级联；该胃镜去模糊卷积神经网络简记作DTM ‑Net； (5)训练：利用训练数据三元组对卷积神经网络模型进行训练；其损失函数如下：权　利　要　求　书 1/2 页 2 CN 114359082 A 2其中，为预测结果Pred与清晰图GT之间的L1损失，为预测的三通道运动先验信息PRED_Dif与实际的三通道运动先验信息 GT_Diff的L 1损失，为由D‑Net提供的含有医生判断的先验信息指导去模糊网络的损失，简称为 “医生指导损失 ”，其计算式为：其中， ψ代表D ‑Net网络， Pred为算法输出去模糊结果图， GT为清晰图， cj、 hj、 wj分别为D‑ Net的第j层卷积层特征的通道数、高度与宽度， J为医生指导损失所采用的D ‑Net卷积层的集合； λ1， λ2， λ3为权重系数； (6)测试与使用：给定模糊的输入图Input，将其输入至经过训练的DTM ‑Net中，得到输出图Pred，即为模糊去除的结果。 2.根据权利要求1所述的胃镜图像去模糊算法，其特征在于，步骤(3)中所述阈值 THRESH取为25；空间域的长度L 根据经验，在集合{47,49,51,5 3,55}中随机取得。 3.根据权利要求1所述的胃镜图像去模糊算法，其特征在于，步骤(4)中所述内容，改进后的轻量残差模块采用两层卷积以加快其运算速度，计算如下： Out＝Conv 2D(ReLU(Co nv 2D(I,W1)),W2)+I；其中， I为输入信号， W1、 W2分别为第一层卷积与第二层卷积的权值； Conv2D为卷积操作， ReLU为激活函数。 4.根据权利要求1所述的胃镜图像去模糊算法，其特征在于，步骤(4)中所述改进后的简单多感受模块，能够在参数量没有增加且没有可变性卷积的参与下，获得更大的感受野，进一步有利于模糊的去除，其计算如下： fuse＝Co ncat((Conv 2D(I,WD1),Conv2D(I,WD2), Out＝Conv2D(ReLU(fuse),W1) 其中， WD1为膨胀率为1 的膨胀卷积， WD2为膨胀率为2的膨胀卷积，为卷积核大小为i ×j的卷积； Co ncat为特征按照通道维度级联的操作。 5.根据权利要求1所述的胃镜图像去模糊算法，其特征在于，步骤(5)中所述训练，超参数设为：学习率为0.0001，训练批大小为8，权值衰减为4e ‑8；学习率衰减，每训练1500轮次，学习衰减为原来的共训练5000轮次。 6.根据权利要求1所述的胃镜图像去模糊算法，其特征在于，步骤(5)中所述权重系数取为： λ1＝1， λ2＝0.01， λ3＝0.1。权　利　要　求　书 2/2 页 3 CN 114359082 A 3

专利 一种基于自建数据对的胃镜图像去模糊算法

专利一种基于自建数据对的胃镜图像去模糊算法