安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111679618.1 (22)申请日 2021.12.31 (71)申请人 上海合合信息科技股份有限公司 地址 200436 上海市 静安区万 荣路1256、 1258号1105-1123室 申请人 上海临冠 数据科技有限公司   上海生腾数据科技有限公司   上海盈五蓄数据科技有限公司 (72)发明人 刘鹏伟 郭丰俊 龙腾 丁凯  张彬 镇立新  (74)专利代理 机构 上海双霆 知识产权代理事务 所(普通合伙) 31415 代理人 殷晓雪 (51)Int.Cl. G06V 20/62(2022.01)G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 30/19(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于图章轮廓 的弯曲文字拉平识别方 法和装置 (57)摘要 本申请公开了一种基于图章轮廓 的弯曲文 字拉平识别方法。 在图像中检测图章, 得到图章 区域。 利用圆或椭圆检测算法在图章区域中进行 检测。 对检测到的圆形图章, 获取圆形图章上的 多条线段; 将所有线段紧挨着平行排列, 组成的 矩形图像就作为圆形图章展平后的图章图片。 对 检测到的椭圆形图章, 获取椭圆形图章上的多条 线段; 将所有线段紧挨着平行排列, 并且缩放各 条线段以使长度相同, 所组成的矩形图像就作为 椭圆形图章展平后的图章图片。 对展平的图章图 片进行文字检测, 再对检测出的文字进行光学字 符识别得到文字识别结果。 本申请仅需对一列列 像素点进行处理, 运算效率更高, 运算速度更快, 对硬件计算资源的要求更低。 权利要求书2页 说明书6页 附图5页 CN 114120308 A 2022.03.01 CN 114120308 A 1.一种基于图章轮廓的弯曲文字拉平 识别方法, 其特 征是, 包括如下步骤; 步骤S10: 在图像中检测图章, 得到图章区域; 步骤S20: 利用圆或椭圆检测算法在图章区域中进行检测; 如果在图章区域中检测出圆, 通过 所述圆检测算法获得圆心位置, 进入步骤S3 0; 如果在图章区域中检测出椭圆, 通过所述椭圆检测算法获得两个焦点位置, 进入步骤 S35; 如果在图章区域中未检测出圆或椭圆, 进入步骤S40, 此时图章区域就作为展平的图章 图片; 步骤S30: 对检测到的圆形图章, 获取圆形图章上的多条线段; 使用布雷森汉姆直线算 法获得每条线段上 的所有像素点; 将所有线段紧挨着平行排列, 相互平行 的多条线段所组 成的矩形图像就作为圆形图章展平后的图章图片; 每条线段上的所有像素点就作为矩形图 像的一列像素点, 然后进入步骤S40; 步骤S35: 对检测到的椭圆形图章, 获取椭圆形图章上的多条线段; 使用布雷森汉姆直 线算法获得每条线段上 的所有像素点; 将所有线段紧挨着平行排列, 并且缩放各条线段以 使各条线段的长度相同, 相互平行的多条线段所 组成的矩形图像就作为椭圆形图章展平后 的图章图片; 缩放后的每条线段上 的所有像素点就作为矩形图像的一列像素点, 然后进入 步骤S40; 步骤S40: 对展平的图章图片进行文字检测, 再对检测出的文字进行光学字符识别得到 文字识别结果。 2.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述步骤 S10中, 采用通用目标检测方法在图像中检测图章。 3.根据权利要求2所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述通用 目标检测方法是你只看一次YOLO算法。 4.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述步骤 S20中, 所述圆或椭圆检测算法是EDCircles算法。 5.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述步骤 S30中, 圆形图章上的多条线段的获取方式为: 以图章的圆形轮廓上的任意一点为起始点, 将圆心与该起始点连接构成第一条线段; 以圆心为固定点, 将第一条线段沿着顺时针或逆 时针每隔固定的α角度转动一次, 依次得到第二条线段、 第三条线段、 ……。 6.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述步骤 S35中, 椭圆形图章上的多条线段的获取 方式为: (a)以图章的椭圆形轮廓的一个焦点与距离该焦点最近的长轴 端点连接构成第 一条线 段; 假设所有 线段的总数为 k条, k必然为偶数; 椭圆的两个焦点之间的距离为d; (b)将第一条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离, 然后将平 移后的第一条线段在椭圆的长轴上的端点作为固定点, 沿着顺时针 或逆时针方向转动固定 的α角度, 并延 长或缩短另一个端点直至与图章的椭圆形轮廓相交即得到第二条线 段; 平移 与转动或者互换顺序, 或者同时进行; 将第二条线段先沿着椭圆的长轴向另一个焦点的方 向平移2d/k的距离, 然后将平移后的第二条线段在椭圆的长轴上的端点作为固定点, 沿着 与之前相同的方向转动固定的α角度, 并延长或缩短另一个端点直至与图章的椭圆形轮廓权 利 要 求 书 1/2 页 2 CN 114120308 A 2相交得到第三条线段; 平移与转动或者互换顺序, 或者同时进 行; 以此类推, 直至得到第k/2 条线段, 第k/2条线段与第一条线段都在 椭圆的长轴上; (c)将第k/2条线段先沿着椭圆的长轴向初始焦点的方向平移2d/k的距离, 然后将平移 后的第k/2条线 段在椭圆的长轴上的端点作为固定点, 沿着与之前相同的方向转动固定的α 角度, 并延 长或缩短另一个端点直至与图章的椭圆形轮廓相交得到第k/2+1条线 段; 平移与 转动或者互换顺序, 或者同时进 行; 将第k/2+1条线 段先沿着椭圆的长轴向初始焦点的方向 平移2d/k的距离, 然后将平移后的第k/2+1条线 段在椭圆的长轴上的端点作为固定点, 沿着 与之前相同的方向转动固定的α角度, 并延长或缩短另一个端点直至与图章的椭圆形轮廓 相交得到第k/2+2条线 段; 平移与转动或者互换顺序, 或者同时进 行; 以此类推, 直至得到第 k条线段。 7.根据权利要求5或6所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, α≤1 度。 8.根据权利要求5或6所述的基于 图章轮廓的弯曲文字拉平识别方法, 其特征是, 在能 整除的情况 下, 一个圆形或椭圆形图章中的所有 线段的总数为3 60/α 条。 9.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述步骤 S40中, 采用高效精确的场景文字检测器EAST算法进行文字检测。 10.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法, 其特征是, 所述步 骤S40中, 如果在展平的图章图片中某一行检测到两段不连续的文字, 将左边一段文字拼接 到右边一段文字的末尾, 将拼接后的文字行通过光学字符识别得到文字识别结果。 11.一种基于 图章轮廓的弯曲文字拉平识别装置, 其特征是, 包括图章检测单元、 圆或 椭圆检测单 元、 圆形拉平单 元、 椭圆形拉平单 元、 以及字符识别单 元; 所述图章检测单 元用于在图像中检测图章, 得到图章区域; 所述圆或椭圆检测单元用于利用圆或椭圆检测算法在图章 区域中进行检测; 如果在图 章区域中检测出圆, 通过所述圆检测算法获得圆心 位置, 送入圆形拉平单元; 如果在图章区 域中检测出椭圆, 通过所述椭圆检测算法获得两个焦点位置, 送入椭圆形拉平单元; 如果在 图章区域中未检测出圆或椭圆, 送入字符识别单 元, 此时图章区域 就作为展平的图章图片; 所述圆形拉平单元用于对检测到的圆形图章获取圆形图章上的多条线段; 使用布雷森 汉姆直线算法获得每条线段上 的所有像素点; 将所有线段紧挨着平行排列, 相互平行 的多 条线段所组成的矩形图像就作为圆形图章展平后的图章图片; 每条线段上的所有像素点就 作为矩形图像的一列像素点, 然后送入字符识别单 元; 所述椭圆形拉平单元用于对检测到的椭圆形图章获取椭圆形图章上的多条线段; 使用 布雷森汉姆直线算法获得每条线段上 的所有像素点; 将所有线段紧挨着平行排列, 并且缩 放各条线段以使 各条线段的长度相同, 相互平行的多 条线段所组成的矩形图像就作为椭圆 形图章展平后的图章图片; 缩放后的每条线段上的所有像素点就作为矩形图像的一列像素 点, 然后送入字符识别单 元; 所述字符识别单元用于对展平的图章图片进行文字检测, 再对检测出的文字进行光学 字符识别得到文字识别结果。权 利 要 求 书 2/2 页 3 CN 114120308 A 3

.PDF文档 专利 一种基于图章轮廓的弯曲文字拉平识别方法和装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于图章轮廓的弯曲文字拉平识别方法和装置 第 1 页 专利 一种基于图章轮廓的弯曲文字拉平识别方法和装置 第 2 页 专利 一种基于图章轮廓的弯曲文字拉平识别方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 00:18:14上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。