安全公司报告
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111683639.0 (22)申请日 2021.12.28 (71)申请人 深圳中智永浩机 器人有限公司 地址 518000 广东省深圳市光明区新湖街 道圳美社区圳美同富裕工业园万代恒 光明高新科技园厂房2栋一层 (72)发明人 李伟强 曹应文 施健 王一科 贾林 涂静一 (74)专利代理 机构 深圳市精英专利事务所 44242 代理人 李燕娥 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/72(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 非结构化数据标注方法、 装置、 计算机设备 及存储介质 (57)摘要 本发明实施例公开了非结构化数据标注方 法、 装置、 计算机设备及存储介质。 所述方法包 括: 获取图片数据; 将所述图片数据输入至标注 模型内进行标签标注, 以得到标注结果; 输出所 述标注结果; 其中, 所述标注模型是指通过若干 个带有标注标签的图像数据作为样本集训练专 家模型所得的。 通过实施本发明实施例的方法可 实现快速高效地对非结构化数据进行打标和清 洗, 保障了生成标签的准确性, 减少错误标签的 生成, 降低了人工成本 。 权利要求书2页 说明书9页 附图4页 CN 114359670 A 2022.04.15 CN 114359670 A 1.非结构化数据标注方法, 其特 征在于, 包括: 获取图片数据; 将所述图片数据输入至标注模型内进行 标签标注, 以得到标注结果; 输出所述标注结果; 其中, 所述标注模型是指通过若干个带有标注标签的图像数据作为样本集训练专家模 型所得的。 2.根据权利要求1所述的非结构化数据标注方法, 其特征在于, 所述标注模型是指通过 若干个带有标注标签的图像数据作为样本集训练专 家模型所得的, 包括: 获取图像数据, 以得到初始数据; 将所述图像数据输入至专用模型内进行 标签标注, 以得到第一标签; 将所述图像数据输入至专 家模型内进行 标签标注, 以得到第二标签; 计算所述第一标签和第二标签的IOU, 以得到计算结果; 根据所述计算结果分类所述第一标签和第二标签, 以得到可用标签和不可用标签; 对所述不可用标签进行清洗, 以得到清洗后的标签; 根据所述可用标签以及清洗后的标签对所述初始数据进行 标注, 以形成样本集; 利用样本集训练专 家模型, 以得到标注模型。 3.根据权利要求2所述的非结构化数据标注方法, 其特征在于, 所述专用模型是通过带 有第一标签标注的图像数据作为样本集训练专 家模型所得的。 4.根据权利要求2所述的非结构化数据标注方法, 其特征在于, 所述专家模型是对数据 进行回归分类的模型。 5.根据权利要求2所述的非结构化数据标注方法, 其特征在于, 所述计算所述第 一标签 和第二标签的IOU, 以得到计算结果, 包括: 计算所述第一标签和第二标签的边界框的交集 面积以及并集 面积; 计算所述交集 面积与并集 面积的比值, 以得到计算结果。 6.根据权利要求5所述的非结构化数据标注方法, 其特征在于, 所述根据 所述计算结果 分类所述第一标签和第二标签, 以得到可用标签和不可用标签, 包括: 当所述计算结果高于设定阈值时, 确定所述第一标签和第二标签对应的值为可用标 签; 当所述计算结果不高于设定阈值时, 确定所述第一标签和第二标签对应的值为不可用 标签。 7.根据权利要求6所述的非结构化数据标注方法, 其特征在于, 所述对所述不可用标签 进行清洗, 以得到清洗后的标签, 包括: 对所述不可用标签进行调整或删除, 以得到清洗后的标签。 8.非结构化数据标注装置, 其特 征在于, 包括: 数据获取 单元, 用于获取图片数据; 标注单元, 用于将所述图片数据输入至标注模型内进行 标签标注, 以得到标注结果; 输出单元, 用于输出所述标注结果。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器及处理器, 所述存储器上 存储有计算机程序, 所述处理器执行所述计算机程序时实现如权利要求 1至7中任一项所述 的方法。权 利 要 求 书 1/2 页 2 CN 114359670 A 210.一种存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算机程序被 处理器执行时实现如权利要求1至7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114359670 A 3
专利 非结构化数据标注方法、装置、计算机设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-19 00:20:43
上传分享
举报
下载
原文档
(594.6 KB)
分享
友情链接
GB-T 31722-2015信息技术安全技术信息安全风险管理.pdf
T-CSIA 014—2023 开放式景区消防安全评估导则.pdf
GB-T 24804-2023 提高在用电梯安全性的规范.pdf
JR-T0073-2012 金融行业信息安全等级保护测评服务安全指引.pdf
GB-T 36073-2018数据管理能力成熟度评估模型.pdf
GB-T 27926.8-2021 金融服务 金融业通用报文方案 第8部分:ASN.1生成.pdf
GB 18483-2001 饮食业油烟排放标准.pdf
GB 40165-2021 固定式电子设备用锂离子电池和电池组 安全技术规范.pdf
GB-T 21898-2008 纺织品颜色表示方法.pdf
GB 37300-2018 公共安全重点区域视频图像信息采集规范.pdf
GB-T 33445-2023 煤制合成天然气.pdf
JR-T 0070-2012 信用增进机构风险管理规范.pdf
DB11-T 1640-2019 冷库系统节能监测 北京市.pdf
CY-T 101.8-2014 新闻出版内容资源加工规范 第8部分%3A图书加工.pdf
ISO 31000-2018.pdf
GB-T 4240-2019 不锈钢丝.pdf
GB-T 893-2017 孔用弹性挡圈.pdf
GB-T 12409-2009 地理格网.pdf
GB-Z 41358-2022 土壤健康综合表征的生物测试方法.pdf
DB11-T 1190.1-2015 古建筑结构安全性鉴定技术规范 第1部分:木结构 北京市.pdf
交流群
-->
1
/
3
16
评价文档
赞助2元 点击下载(594.6 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。