欢迎访问西安知识产权运营服务平台

< a href=' '>web对话
  • 一种基于EIoU改进的YOLOv3算法
一种基于EIoU改进的YOLOv3算法 授权有效中;
  • 专利(申请)号: CN202010892321.2
  • 专利类型: 发明;
  • 主分类: G物理;
  • 产业领域: 目标检测;算法
  • 专利来源: 高校;
  • 申请日: 2020-08-28
  • 申请人: 西安电子科技大学;陕西理工大学
  • 当前专利权人: 西安电子科技大学;陕西理工大学
  • 交易方式: 转让; 许可; 其他;
  • 其他交易方式: 产学研
  • 参考价格(元): ¥面议
  • 联系方式: 运营平台029-65666507/29

目标检测技术

目标检测主要包括传统目标检测技术及基于深度学习的目标检测技术。近年来,随着科技的发展及智能化的普及,传统的目标检测技术远远达不到人们的需求,基于深度学习的目标检测技术应运而生且发展迅速,成为当前目标检测领域的主流算法:使用一个卷积神经网络直接预测不同目标的类别与位置,属于端到端的方法,主要有SSD、YOLO系列。

西安电子科技大学物理与光电工程学院王兰美教授简介:王兰美,女,现为西安电子科技大学教授,无线电物理学科博士/硕士生导师,电子与通信工程专业硕士生导师。“信息感知协同创新中心”(2011)目标与环境特征研究部研究员。主持国家自然科学基金面上项目以及其它横向项目数项,参与包括国家重大专项,教育部基金,国家自然科学基金项目数项。 科研方向,长期从事雷达极化信号处理和卫星导航抗干扰等技术领域的研究工作,智能信号处理。先后主持国家自然科学基金面上项目、国家自然科学基金青年项目、陕西省自然科学基金面上项目、企业横向联合项目等课题项目。近年来,第一作者在本学科权威期刊发表论文近40篇,其中SCI检索13篇,EI检索40余篇,获得授权发明专利20多项,转让专利4项。教学方面,主要从事“数字信号处理”和“大学物理”等课程的教学工作。

陕西理工大学机械工程学院王桂宝教授简介:王桂宝,西安电子科技大学信息与通信工程专业博士,美国旧金山州立大学访问学者,教授,正高级工程师,硕导,汉中市青年科技领军人才,陕西省高层次人才特殊支持计划区域发展人才。主要研究方向为智能感知与监测识别、物联网与人工智能。现为“电子信息”硕士专业学位点学术负责人,陕西理工大学电子信息技术与交叉前沿应用科技创新团队(重点攻关型)负责人,陕西理工大学信息与控制工程院士工作室负责人,陕西省人工智能产业发展联盟副理事长,科技部网络协同制造和智能工厂专家。国家自然科学基金通讯评审人,多个省、市科技计划项目、人才工程项目和科学技术奖的评审专家,多个国际、国内知名期刊的审稿人。

研究方向

1.智能感知与监测识别

智能感知与监测识别包括信息采集、识别和分析等技术,是组成人工智能的重要内容,也是为人工智能提供信息的一环。瞄准智能技术发展前沿,紧密结合国家智能制造发展的战略需求,基于人工智能、信息处理理论及机械雷达系统,研究复杂环境下的智能感知和目标检测识别理论与应用。

2.物联网与人工智能

通过各种信息传感器、射频识别技术等各种装置实现万物互联的物联网技术与人工智能融合,实现对各类应用场景(各类战场、智慧城市、雷达导航)大数据的实时自动采集、存储、传输与处理,实现全域覆盖、多元融合和信息共享,解决复杂环境下的精确态势感知难题,实现感知信息在各类应用场景下的综合应用。

摘要

【 中文摘要 】本发明提出了一种基于EIoU改进的YOLOv3算法,主要解决现有算法中由于重叠率、尺度及长宽比导致的基于IoU的损失LIoU计算不准从而影响检测性能的问题。首先下载当前目标检测领域通用数据集;其次重建现有算法YOLOv3网络模型并用备好的数据集进行训练,检测其性能;然后将基于EIoU的损失函数LEIoU嵌入YOLOv3算法模型中进行训练并作性能评价;最后对比经典的YOLOv3算法,分析测试结果。本发明提出的基于EIoU改进的YOLOv3算法,相比经典的YOLOv3算法,提高了平均准确率,且更适用于同一区域中有多个物体重叠时的情况,另外该模块也没有引入更多的计算量,与原模型相比,实时性没有受到影响。该模块仍然能够嵌入其他经典算法模型中做对比测试,更具适用性,且鲁棒性更好。

【 英文摘要 】The invention provides an improved YOLOv3 algorithm based on an EIoU. The improved YOLOv3 algorithm based on the EIoU mainly solves the problem that detection performance is affected due to loss of the IoU caused by an overlap rate, a scale and a length-width ratio in an existing algorithm and inaccurate calculation of the IoU. Firstly, downloading general data set of current target detection field; Secondly, the existing algorithm YOLOv3 network model is reconstructed and trained with the prepared data set to detect its performance; EIoU-based loss function LEIoU is then embedded into YOLOv3 algorithm model for training and performance evaluation; Finally, compare the classic YOLOv3 algorithm and analyze the test results. Compared with a classic YOLOv3 algorithm, the improved YOLOv3 algorithm based on the EIoU has the advantages that the average accuracy is improved, and the improved YOLOv3 algorithm based on the EIoU is more suitable for the situation that a plurality of objects are overlapped in the same area; in addition, more calculated amount is not introduced into the module, and compared with an original model, the improved YOLOv3 algorithm based on the EIoU is not affected in real-time performance. The module can still be embedded into other classical algorithm models for comparison test, and is more applicable and better in robustness.

技术摘要(来自于incoPat)

【 DWPI用途 】

该算法对于多个对象在相同区域中重叠的情况是有用的。

【 DWPI优势 】

该算法:提高了平均准确率; 没有引入更多的计算,影响实时性; 被嵌入到其他经典算法模型中进行对比测试; 并且具有适用性和较好的鲁棒性。

【 DWPI新颖性 】

该算法具有下载当前目标检测字段通用数据集上下文(COCO)中的通用对象数据集。 对当前目标检测领域通用数据集的性能进行检测。 输出权重文件。 对当前目标检测领域通用数据集的性能进行检测。 预选帧被目标帧完全覆盖。 嵌入式算法模型被嵌入。 对当前目标检测领域通用数据集的性能进行训练检测。 分析测试结果。 提供了由并集边缘交叉(EIoU)表示的改进的损失函数LEIoU。

【 用途 】

计算控制计算方法算法

【 技术功效 】

技术功效句而且同时考虑了真实框完全包裹预测框的情况下预测框相同面积大小但不同长宽比的情形; 实时性没有受到影响; 保证与该领域通用数据集保持一致; 且鲁棒性更好; 仍然可使预测框向真实框方向靠近; 更具适用性; 提高了平均准确率
技术功效短语预测框完全包裹; 实时性; 保证通用数据集; 鲁棒性好; 真实框; 适用性; 提高平均准确率
技术功效1级完成率; 实时性; 数据集; 鲁棒性; 真实性; 适用性; 精度
技术功效2级完成率; 实时性提高; 数据集保持; 鲁棒性好; 真实性; 适用性提高; 精度提高
技术功效3级预测框包裹完成率; 实时性提高; 通用数据集保持; 鲁棒性好; 框真实性; 适用性提高; 平均精度提高
技术功效TRIZ参数25-时间损失;35-适应性、通用性;28-测量精度;

分类号

【技术分类】

主分类号

G06V10/82;

  • G 物理

  • G06

    计算;推算或计数

  • G06V

    图像或视频识别或理解 笔记

  • 1.本子类涵盖: 特别适用于图像或视频的模式识别或机器学习的方法或安排。

  • 2. 在本小类中,下列术语或表述的使用具有指明的含义:

  • “模式识别”是指通过获取、预处理或提取显着特征并对这些特征或其表示进行匹配、聚类或分类,对模式进行检测、分类、认证和识别,以用于解释目的或在图像或视频中推导出某种含义;

  • “特征提取”是指从图像或视频中得出描述性或定量的度量;

  • “聚类”是指根据模式的(不同)相似性或接近程度对模式进行分组或分离;

  • “分类”是指通过分配标签将对象/特征识别为属于一类对象/特征。

  • 3.在本小类中,归入G06V20/00-G06V40/00组的主题,如果识别依赖于获取或预处理阶段的特定处理,则也分别归入G06V10/10或G06V10/20组。[2022.01]

  • G06V10/00

    图像或视频识别或理解的安排(图像或视频中的字符识别 G06V30/10)[2022.01]

  • *G06V10/70

    使用模式识别或机器学习(光学模式识别或电子计算 G06V10/88)[2022.01]

  • **G06V10/82

    使用神经网络 翻使用神经网络[2022.01]

IPC分类号
CPC分类号G06N3/08; G06V10/25; G06V2201/07; G06N3/045; Y02T10/40;
DWPI分类号T01;
DWPI手工代码T01-J10B2; T01-J16C1; T01-N01D2;

【行业分类】

国民经济行业分类

制造业信息传输、软件和信息技术服务业

国民经济行业(主)

信息传输、软件和信息技术服务业

新兴产业分类

互联网与云计算、大数据服务

知识密集型分类

信息通信技术制造业信息通信技术服务业

学科分类

工程

数字经济核心产业

数字产品制造业数字技术应用业数字要素驱动业

专利历程

  • 2020-08-28

    申请日

    CN202010892321.2(当前专利)

    申请号

  • 2021-02-26

    首次公开日

    CN112418212A

    首次公开号

  • 2024-02-09

    授权公告日

    CN112418212B(当前专利)

    授权公告号

  • 2040-08-28

    预估到期日

    计算因素

申请语言汉语
审查员李志研

权利要求

×
发送意向

申请须知:申请人无需注册账号即可提交交易意向,交易意向一经提交不可查询或更改,请准确填写相关信息;平台运营人员将在3-5个工作日内查看交易意向并与您联系,感谢阅读。