yolox小目标检测改进(删除感受野大的特征图) 问题yolox中有3个检测分支,分别预测小、中、大的目标但在我的数据集上,并不需要预测大目标,甚至还要手动去掉错误的大预测框,因此有一个想法是去掉一个最深的检测分支,使网络预测大目标的能力下降,整体感受野变小,对小目标更加敏感。 方法修改yolox/models/yolo_head.py 123456789101112131415161718class YOLOXHead(nn 2022-10-24 目标检测 #目标检测
yolox添加注意力机制 原文链接 Coordinate Attention论文来源 官方代码 注意力机制广泛用于深度神经网络中来提高模型的性能。然而,因为其昂贵的计算代价,很难应用在一些轻量级网络,但不乏有一些注意力模块脱颖而出,具有代表性的有SE、CBAM等。SE模块通过2D全局池化来计算通道注意力,在非常低的计算成本下达到了提升网络性能的目的,遗憾的是,SE模块忽视了捕获位置信息的注意力;CBAM模块通过使用大尺寸卷 2022-10-24 目标检测 #目标检测
yolo主流版本介绍(v1-v7) 本文主要介绍目标检测yolo系列主流版本的发展。 目标检测评价指标IOU真实框和预测框之间的交并比。 精确度预测为正例的那些数据里预测正确的比例。 召回率真实为正例的那些数据里预测正确的比例。 AP不同的置信度阈值对应不同的检测结果,对应一组精确度和召回率,计算合成的面积 MAPMAP是不同类别的平均AP。 YOLOv1paper(CVPR2015) You only look once,one- 2022-10-08 目标检测 #目标检测
windows命令行cmd代理设置(结合v2rayn) v2rayn代理端口socks5:127.0.0.1:10808 http:127.0.0.1:10809 cmd临时代理(对当前cmd生效)set http_proxy=http://127.0.0.1:10809 set https_proxy=http://127.0.0.1:10809 set http_proxy=socks5://127.0.0.1:10808 set https_ 2022-09-22 杂 #代理 #软件安装配置
Yolox+Siamese孪生神经网络:图标点选验证码识别 问题描述图标点选验证码_点选验证码_验证码API_在线体验_网易易盾 (163.com) 网页场景 图片下载下来是这样的,底部会有几行小图标,第三行小图标是正确的顺序 这个问题的目标就是按顺序给出三个坐标点。 解决方案step1.使用yolox检测出所有图标的位置(不包含下面的三行图标)因为图标种类众多,没法直接用yolox进行图标详细分类,所以我训练的时候只分了两类,一类白的,一类黑的,虽然 2022-09-15 目标检测 #数据集 #目标检测 #图像处理 #孪生网络
paddleocr转pytorch推理 frotms/PaddleOCR2Pytorch: PaddleOCR inference in PyTorch. Converted from PaddleOCR 安装paddlepaddle==2.0.0 shapely numpy pillow pyclipper opencv-python <= 4.2.0.32 pytorch pyyaml scikit-image 中 2022-08-17 pytorch #python #pytorch
用yolox预测结果自动生成voc数据集标签文件 问题已有少量(100张)数据集由手工标注,训练结果也不算差,但希望能够进一步提高准确率,需要扩充数据集样本,手工标注太累,因此利用已有训练权重进行预测,用预测结果自动生成xml格式的标注文件,当然也会存在预测错误的情况,自定义条件筛选正确,其余手工标注即可。 voc数据集的xml文件格式12345678910111213141516171819202122232425262728293031323 2022-07-12 目标检测 #数据集 #目标检测
基于直方图分析的自适应阈值分割 问题描述分割出文字,去掉背景 方法画出直方图,用多项式曲线拟合。在斜率绝对值最大处左右两侧找极小值,对应横坐标作为分割的左右阈值。 对于背景复杂,前景颜色单一的图片,分割效果佳,其余情况可能不适合。 细节略 2022-06-10 python #python #图像处理
基于已知背景的验证码文字倾斜矫正及识别 问题描述请点击“荔枝茶”。即判断文字位置及顺序。 已知条件:yolox能够预测汉字位置,paddleOCR可以直接识别文字,但有时出错。 现在要做的是矫正验证码图片中的文字倾斜,以提高文字识别准确率。 背景匹配所有可能的背景 用直方图标准差的方法来做背景匹配 图像相似度-直方图标准差 汉字分割为什么要分割?分割后可以根据二值图来画出最小外接矩形,计算倾斜角度,给原图汉字矫正。 怎么分割?遍历像 2022-06-10 python #python #验证码
图像相似度-直方图标准差 问题描述现有一张验证码图片,可能的背景有6种,怎么判断他的背景是哪一种? 方法对于这种大面积相同的图片,一种很快速的方法是计算两张图直方图的标准差。 计算和每一张背景图的标准差,取最小的就行 1234567891011121314from PIL import Imageimport numpy as np#计算直方图的标准差def image_contrast_std(img1, img2) 2022-06-10 python #python #图像处理