用yolox预测结果自动生成voc数据集标签文件 问题已有少量(100张)数据集由手工标注,训练结果也不算差,但希望能够进一步提高准确率,需要扩充数据集样本,手工标注太累,因此利用已有训练权重进行预测,用预测结果自动生成xml格式的标注文件,当然也会存在预测错误的情况,自定义条件筛选正确,其余手工标注即可。 voc数据集的xml文件格式12345678910111213141516171819202122232425262728293031323 2022-07-12 目标检测 #数据集 #目标检测
基于直方图分析的自适应阈值分割 问题描述分割出文字,去掉背景 方法画出直方图,用多项式曲线拟合。在斜率绝对值最大处左右两侧找极小值,对应横坐标作为分割的左右阈值。 对于背景复杂,前景颜色单一的图片,分割效果佳,其余情况可能不适合。 细节略 2022-06-10 python #python #图像处理
基于已知背景的验证码文字倾斜矫正及识别 问题描述请点击“荔枝茶”。即判断文字位置及顺序。 已知条件:yolox能够预测汉字位置,paddleOCR可以直接识别文字,但有时出错。 现在要做的是矫正验证码图片中的文字倾斜,以提高文字识别准确率。 背景匹配所有可能的背景 用直方图标准差的方法来做背景匹配 图像相似度-直方图标准差 汉字分割为什么要分割?分割后可以根据二值图来画出最小外接矩形,计算倾斜角度,给原图汉字矫正。 怎么分割?遍历像 2022-06-10 python #python #验证码
图像相似度-直方图标准差 问题描述现有一张验证码图片,可能的背景有6种,怎么判断他的背景是哪一种? 方法对于这种大面积相同的图片,一种很快速的方法是计算两张图直方图的标准差。 计算和每一张背景图的标准差,取最小的就行 1234567891011121314from PIL import Imageimport numpy as np#计算直方图的标准差def image_contrast_std(img1, img2) 2022-06-10 python #python #图像处理
验证码背景合成(多张残缺图合成一张完整图) 问题描述有多张验证码图片,背景相同,如何获取完整的背景图? 已有条件:可以使用yolox检测出汉字的位置矩形框。 方法输入:一个验证码图片文件夹 输出:包含所有的背景图片的文件夹 背景区分:假设相同的背景的验证码图片的背景部分是完全一致的的,那么可以比较边框的像素点来判断是否是同一个背景,把所有图片按照背景分类。 针对每一个分类,用yolox预测出汉字框,把汉字框部分像素点设置为黑色,以其中一 2022-06-10 python #python #图像处理 #验证码
ubuntu20.04安装配置vncserver 更新系统sudo apt update sudo apt upgrade 安装软件sudo apt install tigervncserver 打开端口 sudo firewall-cmd --zone=public --add-port=5900/tcp --permanent sudo firewall-cmd --zone=public --add-port=5901/tcp --pe 2022-05-18 软件安装配置 #linux #软件安装配置
selenium爬取极验验证码,PaddleOCR识别文字作为文件名 问题描述自动爬取验证码图片,图片文件名需要包含右上角的标题文字(在网页上是图片类型,不是文本) Edge driver初始化第一种 1234567from msedge.selenium_tools import Edge, EdgeOptions edge_options = EdgeOptions() edge_options.use_chromium = Tru 2022-05-15 python #爬虫 #selenium #验证码 #ocr
linux命令行代理工具:proxychains 安装sudo apt install proxychains4 编辑/etc/proxychains4.conf 在末尾添加代理服务器设置 验证curl www.httpbin.org/ip 在命令前添加proxychains4来走代理 proxychains4 curl www.httpbin.org/ip 2022-05-09 杂 #linux #代理
获取PDF中的可复制的文本信息 123456789import PyPDF2pdfFile = open(filePath, 'rb')pdfReader = PyPDF2.PdfFileReader(pdfFile)page0=pdfReader.getPage(0)#获取第几页的内容page1=pdfReader.getPage(1)###########text = page.extractText() 2022-04-14 python #python #PDF
frp内网穿透 目的在公网访问实验室服务器 环境服务端:腾讯云服务器(centos7),有公网IP 客户端:内网服务器(ubuntu20.04) 下载frp两台机器都下载同一个东西 Releases · fatedier/frp (github.com) wget https://github.com/fatedier/frp/releases/download/v0.38.0/frp_0.38.0_l 2022-04-14 杂 #内网穿透