人脸关键点检测及人脸分割 人脸关键点检测,输入opencv格式的bgr通道图,默认在输入图上画关键点,也可以在空白图上画,如果要分割出人脸,可以使用矩形框框住关键点,然后在原图上裁剪,下面是一个成功案例。 源代码12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758 2023-03-23 python #python #目标检测 #人脸检测
百度短语音转文字API调用 百度的语音转文字API只支持最长60s的语音,如果要识别长语音,需要先切分,识别后再把结果合并。音频采样率和声道数好像也有影响,需要做修改,以下是一个成功案例。 源代码1234567891011121314151617181920212223242526272829303132333435363738from aip import AipSpeech # baidu_aipfrom pydub 2023-03-23 python #python #语音转文字
npm换源 npm换源查看当前源1npm config get registry 默认是指向 https://registry.npmjs.org/,也就是官方源。 更换源新淘宝源,一些文章还是写着旧的淘宝 NPM 镜像 registry.npm.taobao.org,但它已于 2022 年 05 月 31 日 废弃,读者需要更换为新的 registry.npmmirror.com 源。 1npm confi 2023-03-21 软件安装配置
yolov5单目标检测简化改进 backbone部分,去掉了7.8两层的conv和c3,只做到16倍下采样 head部分,去掉所有concat,3个检测层改为1个 Model size:3.63M->1.01M Params:1.7M->0.45M FLOPs:4.1G->2.8G mAP:81.46->81.96 主要原因应该是对于我的检测任务,待检测目标的大小几乎不会有很大的变化,且和16倍下采样后每 2022-12-07 目标检测 #目标检测
yolox小目标检测改进(删除感受野大的特征图) 问题yolox中有3个检测分支,分别预测小、中、大的目标但在我的数据集上,并不需要预测大目标,甚至还要手动去掉错误的大预测框,因此有一个想法是去掉一个最深的检测分支,使网络预测大目标的能力下降,整体感受野变小,对小目标更加敏感。 方法修改yolox/models/yolo_head.py 123456789101112131415161718class YOLOXHead(nn 2022-10-24 目标检测 #目标检测
yolox添加注意力机制 原文链接 Coordinate Attention论文来源 官方代码 注意力机制广泛用于深度神经网络中来提高模型的性能。然而,因为其昂贵的计算代价,很难应用在一些轻量级网络,但不乏有一些注意力模块脱颖而出,具有代表性的有SE、CBAM等。SE模块通过2D全局池化来计算通道注意力,在非常低的计算成本下达到了提升网络性能的目的,遗憾的是,SE模块忽视了捕获位置信息的注意力;CBAM模块通过使用大尺寸卷 2022-10-24 目标检测 #目标检测
yolo主流版本介绍(v1-v7) 本文主要介绍目标检测yolo系列主流版本的发展。 目标检测评价指标IOU真实框和预测框之间的交并比。 精确度预测为正例的那些数据里预测正确的比例。 召回率真实为正例的那些数据里预测正确的比例。 AP不同的置信度阈值对应不同的检测结果,对应一组精确度和召回率,计算合成的面积 MAPMAP是不同类别的平均AP。 YOLOv1paper(CVPR2015) You only look once,one- 2022-10-08 目标检测 #目标检测
windows命令行cmd代理设置(结合v2rayn) v2rayn代理端口socks5:127.0.0.1:10808 http:127.0.0.1:10809 cmd临时代理(对当前cmd生效)set http_proxy=http://127.0.0.1:10809 set https_proxy=http://127.0.0.1:10809 set http_proxy=socks5://127.0.0.1:10808 set https_ 2022-09-22 杂 #代理 #软件安装配置
Yolox+Siamese孪生神经网络:图标点选验证码识别 问题描述图标点选验证码_点选验证码_验证码API_在线体验_网易易盾 (163.com) 网页场景 图片下载下来是这样的,底部会有几行小图标,第三行小图标是正确的顺序 这个问题的目标就是按顺序给出三个坐标点。 解决方案step1.使用yolox检测出所有图标的位置(不包含下面的三行图标)因为图标种类众多,没法直接用yolox进行图标详细分类,所以我训练的时候只分了两类,一类白的,一类黑的,虽然 2022-09-15 目标检测 #数据集 #目标检测 #图像处理 #孪生网络
paddleocr转pytorch推理 frotms/PaddleOCR2Pytorch: PaddleOCR inference in PyTorch. Converted from PaddleOCR 安装paddlepaddle==2.0.0 shapely numpy pillow pyclipper opencv-python <= 4.2.0.32 pytorch pyyaml scikit-image 中 2022-08-17 pytorch #python #pytorch