vscode SSH无法建立连接问题 问题其他SSH工具能连上,vscode的RemoteSSH插件显示无法建立连接 解决方法在C:\Users\yourname\.ssh下有一个known_hosts文件,使用记事本打开,删除你要连接的IP相关的所有内容即可 2023-04-14 软件安装配置
VOC格式数据集转YOLO格式 VOC格式12345678910111213141516171819202122232425262728293031323334353637383940VOC--Annotations 00001.xml <annotation> <size> <width>320</width> 2023-04-14 目标检测
centos7使用docker部署chatgpt 安装docker1sudo curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 查看安装版本1docker -v 卸载docker123sudo yum remove docker-ce docker-ce-cli containerd.iosudo yum remove docker #删除早期版本sudo rm 2023-04-03 杂
解决录制音视频不同步问题 问题使用opencv录制视频,同时使用pyaudio录制音频,存在两个问题1.视频录制和音频录制没有同时启动,开始时间对不上2.视频录制时长和视频保存后的时长不一致,会出现视频变慢的现象 解决方法1.使用event事件,使两个录制同步开始2.读取音频视频时长,调整视频帧率,把视频时长调整成和音频一样长,再把音频合并到视频中。 源代码123456789101112131415161718192021 2023-03-23 python
人脸关键点检测及人脸分割 人脸关键点检测,输入opencv格式的bgr通道图,默认在输入图上画关键点,也可以在空白图上画,如果要分割出人脸,可以使用矩形框框住关键点,然后在原图上裁剪,下面是一个成功案例。 源代码12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758 2023-03-23 python
百度短语音转文字API调用 百度的语音转文字API只支持最长60s的语音,如果要识别长语音,需要先切分,识别后再把结果合并。音频采样率和声道数好像也有影响,需要做修改,以下是一个成功案例。 源代码1234567891011121314151617181920212223242526272829303132333435363738from aip import AipSpeech # baidu_aipfrom pydub 2023-03-23 python
npm换源 npm换源查看当前源1npm config get registry 默认是指向 https://registry.npmjs.org/,也就是官方源。 更换源新淘宝源,一些文章还是写着旧的淘宝 NPM 镜像 registry.npm.taobao.org,但它已于 2022 年 05 月 31 日 废弃,读者需要更换为新的 registry.npmmirror.com 源。 1npm confi 2023-03-21 软件安装配置
yolov5单目标检测简化改进 backbone部分,去掉了7.8两层的conv和c3,只做到16倍下采样 head部分,去掉所有concat,3个检测层改为1个 Model size:3.63M->1.01M Params:1.7M->0.45M FLOPs:4.1G->2.8G mAP:81.46->81.96 主要原因应该是对于我的检测任务,待检测目标的大小几乎不会有很大的变化,且和16倍下采样后每 2022-12-07 目标检测
yolox小目标检测改进(删除感受野大的特征图) 问题yolox中有3个检测分支,分别预测小、中、大的目标但在我的数据集上,并不需要预测大目标,甚至还要手动去掉错误的大预测框,因此有一个想法是去掉一个最深的检测分支,使网络预测大目标的能力下降,整体感受野变小,对小目标更加敏感。 方法修改yolox/models/yolo_head.py 123456789101112131415161718class YOLOXHead(nn 2022-10-24 目标检测
yolox添加注意力机制 原文链接 Coordinate Attention论文来源 官方代码 注意力机制广泛用于深度神经网络中来提高模型的性能。然而,因为其昂贵的计算代价,很难应用在一些轻量级网络,但不乏有一些注意力模块脱颖而出,具有代表性的有SE、CBAM等。SE模块通过2D全局池化来计算通道注意力,在非常低的计算成本下达到了提升网络性能的目的,遗憾的是,SE模块忽视了捕获位置信息的注意力;CBAM模块通过使用大尺寸卷 2022-10-24 目标检测