xinhaojin's blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

滑块验证码自动拖拽(selenium+opencv)

计算需要移动的像素首先我在github上找到了一个大佬写的项目SlideCrack/slide_01 at master · crazyxw/SlideCrack (github.com) 输入是本地的两张图:滑块验证码背景和滑块图片 输出是两个缺口的像素距离 1234567891011121314151617181920212223242526272829303132333
2022-02-22
python
#验证码

ubuntu终端source: not found

错误shell脚本中含有source命令运行时提示 source: not found 运行 ls -l /bin/sh 后显示/bin/sh -> dash这说明是用dash来进行解析的。 解决方案命令行执行:(需要root权限) dpkg-reconfigure dash 在界面中选择no再运行ls -l /bin/sh 后显
2022-01-07
杂
#linux
nodejs cheerio爬虫

nodejs cheerio爬虫

需求获取美国各州疫情数据美国疫情(每小时更新) 各州新增新冠确诊案例、疫苗接种率、实时新闻、疫情地图 - 咕噜美国通 (Guruin.com) 本来用的数据来源不是这个网站,但原先的数据源不让跨域爬虫,http和request都没法获取HTML源码,只好换了一个数据源 request获取目标网页源代码12345678910111213var request = require('req
2021-12-14
爬虫
#爬虫 #nodejs

ubuntu普通用户安装配置anaconda

下载anaconda清华源地址 方法一:在服务器上使用wget命令 wget -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.11-Linux-x86_64.sh 方法二:下载到本地之后通过ftp工具上传到服务器(推荐使用FinalShell) 安装在下载目录执行下载的bash文件 bash Anac
2021-12-10
软件安装配置
#linux #软件安装配置

selenium+beautifulsoup4获取网页动态加载的数据

问题想要获取一个网页中的表格数据,但是不提供下载 网页源码中能看到表格信息,但beautiful获取源码结果中没有表格 原因是表格数据从后台动态加载,beautifulsoup无法获取 使用selenium获取源码selenium是浏览器自动化工具,可以模拟人的操作,能够正常获取所有源码 为了程序运行更优雅,设置浏览器在后台静默运行 123456789101112131415161718192
2021-11-25
python
#爬虫 #selenium

wordcloud词云

加载停用词stopwords.txt是一个自定义的停用词列表,里面的词都会被过滤 123"""读取停用词"""with open("stopwords.txt", "r", encoding="utf-8") as fp: stopwords = set([s.rstrip
2021-11-10
python
#python #worldcloud

红米AC2100在线刷breed+老毛子固件

纯记录,不放图了 刷breed登录路由器后台192.168.31.1,复制地址栏的stock 替换掉下面地址中的stock,直接在浏览器里输入并回车,返回一个code:0即成功 http://192.168.31.1/cgi-bin/luci/;stok=dcd5c3196a7d5e620bd382328bf36218/api/misystem/set_config_iotdev?bssid=X
2021-10-25
杂
#路由器刷机 #老毛子固件
jupyter matplotlib画图中文乱码的解决方案

jupyter matplotlib画图中文乱码的解决方案

在jupyter notebook中使用matplotlib画图时,中文字体显示乱码 看提示是缺少字体 查找matplotlib字体配置文件的目录import matplotlibmatplotlib.matplotlib_fname() 下载字体,放入对应目录中下载地址:https://xinhaojin.lanzoui.com/ibUMJvbo7ib 修改配置文件,启用新字体打开matp
2021-10-14
python
#python #图像处理

python与RPA(转载)

RPA,是Robotic Process Automation的英文缩写,中文是机器人流程自动化,利用软件将重复性的工作自动化。基本目标是让人从重复性强的繁琐工作中解放出来去做更有意义更具创造性的工作。比如自动爬取网站内容、将十几个Excel中数据合并分析、定时发送邮件等都是简单的RPA应用的例子。 加上如今AI技术的快速发展,能极大地扩展软件自动化的应用范围,可以实现更复杂的功能。比如,可以通过
2021-09-14
python
#python #rpa

使用labelme制作coco数据集

安装labelme直接使用pip安装 pip install labelme 运行命令行执行 labelme 打开后选择打开文件夹,选择自动保存 编辑,画矩形,然后打上标签 在图片目录下会保存json格式的标签信息 应用(以yolox为例)yolox的数据集readme中写明了需要的数据集格式 其中instancesxxx.json是很多json的集合,需要手动生成 现在要做的是,先手动
2021-09-02
目标检测
#数据集 #目标检测
1…910111213…20

搜索

总访问量 次 总访客数 次