5天前活跃

• UID:23664
综合评分 36
方向: 爬虫/脚本-爬虫/脚本
嘉兴市
200元/8h
1年经验
求职意愿:接单·不求职(30天前更新)

个人简介

一、网络基础技能 HTTP/HTTPS协议理解 请求方法(GET/POST/PUT/DELETE) 状态码含义(200/301/403/404/500) 请求头/响应头解析 Cookie/Session机制 请求库使用 requests - 同步HTTP请求 aiohttp - 异步HTTP请求 httpx - 同步/异步混合请求 二、解析与数据提取 HTML解析技术 BeautifulSoup - DOM树解析 lxml - XPath表达式解析 pyquery - jQuery风格选择器 正则表达式 re模块高级用法 模式匹配与分组提取 性能优化技巧 JSON/XML处理 json模块序列化/反序列化 xml.etree.ElementTree解析 复杂嵌套结构提取 三、动态内容处理 浏览器自动化 Selenium - 全功能浏览器控制 Playwright - 现代浏览器自动化 Puppeteer(Python版本)- 高性能自动化

技能

核心技能:
其他技能: Cheerio、Selenium
交流语言: 普通话( 母语水平 )
行业经验: 金融 人工智能

项目案例

东方财富实时行情爬虫
股票数据获取:实时抓取A股今日涨幅前30和跌幅前30的股票 股票代码、名称、最新价、涨跌额、涨跌幅 热门板块分析:获取近30天热门板块数据 板块名称、热度(涨跌幅)、排名 双模式运行: API模式:直接调用东方财富API(速度快) Selenium模式:浏览器模拟(备用方案,抗检测) 自动切换:API失败时无缝切换到Selenium 防检测机制: 随机User-Agent、代理支持 执行防检测JS脚本(隐藏WebDriver特征) 广告拦截JS脚本 验证码处理框架(预留接口) 定时刷新:每10秒自动更新数据,终端实时显示
金融
多线程爬取樱花动漫视频
. 动漫视频下载器 (网站克隆工具/) 业务功能: 在樱花动漫网站搜索动漫资源 获取动漫简介、剧集列表 解析M3U8播放地址,多线程下载TS分片 自动合并为MP4视频文件 技术特点: Base64/Hex URL解密算法 多线程并发下载(可配置线程数) 集成FFmpeg视频合并 进度条实时显示下载状态
音视频 搜索

工作经历

电子商务有限公司
  
15-49人
数据抓取
2025.01 - 2025.09
公司业务电子商务,我主要用爬虫分析对手价格

教育经历

嘉兴职业技术学院
2025.09 - 2028.06
物联网
专科
相似推荐
吉林市
爬虫/脚本-爬虫/脚本
技能:C++、Python
长沙市
爬虫/脚本-爬虫/脚本
技能:Blender、Anime.js、Automake、JavaScript
忻州市
爬虫/脚本-爬虫/脚本
技能:Python
重庆市
测试-测试、爬虫/脚本-爬虫/脚本
技能:Java、Python、ActiveMQ、JMeter、Postman、Selenium IDE、LoadRunner、Oracle Database
长沙市
后端-C#、爬虫/脚本-爬虫/脚本
技能:C#、Angular、Vue
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服