个人简介
资深Python爬虫工程师,5年数据采集与逆向工程实战经验。精通Scrapy、Playwright等主流爬虫框架,擅长JS逆向、AST解混淆、App脱壳、反爬对抗等技术领域。独立设计并实现过日采百万级的分布式采集系统,对代理IP池调度、验证码识别、浏览器指纹伪装有深入研究和丰富的落地经验。同时具备全栈开发能力,熟悉Vue.js + Django技术栈,能独立完成从数据采集、清洗、存储到可视化分析的全链路开发。热爱技术钻研,GitHub上维护多个开源逆向工具,技术博客累计阅读量50万+。
核心技术:Python, JavaScript, SQL
爬虫框架:Scrapy, Scrapy-Redis, PySpider, Colly
逆向分析:JS AST解混淆, Xposed/Frida Hook, IDA Pro, JADX, Charles/Fiddler抓包
浏览器自动化:Playwright, Selenium, Puppeteer
反爬对抗:TLS指纹伪装, 验证码识别(ddddocr/深度学习), IP代理池, Cookie池
数据存储:MySQL, Redis, Elasticsearch, MongoDB
前端:Vue.js 3, Element Plus, ECharts, TypeScript
后端:Django REST Framework, FastAPI, Celery
运维:Docker, Nginx, Linux, Git, CI/CD