根据用户需求采集各大平台数据,设计网络数据分析、js逆向、加密解密算法、验证码识别、模拟网络请求等多种技术。
主要功能有:
1、js加解密算法分析
2、数据请求
3、验证码智能识别系统
4、数据ETL处理管线
5、数据入库
6、多级代理IP轮换机制
7、自适应反爬对抗策略(随机User-Agent轮换;TLS指纹伪装;请求头参数加密;随机操作延迟(0.5-3s);鼠标移动轨迹模拟;页面停留时间控制)
8、分布式任务调度支持
全部由本人完成,主要使用python语言实现,使用的技术栈有:网页结构分析、数据流分析、数据加解密分析、验证码识别技术、数据清洗和入库、数据可视化等。