程序聚合 程序员 七夕不起早
30天前活跃

七夕不起早

• UID:15704
综合评分 33
方向: 爬虫/脚本-爬虫/脚本
邵阳市
200元/8h
1年经验
求职意愿:接单·(30天前更新)

个人简介

熟悉web,app爬虫 熟悉数据分析

技能

核心技能: Python
其他技能:
交流语言: 普通话( 母语水平 )
行业经验: 在线教育 医疗健康 大数据 电商

项目案例

全网招聘信息分布式智能爬取系统
智能源码抓取引擎:​​基础抓取层​​使用定制化Requests组件发送请求,植入动态请求头(包含自动轮换的User-Agent池和Cookies策略)​​渲染层​​自动切换到Playwright无头浏览器执行智能渲染,遇到瑞数反爬等​​则通过单独编写spider进行数据爬取 智能分级清洗系统:首先进行标题的规则匹配,建立多维度匹配规则库(正则表达式+关键词权重算法),通过时间维度,关键词,排除此,联合词等规则进行权重匹配,如含有排除词考编等则直接排除,含有关键词两个如教师,招聘则通过一轮筛选;接着是公告内容解析清洗,使用XPath/CSS定位主体容器,避开干扰区块(广告/侧边栏/评论区),接着仍然使用正则和关键词权重进行确认是否为招聘信息 数据存储:在进行源码抓取以及清洗的时候进行实时数据标注,(如 JS渲染标注,反爬识别),同时也保存url的访问状态码等信息,最后将url以及相关信息存入Redis中间件中进行hash去重,确保数据不重复,接着存入Mysql中完成最后的数据保存。
在线教育 大数据

工作经历

长沙麦都网络有限公司
  
501-1000人
爬虫工程师
2025.03 - 2025.06
提供考编考公求职信息

教育经历

湖南交通工程学院
2021.09 - 2025.06
数据科学与大数据技术
本科
相似推荐
乌鲁木齐市
爬虫/脚本-爬虫/脚本、后端-Python
技能:Python
成都市
后端-Python、爬虫/脚本-爬虫/脚本
技能:Python、Oracle Database、Node.js、Vue
北京市
爬虫/脚本-爬虫/脚本、后端-Go
技能:Django、Gin、Gorm、Qt、Python、Go、React、Vue、Selenium
南京市
人工智能-AI应用开发、爬虫/脚本-爬虫/脚本
技能:PyTorch
南昌市
数据库工程师-数据库、爬虫/脚本-爬虫/脚本
技能:ActiveMQ、JavaScript、.NET Core
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服