15天前活跃

My.zhang

• UID:28469
综合评分 34
方向: 后端-Python
新乡市
200元/8h
10年以上经验
求职意愿:接单·不求职(15天前更新)

个人简介

一名入门级后端 Python 开发者,主攻基础爬虫与数据清洗业务,同时拥有 10 年 + 企业级 IT 项目服务经验,可承接各类远程项目。我毕业于新乡学院计算机网络技术专业,之前一直从事企业信息化系统实施与数据管理工作,深刻理解企业客户对结构化数据的需求,知道怎么把爬取的数据整理成真正能用的格式,而非单纯的技术堆砌。 目前我已掌握 Python 基础爬虫开发能力,熟练使用 Python、requests、BeautifulSoup、lxml、pandas、openpyxl 等技术栈,可承接以下公开合规的基础爬虫需求: 论坛 / 社区文章索引、官网公告批量爬取公开列表页 / 详情页数据批量提取多关键词筛选、数据去重、格式标准化清洗结果一键导出 Excel 表格 我已准备好完整可运行的项目案例,代码注释完整,配置与逻辑简单分离,您拿到手就能快速调整使用,交付后提供免费微调售后,全程严格遵守网站 robots 协议,低频率请求,合规安全。 如果您有相关的基础爬虫、数据处理需求,欢迎点击 “立即预约” 或 “发布需求” 与我联系,我会为您提供高性价比、靠谱落地的服务。

技能

核心技能:
其他技能: ParseHub、Scrapy、Selenium、Puppeteer、WebHarvy、Cheerio
交流语言: 普通话( 母语水平 )
行业经验: 内容平台

项目案例

掘⾦技术社区⽂章索引
随着掘金社区技术文章数量快速增长,用户手动筛选特定关键词(如 “AI”)的相关文章效率极低,难以快速获取目标领域的优质内容。本项目旨在开发一款自动化爬虫工具,通过模拟浏览器访问、动态加载页面、关键词过滤与数据整理,帮助用户批量获取并结构化存储符合需求的技术文章,大幅提升信息检索效率,为学习研究提供数据支持。 本工具基于 Python 开发,核心功能分为三大模块:①动态页面爬取模块,通过 SeleniumBase 模拟浏览器滚动加载,完整获取掘金后端板块的文章列表;②数据解析与过滤模块,使用 BeautifulSoup 解析 HTML,提取文章标题、作者、发布时间、阅读量等信息,并按用户设定的关键词进行不区分大小写的匹配筛选;③数据存储模块,通过 Pandas 将筛选后的结果去重并导出为 Excel 文件,方便用户后续查看与分析。 工具运行时,首先启动自动化浏览器访问掘金目标板块,通过多次模拟滚动触发页面加载,获取完整的页面源码;随后解析 HTML 中的文章条目,提取关键信息并按关键词规则过滤;接着对重复文章标题进行去重处理,确保数据唯一性;最后将清洗后的结构化数据整理为表格形式,保存为 Excel 文件并提示文件路径,用户可直接打开文件查看所有匹配结果。
内容平台

工作经历

河南中誉鼎力智能装备有限公司
  
50-200人
系统运维专员
2024.02 - 2025.11
1、日常处理维护公司在用电脑、打印机、监控、服务器等网络办公设备,对问题设备及时维护,保证设备正常使用。 2、维护金蝶软件使用,管理ERP系统,LPM系统、PDM系统的正常使用,权限管理,异常单据处理。 3、泛微OA系统的维护,处理一场流程,调整现有审批流程,增减公司需要的OA审批流程。OA系统与ERP系统的接口对接。 4、管理公司IT资产台账,管理IT相关文件。

教育经历

新乡学院
2009.09 - 2012.06
计算机网络技术
专科
相似推荐
阜阳市
爬虫/脚本-爬虫/脚本、后端-Python
技能:Python、Java
铜陵市
后端-Python、人工智能-人工智能其他
技能:Python、JavaScript、React、Vue、Docker、FastAPI、Express、Bash
汕头市
前端-Web前端、后端-Python
技能:Flutter、C#、Java
合肥市
后端-Python
技能:Python
合肥市
人工智能-AI应用开发、后端-Python
技能:FastAPI、Selenium
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服