My.zhang

• UID:28469

综合评分 34

方向：后端-Python

新乡市

200元/8h

10年以上经验

求职意愿：接单·不求职(15天前更新)

个人简介

一名入门级后端 Python 开发者，主攻基础爬虫与数据清洗业务，同时拥有 10 年 + 企业级 IT 项目服务经验，可承接各类远程项目。我毕业于新乡学院计算机网络技术专业，之前一直从事企业信息化系统实施与数据管理工作，深刻理解企业客户对结构化数据的需求，知道怎么把爬取的数据整理成真正能用的格式，而非单纯的技术堆砌。目前我已掌握 Python 基础爬虫开发能力，熟练使用 Python、requests、BeautifulSoup、lxml、pandas、openpyxl 等技术栈，可承接以下公开合规的基础爬虫需求：论坛 / 社区文章索引、官网公告批量爬取公开列表页 / 详情页数据批量提取多关键词筛选、数据去重、格式标准化清洗结果一键导出 Excel 表格我已准备好完整可运行的项目案例，代码注释完整，配置与逻辑简单分离，您拿到手就能快速调整使用，交付后提供免费微调售后，全程严格遵守网站 robots 协议，低频率请求，合规安全。如果您有相关的基础爬虫、数据处理需求，欢迎点击 “立即预约” 或 “发布需求” 与我联系，我会为您提供高性价比、靠谱落地的服务。

技能

核心技能：

其他技能： ParseHub、Scrapy、Selenium、Puppeteer、WebHarvy、Cheerio

交流语言：普通话（母语水平）

行业经验：内容平台

项目案例

掘⾦技术社区⽂章索引

随着掘金社区技术文章数量快速增长，用户手动筛选特定关键词（如 “AI”）的相关文章效率极低，难以快速获取目标领域的优质内容。本项目旨在开发一款自动化爬虫工具，通过模拟浏览器访问、动态加载页面、关键词过滤与数据整理，帮助用户批量获取并结构化存储符合需求的技术文章，大幅提升信息检索效率，为学习研究提供数据支持。本工具基于 Python 开发，核心功能分为三大模块：①动态页面爬取模块，通过 SeleniumBase 模拟浏览器滚动加载，完整获取掘金后端板块的文章列表；②数据解析与过滤模块，使用 BeautifulSoup 解析 HTML，提取文章标题、作者、发布时间、阅读量等信息，并按用户设定的关键词进行不区分大小写的匹配筛选；③数据存储模块，通过 Pandas 将筛选后的结果去重并导出为 Excel 文件，方便用户后续查看与分析。工具运行时，首先启动自动化浏览器访问掘金目标板块，通过多次模拟滚动触发页面加载，获取完整的页面源码；随后解析 HTML 中的文章条目，提取关键信息并按关键词规则过滤；接着对重复文章标题进行去重处理，确保数据唯一性；最后将清洗后的结构化数据整理为表格形式，保存为 Excel 文件并提示文件路径，用户可直接打开文件查看所有匹配结果。

内容平台

工作经历

河南中誉鼎力智能装备有限公司

50-200人

系统运维专员

2024.02 - 2025.11

1、日常处理维护公司在用电脑、打印机、监控、服务器等网络办公设备，对问题设备及时维护，保证设备正常使用。 2、维护金蝶软件使用，管理ERP系统，LPM系统、PDM系统的正常使用，权限管理，异常单据处理。 3、泛微OA系统的维护，处理一场流程，调整现有审批流程，增减公司需要的OA审批流程。OA系统与ERP系统的接口对接。 4、管理公司IT资产台账，管理IT相关文件。