5天前活跃

范希文

• UID:24867
综合评分 33
方向: 数据库工程师-数据库 爬虫/脚本-爬虫/脚本
南阳市
200元/8h
1年经验
求职意愿:接单·不求职(5天前更新)

个人简介

我是范希文,一名专注Python爬虫与数据处理的自由开发者。 独立完成过“足彩14场数据采集”项目,从0到1解决了网站改版、动态数据提取、自动跨年采集等实际问题。熟练掌握 requests、lxml、pandas、XPath,能快速从网页中提取结构化数据并整理为Excel报表。 擅长技能:Python爬虫、数据清洗、自动化脚本、Excel处理。乐于沟通,按时交付。 如果您有数据采集、网页信息提取、Excel自动化处理等需求,欢迎联系。

技能

核心技能: Python
其他技能: Apache Nutch
交流语言: 普通话( 母语水平 ) 英语( 无需工具可书面交流 )
行业经验: 搜索 企业服务(saas) 大数据

项目案例

Python足彩数据采集与清洗系统
【立项背景】客户需要获取近两年中国体育彩票“14场胜负”游戏的详细开奖数据,包括每期14场比赛的场次编号、对阵球队、赔率、比赛结果以及大奖金额,用于数据分析和研究。由于该数据无官方API且分散在多个网页,手动收集效率极低,因此开发此自动化采集工具。 【核心功能】 1. 自动采集:根据用户输入的起始和结束期号,循环请求目标网站获取每一期详细页面。 2. 数据解析:从HTML中提取14场比赛的主队、客队、比分、百家平均赔率(胜/平/负)以及开奖奖金信息。 3. 数据清洗:将比分自动转换为标准赛果(3/1/0),从赔率字符串中拆分出胜、平、负三列,处理缺失数据。 4. 自动跨年:支持期号自动跳转(如从25年最后一期跳至26年第一期),实现连续采集无需人工干预。 5. 数据导出:将多期数据合并后导出为一份完整的Excel文件。
内容平台 大数据

工作经历

自由职业
  
5人以下
Python工程师
2024.09 - 2026.02
Python工程师(爬虫、数据清洗、Pandas、requests、lxml,数据框架化编辑)

教育经历

南阳师范学院
2025.09 - 2026.02
地理科学类
本科
相似推荐
吉林市
爬虫/脚本-爬虫/脚本
技能:C++、Python
长沙市
爬虫/脚本-爬虫/脚本
技能:Blender、Anime.js、Automake、JavaScript
忻州市
爬虫/脚本-爬虫/脚本
技能:Python
昆明市
数据库工程师-数据库
技能:Microsoft SQL Server、Oracle Database、Oracle、WebLogic、Oracle SQL Developer
重庆市
测试-测试、爬虫/脚本-爬虫/脚本
技能:Java、Python、ActiveMQ、JMeter、Postman、Selenium IDE、LoadRunner、Oracle Database
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服