5天前活跃

无名客

• UID:13726
综合评分 34
方向: 爬虫/脚本-爬虫/脚本 爬虫/脚本-爬虫/脚本
广州市
500元/8h
1-3年经验
求职意愿:接单·不求职(5天前更新)

个人简介

本人擅长python爬虫,js逆向.就是这样

技能

核心技能:
其他技能: Python、JavaScript
交流语言: 普通话( 母语水平 )
行业经验: 生活服务

项目案例

InterPro网站抓取程序
1. 立项背景和目标 背景:在生物信息学和蛋白质研究领域,研究人员经常需要从专业数据库中获取蛋白质家族、结构域和功能位点的系统分类信息。EBI InterPro数据库整合了多个蛋白质家族数据库,是重要的生物信息学资源。 目标:开发一个高效、稳定的数据采集系统,能够自动化地从InterPro数据库爬取特定蛋白质家族的全方位信息,包括分类层级关系、结构域重叠情况、相关文献等,为生物医学研究提供数据支持。 2. 软件功能和核心功能模块 核心功能模块: ① 父级数据采集模块 根据用户指定的蛋白质家族名称进行搜索 自动处理分页和翻页逻辑 提取顶级蛋白质家族的accession编号和名称 ② 子级数据采集模块 针对每个父级蛋白质家族,获取其下属的所有子分类 处理子级页面的分页机制 建立父子层级关系映射 ③ 详情数据提取模块 深入爬取每个具体蛋白质条目的详细信息 提取包括ID、名称、短名称、重叠同源超家族、结构域关系和相关文献等关键数据 ④ 数据存储模块 支持Excel和CSV双格式存储 结构化保存爬取结果 支持增量爬取和断点续传
内容平台

工作经历

霹雳网络技术有限公司
  
5人以下
爬虫工程师
2024.01 - 2024.03
我逆向写代码负责抓取数据

教育经历

先进计算科学学院
2020.11 - 2023.11
专科
相似推荐
濮阳市
后端-C++、爬虫/脚本-爬虫/脚本
技能:C++、Python
亳州市
爬虫/脚本-爬虫/脚本、低代码-低代码
技能:PyAutoGUI
北京市
前端-小程序、爬虫/脚本-爬虫/脚本
技能:Python
邢台市
爬虫/脚本-爬虫/脚本
技能:AntiCaptcha
沈阳市
后端-Python、爬虫/脚本-爬虫/脚本
技能:Java、Python
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服