24小时内活跃

啦啦啦

• UID:30374
综合评分 34
方向: 后端-Python 爬虫/脚本-爬虫/脚本
北京市
300元/8h
1年经验
求职意愿:接单·不求职(1天前更新)

个人简介

计算机专业毕业,可独立完成各种项目开发

技能

核心技能:
其他技能: Python
交流语言: 普通话( 母语水平 )
行业经验: 云计算 区块链 大数据 农业

项目案例

java赛事爬虫
## 一、项目概述 本项目是一个基于 Java 的**东京奥运会(2020)赛事数据爬虫与可视化系统**,以新浪体育东京奥运专题页面(`http://2020.sina.com.cn/`)为数据来源,自动抓取奥运**新闻资讯**和**中国代表团各项目奖牌数据**,持久化存储至本地 MySQL 数据库,并通过图形化桌面界面(Java Swing)进行数据展示与查询。 --- ## 二、业务背景 东京奥运会于 2021 年 7 月 23 日至 8 月 8 日举行(因疫情延期一年)。新浪体育为此开设了专题页面,提供实时新闻报道和各项目奖牌查询 API。本项目通过爬虫技术对上述数据进行采集,服务于以下业务场景: - **赛事跟踪**:快速聚合奥运新闻,方便集中浏览。 - **奖牌统计**:自动汇总中国代表团在射击、乒乓球、举重、跳水等 13 个重点项目的金/银/铜牌数量。 - **数据查询**:支持按关键词检索新闻标题和赛事名称,实现快速定位。 --- ## 三、系统功能介绍 ### 3.1 主界面 — 爬虫启动 | 功能 | 说明 | |------|------| | **一键爬取** | 点击"开始爬取"按钮,系统自动清空旧数据并重新采集 | | **新闻采集** | 抓取新浪奥运首页的新闻链接,逐条进入详情页提取完整内容 | | **奖牌采集** | 依次调用新浪奥运奖牌 API,获取 13 个运动项目的实时奖牌数据 | | **进度反馈** | 控制台打印"....."进度提示;采集完成后弹出"爬取成功"对话框 | | **自动跳转** | 成功后自动关闭启动窗口,打开"奥运数据一览"展示窗口 | ### 3.2 数据展示界面 — 奥运数据一览 #### Tab 1:新闻信息 | 功能 | 说明 | |------|------| | **列表展示** | 以表格展示所有新闻的标题、发布时间、发布者、正文内容 | | **关键词搜索** | 在搜索框输入新闻标题关键词,点击"查询"进行模糊匹配过滤 | | **实时刷新** | 界面加载时自动从数据库读取最新数据 | #### Tab 2:奖牌信息 | 功能 | 说明 | |------|------| | **列表展示** | 以表格展示 13 个运动项目的金牌、银牌、铜牌合计数 | | **关键词搜索** | 支持按赛事名称(如"乒乓球")进行模糊查询 | | **实时刷新** | 组件渲染时自动加载数据库记录 | **涵盖的 13 个赛事项目:** > 射击、篮球、三对三篮球、田径、游泳、乒乓球、羽毛球、举重、跳水、蹦床、竞技体操、艺术体操、赛艇
大数据

工作经历

教育经历

中国农业大学
2020.09 - 2024.06
计算机科学与技术
本科
相似推荐
临沂市
爬虫/脚本-爬虫/脚本
技能:Selenium
南京市
后端-Go、后端-Python
技能:Go、Ray、Python、Google Kubernetes Engine
桂林市
游戏开发-游戏开发其他、后端-Python
技能:C++、Python
天津市
后端-Java、后端-Python
技能:Java
北京市
爬虫/脚本-爬虫/脚本、后端-Python
技能:Java、Python、SQLite
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服