1天前活跃

BHF

• UID:26709
综合评分 41
方向: 后端-Python 桌面端-Java桌面开发
北京市
320元/8h
1年经验
求职意愿:接单·不求职(1天前更新)

个人简介

【核心技能】 Python爬虫开发、数据采集、Excel自动化、桌面应用开发、Android App开发 【技术栈】 - 后端/脚本:Python、requests、BeautifulSoup、pandas、tkinter - 移动端:Java、Android SDK、OkHttp、Jsoup - 工具:PyInstaller、Git 【项目经验】 独立完成新闻爬虫工具开发,包括: - 电脑版:Python GUI + 爬虫 + Excel导出,打包成exe - 手机版:安卓APK,支持关键词搜索、点击跳转原文 【可接类型】 - 网页数据爬取(新闻、商品、公开数据) - Excel/CSV自动化处理 - Python脚本定制 - 简单安卓App开发 【交付方式】 提供源码或打包文件(exe/APK),附带使用说明,支持测试后付款。

技能

核心技能: Python、Java
其他技能: Android SDK、AntiCaptcha
交流语言: 普通话( 母语水平 ) 英语( 借助工具可书面交流 )
行业经验: 大数据

项目案例

爬虫工具 -新闻爬虫工具
1. 立项背景和目标: 日常需要监控特定关键词的新闻动态,但手动搜索效率低。本工具实现自动抓取联合早报新闻,支持关键词搜索和首页热闻获取,帮助用户快速获取最新资讯。 2. 软件功能、核心功能模块: - 电脑版:输入关键词,自动抓取新闻,导出Excel文件,支持打包成exe独立运行 - 手机版:安卓APK,输入关键词获取新闻列表,点击标题直接跳转浏览器阅读原文 - 支持首页热闻获取(无需关键词) - 自动去重、实时进度显示 3. 业务流程、功能路径: 用户打开软件 → 输入关键词(或点击首页按钮)→ 程序抓取新闻 → 显示结果列表 → 电脑版导出Excel,手机版点击跳转原文
大数据
Web应用 / 数据分析工具-微软新闻词云分析系统
软件功能、核心功能模块的介绍 本系统包含四大核心功能模块: (1)新闻数据采集模块:基于Requests和BeautifulSoup库实现网络爬虫,能够从微软新闻网站(news.microsoft.com)自动抓取最新新闻标题和正文内容。该模块具备多级容错机制,当网络异常或页面结构变化时,自动切换至备用数据源,确保系统稳定运行。 (2)中文分词与关键词提取模块:使用Jieba分词库对采集的新闻文本进行精确分词,结合自定义停用词库(包含200余个虚词和常见词),过滤掉无实际意义的词语。通过Counter工具进行词频统计,提取出现频率最高的关键词作为分析基础。 (3)词云可视化生成模块:基于WordCloud库将关键词数据转化为可视化词云图片。该模块实现了跨平台字体自动检测功能,优先使用黑体、微软雅黑等中文字体确保中文正常显示,并设计了PIL备用方案作为最终保障。 (4)Web应用与交互模块:采用Flask框架构建轻量级Web服务,提供RESTful API接口。前端采用响应式设计,支持PC端和移动端访问。用户点击生成按钮后,系统异步执行后台任务,通过状态轮询机制实时反馈处理进度,最终展示词云图片和关键词分析结果。 3、业务流程、功能路径描述 用户访问系统首页(http://127.0.0.1:5050),页面展示控制面板和词云展示区。用户点击“开始抓取新闻并生成词云”按钮后,系统触发后台异步任务:首先启动爬虫模块访问微软新闻网站,抓取15条最新新闻的标题和正文内容,合并生成约5000-10000字符的文本数据;随后调用分词模块对文本进行切词和停用词过滤,统计出前100个高频关键词;接着调用词云生成模块,根据词频数据生成800×600像素的词云图片并保存至static目录;最后更新处理状态为完成。前端通过每2.5秒轮询状态接口,实时显示“抓取中”、“分析中”、“生成中”等进度信息,任务完成后自动加载词云图片并展示关键词列表。整个流程约1-2分钟,用户无需等待即可获得可视化分析结果。
大数据 智慧数字孪生
基于Java Swing的教务管理平台-学生信息管理系统
1、立项背景和目标 随着高校招生规模不断扩大,学生信息管理面临数据量大、查询效率低、信息更新滞后等问题。传统的人工管理或Excel表格方式已无法满足现代化教务管理需求。本项目旨在开发一套基于Java Swing的学生信息管理系统,实现学生信息的电子化、自动化管理。系统采用图形化界面,支持学生信息的增删改查、多维度查询和统计分析功能,同时实现MySQL数据库与TXT文件双重数据存储,确保数据安全可靠。目标是建立一个操作简单、功能完整、运行稳定的学生信息管理平台,提高教务管理效率,为高校信息化建设提供技术支持。 2、软件功能、核心功能模块的介绍 本系统包含四大核心模块: (1) 学生信息管理模块:实现学生信息的完整生命周期管理,包括学号、姓名、年龄、性别、籍贯、年级、专业等7个核心字段的增删改查操作。支持字段合法性验证,如学号格式验证(8位数字)、年龄范围验证(1-99岁)、性别验证(男/女)等。 (2) 数据存储模块:采用MySQL数据库与TXT文件双存储机制,所有操作自动同步到两种存储介质。数据库负责高效查询和复杂统计,文件作为备份确保数据在数据库异常时可恢复。系统初始包含200条以上测试数据。 (3) 查询展示模块:支持三种查询方式:全部学生展示、按专业筛选、按年级筛选。查询结果实时显示在表格中,支持快速定位目标学生群体。 (4) 统计分析模块:提供多维度的数据统计功能,包括年龄分布统计(分段统计:18-20岁、21-23岁、24-26岁、27岁以上)、男女比例统计(显示人数和百分比)、籍贯分布统计(各地人数排名),帮助管理者掌握学生整体情况。 3、业务流程、功能路径描述 用户启动系统后,进入主界面三个标签页: 管理页面:用户可查看所有学生列表,选择表格中的学生自动填充表单,点击“添加”可录入新学生信息(系统自动验证字段合法性),点击“更新”可修改选中学生信息,点击“删除”需二次确认后删除记录。所有操作实时同步到数据库和文件。 查询页面:用户选择查询类型(全部/按专业/按年级),输入查询条件后点击“查询”,系统执行SQL查询并在表格中展示结果,同时弹出查询结果数量提示。 统计页面:用户点击“刷新统计”按钮,系统从数据库读取数据并计算年龄分布、性别比例、籍贯分布,以文本形式清晰展示统计结果,帮助管理者快速掌握学生构成。
大数据

工作经历

自由开发者
  
5人以下
Python开发工程师
2025.03 - 2026.03
负责Python爬虫开发、数据处理脚本编写、桌面应用开发;完成新闻爬虫工具(电脑版+手机版)项目,支持关键词搜索、Excel导出、安卓APK打包

教育经历

北京印刷学院
2023.09 - 2027.06
自动化
本科
相似推荐
北京市
后端-Python、爬虫/脚本-爬虫/脚本
技能:Python、Beautiful Soup、JavaScript、Vue、Scrapy、Robot Framework、Selenium WebDriver
上海市
后端-Python、前端-Web前端
技能:Python
北京市
后端-Java、后端-Python
技能:Kubernetes、PyAutoGUI
成都市
前端-Web前端、后端-Python
技能:React、Vue、Chart.js、TypeScript、JavaScript
长沙市
后端-Python、前端-Web前端
技能:Django、MySQL Workbench、Vue
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服