爬虫/脚本 软件定制 案例

股票爬取-股票爬取
在金融数据需求不断增长的背景下,股票数据爬取工具应运而生,为投资者、金融分析师、研究人员及相关机构提供了获取多维度股票数据的便捷途径。这类工具具备丰富且强大的功能,以满足不同用户在股票分析、投资决策、策略研究等方面的需求。
金融
Python
Android-Liveme
超低延迟直播 基于改造版WebRTC搭建传输层,通过动态码率调整(DRA)和FEC前向纠错,在东南亚弱网环境下将卡顿率降低至5%以下 独创「区域中继节点」方案:根据用户IP自动选择土耳其/新加坡中转服务器,跨国连麦延迟稳定在800ms内 3D虚拟礼物系统 采用GLSurfaceView+骨骼动画实现轻量化渲染,单个礼物资源包控制在3MB内 礼物队列熔断机制:当GPU温度>75℃时自动降级为2D渲染,崩溃率下降70% 跨服PK竞技场 基于Socket长连接实现实时比分同步,使用差分压缩协议(Delta Encoding)减少60%数据传输量 动态负载均衡:根据实时在线人数自动扩容AWS EC2实例
音视频、社交
Java、Kotlin、AndroidX...
微信小程序-瓷典通
核心模块: 智能查询: 支持釉色/纹饰/年代多维度筛选 模糊搜索(如"青花缠枝莲纹")联想补全 AI鉴瓷: 拍照识别瓷器特征,输出年代概率分布 生成可视化鉴定报告(含相似馆藏对比) 收藏社区: 用户创建个人瓷器库,支持添加自定义标签 同好圈层交流(带鉴权的内容发布系统) 功能路径: 首页 → [拍照识别] → 结果页 ↔ 收藏夹 ↘ [文字搜索] → 详情页 ↔ 分享
社交
Java、PowerShell、Pyth...
基于mediapipe的手势识别结合pyautogui库控制鼠标点击和移动
这款鼠标隔空手势识别系统,让你摆脱物理鼠标束缚,用手势掌控数字世界。通过摄像头捕捉手部动作,精准识别食指移动、拇指点击、握拳拖动等指令,抬手间完成光标定位、左右键操作。基于MediaPipe手部追踪与OpenCV图像处理,响应灵敏,适配多种场景。无论是办公演示中隔空翻页,还是寒冬里蜷在被窝操作电脑,都能带来无接触的流畅体验,重新定义人机交互的便捷与自由。
人工智能
Python
图片坐标自动化识别
1.图像路径输入:在控制台输入图像路径,程序读取并预处理图像、检测红点。 2.坐标轴标定:在弹出的 Matplotlib 窗口中,依次点击 4 个坐标轴点(x 起点、x 终点、y 起点、y 终点),点击后控制台会提示已标定的点。 3.命令行选坐标系:4 个点标定完成后,控制台会让你分别为 X 轴和 Y 轴选择坐标系(输入1选直角,2选指数)。 4.输入物理范围:选择完坐标系,按提示输入 X、Y 轴的物理最小值和最大值。 5.输出结果:控制台打印红点物理坐标,同时弹出新图标记坐标,方便核对。
人工智能
Python
数据分析-后端工程
通过模块与数据结构框架,对多功能系统进行统一整合,比如,对数据的读写能力与整理分析能力进行模块化与结构化,然后通过算法及算法优化对相关函数功能进行整合,实现高效与高质量。用户可在使用过程中感受到兼具效率与质量的使用感受。
人工智能、金融
Python、Jython
小米公司RPA项目
根据指定站点的数据位置,进行获取指定的机型信息,填写到表格内,进行一些分析操作后将结果写入到数据库供人工审核,最终实现为并行获取多个站点的多个机型的数据信息并分析出结果后保存到数据库
电商
Python、SQL、Pandas
植物大战僵尸简化版
太阳生成,角色配置,互动,数值的增加以及角色形象改变,太阳生成,角色配置,互动,数值的增加以及角色形象改变太阳生成,角色配置,互动,数值的增加以及角色形象改变。太阳生成,角色配置,互动,数值的增加以及角色形象改变
游戏/电竞
Python
舆情监督系统
1.数据爬取:根据给定的网页集合,定期的爬取最新的数据,供工作人员查看梳理; 2.模拟登录:模拟登录功能, 可以从爬取的新闻处一键跳转到指定的网页进行登录、自动校验图形验证码。登录成功后,模拟表单填报,自动将该条新闻内容上传,并提交。
企业内部管理
Python
toc平台电商APP-淘宝
1、用于分析市场趋势、竞争对手动态,电商监控价格波动 ‌ 2、通过预设规则自动访问网页并处理数据,替代人工操作。例如通过爬虫批量获取电商平台的数据进行大数据分析,效率显著提升。 数据采集与处理 通过模拟浏览器请求获取网页内容,支持HTTP/HTTPS协议,可自定义请求头(如User-Agent)规避反爬机制。解析HTML页面时,使用正则表达式或DOM解析库(如BeautifulSoup)提取指定数据(如文本、图片链接、商品价格等),并将结果存储为文本、数据库或特定格式文件。
大数据
Python
全网招聘信息分布式智能爬取系统
智能源码抓取引擎:​​基础抓取层​​使用定制化Requests组件发送请求,植入动态请求头(包含自动轮换的User-Agent池和Cookies策略)​​渲染层​​自动切换到Playwright无头浏览器执行智能渲染,遇到瑞数反爬等​​则通过单独编写spider进行数据爬取 智能分级清洗系统:首先进行标题的规则匹配,建立多维度匹配规则库(正则表达式+关键词权重算法),通过时间维度,关键词,排除此,联合词等规则进行权重匹配,如含有排除词考编等则直接排除,含有关键词两个如教师,招聘则通过一轮筛选;接着是公告内容解析清洗,使用XPath/CSS定位主体容器,避开干扰区块(广告/侧边栏/评论区),接着仍然使用正则和关键词权重进行确认是否为招聘信息 数据存储:在进行源码抓取以及清洗的时候进行实时数据标注,(如 JS渲染标注,反爬识别),同时也保存url的访问状态码等信息,最后将url以及相关信息存入Redis中间件中进行hash去重,确保数据不重复,接着存入Mysql中完成最后的数据保存。
在线教育、大数据
Python、SQL
数据采集
主要功能有: 1、js加解密算法分析 2、数据请求 3、验证码智能识别系统 4、数据ETL处理管线 5、数据入库 6、多级代理IP轮换机制 7、自适应反爬对抗策略(随机User-Agent轮换;TLS指纹伪装;请求头参数加密;随机操作延迟(0.5-3s);鼠标移动轨迹模拟;页面停留时间控制) 8、分布式任务调度支持
电商、内容平台
JavaScript、Python
基于数据挖掘的社交网络用户行为分析与可视化
主要围绕社交网络用户行为分析数据可视化进行研究,本设计依靠着Python语言强大的功能及丰富的库来搭建一套完整的数据处理与分析体系,为了方便对数据处理流程进行妥善管理与交互使用Django框架构建了一个Web网站。该网站利用爬虫技术在微博上收集用户行为数据,其中包含用户发布的内容和互动记录等多方面信息。这些数据经过清洗和预处理之后存储到MySQL数据库中既能保障数据的安全又便于后续使用。系统采用聚类分析方法等数据挖掘算法来解析用户行为模式挖掘用户兴趣偏好、社交关系等关键信息。根据分析结果利用可视化工具将大量数据以直观、易懂的图表形式呈现在网站上,比如柱状图、折线图、网络图等,这样可以帮助用户清晰把握社交网络用户行为特征。本研究能够为社交平台完善服务体系、帮助企业把握营销策略,提供可靠的数据支撑以及有针对性的决策参考。 研究分析结果以直观的柱状图、折线图、网络图等可视化呈现,助力清晰洞察用户行为特征,为社交平台优化服务、企业精准营销提供有力的数据支撑,在实际应用中具有一定推广价值。
大数据
Python、Django、SQLite...
股票分析系统
主要功能:行情数据发送,行情数据接收,高速数据处理,每分钟上百兆的数量处理量,多维分析手段,方便分析师从任意角度提取和分析数据,数量大,速度要求很快。数据复杂,所以需要展现的元素都得进入分析界面。界面展示丰富。
金融
C++、Delphi/Object Pa...
各项零散爬虫项目
1.并行进行爬虫,并可有终止自启功能 2.按用户需求所需要格式组织成csv、json等 3.自动爬取 4.自动纠错 5.多尺度灵活爬取,不同空间、时间、范围 6.支持百度、高德多平台爬取 7.可根据指定渠道爬取 8.支持多层级深入爬取
出行
Python、Selenium WebD...
智慧发改项目
智能辅助子系统为上层业务系统的高效运转与便捷操作提供技术支撑底座,建设综合知识图谱、智能服务引导、重点片区BIM应用服务、重点项目倾斜摄影建模及统一对象存储管理。知识图谱工具为用户智能检索和问答交互提供服务,建立产业政策、发展规划之间的关联图谱,为龙华区发改局的政策检索、政策制定等提供智库参考;智能服务引导模块为用户提供智能的操作指引,特别针对项目申报、专项资金申报等复杂业务流程,在相应环节给出流程指引,可以提高各项目环节的工作效率;重点片区BIM应用以全景视角建模进行展示地理空间信息,展示全区六大重点片区的发展全面及配套规划;重点项目的无人机倾斜摄影服务,对北站国际商务区内的重点项目进展定期进行航拍建模,辅助片区的可视管理与三维展示;多统一对象存储管理用于项目资料、过程审批文件等多媒体资料的集中存储、权限管理、版本管理和同步服务等,以便智能便捷地归档文件资料
智慧数字孪生
Java、Vue
小红书评论爬取加主页访问-小红书
根据需求使用浏览器自动化工具爬取评论内容和评论人名以及评论时间,对于个人小红书号和所在ip则使用request请求并发访问获取数据,整个脚本除了浏览器初始启动外全部采用人工翻页加监听器捕获请求获取数据,最大程度模拟真人操作避免反爬。最终获取1万多条有效数据
电商、内容平台
Robot Framework、Scra...
excel导入mysql
1,整体来说一个模块调用mysql的api,得到当前数据库的权限 2,另一个模块来控制文本,从文本文件中截取文本,然后调用第一个模块来插入,修改数据库 3,不仅可以excel,还可以csv等文本。 4,其实他不仅可以利用musql,只需要小小改动导入到别的数据库依旧可以
产业互联网
Bash、MySQL Workbench
基于机器翻译的脚本-终端翻译
1,第一个模块得到包含翻译结果的json,第二个模块调用第一个模块并处理第一个模块的返回值 2,可以根据需求进行更改,比如想把整个终端的英文全替换了都可以,重定向到另一个文本中,处理后在输出到终端
生活服务
Bash、CMake、GCC
tb数据采集
解决了获取数据的参数逆向解密 使用分布式爬虫,解决同ip的多线程爬取的限制 使用redis的临时存储,提高采集存储效率 使用生产-消费的队列机制,可以防止重复采集,漏采,以及中断后继续采集 提供查询数据,调取数据的功能
电商
Python
  • 1
  • 2
  • 3
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服