程序聚合软件案例根据特定关键词抓取图片，并进行图片清洗

根据特定关键词抓取图片，并进行图片清洗

NightShadow

2026-04-11 19:43:52

行业：人工智能

载体：爬虫/脚本

技术：Python

业务和功能介绍

根据给定的几个关键词，从网络上抓取不少于1000张图片，且图片大小符合特定尺寸，抓取后对所有图片进行去重，计算清晰度并排序，接着将每张图片的大小都缩放到特定尺寸,并按照特定规则命名，打包即可

项目实现

icrawler: 核心爬取引擎
opencv-python & pillow: 图片处理 (尺寸、格式等)
imgdd: 高性能图片去重
cleanvision: 自动检测模糊、曝光异常等质量问题
pandas: 用于管理去重和检测后的文件清单

完整性检测：尝试用 OpenCV 读取图片，任何读取失败的都被视为损坏文件，立即删除。
格式与尺寸统一：
对于能够打开的图片，使用 Pillow 将其转换为 RGB 三通道的 JPG 格式。
缩放处理：保持原图比例，将长边统一缩放至特定尺寸。
对所有图片进行哈希比对，识别并删除内容完全相同或高度相似的图片。
图片模糊检测 (使用 cleanvision)：利用 cleanvision 的 find_issues() 功能扫描所有图片，它会返回一个包含 "blurry", "dark", "low_information" 等标签的报告。

示例图片视频

NightShadow

30天前活跃

方向：爬虫/脚本-爬虫/脚本、

交付率：100.00%

查看主页

面向会议记录、工业对讲、人机交互及嵌入式智能终端在风扇、空调、键盘敲击和室内混响等噪声环境下的语音采集需求，设计并实现一套基于GD32H759IMT6微控制器的边缘语音降噪系统。系统通过ES7210音频采集模块、SAI和DMA连续获取48 kHz多通道音频，在本地完成通道选择、音量统计、短时傅里叶变换、频带特征提取、神经网络推理、频谱掩蔽和语音重建，无需依赖云端服务器。系统支持RAW原始音频、RNNoise对照降噪和自研CRN降噪三种工作模式，可通过触摸屏完成模式切换、输入通道选择、增益调整、开始或停止录音以及屏幕截图。LCD实时显示原始与降噪波形、音量、模型状态、录音时间、缓存状态和输出文件名；TF卡可保存原始WAV录音、CRN降噪音频及LCD截图，形成“音频采集—边缘推理—效果显示—文件保存”的完整闭环。

图片数据智能提取

本程序用于信息录入场景，可将截图内容整理为规范表格。先借助 OCR 识别提取截图内图文原始信息，再调用大模型 API，按预设规则完成数据筛选与结构化解析，属于专用数据格式提取脚本。支持自定义提取规则灵活适配不同业务需求，可按需调整输出模板，高效完成图片信息标准化导出，大幅减少人工录入整理工作量。

excel智能体

立项背景与目标：日常办公中，表格合并、文档处理、数据看板生成等重复性工作耗时且门槛高。雪球旨在利用大语言模型的自然语言理解能力，让用户通过一句话即可完成复杂办公任务，实现"对话即操作"的智能办公体验。软件功能与核心模块：平台围绕四大模块构建——表格处理引擎（JOIN联查、批量填充、分组聚合、拆分合并）、文档处理引擎（Word改写/模板填充、PDF提取/拆分/合并、PPT生成）、BI看板生成器（11种ECharts图表，支持HTML/PNG/PDF/PPT导出）和PPT自适应渲染引擎（四级降级策略）。所有工具通过DeepSeek Agent统一调度。业务流程与功能路径：用户自然语言输入 → Agent解析意图并编排步骤 → 自动调用工具链执行 → SSE流式返回执行进度与结果 → 任务快照持久化存档。全程支持审计日志脱敏和中断恢复，确保数据安全与操作可追溯。

基于多智能体与知识图谱的复杂知识分析平台

1. 立项背景和目标面向复杂知识问答、多步任务拆解和证据驱动分析场景，搭建统一的 AI Agent 平台。旨在解决传统问答系统在复杂任务中可分解性不足、证据链不可追溯、文档与图谱数据割裂、模型选型缺乏统一评测等痛点，降低知识密集型分析任务的人工操作成本。 2. 核心功能模块多智能体协作：采用 planner -> dispatcher -> summary 主链路，支持任务拆解、依赖编排和拓扑执行。知识检索与定位：集成文档多格式解析、片段级检索、页级定位及 Neo4j 知识图谱 Cypher 检索。评测与选型底座：支持对不同模型、提示词策略和子代理组合进行横向对比与流程稳定性观察。前端工作台：支持多会话聊天、模型参数配置、执行轨迹面板、知识图谱可视化及结果下载。 3. 业务流程与功能路径用户上传多格式文档或输入复杂分析任务 -> 系统提取分析并构建图谱 -> 多智能体协作编排并调度任务（子代理执行文档精读和图谱检索） -> 聚合生成可追溯、可信的结构化报告或演示文稿 -> 通过 SSE 流式反馈、渲染任务轨迹并展示给前端。

豪视界-AI 图像处理平台

AI 图像处理平台（"流行智能"后更名"豪视界"） —— 一个面向电商卖家的 SaaS 化 AI图像处理工具站。核心业务逻辑:卖家上传商品图,平台调用多个 AI引擎完成换背景、生成模特图、扩图/高清/去水印等处理,按张扣积分,处理结果存云端图库。支撑业务的系统能力 - 账户体系:邮箱/手机注册登录、JWT 鉴权、图形验证码、访客可浏览(登录才可下单) - 积分计费系统:注册赠送 100 积分、按任务类型差异化定价(可后台配置)、消费流水记录、积分套餐 - 异步任务系统:任务状态机(等待→处理中→完成/失败)、批量提交、全局任务列表、结果轮询 - 图库:处理结果云端存储(阿里云 OSS)、缩略图、任务详情回看 - 管理后台:用户管理(禁用/启用/改积分)、任务监控与重试、系统配置、积分规则/套餐配置、操作日志、仪表盘统计