立项背景:
中小企业及自由职业者在日常运营中常需快速了解本地文件资产分布情况(如设计稿、合同文档、代码等)。传统手动统计耗时易错,且无法及时响应管理层的即时数据需求。本项目旨在开发一款无需安装、零外部依赖的命令行工具,解决这一痛点。
核心功能模块:
1. 路径输入解析:接收任意文件夹路径,支持绝对路径和相对路径
2. 递归文件扫描:深度遍历所有子目录,不遗漏任何文件
3. 按扩展名分类统计:自动识别文件后缀并分组计数,无扩展名文件归类为"(无扩展名)"
4. 报告生成:输出结构化TXT报告,包含各类型数量、总文件数、统计时间,按数量降序排列
5. 参数自定义:支持指定输出文件名、排除特定目录(如node_modules、.git等)
业务流程:
用户在终端执行命令并传入文件夹路径 → 程序解析参数并验证路径有效性 → 递归遍历目录树,按扩展名分组统计 → 按数量降序排列结果 → 生成格式化报告写入指定路径 → 终端输出统计摘要。
该项目完整演示了从需求分析到工具交付的AI辅助全流程开发模式。
整体架构:
采用三层模块化架构,入口层(main.py)负责参数解析与流程编排,业务逻辑层(scanner.py)负责核心的文件遍历与分类,输出层(reporter.py)负责报告格式化。模块间通过明确的函数接口解耦,便于后期扩展为Web版或多格式输出(CSV/JSON/PDF)。技术栈全部使用Python 3标准库(pathlib、argparse、collections),实现零外部依赖、即装即用。
我的角色与贡献:
独立完成全部开发工作。采用创新的"双模型协同"AI开发模式:
- 规划阶段(Plan模式):使用本地部署的Qwen3.6-27B大模型进行需求分析、技术方案设计和任务拆解,明确模块划分与接口规范
- 执行阶段(Act模式):使用Devstral代码专用模型按规划方案生成核心代码并完成自动化测试
技术难点与解决方案:
1. 双模型显存调度:RTX 4090 24G无法同时加载千问(17G)和Devstral(14G)。采用串行调度策略,Plan完成后释放千问再加载Devstral,确保执行阶段完整可用显存
2. 需求完整性保障:通过Plan模式输入结构化需求文档,明确列出正常路径和异常路径,让AI自动覆盖所有边界条件
3. 代码质量控制:建立"AI自检+人工审核"双轮验证机制,确保交付代码可直接部署运行
量化成果:
- 开发周期:从需求输入到可用工具交付仅需1.5小时(传统开发需1-2天)
- 代码通过率:100%(AI生成后经自检+人工审核两轮验证)
- 性能指标:支持单次扫描10万+文件目录,报告生成时间<5秒
- 交付质量:零外部依赖,客户无需配置任何环境即可使用