新媒体运营者每天需要从大量 RSS 信息源中筛选热点、提炼要点、撰写各平台差异化文案,再手动粘贴到微信公众号、微博、头条号等编辑器——全流程耗时长、重复劳动多,且各平台对排版格式要求不同,人工适配成本极高。
本项目(mp-agent)的目标是构建一条"信息聚合 → AI 生成 → 多平台分发"的全自动内容流水线:定时从订阅的 RSS 源抓取文章,由大语言模型自动摘要和合写每日资讯,并按平台规范格式化后一键发布或提供带主题排版的富文本复制,将单期内容生产时间从数小时压缩至分钟级,支持零人工干预的定时全自动运行,也支持人工介入的半自动审核模式。
整体架构和设计思路:项目采用"模块协议化 + 异步流水线"架构,全链路基于 Python asyncio,确保高并发下 I/O 不阻塞。
核心层次:
CLI / Scheduler(typer + APScheduler)
↓
Orchestrator(流水线调度中枢)
↓
Fetcher ──→ Generator ──→ Publisher
↓ ↓ ↓
Storage(SQLAlchemy async + SQLite)
↓
Dashboard(FastAPI + SSE + Jinja2 + HTMX)
负责模块和结果:作为独立开发者,负责全部模块的设计与实现:
- 设计并实现完整的 Fetcher → Generator → Publisher 流水线,支持 4 家 LLM 提供商和 3 个发布平台。
- 构建 Web Dashboard 全部 10 个页面和路由,包含 SSE 实时日志流、主题切换预览、配置可视化编辑等功能。
- 实现多平台主题排版系统:微信公众号 5 套主题(经典蓝/优雅紫/清新绿/暖橙/玫瑰金)、头条号 2 套主题,每套主题均通过 inline-style 注入确保粘贴到平台编辑器后样式完整保留。
- 实现 SHA-256 哈希去重方案,在实测中对同一 Feed 多次拉取做到 100% 去重。
- 自动化流水线单次运行(含抓取 + AI 生成 + 发布)平均耗时约 90 秒,覆盖 10+ Feed 源、生成 3-5 篇分类资讯稿并同步发布至三端。
- 通过 APScheduler 实现定时全自动运行,运营人员每日无需手动介入即可完成内容发布,节省单期制作时间 2-3 小时。