程序聚合软件案例 toc AI漫剧推文生成-绘聚AI

toc AI漫剧推文生成-绘聚AI

2026-02-03 12:56:47

行业：人工智能、内容平台

载体：网站

技术：Go、Vue、MySQL

业务和功能介绍

立项背景
当前网文IP轻量化可视化需求激增，但传统小说转视频流程繁琐、门槛高，分镜、背景、字幕语音需专业操作且多工具协同，效率低下。现有AI工具多聚焦单一环节，缺乏全链路解决方案，且生成质量不稳定，无法满足高效创作需求，为此立项研发绘聚AI。

立项目标
1.打造全链路小说可视化工具，实现“上传小说即出视频”，大幅缩短制作周期；
2.提升AI生成精准度，解决语义偏差、质量不稳问题；
3.降低使用门槛，让普通用户无需专业技能即可完成创作；
4.适配多类型小说，支持个性化编辑，助力IP多元化传播。

整体软件功能
绘聚AI以“全流程自动化、精准化、便捷化”为核心，涵盖小说上传解析、自动分镜、背景生成、字幕语音拆分、视频合成导出五大核心功能，搭配辅助功能，实现文字到视频一站式转化。

核心功能模块介绍
四大核心模块协同联动，兼顾自动化与个性化编辑：
1.小说解析与自动分镜模块：解析小说信息，自动生成分镜脚本；
2.分镜背景图生成模块：联动分镜，自动生成适配风格的背景图；
3.字幕与语音生成模块：自动拆分子幕、合成贴合语气的语音；
4.视频合成模块：整合三大元素，自动合成视频。

整体业务流程
整体流程：用户添加小说→系统自动生成分镜→生成对应背景图→拆分字幕并合成语音→合成视频→用户导出视频，形成闭环创作流程。

详细功能路径描述
1. 初始路径：登录系统→配置添加小说；
2. 创建章节：创建任务添加章节内容；
3. 执行任务：自动生成分镜→自动生成背景→自动拆分合成语音和字幕→自动合成视频；
4. 视频导出。

项目实现

整体采用前后端分离架构，设计思路以“自动化、轻量化、高适配”为核心，拆分前端交互层、后端服务层、AI算法层、数据存储层，各层独立部署、协同联动。技术栈如下：前端（Vue3+Element Plus，负责交互界面与操作流程）；后端（go+python，负责接口开发与流程调度）；分镜模块（NLP+多模态大模型，基于BERT微调，实现小说语义解析）；背景图模块（Stable Diffusion，搭配自定义提示词工程）；字幕语音模块（WhisperX分词幕、GPT-SoVITS合成语音）；视频合成模块（FFmpeg，实现多元素整合同步）；数据存储（MySQL+Redis，存储小说、分镜、视频等数据）。

该项目由我独立完成，全程负责从需求梳理、架构搭建、各模块开发优化，到全流程协同对接、测试调试及落地交付的所有工作，核心重点推进分镜生成模块，同时统筹完成其他模块的联动适配。量化结果：独立完成全项目核心代码开发与整合，优化小说语义解析模型，实现单章节（5000字内）分镜生成耗时≤30秒，解析准确率达97%；优化各模块间数据交互接口（含分镜与背景图模块），接口响应速度提升60%，全项目异常报错率降至0.8%以下；输出分镜脚本标准化，支撑视频合成模块高效对接，确保全流程自动化运行顺畅，顺利完成项目落地。

1. 难点：小说语义解析偏差，分镜易遗漏关键情节、人物动作。解决方案：新增10万+小说语料微调模型，增加情节、人物关键词权重，加入人工标注样本优化，解析准确率从78%提升至95%。
2. 难点：分镜与背景图风格不匹配，接口数据交互卡顿。解决方案：设计结构化提示词模板，让分镜模块向背景图模块传递场景、风格参数；优化接口调用逻辑，引入异步处理，卡顿率从35%降至5%以下。
3. 难点：长章节分镜生成碎片化，逻辑混乱。解决方案：加入章节情节脉络梳理算法，按场景转换拆分镜头，设置分镜数量阈值，长章节分镜逻辑连贯率提升88%。

示例图片视频

KeLL

30天前活跃

方向：后端-Go、前端-Web前端、

交付率：100.00%

查看主页

相似推荐

公司内部管理软件-排程系统

1、背景：由于公司内部无法直接看到生产订单完成时间、所以按照设备产能计算出每个订单预计完成时间 2、功能包含：数据同步、用户权限管理、订单管理、设备管理、日历管理、数据排程等 3、业务流程从MES同步订单数据、维护设备产能、维护订单数据，计算排程

物联网-远程机械管理系统

此平台为针对特种设备（主要是起重机）传感器数据采集及监控的多租户平台，含pc端和小程序端；实现在线及历史数据可视化展示；同时引入大模型，搜索知识库，知识库基于国标和行标，以及生产实践积累的实施文档和技术文档；并可对设备故障预警及告警。

企业园区管理系统-园区管理小程序

面向企业多园区日常运营。随着业务规模扩大，会议预约、访客接待、公车调度、设备共享、巡更安防等事务长期依赖线下登记与分散沟通，信息传递慢、审批链条长、数据难追溯。立项目标是建设一套覆盖「移动申请—流程审批—后台管控」的数字化平台，让员工在手机上完成办事，让管理员在网页端统一配置与监管，提升行政效率与园区管理水平。系统由微信小程序、Spring Boot 业务后端、基于若依与 Flowable 的网页管理端组成，按业务划分为四大板块。行政服务含会议预约与扫码签到、企业邮箱申请、名片管理、办公用品申领、展厅预约、检测设备预约；园区管理含来访处理、车辆通行证申请、蓝牙巡更打卡；车辆管理含公车申请/派车/还车、货车预订及多级审核；后勤服务含每周食谱、线上超市、意见箱与问卷调查。管理端对应提供访客、会议室、设备、公车、巡更点位、展厅、用品、名片、邮箱、食谱及小程序用户等维护功能，并通过 Flowable 配置多级审批流程。典型业务路径如下：员工在小程序首页选择功能模块，填写表单并提交；后端校验身份与数据后写入数据库，触发 Flowable 工作流，推送给部门主管、行政或车队等审批人；审批人在管理端或小程序待办中处理，流程结束后更新业务状态，并通过微信模板消息或订阅消息通知申请人。以公车预约为例：员工填写用车时间、人数、事由→部门审核→行政/车队派司机→用车完成后还车登记→管理员可在后台查询全程记录。以巡更为例：安保人员打开巡更模块，通过蓝牙连接指定信标设备，系统结合 RSSI 信号判断是否在打卡点位范围内，验证通过后记录巡更时间与位置。不同角色（普通员工、安保、物业、管理员）登录后首页菜单自动切换，实现「同一平台、分级可见」，形成完整业务闭环。

企业科研项目管理系统-科研项目管理系统

泰金科研项目管理系统（019_RPMSC）面向科研机构课题全生命周期管理，旨在解决传统模式下纸质文档流转繁琐、审批环节分散、工时与项目进度脱节、跨部门协同成本高、历史数据难以追溯等问题。建设目标是打造一体化、数字化的课题管理平台，贯通「立项—执行—验收」主线，并与工时记录、工作日志、经费执行等环节联动，实现无纸化流转、流程规范化、多角色协同及数据集中管控与自动汇总，提升科研管理效率与过程可追溯性。系统功能覆盖课题管理全链条。项目管理中枢以课题主数据为核心，维护项目编号、负责人、成员、阶段状态及审批状态，支持按角色、部门、项目成员进行数据权限过滤，科研管理办公室可按部门分库查询。课题文档与审批涵盖课题申请、开题评审、课题计划、开题报告、阶段评审、结题评审、结题报告、变更申请、终止报告、试验验证报告等十余类业务单据，各模块独立列表管理并关联课题主键，支持在线填报、附件上传、Excel 导出及版本留痕。工作流引擎基于 Flowable 实现流程可视化配置、待办/已办任务处理、多级审批、驳回与流程跟踪，流程结束自动推进课题阶段。文档生成支持配置 Word 模板，通过书签机制将表单数据与审批意见自动填充，生成标准化科研文档。辅助管理包括工时统计、工作日志、经费执行台账、实验室样品/废料台账、实验记录、申报统计（Declare）及数据上传等模块。系统支撑提供用户、角色、部门、菜单权限管理，电子签章配置，流程与模板配置，以及定时任务等基础能力。业务流程以课题主状态机驱动。课题创建后进入「课题申请」阶段，填报申请表并发起 Flowable 审批；审批通过后通过 commitProject 提交进入下一阶段，依次经历开题评审→课题计划→开题报告→阶段评审（可多次循环）→结题评审→结题，最终标记为「已完成」。各阶段典型路径为：在对应业务页面填写表单→保存→发起流程→审批人在待办中处理（可写入审批意见并回填 Word 书签）→流程结束由监听器更新业务表状态并推进课题阶段。分支流程包括：任意阶段可发起「课题变更」，变更审批结束后同步主数据并恢复至变更前状态；可发起「试验验证」，结束后通过 Redis 缓存恢复原有阶段；可发起「课题终止」，流程结束后标记为「已终止」。功能路径上，项目负责人从「项目信息管理」进入课题详情，按当前阶段跳转至对应业务菜单操作；审批人从「待办任务」统一处理各类型审批；管理员在「流程配置」「模板管理」「电子签章配置」中维护流程与文档规则；科研办通过申报统计模块汇总台账数据。系统通过「业务单据 + 流程实例 + 课题状态」三层联动，形成闭环管理路径。

微信小程序-渝铁通

为派出所事项的快速文档处理，警察具有太多文档需要填写和审核，可以通过在线小程序来实现填写、打印、上传、审核等功能，为民警节约大部分时间和精力，正如科技改变生活一样。由于安全和隐私问题不方便展示全部功能，可自行在微信里搜索使用。