程序聚合 软件案例 toc AI漫剧推文生成-绘聚AI

toc AI漫剧推文生成-绘聚AI

2026-02-03 12:56:47
行业:人工智能、内容平台
载体:网站
技术:Go、Vue、MySQL

业务和功能介绍

立项背景
当前网文IP轻量化可视化需求激增,但传统小说转视频流程繁琐、门槛高,分镜、背景、字幕语音需专业操作且多工具协同,效率低下。现有AI工具多聚焦单一环节,缺乏全链路解决方案,且生成质量不稳定,无法满足高效创作需求,为此立项研发绘聚AI。

立项目标
1.打造全链路小说可视化工具,实现“上传小说即出视频”,大幅缩短制作周期;
2.提升AI生成精准度,解决语义偏差、质量不稳问题;
3.降低使用门槛,让普通用户无需专业技能即可完成创作;
4.适配多类型小说,支持个性化编辑,助力IP多元化传播。

整体软件功能
绘聚AI以“全流程自动化、精准化、便捷化”为核心,涵盖小说上传解析、自动分镜、背景生成、字幕语音拆分、视频合成导出五大核心功能,搭配辅助功能,实现文字到视频一站式转化。

核心功能模块介绍
四大核心模块协同联动,兼顾自动化与个性化编辑:
1.小说解析与自动分镜模块:解析小说信息,自动生成分镜脚本;
2.分镜背景图生成模块:联动分镜,自动生成适配风格的背景图;
3.字幕与语音生成模块:自动拆分子幕、合成贴合语气的语音;
4.视频合成模块:整合三大元素,自动合成视频。

整体业务流程
整体流程:用户添加小说→系统自动生成分镜→生成对应背景图→拆分字幕并合成语音→合成视频→用户导出视频,形成闭环创作流程。

详细功能路径描述
1. 初始路径:登录系统→配置添加小说;
2. 创建章节:创建任务添加章节内容;
3. 执行任务:自动生成分镜→自动生成背景→自动拆分合成语音和字幕→自动合成视频;
4. 视频导出。

项目实现

整体采用前后端分离架构,设计思路以“自动化、轻量化、高适配”为核心,拆分前端交互层、后端服务层、AI算法层、数据存储层,各层独立部署、协同联动。技术栈如下:前端(Vue3+Element Plus,负责交互界面与操作流程);后端(go+python,负责接口开发与流程调度);分镜模块(NLP+多模态大模型,基于BERT微调,实现小说语义解析);背景图模块(Stable Diffusion,搭配自定义提示词工程);字幕语音模块(WhisperX分词幕、GPT-SoVITS合成语音);视频合成模块(FFmpeg,实现多元素整合同步);数据存储(MySQL+Redis,存储小说、分镜、视频等数据)。

该项目由我独立完成,全程负责从需求梳理、架构搭建、各模块开发优化,到全流程协同对接、测试调试及落地交付的所有工作,核心重点推进分镜生成模块,同时统筹完成其他模块的联动适配。量化结果:独立完成全项目核心代码开发与整合,优化小说语义解析模型,实现单章节(5000字内)分镜生成耗时≤30秒,解析准确率达97%;优化各模块间数据交互接口(含分镜与背景图模块),接口响应速度提升60%,全项目异常报错率降至0.8%以下;输出分镜脚本标准化,支撑视频合成模块高效对接,确保全流程自动化运行顺畅,顺利完成项目落地。

1. 难点:小说语义解析偏差,分镜易遗漏关键情节、人物动作。解决方案:新增10万+小说语料微调模型,增加情节、人物关键词权重,加入人工标注样本优化,解析准确率从78%提升至95%。
2. 难点:分镜与背景图风格不匹配,接口数据交互卡顿。解决方案:设计结构化提示词模板,让分镜模块向背景图模块传递场景、风格参数;优化接口调用逻辑,引入异步处理,卡顿率从35%降至5%以下。
3. 难点:长章节分镜生成碎片化,逻辑混乱。解决方案:加入章节情节脉络梳理算法,按场景转换拆分镜头,设置分镜数量阈值,长章节分镜逻辑连贯率提升88%。

示例图片视频


KeLL
30天前活跃
方向: 后端-Go、前端-Web前端、
交付率:100.00%
相似推荐
公司内部管理软件-排程系统
1、背景:由于公司内部无法直接看到生产订单完成时间、所以按照设备产能计算出每个订单预计完成时间 2、功能包含:数据同步、用户权限管理、订单管理、设备管理、日历管理、数据排程等 3、业务流程从MES同步订单数据、维护设备产能、维护订单数据,计算排程
物联网-远程机械管理系统
此平台为针对特种设备(主要是起重机)传感器数据采集及监控的多租户平台,含pc端和小程序端;实现在线及历史数据可视化展示;同时引入大模型,搜索知识库,知识库基于国标和行标,以及生产实践积累的实施文档和技术文档;并可对设备故障预警及告警。
企业园区管理系统-园区管理小程序
面向企业多园区日常运营。随着业务规模扩大,会议预约、访客接待、公车调度、设备共享、巡更安防等事务长期依赖线下登记与分散沟通,信息传递慢、审批链条长、数据难追溯。立项目标是建设一套覆盖「移动申请—流程审批—后台管控」的数字化平台,让员工在手机上完成办事,让管理员在网页端统一配置与监管,提升行政效率与园区管理水平。 系统由微信小程序、Spring Boot 业务后端、基于若依与 Flowable 的网页管理端组成,按业务划分为四大板块。行政服务含会议预约与扫码签到、企业邮箱申请、名片管理、办公用品申领、展厅预约、检测设备预约;园区管理含来访处理、车辆通行证申请、蓝牙巡更打卡;车辆管理含公车申请/派车/还车、货车预订及多级审核;后勤服务含每周食谱、线上超市、意见箱与问卷调查。管理端对应提供访客、会议室、设备、公车、巡更点位、展厅、用品、名片、邮箱、食谱及小程序用户等维护功能,并通过 Flowable 配置多级审批流程。 典型业务路径如下:员工在小程序首页选择功能模块,填写表单并提交;后端校验身份与数据后写入数据库,触发 Flowable 工作流,推送给部门主管、行政或车队等审批人;审批人在管理端或小程序待办中处理,流程结束后更新业务状态,并通过微信模板消息或订阅消息通知申请人。以公车预约为例:员工填写用车时间、人数、事由→部门审核→行政/车队派司机→用车完成后还车登记→管理员可在后台查询全程记录。以巡更为例:安保人员打开巡更模块,通过蓝牙连接指定信标设备,系统结合 RSSI 信号判断是否在打卡点位范围内,验证通过后记录巡更时间与位置。不同角色(普通员工、安保、物业、管理员)登录后首页菜单自动切换,实现「同一平台、分级可见」,形成完整业务闭环。
企业科研项目管理系统-科研项目管理系统
泰金科研项目管理系统(019_RPMSC)面向科研机构课题全生命周期管理,旨在解决传统模式下纸质文档流转繁琐、审批环节分散、工时与项目进度脱节、跨部门协同成本高、历史数据难以追溯等问题。建设目标是打造一体化、数字化的课题管理平台,贯通「立项—执行—验收」主线,并与工时记录、工作日志、经费执行等环节联动,实现无纸化流转、流程规范化、多角色协同及数据集中管控与自动汇总,提升科研管理效率与过程可追溯性。 系统功能覆盖课题管理全链条。项目管理中枢以课题主数据为核心,维护项目编号、负责人、成员、阶段状态及审批状态,支持按角色、部门、项目成员进行数据权限过滤,科研管理办公室可按部门分库查询。课题文档与审批涵盖课题申请、开题评审、课题计划、开题报告、阶段评审、结题评审、结题报告、变更申请、终止报告、试验验证报告等十余类业务单据,各模块独立列表管理并关联课题主键,支持在线填报、附件上传、Excel 导出及版本留痕。工作流引擎基于 Flowable 实现流程可视化配置、待办/已办任务处理、多级审批、驳回与流程跟踪,流程结束自动推进课题阶段。文档生成支持配置 Word 模板,通过书签机制将表单数据与审批意见自动填充,生成标准化科研文档。辅助管理包括工时统计、工作日志、经费执行台账、实验室样品/废料台账、实验记录、申报统计(Declare)及数据上传等模块。系统支撑提供用户、角色、部门、菜单权限管理,电子签章配置,流程与模板配置,以及定时任务等基础能力。 业务流程以课题主状态机驱动。课题创建后进入「课题申请」阶段,填报申请表并发起 Flowable 审批;审批通过后通过 commitProject 提交进入下一阶段,依次经历开题评审→课题计划→开题报告→阶段评审(可多次循环)→结题评审→结题,最终标记为「已完成」。各阶段典型路径为:在对应业务页面填写表单→保存→发起流程→审批人在待办中处理(可写入审批意见并回填 Word 书签)→流程结束由监听器更新业务表状态并推进课题阶段。分支流程包括:任意阶段可发起「课题变更」,变更审批结束后同步主数据并恢复至变更前状态;可发起「试验验证」,结束后通过 Redis 缓存恢复原有阶段;可发起「课题终止」,流程结束后标记为「已终止」。功能路径上,项目负责人从「项目信息管理」进入课题详情,按当前阶段跳转至对应业务菜单操作;审批人从「待办任务」统一处理各类型审批;管理员在「流程配置」「模板管理」「电子签章配置」中维护流程与文档规则;科研办通过申报统计模块汇总台账数据。系统通过「业务单据 + 流程实例 + 课题状态」三层联动,形成闭环管理路径。
微信小程序-渝铁通
为派出所事项的快速文档处理,警察具有太多文档需要填写和审核,可以通过在线小程序来实现填写、打印、上传、审核等功能,为民警节约大部分时间和精力,正如科技改变生活一样。由于安全和隐私问题不方便展示全部功能,可自行在微信里搜索使用。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服