程序聚合 软件案例 AIGC-AI 漫剧生成器

AIGC-AI 漫剧生成器

行业:音视频
载体:网站
技术:TypeScript、NestJS、React、FFmpeg

业务和功能介绍

1)项目管理与多语言界面:支持中文等多语言,项目与分集结构化存储。(2)剧本导入与解析:支持 TXT/DOCX/PDF 等上传,结合大模型解析剧情、辅助分集与导入流程可视化。(3)角色体系:从剧本自动提取角色与视觉描述,支持主角/配角与按集关联,并可生成角色多视图参考图以约束后续画面一致性。(4)智能分镜:将剧本拆解为镜头列表,含构图、运镜等可编辑字段。(5)关键帧与参考帧:支持首尾帧模式或参考帧模式,为每镜生成起止关键画面。(6)视频提示词与逐镜视频生成:基于分镜与参考图生成视频提示词,并调用多厂商视频模型生成片段。(7)合成与导出:片段拼接、字幕烧录、最终视频与素材包下载。(8)模型与密钥管理:可配置多家文本/图像/视频供应商,API 密钥服务端持久化;集成火山引擎方舟豆包 Seedream(图片)、Seedance(视频)及即梦 Visual 等能力,便于在合规前提下选用国内可用算力。

项目实现

本人负责产品需求梳理、前后端一体化实现、多模型接入与生成流水线编排、本地数据与部署方案维护。技术栈:Next.js 16(App Router)、React 19、Tailwind CSS、Zustand、next-intl;数据层 SQLite + Drizzle ORM;AI 侧统一抽象文本/图像/视频 Provider,对接 OpenAI 兼容 SDK、Google Gemini、Kling、火山方舟(Seedream 生图、Seedance 视频任务 API)、即梦(火山 Visual OpenAPI)等;媒体侧使用 FFmpeg 完成拼接与字幕。实现亮点:将「导入—角色—分镜—帧—视频—合成」拆为可单独触发与批量执行的阶段,配合分镜版本与看板视图支持迭代;密钥与模型偏好服务端存储,减轻浏览器泄露风险。难点:多厂商 API 形态差异大(同步/异步、鉴权方式、Base URL 与路径),需在工厂层统一配置并处理轮询、重试与错误可观测性;角色与镜头跨阶段一致性依赖提示词与参考图管线,需在 UI 与任务队列之间保持状态一致。若团队多人,可将「本人」改为「本团队」并列出分工。

示例图片视频


深圳市龙智俊影科技有限公司
3天前活跃
交付率:100.00%
相似推荐
中医肠胃病智能体-智痞通
本项目构建了一套融合提示词工程、指令微调、大语言模型(Large Language Model, LLM)与检索增强生成(Retrieval-Augmented Generation, RAG)技术 的中医痞满智能辅助诊疗智能体,实现了多种前沿技术在中医领域的协同应用。 该智能体基于指令调优采用多层次 LLM 推理框架,整合本地化知识库检索机 制,实现了多模态数据(包括文本、语音及图像)到中医辨证论治决策的全流程 智能化处理。
《码上学》App-coze
图3 (二)学习板块:系统课程+趣味实践 这是我们精心打造的Python学习核心区域,采用"双轨并行"的学习模式: 课程学习模块(如图4) ● 资源整合:精选B站等优质平台的Python基础、数据挖掘等系列课程 ● 分类清晰:按模块、方向进行分类,支持按需深入学习 ● 适配人群:从零基础入门到进阶提升,覆盖不同学习阶段 图4 趣味学习模块 这是我们特别设计的创新功能,将枯燥的编程练习变成有趣的挑战: 1. 拆解代码挑战:提供一段完整代码,要求分析其功能、逻辑和算法,培养代码阅读能力 2. 魔改挑战:给定代码和新的需求,需要修改代码实现特定功能,加深对Python语法和逻辑的理解 3. 代码溯源:从运行结果反推代码实现,锻炼逆向思维和问题分析能力 这种游戏化的学习方式让我们在测试中发现,用户的学习积极性显著提升,平均学习时长增加了40%以上。 如图5 图5 AI编程助教 这是一个24小时在线的智能助教,它的核心能力包括: ● 多模态输入:支持文字描述、代码截图、错误信息截图等多种提问方式 ● 智能诊断:快速识别语法错误、逻辑问题、运行时错误,并分析产生原因 ● 分级讲解:根据用户水平自动调整讲解深度,初学者讲得更详细,有基础的同学提供进阶知识 ● 标准化流程:每次回答按照"问题分析→解决步骤→代码示例→知识拓展"的顺序,帮助系统性理解 (三)发现模块:构建学习社区生态 学习不应该是孤独的,我们打造了一个活跃的编程学习社区: 交流圈 ● 热门话题:以弹幕形式滚动展示当前热门讨论话题,点击即可进入 ● 文章列表:支持"最热/最新/精华"排序,可按类型筛选 ● 互动功能:评论、点赞、分享,形成良好的学习氛围 社区互动入口 ● 代码分享墙:计划中的功能,用于展示优秀代码作品,支持双向学习 ● 学习小组:规划中的功能,支持组队学习、进度同步、相互监督 交流互助板块 ● 问题答疑:遇到编程问题可以发帖求助,社区成员或AI助手提供解答 ● 经验分享:学习心得、踩坑经验、项目总结都可以在这里分享 ● 知识沉淀:优质问答会被标记为精华,形成知识库 博客功能(如图6) ● 学习日志:记录每天的学习内容、心得体会、成长轨迹 ● 技术分享:发布学习指导、教程文章 ● 数据可视:查看自己的文章点赞量、浏览量、粉丝数 三、AI智能体应用(核心创新,如图7) 这是我们项目的最大亮点!我们基于Coze AI平台,设计并实现了五个具有实际应用价值的AI智能: 图7 场景一:AI智能招聘助理(校招小助手) 设计初衷:临近毕业时,我们发现很多同学因为缺少面试经验而紧张失常。如果能有一个AI面试官陪你练习,是不是能更从容地应对真实面试?
华为杯研究生数学建模大赛-抗胰腺癌候选药物的优化建模
据 2020 年国际癌症研究机构(IARC)调查的最新数据显示,乳腺癌在全球女性癌症中的发病率为 24.2%,位居女性癌症的首位。在药物研发领域,利用预测模型对能够拮抗 ERα 活性的化合物进行筛选的方法受到广泛的关注,本文通过建立回归与分类预测模型,对化合物的生物活性和 ADMET 性质做多目标优化求解
数据库管理平台-绿洲数据库管理平台
1.项目背景 公司内部管理的数据库类型种类繁多,数量庞大,权限管控难等问题,所以需要一款数据库管理平台,来统筹接觉这些问题 2.功能介绍 1)提供多种数据库类型的查询窗口,替换本地数据库工具 2)针对不同用户进行权限管理,以及数据库字段权限管理,支持字段加解密显示 3)支持多库多表等中间件配置 4)支持数据库日常维护工具,如数据迁移,数据归档等
AI搜索和创作平台-felo.ai
Felo.ai 是一款面向研究与内容生产场景的多语言 AI 搜索与创作平台,目标是在同一产品内打通「检索—理解—生成—交付」,降低用户在不同工具之间反复复制、整理信息的成本。平台以 AI 搜索为入口,支持自然语言提问、多源信息检索与结果结构化呈现,并可将检索结果进一步转化为演示文稿、研究报告、思维导图、网页内容等多种可交付成果。 核心功能模块包括:AI 搜索(Felo Search)、一站式创作(Felo Create)、AI Office 工具集(如 AI Slides、AI Research、AI Page、AI Image 等),以及 Felo Agent 智能体能力,用于自动化调研、摘要、翻译等复杂任务。典型业务流程为:用户输入问题或主题 → 系统检索并归纳关键信息 → 用户选择创作类型(如幻灯片、报告、页面)→ 平台基于上下文生成初稿 → 用户编辑、导出或分享。产品为 Web 端访问,强调多语言支持、可视化信息展示与从搜索到创作的连续工作流。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服