1)项目管理与多语言界面:支持中文等多语言,项目与分集结构化存储。(2)剧本导入与解析:支持 TXT/DOCX/PDF 等上传,结合大模型解析剧情、辅助分集与导入流程可视化。(3)角色体系:从剧本自动提取角色与视觉描述,支持主角/配角与按集关联,并可生成角色多视图参考图以约束后续画面一致性。(4)智能分镜:将剧本拆解为镜头列表,含构图、运镜等可编辑字段。(5)关键帧与参考帧:支持首尾帧模式或参考帧模式,为每镜生成起止关键画面。(6)视频提示词与逐镜视频生成:基于分镜与参考图生成视频提示词,并调用多厂商视频模型生成片段。(7)合成与导出:片段拼接、字幕烧录、最终视频与素材包下载。(8)模型与密钥管理:可配置多家文本/图像/视频供应商,API 密钥服务端持久化;集成火山引擎方舟豆包 Seedream(图片)、Seedance(视频)及即梦 Visual 等能力,便于在合规前提下选用国内可用算力。
本人负责产品需求梳理、前后端一体化实现、多模型接入与生成流水线编排、本地数据与部署方案维护。技术栈:Next.js 16(App Router)、React 19、Tailwind CSS、Zustand、next-intl;数据层 SQLite + Drizzle ORM;AI 侧统一抽象文本/图像/视频 Provider,对接 OpenAI 兼容 SDK、Google Gemini、Kling、火山方舟(Seedream 生图、Seedance 视频任务 API)、即梦(火山 Visual OpenAPI)等;媒体侧使用 FFmpeg 完成拼接与字幕。实现亮点:将「导入—角色—分镜—帧—视频—合成」拆为可单独触发与批量执行的阶段,配合分镜版本与看板视图支持迭代;密钥与模型偏好服务端存储,减轻浏览器泄露风险。难点:多厂商 API 形态差异大(同步/异步、鉴权方式、Base URL 与路径),需在工厂层统一配置并处理轮询、重试与错误可观测性;角色与镜头跨阶段一致性依赖提示词与参考图管线,需在 UI 与任务队列之间保持状态一致。若团队多人,可将「本人」改为「本团队」并列出分工。