1、立项背景和目标
随着AI技术的发展,普通人也可以轻松生成高质量的图片、视频和音乐。但现有工具要么收费太高,要么操作复杂,对刚开始尝试AI创作的用户不够友好。我结合自己使用大模型API的经验,开发了一款集图片生成、视频生成、音乐生成于一体的多媒体创作工具,旨在降低AI创作门槛,让每个人都能免费体验AI生成内容的乐趣。项目灵感来源于我在AFAC比赛中使用AI API的经历,以及对TRAE Work工具的探索。
2、软件功能和核心模块介绍
图片生成模块:用户可自定义图片尺寸(宽/高),选择不同风格的图案类型(抽象图案、写实风格、卡通风格等),AI根据用户选择生成对应的图片。
视频生成模块:用户输入视频主题或关键词,AI自动生成短视频脚本并调用视频生成API产出视频。
音乐生成模块:用户选择音乐风格(古典/电子/轻音乐等),AI生成对应的音频文件。
参数配置面板:所有生成参数(尺寸、风格、时长等)集中在一个面板,用户可自由调整。
3、业务流程和功能路径描述
用户打开网页 → 选择“图片生成”/“视频生成”/“音乐生成” → 填写参数(宽高、风格、主题等) → 点击“生成”按钮 → 系统调用大模型API → 生成内容展示在页面上 → 用户可预览并下载。
1、整体架构和设计思路
项目采用纯前端单页应用架构,使用HTML + CSS + JavaScript开发,部署在TRAE Work云端环境。图片生成调用Kimi API的多模态能力,视频和音乐生成调用对应的AI服务接口。前端通过表单收集用户参数,以JSON格式发送给后端API,AI返回生成结果后通过
![]()
/