程序聚合 软件案例 文本智能生成视频

文本智能生成视频

2025-07-21 15:36:15
行业:音视频
载体:Windows应用
技术:Python、OpenGL

业务和功能介绍

输入文案,利用大语言模型划为分镜
通过AI生图及AI配音快速生成视频
用于小说推文等视频生成
git地址https://github.com/yangranaa/TextToVideo
一.AI配音
1.部署到本地配音模型
2.部署到本地的声音克隆
3.AI逆向翻译第三方生成的配音音频,用于匹配输入文本及后续处理
二.视频画面
1.AI生图: 利用大语言模型生成分镜描述,再使用文心,智谱等当前开放免费使用的生图API
2.视频随机混剪
3.简易高效的本地AI换脸视频生成

项目实现

由作者单独开发,使用Python语言,QtUI框架,
opengl渲染处理利用双缓存批量渲染提效,
ffmpeg、pydub等音视频处理,
mediapipe人脸识别,vosk逆向翻译配音等等技术,

示例图片视频


板板
30天前活跃
方向: 游戏开发-Unity、桌面端-Qt、
交付率:100.00%
相似推荐
拾金者
本想自主研发的一款在线网页游戏。 游戏地址:https://12345.sale/gold/ 「缩放画面」:滚动鼠标中键(同CAD) 「拖动画面」:点住鼠标中键,然后移动鼠标(同CAD) 「拖动对象(如:人物、动物、植物)」:把鼠标移动到目标对象,点住鼠标左键,然后移动鼠标 「跟踪对象」:把鼠标移动到目标对象,单击鼠标右键(注意:1、程序默认跟踪女孩,可手动取消跟踪。2、对于移动速度较快的对象,需要足够快的手速才能成功点击。) 「取消跟踪对象」:点击状态栏的「取消跟踪」按钮 「播放/暂停背景音乐」:点击状态栏的「BGM」按钮 淘金者:一个锲而不舍的淘金女孩,她会前往每个金矿的位置收集这些金矿; 小蓝鸟:作为淘金者的好朋友,它如影随形地陪伴在「淘金者」的身侧; 蝴蝶:在各「花」对象之间停留和往返; 燕子:在各「树」对象之间停留和往返; 狗:作为人类的忠实朋友,狗将会往返于「人」对象和「房屋」对象之间以帮助人类传递讯息; 你,作为这个世界的幕后操控者,可用鼠标拖动任何对象穿梭于虚拟空间的每一个角落,在它们毫无防备与察觉之下,悄无声息地操控这个世界的流转。
游戏制作-仿制黄金矿工
我们选择了简单易懂的Python语言。它就像搭积木一样,用清晰的代码块就能构建游戏世界:Pygame库负责让钩爪"活"起来,Photoshop把矿洞画得栩栩如生,PyCharm开发工具就像智能助手,随时帮我们修正代码里的"小马虎"。整个过程就像拼乐高,看着简单的零件逐渐变成精巧的矿车、闪烁的宝石,这种创造的快乐,正是游戏开发最迷人的地方。
小六免费网
1,目前分为短剧类,游戏类,游戏补丁类,常用工具,还有小六工具这几个模块。 2,游戏主要是分享一些转载来的游戏,不存在侵权行为,如有侵权,立刻删除。 3,常用工具主要是装机工具,还有编辑工具等日常用到的工具,网站目的只是方便用户去下载,因为其他网站下载有很多广告,我们主要为了让用户能够无广告的去下载常用软件。 4,主要是自研工具让大家免费使用,将来会研发更多的工具放上去,目前正在完善中。
H5游戏聚合服务
1.前端基于CocosCreator,服务器基于NodeJS,采用WebSocket通讯; 2.H5前端与游戏服务器的状态同步,即前端不参与任何数据计算,完全保证用户数据安全性 3.H5页面通过url参数及APP提供的“桥”与APP直接交互,游戏服务器与APP服务器使用HTTP(S)请求交互,涉及白名单,请求压缩等功能; 4.游戏内容,根据不同的游戏类别,提供不同的游戏内容; 5.Redis缓存,实现游戏运行时数据的热更新。
u3d开发的AVG文字冒险游戏
1.AVG功能 2.小的集卡战斗 3.小游戏合集 AVG主要是文字冒险,包括对话,角色头像,互动演出等等 集卡战斗是卡牌战斗的设计方式,类似宝可梦的战斗舞台 小游戏包括连连看,记忆力挑战等,主要是为了获取游戏内资源
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服