文本智能生成视频

2025-07-21 15:36:15

行业：音视频

载体：Windows应用

技术：Python、OpenGL

业务和功能介绍

输入文案，利用大语言模型划为分镜
通过AI生图及AI配音快速生成视频
用于小说推文等视频生成
git地址https://github.com/yangranaa/TextToVideo
一.AI配音
1.部署到本地配音模型
2.部署到本地的声音克隆
3.AI逆向翻译第三方生成的配音音频，用于匹配输入文本及后续处理
二.视频画面
1.AI生图: 利用大语言模型生成分镜描述，再使用文心，智谱等当前开放免费使用的生图API
2.视频随机混剪
3.简易高效的本地AI换脸视频生成

项目实现

由作者单独开发，使用Python语言，QtUI框架，
opengl渲染处理利用双缓存批量渲染提效，
ffmpeg、pydub等音视频处理,
mediapipe人脸识别，vosk逆向翻译配音等等技术，

示例图片视频

板板

30天前活跃

方向：游戏开发-Unity、桌面端-Qt、

交付率：100.00%

查看主页

相似推荐

slog试玩广告-采矿

采矿slog试玩广告游戏制作。改策略游戏通过操作玩家进行采矿并出售获取金币，然后用金币去解锁砍伐和采矿小屋，当砍伐和采矿小屋解锁后会有工人自动进行资源采集并出售，玩家拿到更多金币后去解锁更多建筑和升级城防，并最终抵御敌人攻击，赢得胜利。

Uni-App移动应用开发-我的世界2048手机版

项目概述这是一个将经典益智游戏 2048 与沙盒游戏《我的世界》相结合的趣味作品。原版网页游戏经过重新设计，使用 uniapp 框架重构，技术栈基于 Vue.js，可实现小程序、Android、H5 等多端适配。主要功能经典 2048 玩法：通过滑动屏幕合并相同数字的方块，合成新的矿物方块。合成动画：合并时方块会有缩放、弹幕效果，操作反馈强。背景音乐与音效：添加了轻快的背景音乐，合并时伴有音效，提升沉浸感。多端支持：基于 uniapp 编译，一套代码可生成微信小程序、H5 网页、Android/iOS App，覆盖主流平台。

流棋

流棋是一款自主创新的下棋游戏，主要是玩法新颖，可跨平台。市面上下棋游戏有很多，但大多都是类型重复，氪金严重，广告横飞的样子，所以我开发了一款完全免费，且好玩的下棋游戏。流棋是一款电脑桌面单机游戏，双方在棋盘上落下的第一子为源子，通过移动源子在原地留下影子，对方移动己方的影子转化为自己的普通子，当一方源子被包围时，或者源子连续4步没移动，即判负。或者双方都无子可走，棋子多者获胜。当双方普通子都将己方源子包围时，棋子多者获胜，一样多则平局。双方都无子可走时，棋子数量一样多则平局。目前已在taptap上运行测试。

teenpattiflush

技术要点： 1、主要基于smartfoxserver这款游戏框架进行开发，应用了hibernate，spring这些框架 2、在游戏玩法的逻辑上涉及并发问题，运用锁等内容保证流程的正常性 3、使用了Memcached,Redis等缓存技术保证高请求量，响应问题 4、有整合Googlepaly,Facebook,Amazon,Paypal等支付接口 5、有应用爬虫技术获取一些赛事的实时信息 6、使用rmi进行分布式的交互

FL模拟赛车平台

Fantasy League 是面向 Assetto Corsa 的赛事运营的一体化平台，覆盖赛事配置、报名管理、成绩与积分、实时圈速、车队/车手管理与内容发布。项目由web后端、AC Live Timing 实时采集服务、Web 前端与小程序端组成。系统结构（四大核心模块） 1) web后端 2) 圈速采集服务 3) Web 前端 4) 小程序端项目正常运营中，地址：https://fantasyleague.online/