程序聚合 软件案例 文本智能生成视频

文本智能生成视频

2025-07-21 15:36:15
行业:音视频
载体:Windows应用
技术:Python、OpenGL

业务背景

输入文案,利用大语言模型划为分镜
通过AI生图及AI配音快速生成视频
用于小说推文等视频生成
git地址https://github.com/yangranaa/TextToVideo

功能介绍

一.AI配音
1.部署到本地配音模型
2.部署到本地的声音克隆
3.AI逆向翻译第三方生成的配音音频,用于匹配输入文本及后续处理
二.视频画面
1.AI生图: 利用大语言模型生成分镜描述,再使用文心,智谱等当前开放免费使用的生图API
2.视频随机混剪
3.简易高效的本地AI换脸视频生成

项目实现

由作者单独开发,使用Python语言,QtUI框架,
opengl渲染处理利用双缓存批量渲染提效,
ffmpeg、pydub等音视频处理,
mediapipe人脸识别,vosk逆向翻译配音等等技术,

示例图片视频


板板
24小时内活跃
方向: 游戏开发-Unity、桌面端-Qt、
交付率:100.00%
相似推荐
资源管理
本项目由Win32、菜单栏、树视图、快捷菜单以及右侧绘图区组成 使用者可以根据自己所需新建或修改已有的文件(并加以保存) 可以在树视图上呼出快捷菜单进行插入结点以及删除结点。 可对树视图项名称进行编辑。 有复选框供将来扩展 对树视图项进行拖拽功能 未来添加"修改树视图项背景"功能,进而实现追踪进度功能
游戏服务器端开发
1、负责游戏服务器端的编码、测试及维护工作。相关技术:C/C++、Linux、MySQL等。 2、负责即时通信软件客户端开发,相关技术:VC++、Win32、Windows、SQLite等。 3、负责游戏服务器端的编码、测试及维护工作。相关技术:C/C++、Linux、MySQL等。 4、参与公司非线性视频编辑软件、快编、转码、收录等产品的开发。相关技术:C/C++、Boost、Windows、Qt等。 5、医院信息系统:健康管理系统(体检)
宁波轮滑协会报名系统
尤其突出的优点: 对发布方报名避免沟通误差,可以安全准确的报名。 对机构 选手报名信息绑定,一次报名一年有效不用重复填写提交信息。 对发布方 编排可以快速高效进行编排工作,一键编排 生成所需要的报表 对裁判:裁判打分体系,大幅减少了打分员 打分到汇总之间的流程,规避了人为抄写的错误,打完分能够即时排名。
交友平台-游戏陪我
1.使用uniapp可开发,可兼容小程序、App、公众号 2.可对接地图导航定位,快速定位用户位置,方便匹配周边陪玩人员 3.对接微信、支付宝等支付方式,方便用户下单支付 4.用户可在APP中发布生活动态 5.可申请平台入驻,方便接单 6.方便体现
动态人机交互迷宫体验项目
1. 迷宫监控端app-可在纸上随意画4*4网格图,线条代表迷宫的墙壁,某个位置线条缺失代表此处不存在墙壁。app任意角度拍摄网格图,或者可以直接使用app绘制图片,人工点击网格线的四个个角,对四个点内的图片做仿射变换将网格图变换成横平竖直的图片,下一步图像处理识别网格图哪里有线条,哪里没有线条,将识别结果通过局域网udp通信发送给vr体验端,生成迷宫使用。同时体验端在游玩时,监控app可以实时显示玩家在迷宫中的位置和朝向,以及可以拖放道具到迷宫中某个位置,体验端会在对应位置生成道具。 2. vr体验端:unity实现,体验端接收到监控端的识别结果后,动态生成迷宫墙壁。玩家佩戴眼镜通过手柄操作在迷宫中探索,拾取迷宫中道具,达成一定目标后迷宫开放出口,玩家可寻找出口走出迷宫,游戏结束。
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服