电商智能视频混剪工具是一款集合图片转视频、文案生成、文案转语音、视频合成、视频配音于一体的智能电商视频生成工具,通过整合云计算、人工智能等技术,实现电商类推广视频的有效解决方案。
应用场景
1、电商推广类视频生成
2、小说解说类视频生成
3、其他涉及混剪类型的视频生成,视频生成类型跟素材相关
整体采用模块分离技术,一个模块封装一个主要功能,对外暴露调用接口,参数配置等信息通过toml配置文件配置。
主要模块
1、图片转视频模块:输入图片,对图片进行亮度/去噪/锐化等处理,输出对图片的平移/旋转/缩放/划入/淡出等视频效果。
2、视频混剪模块:输入多个视频,对视频内容进行智能选择截取,合成新视频。
3、文案处理模块:输入文案,对文案内容进行解析、智能处理,然后分层、分段,计算长度,生成srt字幕文件。
4、语音合成模块:输入文案处理模块生成的srt字幕文件,对字幕文件进行解析分段,然后调用云语音合成接口,然后对合成的语音进行智能语速调节用以适配srt字幕文件,最后合成整个语音配音。
5、语音视频合成模块:输入一个视频,多段语音(背景音乐和配音),合成视频和配音以及背景音乐(可调节人声和背景音乐大小)。
6、视频加字幕模块:输入视频和srt字幕文件,合成硬字幕视频文件(字幕大小,位置,颜色、格式可调节)。
7、爬虫模块:爬取一些公开视频或图片,用作素材测试软件。
主要技术
1、Python:软件整体使用 Python 开发。
2、ffmpeg:底层调用 ffmpeg 处理视频相关的内容
3、opencv:处理图片相关内容。
4、numpy:用作图片、视频效果计算。
5、av:视频处理。
6、requests:爬虫。
7、Qt:软件UI制作(还未实现,正在实现当中)
目标:短期实现UI功能,使之操作更简易,长期目标实现一款智能剪辑软件。