💡
全网U调试:根据视频内容和目标时长,AI将自动优化剪辑点、字幕节奏和配音配乐,确保成片达到专业水准
1 项目基础设置
源视频时长:--
2 上传视频素材
📹
点击上传视频文件或拖拽到此处
支持 MP4, AVI, MOV, MKV 等格式,最大2GB
可复用之前上传的视频文件,无需再次上传
3 AI生成解说文稿
👁️

第一步:视频内容深度理解

通过计算机视觉AI技术分析视频画面内容、人物动作、场景情感,为文案生成提供素材

通义千问-VL
视频理解专家
推荐
GPT-4 Vision
多模态之王
Gemini Vision
长视频分析
Claude Vision
细节捕捉强
GLM-4V
国产视觉模型
百度视觉
中文场景优化
✍️

第二步:智能文案生成

基于视频分析结果,使用大语言模型AI生成专业、生动的原创解说文案

OpenAI GPT-4
最强创作能力
推荐
Claude 3
长文本理解专家
Google Gemini
多语言生成
文心一言
中文场景优化
通义千问
阿里云大模型
ChatGLM
智谱AI对话
DeepSeek
深度推理
Kimi
超长上下文
讯飞星火
多领域知识
字数: 0 AI原创度: 100%
文稿生成进度
0%
4 AI语音合成配置
🎙️

第三步:AI语音合成(TTS)

采用端到端语音合成技术,支持情感化表达和多音色选择

🎙️
Edge-TTS
🎭
Voice Clone
🧠
Voice-Pro 外部引擎
👩
晓晓
👨
云希
🧑
云扬
👧
晓伊
🧔
云健
👦
晓辰
🎤
云枫
🔊 音色试听播放器

自动生成字幕

AI智能识别语音并生成时间轴字幕

自动添加背景音乐

智能匹配视频节奏添加背景音乐

🎚️

音量控制(精准调节)

独立调节配音、BGM和原始音频的音量大小

100%
静音 200%(最大)
30%
静音 100%(最大)
20%
静音 100%(最大)

💡 提示: 配音音量建议100%,BGM建议20-40%,原始音频建议0-30%,根据实际效果调整。

🎬

字幕样式设置

控制字幕的大小、样式和屏幕位置

自动 120px
0 10
示例字幕预览:这是一个测试句子
提示:修改上方的样式、字体和颜色时,这里的字幕效果会实时更新。
⏱️

核心算法:时间轴优化(音视频同步)

动态时间规整确保音视频精确同步

技术性能优化

处理速度与质量的平衡控制

📱

跨平台适配配置

自动适配不同平台的视频格式和尺寸要求

🤖

AIGC技术融合(未来方向)

生成式AI技术创建原创内容

5 开始处理
处理进度
0%

✅ 处理完成!

清理产物
缓存
文案脚本
音频
视频
画面帧
字幕
源音频
源视频
时间范围:
最终导出与成片(谨慎)
注意:勾选"最终导出与成片"将删除 output/ 与 exports/ 下的最终文件。
⚠️ 源音频、源视频:这是您上传的原始素材,删除后无法恢复!