返回首页 系统设置 声音克隆
配置已保存

说话人嵌入 (Speaker Embedding)

多语言人语音合成的音调选择

嵌入文本模型
嵌入维度

音频特征提取配置

MFCC、梅尔频谱等声学特征

特征类型
梅尔滤波器组数
FFT长度
跳跃长度 (Hop Length)

数据增强配置

语音合成数据增强策略

时间间常数
音调修改范围
背景音消除强度
音量变化强度

格式性能优化

处理速度与质量的平衡

推理速度模式
计数数值
批处理大小