语音与音乐

whisper-stt

whisper-stt 页面用于说明语音识别、语音合成、声音克隆或音乐生成任务。

任务类型

whisper-stt 页面用于说明语音识别、语音合成、声音克隆或音乐生成任务。

多模态任务失败时，优先检查文件大小、URL 是否公网可访问、格式是否符合模型要求，以及客户端 timeout 是否过短。