语音与音乐

whisper-stt

whisper-stt 页面用于说明语音识别、语音合成、声音克隆或音乐生成任务。

任务类型

whisper-stt 页面用于说明语音识别、语音合成、声音克隆或音乐生成任务。

请求准备

  • 确认模型目录中存在对应模型或能力。
  • 准备输入文本、图片、音频、视频或参考素材。
  • 设置合理的尺寸、时长、格式和 timeout。
  • 生成类任务建议保存任务 ID、状态和结果 URL。

接口配置

Base URLhttps://api.aliapi.me/v1
模型模型目录中的对应模型
接口语音识别接口

排查建议

多模态任务失败时,优先检查文件大小、URL 是否公网可访问、格式是否符合模型要求,以及客户端 timeout 是否过短。