OpenAI Audio 操作(OpenAI Audio operations)#
使用此操作来生成音频,或转录或翻译 OpenAI 中的录音。有关 OpenAI 节点本身的更多信息,请参阅 OpenAI。
🌐 Use this operation to generate an audio, or transcribe or translate a recording in OpenAI. Refer to OpenAI for more information on the OpenAI node itself.
生成音频(Generate Audio)#
使用此操作根据文本提示创建音频。
🌐 Use this operation to create audio from a text prompt.
请输入以下参数:
🌐 Enter these parameters:
- 连接凭证:创建或选择一个现有的 OpenAI 凭证。
- 资源:选择 音频。
- 操作:选择 生成音频。
- 模型:选择你想要用于生成音频的模型。更多信息请参考 TTS | OpenAI。
- TTS-1:使用此选项以优化速度。
- TTS-1-HD:使用此选项以优化音质。
- 文本输入:输入要生成音频的文本。最大长度为4096个字符。
- 语音:选择在生成音频时使用的语音。在 文本转语音指南 | OpenAI 中试听语音预览。
选项(Options)#
- 响应格式:选择音频响应的格式。可从 MP3(默认)、OPUS、AAC、FLAC、WAV 和 PCM 中选择。
- 音频速度:输入生成音频的速度,范围从
0.25到4.0。默认值为1。 - 放置输出到字段:默认为
data。请输入要将二进制文件数据放入的输出字段名称。
有关更多信息,请参考 Create speech | OpenAI 文档。
🌐 Refer to Create speech | OpenAI documentation for more information.
转录录音(Transcribe a Recording)#
使用此操作将音频转录为文本。OpenAI API 对音频文件的大小限制为 25 MB。默认情况下,OpenAI 将使用 whisper-1 模型。
🌐 Use this operation to transcribe audio into text. OpenAI API limits the size of the audio file to 25 MB. OpenAI will use the whisper-1 model by default.
请输入以下参数:
🌐 Enter these parameters:
- 连接凭证:创建或选择一个现有的 OpenAI 凭证。
- 资源:选择 音频。
- 操作:选择 转录录音。
- 输入数据字段名称:默认为
data。输入包含音频文件的二进制属性的名称,文件格式可以是:.flac、.mp3、.mp4、.mpeg、.mpga、.m4a、.ogg、.wav或.webm。
选项(Options)#
- 音频文件的语言:请输入输入音频的语言,使用 ISO-639-1 格式。使用此选项可提高准确性和响应速度。
- 输出随机性(温度):默认值为
1.0。调整响应的随机性。范围在0.0(确定性)到1.0(最大随机性)之间。建议修改此值或 输出随机性(Top P),但不要同时修改。可以从中等温度(约 0.7)开始,根据观察到的输出进行调整。如果响应过于重复或僵硬,请提高温度。如果响应过于混乱或偏离主题,请降低温度。
有关更多信息,请参考 Create transcription | OpenAI 文档。
🌐 Refer to Create transcription | OpenAI documentation for more information.
翻译录音(Translate a Recording)#
使用此操作将音频翻译成英文。OpenAI API 将音频文件大小限制为 25 MB。OpenAI 默认将使用 whisper-1 模型。
🌐 Use this operation to translate audio into English. OpenAI API limits the size of the audio file to 25 MB. OpenAI will use the whisper-1 model by default.
请输入以下参数:
🌐 Enter these parameters:
- 连接凭证:创建或选择一个现有的 OpenAI 凭证。
- 资源:选择 音频。
- 操作:选择翻译录音。
- 输入数据字段名称:默认为
data。输入包含音频文件的二进制属性的名称,文件格式可以是:.flac、.mp3、.mp4、.mpeg、.mpga、.m4a、.ogg、.wav或.webm。
选项(Options)#
- 输出随机性(温度):默认值为
1.0。调整响应的随机性。范围在0.0(确定性)到1.0(最大随机性)之间。建议修改此值或 输出随机性(Top P),但不要同时修改。可以从中等温度(约 0.7)开始,根据观察到的输出进行调整。如果响应过于重复或僵硬,请提高温度。如果响应过于混乱或偏离主题,请降低温度。
有关更多信息,请参考 Create transcription | OpenAI 文档。
🌐 Refer to Create transcription | OpenAI documentation for more information.
常见问题(Common issues)#
有关常见错误或问题及建议的解决步骤,请参考 常见问题。
🌐 For common errors or issues and suggested resolution steps, refer to Common Issues.