TACOTRON2_WAVERNN_CHAR_LJSPEECH¶
- torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH¶
基於字元的 TTS pipeline,使用在 LJSpeech 上訓練 1,500 個 epoch 的
Tacotron2
[Ito 和 Johnson, 2017] 以及在 LJSpeech 的 8 位元深度波形上訓練 10,000 個 epoch 的WaveRNN
聲碼器 [Ito 和 Johnson, 2017]。文字處理器逐字元編碼輸入文字。
您可以在 這裡 找到訓練腳本。使用了以下參數:
win_length=1100
、hop_length=275
、n_fft=2048
、mel_fmin=40
和mel_fmax=11025
。您可以在 這裡 找到訓練腳本。
請參考
torchaudio.pipelines.Tacotron2TTSBundle()
以了解用法。範例 - “Hello world! T T S stands for Text to Speech!”
範例 - 「專家的檢查和證詞使委員會能夠斷定可能開了五槍」,