TACOTRON2_WAVERNN_CHAR_LJSPEECH¶

torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH¶

基於字元的 TTS pipeline，使用在 LJSpeech 上訓練 1,500 個 epoch 的 Tacotron2 [Ito 和 Johnson, 2017] 以及在 LJSpeech 的 8 位元深度波形上訓練 10,000 個 epoch 的 WaveRNN 聲碼器 [Ito 和 Johnson, 2017]。

文字處理器逐字元編碼輸入文字。

您可以在這裡找到訓練腳本。使用了以下參數：win_length=1100、hop_length=275、n_fft=2048、mel_fmin=40 和 mel_fmax=11025。

您可以在這裡找到訓練腳本。

範例 - “Hello world! T T S stands for Text to Speech!”

範例 - 「專家的檢查和證詞使委員會能夠斷定可能開了五槍」，

文件