快捷鍵

TACOTRON2_WAVERNN_CHAR_LJSPEECH

torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH

基於字元的 TTS pipeline,使用在 LJSpeech 上訓練 1,500 個 epoch 的 Tacotron2 [Ito 和 Johnson, 2017] 以及在 LJSpeech 的 8 位元深度波形上訓練 10,000 個 epoch 的 WaveRNN 聲碼器 [Ito 和 Johnson, 2017]

文字處理器逐字元編碼輸入文字。

您可以在 這裡 找到訓練腳本。使用了以下參數:win_length=1100hop_length=275n_fft=2048mel_fmin=40mel_fmax=11025

您可以在 這裡 找到訓練腳本。

請參考 torchaudio.pipelines.Tacotron2TTSBundle() 以了解用法。

範例 - “Hello world! T T S stands for Text to Speech!”

Spectrogram generated by Tacotron2

範例 - 「專家的檢查和證詞使委員會能夠斷定可能開了五槍」,

Spectrogram generated by Tacotron2

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得適合初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得您的問題解答

檢視資源