Sintesi Vocale con Python e gTTS

Pubblicato da Michele Saba

La sintesi vocale (in inglese speech synthesis) è la tecnica per la riproduzione artificiale della voce umana.
Nel video tutorial di oggi vedremo come sia possibile utilizzare le API per la sintesi vocale messe a disposizione da Google in Python, tramite il modulo gTTS, che sta appunto per Text To Speech.

Di seguito il codice utilizzato nel video tutorial:

from gtts import gTTS import subprocess

text = """ciao a tutti, questo è il primo test!"""
tts = gTTS(text=text, lang='it')
tts.save("tts_output_audio.mp3")
print("tutto fatto, file salvato!")
subprocess.run(["audacious", "tts_output_audio.mp3"])

Piccola precisazione: per cercare di trasmettere un messaggio quanto più accessibile possibile, parlo all'inizio della creazione di un "sintetizzatore vocale", quando in effetti si tratta, come faccio notare subito dopo, di uno script che utilizza una libreria per implementare le funzionalità di sintesi vocale offerte e messe a disposizione da Google, mediante le API di Translate. Cerco sempre di trovare un buon equilibrio tra facilità di acquisizione dei contenuti e livello di approfondimento nei miei tutorial, e per questo motivo ho comunque aperto con la pagina di Wikipedia dedicata proprio alla Sintesi Vocale. Tuttavia questo mi è stato fatto notare, e giustamente, per alcuni potrebbe sembrare un'over semplificazione. Se così fosse, be in effetti avete ragione! ;)

Buona Visione, ed Happy Coding! ;) 


Vuoi imparare Python come un/a professionista? Dai uno sguardo ai nostri