OpenAI, l’azienda che ha creato ChatGPT, ha annunciato l’introduzione di una nuova funzionalità a pagamento che consentirà agli utenti di interagire con l’applicazione attraverso la voce.

Questa modalità di conversazione sarà simile a quella utilizzata con assistenti virtuali come Alexa di Amazon o Siri di Apple: gli utenti potranno porre domande vocali e il software risponderà con una voce sintetica.

Da quando sarà disponibile, quanto costerà e come funzionerà? Vediamo tutti i dettagli nell’articolo.

Conversazione vocale con ChatGPT, in cosa consisterà?

ChatGPT sarà in grado di fornire risposte vocali originali ed elaborate, simili a quanto già fa attraverso il testo scritto.

OpenAI, infatti, nel suo blog ha illustrato come questa nuova funzione potrà essere utile, per esempio, per raccontare storie della buonanotte ai propri figli.

In una dimostrazione un utente ha chiesto a ChatGPT di inventare una storia su un personaggio di fantasia chiamato “super riccio girasole di nome Larry,” e il chatbot ha iniziato a raccontare la storia, non facendosi mai trovare impreparato nemmeno a domande come “come era la sua casa?”, “chi era il suo miglior amico?”.

La nuova funzione Voce si basa su nuovo modello di sintesi vocale. Il sistema Whisper di OpenAI viene utilizzato per convertire le parole pronunciate in testo. Si tratta di un software di trascrizione disponibile da molto tempo come versione open source.

Una volta che la nuova funzionalità vocale sarà disponibile in ChatGPT, gli utenti potranno selezionare una delle cinque voci utilizzando il pulsante delle cuffie nella schermata principale di ChatGPT. Si tratta di voci registrate da alcuni attori.

Con la funzione vocale OpenAI fa un ulteriore passo avanti nell’attuale corsa degli assistenti AI.

Proprio la settimana scorsa, Amazon ha annunciato che avrebbe migliorato le risposte di Alexa con un nuovo Large Language Model (LLM). Microsoft, invece, lancerà Copilot questo autunno.

Il nuovo modello di sintesi vocale di OpenAI è disponibile anche per altri servizi. Spotify, per esempio, vuole usarlo per tradurre automaticamente i podcast, usando la voce del rispettivo podcaster.

Scopri l’app di ChatGPT, cliccando qui.

ChatGPT acquisirà anche input di immagini

Oltre a questa novità, l’aggiornamento introdurrà altre funzionalità interessanti. Ad esempio, ChatGPT sarà in grado di rispondere a messaggi che includono immagini, come una foto del contenuto del frigorifero, e creare un menu basato sugli ingredienti disponibili.

Dovrebbe essere possibile valutare anche diagrammi o altri grafici, e utilizzare uno strumento di disegno per contrassegnare determinate aree di un’immagine per rendere le voci più precise.

Ovviamente, per tutelare la privacy, sono state integrate delle restrizioni se ChatGPT deve analizzare le persone e fare dichiarazioni dirette su di loro.

Queste nuove funzionalità saranno disponibili nell’applicazione entro le prossime due settimane per gli abbonati ai servizi Plus, che costa 20 dollari al mese, ed Enterprise, attualmente riservato ai clienti aziendali.

La funzione vocale sarà disponibile solo per le versioni iOS e Android di ChatGPT; gli utenti dovranno attivarla nelle impostazioni. La funzione immagine è disponibile su tutte le piattaforme, inclusa la versione desktop.

In conclusione, se hai ChatGPT a pagamento, a breve potrai utilizzare questa nuova e avanzata funzione di conversazione vocale che ti permetterà di interagire con il software utilizzando la voce, fornendo risposte vocali originali e complesse.

E, non dimentichiamolo, di scegliere tra 5 voci diverse di attori e doppiatori professionisti.

Questo aggiornamento rende l’esperienza di utilizzo ancora più naturale e versatile, consentendo agli utenti di porre domande a voce e ricevere risposte vocali dettagliate.

Questa innovativa funzionalità amplia le possibilità di utilizzo di ChatGPT, rendendolo un assistente virtuale ancora più potente e completo.