Google ha rilasciato in modalità sperimentale un’app di dettatura chiamata Google AI Edge Eloquent, inizialmente per dispositivi iOS. L’app, come riportato da TechCrunch, è gratuita e si basa su modelli di riconoscimento vocale automatico (ASR) derivati da Gemma, che possono essere scaricati sul dispositivo per un funzionamento completamente offline. Una volta installati i modelli, l’app fornisce una trascrizione in tempo reale. All’interruzione della dettatura, il sistema filtra automaticamente le interiezioni come ‘um’ e ‘ah’ e ripulisce il testo. L’applicazione offre opzioni per trasformare il testo in punti chiave o in versioni formali, brevi o lunghe. È possibile disattivare la modalità cloud, che altrimenti utilizza i modelli Gemini per la pulizia del testo, a favore di un’elaborazione esclusivamente locale. Google AI Edge Eloquent può importare termini specifici dall’account Gmail dell’utente e consente l’aggiunta di parole personalizzate. L’app mantiene una cronologia delle sessioni di trascrizione, con funzioni di ricerca, e mostra metriche come le parole dettate nell’ultima sessione, la velocità in parole al minuto e il conteggio totale. La descrizione ufficiale sull’App Store menziona anche un’integrazione con Android, che permetterebbe di impostare l’app come tastiera di sistema predefinita e di utilizzare un pulsante fluttuante per l’accesso rapido alla trascrizione.
L’impatto pratico di questa tecnologia interessa principalmente professionisti che necessitano di trascrizioni rapide e accurate in contesti dove la connettività è limitata o la privacy è una priorità. Giornalisti, ricercatori, medici e avvocati possono dettare appunti, relazioni o verbali senza dipendere da una connessione internet, con la garanzia che i dati rimangano sul dispositivo. La capacità di ripulire automaticamente il testo dalle esitazioni riduce significativamente il tempo di post-elaborazione rispetto alle soluzioni di dettatura tradizionali. L’integrazione prospettata con il sistema Android, rendendo l’app accessibile da qualsiasi campo di testo, potrebbe semplificare ulteriormente il flusso di lavoro, avvicinandosi all’esperienza offerta da concorrenti come Wispr Flow. Per gli sviluppatori, il rilascio segnala l’evoluzione e la disponibilità di modelli ASR efficienti come Gemma per applicazioni edge, aprendo a nuove possibilità di integrazione in app di terze parti.
La fonte originale non menziona esplicitamente limiti o rischi, ma alcuni aspetti critici sono ragionevolmente inferibili dalla natura della tecnologia. L’accuratezza della trascrizione offline, sebbene probabilmente elevata, potrebbe essere inferiore rispetto all’elaborazione su cloud che utilizza modelli più grandi e aggiornati come Gemini, specialmente per accenti regionali, terminologia tecnica molto specifica o audio in ambienti rumorosi. La dipendenza dall’importazione di termini da Gmail per personalizzare il vocabolario solleva questioni sulla gestione dei dati personali, nonostante l’elaborazione locale. L’app è attualmente disponibile solo su iOS, limitandone la diffusione iniziale, e la sua natura sperimentale suggerisce che potrebbero emergere bug o instabilità. Inoltre, l’ottimizzazione del testo automatica, sebbene utile, potrebbe occasionalmente alterare il significato inteso o rimuovere sfumature importanti in contesti dove la precisione verbatim è richiesta, come in alcune trascrizioni legali.
Il rilascio di Google AI Edge Eloquent si inserisce in un trend crescente di applicazioni AI ‘offline-first’ o ‘edge AI’, che spostano l’elaborazione dai data center ai dispositivi finali. Questo approccio risponde alla domanda di maggiore privacy, minore latenza e indipendenza dalla rete. Google, testando questa funzionalità su iOS prima di un possibile rollout su Android, sembra voler competere in un mercato di app di dettatura di terze parti che sta guadagnando popolarità. Lo sviluppo futuro plausibile include il perfezionamento dei modelli ASR locali, una loro integrazione nativa nel sistema operativo Android e l’estensione delle capacità di ottimizzazione del testo per settori verticali specifici. La domanda aperta è se e come questo tipo di tecnologia, attualmente confinata in un’app sperimentale, verrà incorporata negli ecosistemi produttivi più ampi di Google, influenzando strumenti come Google Docs, Gmail o l’assistente vocale. Per un professionista, la riflessione chiave è: in che misura la disponibilità di una dettatura affidabile e privata sul proprio dispositivo cambierà le abitudini di produzione e documentazione del testo?
Alessio Baronti
Consulente Strategico AI & Sviluppatore Web


