Google ha recentemente presentato Imagen 2, la nuova versione del sistema di generazione di immagini tramite testo sviluppato da Google DeepMind. Imagen 2 fornisce risultati di qualità superiore rispetto al passato. Le immagini sono più dettagliate e realistiche, generate sulla base di brevi prompt testuali. Da poche ore Google ha rilasciato ImageFX, un nuovo strumento di generazione di immagini basato su Imagen 2.
ImageFX offre un’interfaccia potente per sperimentare in modo rapido e sicuro la generazione di immagini. Google ha annunciato di aver migliorato anche gli altri due strumenti di creazione di IA generativa già esistenti MusicFX e TextFX. Tutti e tre i tool sono disponibili sul sito aitestkitchen.withgoogle.com .
Purtroppo questi tre strumenti sono per ora disponibili solo negli Stati Uniti, in Nuova Zelanda, Kenya e Australia. Se hai una VPN, puoi provare ad utilizzarli tramite la VPN di uno di questi stati.
Inoltre, Google ha annunciato che a partire da oggi, Imagen 2 alimenterà nuove funzionalità di generazione di immagini su Bard, la chat conversazionale di Google e Vertex AI. Sempre da oggi, Imagen 2 potenzia anche le funzionalità di conversione del testo in immagine in Ads, Duet AI in Workspace e SGE.
In questo modo Google vuole portare ad un ampio pubblico la sperimentazione di Imagen 2.
ImageFX
ImageFX è un progetto sperimentale di Google potenziato da Imagen 2. Progettato per la sperimentazione e la creatività, ImageFX consente di creare immagini da un semplice messaggio di testo; in modo simile a DALL-E 3, Midjourney ed altri generatori di immagine.
ImageFX può anche modificarle facilmente con un nuovo approccio utilizzando “chips” espressive. Le “chips” espressive sono opzioni o attributi di immagine che è possibile applicare alle immagini create con ImageFX.
ImageFX è disponibile nella AI Test Kitchen. Google ha annunciato di aver migliorato anche gli altri due strumenti di creazione di IA generativa già esistenti nella AI Test Kitchen, MusicFX e TextFX. Ma non ha precisato quali siano esattamente le novità per questi due tool.
MusicFX e TextFX
MusicFX utilizzando la tecnologia IA, permette di trasformare prompt di testo in brani strumentali originali. Il processo è semplice: inserendo una descrizione testuale dello stile, del genere o dell’atmosfera desiderati, MusicFX elabora queste informazioni per generare musica che corrisponde alle specifiche fornite.
L’interfaccia intuitiva di MusicFX permette di modificare i prompt e sperimentare con diversi stili e tempi musicali. Con opzioni per regolare la durata del brano generato e la possibilità di scaricare e condividere le creazioni, MusicFX apre più possibilità ai creatori di contenuti e appassionati di musica.
MusicFX non è però una novità. Per esempio, Microsoft permette di fare qualcosa di simile con Copilot grazie alle potenzialità offerte da Suno.
TextFX invece è un esperimento di IA progettato per aiutare rapper, scrittori e amanti delle parole a ampliare il loro processo creativo. È stato creato in collaborazione con Lupe Fiasco, prendendo ispirazione dalle tecniche liriche e linguistiche che ha sviluppato nel corso della sua carriera. TextFX è composto da 10 strumenti, ognuno progettato per esplorare possibilità creative con il testo e il linguaggio. TextFX è potenziato dal modello IA LLM PaLM 2 di Google, tramite l’API PaLM.
Puoi accedere a TextFX da questo link.
Sicurezza sulla privacy e SynthID
Google è molto attenta alla sicurezza del modello di creazioni immagini Imagen 2. Applica diversi filtri per evitare la generazione di immagini che potrebbero violare la privacy; inoltre tutte le immagini generate con Imagen 2 sono contrassegnate da SynthID. Il SynthID aggiunge un watermark digitale (invisibile) direttamente nei pixel delle immagini generate.
I watermark SynthID sono invisibili ma rilevabili per l’identificazione. Il SynthID permetterà di identificare se l’immagine è stata creata da una IA. Google fornirà informazioni su un eventuale presenza di un SynthID, anche sulle immagini che cercherai su Google Search o Chrome.
Lo stesso approccio è adottato anche per la musica creata in modo artificiale con MusicFX .
Conclusione
Google sta lavorando attivamente per rendere sempre più accessibili ed evolute le proprie tecnologie di generazione creativa tramite intelligenza artificiale, nel rispetto dei propri principi di sicurezza e trasparenza. La concorrenza è spietata ed agguerrita; basti pensare a Midjourney, Stable Diffusion o DALL-E 3. Tuttavia, Google sembra avere tutti i mezzi per recuperare i passi perduti.
Attraverso la piattaforma AI Test Kitchen, Google dimostra le capacità avanzate dei suoi modelli IA. In più, offre anche un’occasione per interagire con queste tecnologie in modo diretto e personale.