Il numero di generatori di testo-immagine di intelligenza artificiale (AI) disponibili sta aumentando rapidamente, offrendo al pubblico una serie di nuovi strumenti per creare immagini digitali.

Il mese scorso, la società di sviluppo AI OpenAI ha rimosso la sua lista d’attesa per DALL· E, un generatore di immagini basato sull’intelligenza artificiale che l’organizzazione ha costruito.

DALL· E, che prende il nome dall’artista spagnolo Salvador Dalí e dal film d’animazione Disney Pixar WALL-E, crea immagini da descrizioni testuali che gli utenti possono inserire nel sistema.

Ad esempio, come si vede sull’account Twitter del CEO di OpenAI Sam Altman, un utente potrebbe richiedere DALL· per creare un’immagine di “un tea party di elefante su un prato d’erba” o “un gatto saggio che medita sull’Himalaya in cerca di illuminazione”.

DALL· E è stato presentato per la prima volta ad aprile per selezionare gli utenti tra cui una serie di grafici, autori e architetti.

A giugno, un DALL· L’immagine ha fatto notizia dopo essere stata pubblicata sulla copertina di Cosmopolitan, la prima copertina di rivista generata dall’intelligenza artificiale, secondo Cosmopolitan.

“Mentre ogni tentativo richiede solo 20 secondi per essere generato, ci sono voluti centinaia di tentativi”, ha spiegato su Instagram Karen X Cheng, un’artista digitale che ha contribuito a produrre la copertina di Cosmopolitan.

“Ore e ore di generazione e perfezionamento dei prompt prima di ottenere l’immagine perfetta.”

DALL· E è stato costruito utilizzando un generatore di testo OpenAI noto come GPT-3.

Il sistema è stato aggiornato e addestrato per produrre immagini corrispondenti da frasi di testo complesse con 12 miliardi di parametri.

Già, DALL· E ha oltre 1,5 milioni di utenti attivi che creano più di 2 milioni di immagini al giorno, secondo OpenAI.

DALL· E si unisce a molti altri generatori di immagini basati sull’intelligenza artificiale che sono stati svelati al pubblico negli ultimi mesi. Ad esempio, ad agosto, l’organizzazione di ricerca sull’intelligenza artificiale Stability.ai ha rilasciato Stable Diffusion, un altro generatore di testo a immagine. Google sta anche lavorando per sviluppare due sistemi text-to-image chiamati Imagen and Parti, acronimo di Pathways Autoregressive Text-to-Image.

Midjourney è un altro generatore di testo a immagine che consente agli utenti di inserire prompt tramite Discord, una popolare piattaforma di messaggistica di gruppo.

Il sistema ha guadagnato un’attenzione diffusa in agosto dopo che un’immagine creata su Midjourney ha vinto un concorso d’arte negli Stati Uniti.

La vittoria ha scatenato un intenso dibattito all’interno del mondo dell’arte sui processi creativi e su ciò che costituisce l’arte.

Migliaia di immagini generate dall’intelligenza artificiale vengono già offerte in vendita e scaricate su alcuni siti Web di foto stock.

Eppure l’uso di generatori di arte AI ha scatenato diffuse preoccupazioni sul copyright.

A settembre, Getty Images, una delle principali società al mondo di media visivi e forniture fotografiche, ha annunciato che non avrebbe accettato immagini generate dall’intelligenza artificiale sulle sue varie piattaforme.

La società ha dichiarato in una dichiarazione che la decisione è stata presa a causa delle responsabilità del copyright e delle preoccupazioni sui diritti d’uso.

“Continueremo a supportare i creativi che utilizzano strumenti, compresi quelli che possono sfruttare l’intelligenza artificiale, per migliorare i loro concetti originali e il lavoro visivo in linea con le nostre politiche di accettazione”, ha aggiunto la dichiarazione di Getty Images.

“Siamo pronti a lavorare con coloro che vogliono far progredire l’IA in modo socialmente responsabile e che rispetti i diritti di proprietà personale e intellettuale”.

Inoltre, gli scettici hanno lanciato l’allarme sui generatori di immagini AI utilizzati per creare contenuti dannosi, diffondere disinformazione e promuovere pregiudizi e stereotipi negativi.

E mentre alcuni sistemi text-to-image hanno alcuni guardrail – come vietare le immagini di personaggi pubblici come celebrità o politici – molte persone hanno chiesto un sistema di governo più rigoroso per regolare il settore.

“Solo perché le immagini sono create dall’IA non significa che non dovrebbero essere governate da principi etici o rispettare le leggi e i regolamenti nazionali, ad esempio le leggi sulla privacy, le leggi sulla protezione dei minori, i diritti d’autore”, ha affermato Hubert Halopé, curatore principale della piattaforma del World Economic Forum per l’intelligenza artificiale e l’apprendimento automatico.

I ricercatori di intelligenza artificiale stanno lavorando per perfezionare i sistemi text-to-image e affrontare tali preoccupazioni. OpenAI, ad esempio, ha già svelato la sua seconda iterazione di DALL· E, DALL· E 2, che è stato costruito per identificare meglio l’uso improprio di immagini personali come i volti individuali e per contrastare i pregiudizi quando gli input di testo non specificano la razza o il genere. Tali input potrebbero includere “CEO”, “pompiere” o “dottore”.

“Sulla base della nostra valutazione interna, gli utenti erano 12× più propensi a dire che DALL· Le immagini E includevano persone di diversa estrazione dopo l’applicazione della tecnica”, ha detto OpenAI in una nota.

Sono in fase di sviluppo anche sistemi text-to-video basati sull’intelligenza artificiale. E mentre i generatori video sono in una fase precedente rispetto ai sistemi text-to-image, molti hanno debuttato negli ultimi mesi.

A maggio, i ricercatori della Tsinghua University cinese e dell’Accademia di intelligenza artificiale di Pechino hanno presentato un generatore video basato sull’intelligenza artificiale chiamato CogVideo.

Più recentemente, a settembre, Meta, la società madre Facebook, Instagram e WhatsApp, ha lanciato Make-A-Video, un sistema di intelligenza artificiale che crea brevi video clip da prompt di testo. “Questo è un progresso piuttosto sorprendente”, ha detto il CEO di Meta Mark Zuckerberg su Facebook.

“È molto più difficile generare video che foto perché oltre a generare correttamente ogni pixel, il sistema deve anche prevedere come cambieranno nel tempo”, ha aggiunto Zuckerberg.

Il rilascio di Meta è arrivato solo poche settimane prima che Google presentasse Imagen Video, un simile sistema di text-to-video AI. La società ha affermato in un documento di ricerca che Imagen Video è “non solo in grado di generare video ad alta fedeltà, ma anche di avere un alto grado di controllabilità e conoscenza del mondo, compresa la capacità di generare diversi video e animazioni di testo in vari stili artistici e con la comprensione degli oggetti 3D”.

Fonte Forum Word Davos

Di Remo12

Lascia un commento

Follow by Email
LinkedIn
LinkedIn
Share