Apibūdinkite šį dirbtinį intelektą keliais žodžiais ir jis sukurs nuostabų vaizdą – bet ar tai menas?

Paveikslėlis gali būti vertas tūkstančio žodžių, tačiau dirbtinio intelekto programos DALL-E 2 dėka galite turėti profesionaliai atrodantį vaizdą su daugybe kitų.

DALL-E 2 yra naujas neuroninio tinklo algoritmas, sukuriantis paveikslėlį iš trumpos jūsų pateiktos frazės ar sakinio. Programa, apie kurią dirbtinio intelekto tyrimų laboratorija „OpenAI“ paskelbė 2022 m. balandį, nebuvo paskelbta viešai. Tačiau nedideliam ir augančiam žmonių skaičiui – įskaitant mane – buvo suteikta prieiga su juo eksperimentuoti.

Kaip mokslininkas, tyrinėjantis technologijų ir meno ryšį, man buvo įdomu pamatyti, kaip programa veikia. Po kelių valandų eksperimentavimo akivaizdu, kad DALL-E – nors ir be trūkumų, bet ir gerokai lenkia esamą vaizdo generavimo technologiją. Tai iš karto kelia klausimų, kaip šios technologijos pakeis meno kūrimą ir vartojimą. Taip pat kyla klausimų, ką reiškia būti kūrybingam, kai atrodo, kad DALL-E 2 automatizuoja tiek daug paties kūrybos proceso.

Stulbinantis stilių ir temų pasirinkimas

OpenAI mokslininkai sukūrė DALL-E 2 iš didžiulės vaizdų su antraštėmis kolekcijos. Kai kuriuos vaizdus jie surinko internete, o kitus licencijavo.

DALL-E 2 naudojimas panašus į vaizdo paiešką internete: į teksto laukelį įvedate trumpą frazę ir pateikiami šeši vaizdai.

Tačiau užuot pašalinta iš žiniatinklio, programa sukuria šešis visiškai naujus vaizdus, ​​kurių kiekvienas atspindi tam tikrą įvestos frazės versiją. (Iki neseniai programa vienu raginimu sukurdavo 10 vaizdų.) Pavyzdžiui, kai su draugais davėme DALL-E 2 tekstinį raginimą „katės devo kepurėse“, buvo sukurta 10 vaizdų kurie buvo įvairių stilių.

Beveik visi jie gali būti tinkami profesionalioms nuotraukoms ar piešiniams. Nors algoritmas nelabai suvokė „Devo skrybėlę“ – keistus šalmus, kuriuos dėvėjo „New Wave“ grupė „Devo“, tačiau jos sukurtuose vaizduose galvos apdangalai priartėjo.

Per pastaruosius kelerius metus nedidelė menininkų bendruomenė meno kūrimui naudojo neuroninių tinklų algoritmus. Daugelis šių meno kūrinių pasižymi išskirtinėmis savybėmis, kurios beveik atrodo kaip tikri vaizdai, tačiau su keistais erdvės iškraipymais – tam tikras kiberpanko kubizmas. Naujausios teksto į vaizdą sistemos dažnai sukuria svajingus vaizdus, ​​kurie gali būti fantastiški, bet retai atrodo tikri.

DALL-E 2 siūlo didelį vaizdų kokybės ir tikroviškumo šuolį. Jis taip pat gali nepaprastai tiksliai imituoti konkrečius stilius. Jei norite vaizdų, kurie atrodytų kaip tikros nuotraukos, bus sukurti šeši gyvenimiški vaizdai. Jei norite priešistorinių Šreko urvų paveikslų, bus sukurtos šešios Šreko nuotraukos, tarsi jas būtų nupiešęs priešistorinis menininkas.

Stulbina, kad algoritmas gali tai padaryti. Kiekvienas vaizdų rinkinys sukuriamas mažiau nei minutę. Ne visi vaizdai atrodys malonūs akiai ir nebūtinai atspindės tai, ką turėjote galvoje. Tačiau net ir turint būtinybę sijoti daugybę rezultatų arba išbandyti skirtingus teksto raginimus, nėra kito būdo taip greitai pasiekti tiek puikių rezultatų – net samdant menininką. Ir kartais netikėti rezultatai būna geriausi.

Iš esmės kiekvienas, turintis pakankamai išteklių ir patirties, gali sukurti tokią sistemą. „Google Research“ neseniai paskelbė apie įspūdingą, panašią teksto į vaizdą sistemą, o vienas startuolis „HuggingFace“ viešai kuria savo versiją, kurią dabar gali išbandyti bet kas internete, nors ji dar nėra tokia gera kaip DALL-E ar „Google“ sistema. .

Nesunku įsivaizduoti, kad šie įrankiai pakeičia žmonių vaizdų kūrimo ir bendravimo būdus, naudojant memus, sveikinimo atvirukus, reklamą ir, taip, meną.

Kur čia menas?

Turėjau akimirką anksti, kai naudoju DALL-E 2 įvairių tipų paveikslams generuoti įvairiais skirtingais stiliais (pvz., „Odilono Redono paveikslas iš Sietlo“), kai man pasirodė, kad tai geresnis už bet kokį mano sukurtą tapybos algoritmą. . Tada supratau, kad tai tam tikra prasme geresnis dailininkas nei aš.

Tiesą sakant, joks žmogus negali padaryti to, ką daro DALL-E 2: per kelias sekundes sukurti tokį aukštos kokybės, įvairų vaizdų diapazoną. Jei kas nors jums pasakytų, kad žmogus sukūrė visus šiuos vaizdus, ​​žinoma, sakytumėte, kad jie buvo kūrybingi.

Tačiau tai nepadaro DALL-E 2 menininku. Nors kartais tai atrodo kaip magija, po gaubtu tai vis dar yra kompiuterinis algoritmas, griežtai vykdantis algoritmo autorių OpenAI instrukcijas.

Jei šie vaizdai pasisektų kaip menas, jie yra algoritmo sukūrimo, vaizdų, kuriais jis buvo išmokytas, ir – svarbiausia – kaip menininkai jį naudoja, produktai.

Galbūt esate linkę sakyti, kad vaizdas, sukurtas keliais klavišų paspaudimais, neturi meninių privalumų. Tačiau, mano nuomone, toks mąstymas atkartoja klasikinį požiūrį, kad fotografija negali būti menas, nes visą darbą atliko mašina. Šiandien meninės fotografijos žmogaus autorystė ir amatai pripažįstami, o kritikai supranta, kad geriausia fotografija apima daug daugiau nei tik mygtuko paspaudimą.

Nepaisant to, dažnai apie meno kūrinius diskutuojame taip, lyg jie būtų tiesiogiai kilę iš menininko ketinimų. Menininkas ketino parodyti daiktą ar išreikšti emociją, todėl jie padarė šį vaizdą. Atrodo, kad DALL-E 2 visiškai sutrumpina šį procesą: turite idėją ir ją įveskite, ir viskas.

Bet kai piešiu senamadišku būdu, pastebėjau, kad mano paveikslai atsiranda tyrinėjant, o ne tik įgyvendinant pradinius tikslus. Ir tai galioja daugeliui menininkų.

Paimkime Paulą McCartney, kuris jam sesijos metu sugalvojo kūrinį „Get Back“. Jis nepradėjo nuo dainos plano; jis tiesiog pradėjo smuikuoti ir eksperimentuoti, o grupė tai sukūrė iš ten.

Picasso savo procesą apibūdino panašiai: „Nežinau iš anksto, ką dėsiu ant drobės, taip pat iš anksto nusprendžiu, kokias spalvas naudosiu… Kiekvieną kartą, kai imuosi nutapyti paveikslą, turiu pojūtį iššokti į kosmosą“.

Tyrinėdamas su DALL-E 2, viena idėja vedė į kitą, kuri atvedė prie kitos, ir galiausiai atsidūriau visiškai netikėtoje, stebuklingoje naujoje vietovėje, labai toli nuo to, kur pradėjau.

Raginimas kaip menas

Norėčiau teigti, kad menas, naudojant tokią sistemą kaip DALL-E 2, kyla ne tik iš galutinio teksto raginimo, bet ir per visą kūrybinį procesą, kuris paskatino tą raginimą. Skirtingi menininkai stebės skirtingus procesus ir pasieks skirtingus rezultatus, atspindinčius jų pačių požiūrį, įgūdžius ir manijas.

Savo eksperimentus pradėjau vertinti kaip serialų rinkinį, kurių kiekvienas nuosekliai pasineria į vieną temą, o ne kaip į nepriklausomų gudrių vaizdų rinkinį.

Šių vaizdų ir serialų idėjos kilo iš visur, dažnai susietos laiptelių rinkiniu. Vienu metu, kurdamas vaizdus pagal šiuolaikinių menininkų darbus, norėjau sukurti konkrečios vietos instaliacijos meno vaizdą šiuolaikinio japonų menininko Yayoi Kusamos stiliumi. Išbandžius keletą nepatenkinamų vietų, man kilo mintis pastatyti jį La Mezquita, buvusioje mečetėje ir bažnyčioje Kordoboje, Ispanijoje. Nusiunčiau nuotrauką kolegai architektui Manueliui Ladronui de Guevarai, kuris yra iš Kordobos, ir mes kartu pradėjome ieškoti kitų architektūrinių idėjų.

Tai tapo serija apie įsivaizduojamus naujus skirtingų architektų stilių pastatus.

Taigi pradėjau galvoti, kad tai, ką darau su DALL-E 2, yra ir tyrinėjimo, ir meno forma, net jei tai dažnai yra mėgėjiškas menas, pavyzdžiui, piešiniai, kuriuos darau savo iPad.

Iš tiesų kai kurie menininkai, kaip Ryanas Murdochas, pasisakė už tai, kad greitas įvaizdžio kūrimas būtų pripažintas menu. Jis nurodo į patyrusi AI menininkė Helena Sarin pavyzdžiui.

„Kai žiūriu į daugumą dalykų iš Midjourney“ – kitos populiarios teksto į vaizdą sistemos – „daug kas bus įdomu ar smagu“, – viename interviu man pasakė Murdochas. „Bet su [Sarin’s] darbas, yra perėjimo linija. Nesunku pastebėti, kad ji daug galvojo ir dirbo šį amatą, nes produkcija yra vizualiai patrauklesnė ir įdomesnė, be to, ji nuolat seka jos stilių.

Darbas su DALL-E 2 arba bet kuria iš naujų teksto į vaizdą sistemų reiškia išmokti jos ypatumus ir kurti strategijas, kaip išvengti įprastų spąstų. Taip pat svarbu žinoti apie galimą jo žalą, pvz., priklausomybę nuo stereotipų ir galimą dezinformacijos panaudojimą. Naudodami DALL-E 2 taip pat atrasite stebinančių sąsajų, pavyzdžiui, kaip viskas tampa sena, kai naudojate seną tapytojo, filmų kūrėjo ar fotografo stilių.

Kai noriu padaryti ką nors labai konkretaus, DALL-E 2 dažnai to negali padaryti. Rezultatams vėliau reikės daug sudėtingo redagavimo rankiniu būdu. Būtent tada, kai mano tikslai yra neaiškūs, procesas yra labiausiai džiuginantis, pasiūlydamas staigmenų, kurios veda į naujas idėjas, kurios savaime sukelia daugiau idėjų ir pan.

Kurti naujas realijas

Šios teksto į vaizdą sistemos gali padėti vartotojams įsivaizduoti ir naujas galimybes.

Menininkė aktyvistė Danielle Baskin man pasakė, kad ji visada stengiasi „parodydama alternatyvias realijas „tikru“ pavyzdžiu: kurdama scenarijus fiziniame pasaulyje arba kruopščiai dirbdama „Photoshop“. Tačiau DALL-E 2 „yra nuostabi nuoroda, nes ji puikiai realizuoja. Ir tai yra esminis dalykas, padedantis kitiems atgaivinti galimą ateitį – ar tai būtų satyra, svajonės ar grožis.

Ji panaudojo tai įsivaizduodama alternatyvi transporto sistema ir santechnika, kuri veža makaronus vietoj vandenskurie abu atspindi jos menininko provokatoriaus jautrumą.

Panašiai ir menininko Mario Klingemanno architektūriniai vaizdai su benamių palapinėmis galėtų būti priimtas kaip replikas mano architektūriniai išgalvotų svajonių namų atvaizdai.

Dar per anksti spręsti apie šios meno formos reikšmę. Vis galvoju apie frazę iš puikios knygos „Art in the After-Culture“ – „Dominuojanti AI estetika yra naujovė“.

Žinoma, tai tam tikru mastu būtų tiesa bet kuriai naujai menui naudojamai technologijai. Pirmieji brolių Lumière’ų filmai 1890-aisiais buvo naujovės, o ne kino šedevrai; žmones nustebino iš viso matant judančius vaizdus.

AI meno programinė įranga vystosi taip greitai, kad yra nuolatinės techninės ir meninės naujovės. Panašu, kad kiekvienais metais atsiranda galimybė ištirti naują įdomią technologiją – kiekviena galingesnė nei ankstesnė, ir kiekviena, atrodo, yra pasirengusi pakeisti meną ir visuomenę.

Leave a Comment