Тешко је поверовати да је прошло само годину дана од када је бета верзија DALL-E, OpenAI генератор слика на основу текста, пуштена на интернет. Од тада је дошло до експлозије AI-генерисаних визуелних садржаја, при чему људи стварају просечно 34 милиона слика дневно, што је више од 15 милијарди слика које су креиране коришћењем алгоритама за текст-у-слику само 2022. године. Према извештају Everypixel Journala, фотографима је требало 150 година, од првог фотографисања 1826. године до 1975. године, да достигну бројку од 15 милијарди слика.
С новим AI генераторима текста-у-слику, који се лансирају тако брзо, тешко је пратити шта је доступно и који пружа најбоље резултате.
ChatGPT: DALL-Е 2 и DALL-Е3
Један од првих који се појавио у таласу AI генератора текста-у-слику, DALL-Е 2 је постао основни извор за стварање уметности на основу природних језичких описа. Има четири пута већу резолуцију од свог претходника DALL-Е 1 и долази са неколико нових безбедносних мера које спречавају кориснике да генеришу насилни или експлицитни садржај, као и фотореалистичне генерације лица стварних особа, укључујући и јавне личности. Такође, омогућава креаторима да искључе своју уметност из OpenAI-јевих података за обуку, међутим, мукотрпан процес уклањања слика једну по једну изазвао је фрустрацију код многих уметника због овог новог развоја. Ако платите за ChatGPT Plus, добићете директни приступ DALL-Е 3 унутар интерфејса ChatGPT-а, што значи да не морате трошити време на креирање правог подстицаја за слику, већ, једноставно, можете замолити ChatGPT-а да то уради за вас. Међутим, ова погодност долази уз цену, са премијум пакетом који кошта 20 долара месечно.
Предности:
- Једноставан кориснички интерфејс, одличан за генерисање надреалних слика
Недостаци:
- Није најбоља опција на листи за генерисање лица или реалистичних слика
- Ради на freemium моделу, који може постати скуп
MIDJOURNEY
Midjourney постаје једна од најбољих опција за генерисање реалистичних слика, лица или било чега што је потребно. За разлику од других модела на овом списку, Midjourney нема посебну платформу већ функционише као бот унутар Discorda. Корисници имају приступ огромној заједници других креатора унутар Discorda и, по подразумеваном подешавању, уметност коју генеришете ће се појавити у једном од многих јавних канала с креацијама свих осталих. Ако вам смета претраживање препуног тока уметности која се непрестано генерише, можете копирати Midjourney бот на приватни сервер. Тренутно, Midjourney ради на верзији 5.2 и укључује режиме веће варијације, нове функције попут зумирања ван/изван слике за проширење оквира слике, и inpainтinga, који омогућава корисницима да врше промене на одређеним деловима слике без потребе за поновним генерисањем целог подстицаја.
Предности:
- Одличан квалитет реалистичних слика
- Опсежна документација на Midjourneyjevom веб сајту
- Корисна Discord заједница за почетнике
Недостаци:
- Бесплатна верзија је укинута
- Генерисање слика унутар јавног Discord сервера може постати хаотично
ADOBE FIREFLY
Adobe Firefly изашао је из бета фазе у септембру и почео је да се разликује од DALL-E и Midjourneyja из неколико разлога. Главна разлика је у томе што је Firefly модел обучен користећи Adobe Stock слике и материјал из јавног домена с истеклим ауторским правима, што осигурава да су подаци за обуку добијени уз експлицитну дозволу креатора. Сада када је доступан комерцијално, Firefly је интегрисан у различите Creative Cloud апликације, укључујући Photoshop, Illustrator и Adobe Express. Корисници могу искористити Generative Fill функцију у Photoshopu да додају, уклоне или прошире садржај на сликама, користећи једноставне текстуалне подстицаје. Такође, има функцију текст-у-векторску графику, која омогућава корисницима да креирају едитабилне векторске графике из текстуалних подстицаја, што би могло да буде прекретница за дизајнере, посебно како се модел наставља побољшавати.
Предности:
- Кориснички интерфејс је врло интуитиван
- Подржава генерисање текста у векторску графику
Недостаци:
- Ограничене опције прилагођавања, недостатак контроле.