Не сте сигурни какво точно си представяте? Илoн Мъск знае
Dall-E открива връзки между обекти в огромни бази данни от изображения и текстове
Лабораторията за изкуствен интелект в Сан Франциско OpenAI обучи софтуера Dall-E да генерира широк спектър от изображения от кратки текстове. Сред получените причудливи форми са диван-авокадо и няколко одухотворени репички, които разхождат домашните си любимци. Изображенията се създават благодарение на база данни от 12 млрд. изображения, описанията към тях и изкуствен интелект (AI), пише CNBC.
Лабораторията се ползва с подкрепата на най-богатия човек в света - Илон Мъск, а софтуерът й Dall-E е кръстен на испанския сюрреалистичен художник Салвадор Дали и Уол-и, малък анимиран робот от едноименния филм за Pixar. OpenAI показа някои от резултатите в публикация в блог, публикувана във вторник. „Установихме, че Dall-E има разнообразен набор от възможности, включително създаване на антропоморфизирани версии на животни и предмети, комбиниране на несвързани концепции по правдоподобни начини, съживява текстове и трансформира вече съществуващи изображения“, коментират от компанията.
Снимка: https://openai.com/
Софтуерът е изграден върху невронна мрежа, която представлява изчислителна система, вдъхновена от човешкия мозък, която може да забелязва модели и да разпознава връзките между обекти в огромни бази данни от изображения. Докато невронните мрежи са генерирали изображения и видеоклипове и преди появата на Dall-E,то софтуерът на Мъск е необичаен, защото разчита на въвеждането на текст.
Синтетичните видеоклипове и изображения стават по-усъвършенствани през последните години до степен, че за хората е трудно да правят разлика между това, което е реално и това, което се генерира от компютър. Генеративни състезателни мрежи (GAN), които използват две невронни мрежи, са използвани за създаване на фалшиви видеоклипове на политици, например.
„Dall-E има потенциала за значителни, широки обществени въздействия. Планираме да направим анализи как софтуери като Dall-E се отнасят към социални проблеми като икономическо въздействие върху определени работни процеси и професии, потенциал за пристрастия в резултатите от модела и дългосрочните етични предизвикателства, породени от тази технология“, споделя OpenAI.
Наследник на GPT-3
Dall-E идва само няколко месеца след като OpenAI обяви, че е изградил текстов генератор, наречен GPT-3 (Generative Pre-Training), който също използва невронна мрежа. Инструментът за генериране на съдържание е способен да създава човекоподобен текст при поискване и стана относително известен заради AI и осъзнаването на обществото, че може да пише своя собствена поезия, новинарски статии и разкази.
„Технологията за създаване на снимка от текстова информация (Text2image) не е новост, но Dall-E е забележителен за създаването на илюстрации, които са много по-последователни от другите системи Text2Image.“ каза Марк Ридл, доцент в Техническото училище по интерактивни изчисления в Джорджия.
OpenAI се състезава с фирми като DeepMind и Facebook AI Research group за изграждане на алгоритми с общо предназначение, които могат да изпълняват широк спектър от задачи, подходящи за компетенциите на човек, а дори и над тях. AI може да играе сложни игри като шах, да превеждат от един език на друг и да откриват тумори в мамография, но истинското предизвикателство пред технологията е да проявява креативност, а Dall-E го постига.
Снимка: https://openai.com/