след дълго чакане, DALL-E 2Това е AI система за генериране на изображения на OpenAI, достъпна като API, което означава, че разработчиците могат да вградят системата в своите приложения, уебсайтове и услуги. В днешната публикация в блога OpenAI обяви, че всеки разработчик може да започне да използва силата на DALL-E 2 – сега се използва от повече от три милиона души за създаване на повече от четири милиона изображения на ден – след като създаде OpenAI API акаунт като част от публична бета версия.
Цената на DALL-E 2 API варира в зависимост от резолюцията. За 1024 x 1024 изображения цената е $0,02 на изображение; Изображение 512 x 512 е $0,018 на изображение; А снимките 256×256 са $0,016 на снимка. Отстъпките за обем са достъпни за компании, работещи с екипа на OpenAI Foundation.
Както при DALL-E 2 бета, API ще позволи на потребителите да създават нови изображения от текстови подкани (например „Пухкав заек, подскачащ през поле с цветя“) или да редактират съществуващи изображения. Microsoft, близък партньор на OpenAI, работи по него в Bing и Microsoft Edge с създател на снимки Което позволява на потребителите да създават изображения, ако уеб резултатите не връщат това, което търсят. Приложението за моден дизайн CALA използва DALL-E 2 API на инструмента, който позволява на клиентите да прецизират идеите за дизайн от текстови описания или изображения, докато стартиращата компания за снимки Mixtiles го включва в потока на създаване на произведения на изкуството на своите потребители.
Няма много промени по отношение на политиката с пускането на API, което вероятно ще разочарова онези, които се страхуват, че генеративни AI системи като DALL-E 2 ще бъдат пуснати без достатъчно внимание на етичните и правни проблеми, които повдигат. Както и преди, потребителите са обвързани от Общите условия на OpenAI, които забраняват използването на DALL-E 2 за създаване на насилствено, сексуално или насаждащо омраза съдържание. OpenAI също така продължава да не позволява на потребителите да качват изображения на хора без тяхното съгласие или изображения, върху които нямат права, като използва комбинация от автоматизирани и човешки системи за наблюдение, за да наложи това.
Една малка промяна е, че изображенията, генерирани с помощта на API, няма да се изисква да съдържат воден знак. OpenAI въведе воден знак по време на DALL-E 2 бета като начин за обозначаване на изображения, произхождащи от системата, но избра да го направи по избор с пускането на API.
„Насърчаваме разработчиците да разкрият, че изображенията са генерирани от AI, но не изискват подписът на DALL-E 2 да бъде включен“, каза Люк Милър, продуктов мениджър в OpenAI, който наблюдава разработката на DALL-E 2, каза пред TechCrunch чрез имейл.
Инструмент Microsoft Designer, захранван от DALL-E API 2. Кредити за изображения: Microsoft
OpenAI също така използва филтри Quick и Image level с DALL-E 2, макар и филтрите, от които някои клиенти се оплакват. прекалено ревностен И на неточно. Компанията е съсредоточила част от изследователските си усилия върху разнообразяване на типовете изображения, които DALL-E 2 произвежда, с цел да се бори с пристрастията, на които е известно, че стават жертва AI системите за преобразуване на текст в изображение (например създаване изображения в предимно бели мъже, когато бъдете подканени).с текст като „Примери за изпълнителни директори“).
Но тези стъпки не успокоиха всички критици. През август, Getty Images забранен Качвайте и продавайте илюстрации, създадени с DALL-E 2 и други подобни инструменти, следвайки подобни резолюции от сайтове, включително Newgrounds, PurplePort и FurAffinity. Главният изпълнителен директор на Getty Images Крейг Питърс каза пред The Verge, че забраната идва от опасения относно „правилните проблеми, които не са били разгледани“, тъй като наборите от данни за обучение съдържат системи като DALL-E 2 Изображения, защитени с авторски права от мрежата.
Много критици казват, че това не е просто нарушение на Бизнес със запазена марка Което поражда тяхната загриженост за DALL-E 2. Системата застрашава прехраната на артисти, чиито модели вече могат да се повтарят с няколко низа от скриптове, казват те, включително артисти, които не са се съгласили работата им да се използва за обучение по DALL-E 2 . (За да бъдем честни към OpenAI, компанията тя има Той е лицензирал част от изображенията в обучителния набор от данни на DALL-E 2, което е повече, отколкото може да се каже за някои от неговите конкуренти.)
Опитвайки се да намеря компромис, конкурсът на Getty Images Shutterstock наскоро обявявам Той ще започне да използва DALL-E 2 за създаване на съдържание, но в същото време ще стартира „фонд за сътрудници“, за да компенсира създателите, когато компанията продава работа за обучение на AI системи за конвертиране на текст в изображения. Той също така блокира произведения на изкуствен интелект, качени от трети страни, за да намали възможността произведения, защитени с авторски права, да си проправят път към платформата.
Техниците Мат Драйхърст и Холи Херндън ръководят усилие, наречено Източник + За да се позволи на хората да не позволяват тяхната работа или други подобни да бъдат използвани за целите на обучението на AI. Но е доброволно. OpenAI не е казал дали ще участва – или наистина, дали ще предложи инструмент за самообслужване, който да позволи на притежателите на права да изключат работата си от обучение или създаване на съдържание.
Mixtiles е сред първите, които възприеха DALL-E 2 API. Кредити за изображения: смес
В интервю Милър разкри малко за спецификата на новите мерки за смекчаване, с изключение на това, че OpenAI работи за подобряване на техниките си, за да предотврати създаването на предубедено, токсично и по друг начин обидно съдържание, което клиентите могат да намерят за нежелателно. Той описа отворената бета версия на API като „итеративен“ процес, такъв, който ще включва работа с „потребители и артисти“ през следващите няколко месеца, докато OpenAI разширява инфраструктурата за работа с DALL-E 2.
Разбира се, ако DALL-E 2 бета е някаква индикация, API ще го направи се развиват с времето. В началото OpenAI деактивира възможността за редактиране на лица на хора с DALL-E 2, но по-късно може би Способност след подобряване на системата за безопасност.
„Ние свършихме много работа по този аспект на нещата – с изображенията, които качвате, и претенциите, които подавате, дотолкова, доколкото те отговарят на нашата политика за съдържанието и включването на различни смекчаващи мерки за филтриране както на ниво място, така и на изображение ниво, за да се уверим, че отговаря на нашата политика за съдържание. Така че, например, ако някой качи изображение, което съдържа символи на омраза или е кърваво – като много, много, много насилствено съдържание – това няма да бъде одобрено”, каза Милър. „Винаги мислим как да подобрим системата.
Но докато OpenAI изглежда силно желае да избегне противоречията около Stable Diffusion, еквивалентът с отворен код на DALL-E 2, който беше използван за създаване на порноИ на несправедливост И на Deepfakes на знаменитостиОставя се на потребителите на API да изберат точно как и къде да разположат своята технология. Някои, като Microsoft, несъмнено ще възприемат изчислен подход, бавно пускайки продукти, захранвани от DALL-E 2, за да съберат обратна връзка. Други ще се гмурнат с главата напред, прегръщайки както технологията, така и Етични дилеми които идват с него.
Ако едно нещо е сигурно, то е, че има задържано търсене на генеративен ИИ – последствията са проклети. Дори преди API да бъде официално достъпен, разработчиците публикуваха решения за интегриране на DALL-E 2 в приложения, услуги, уебсайтове и дори Видео игри. С пускането на своята публична бета версия, подхранвана от огромната маркетингова сила на OpenAI, синтетичните изображения са готови наистина да навлязат в мейнстрийма.