Є новий фоторедактор від Apple, якщо ви знаєте, де його шукати. Компанія iPhone Kings об’єдналася з дослідниками Каліфорнійського університету в Санта-Барбарі, щоб створити інструмент, який дозволяє редагувати фотографії та зображення за допомогою текстових інструкцій. Він не має офіційного випуску, але дослідники розміщують демо-версію, яку ви можете спробувати самі, яка була помічена вперше Екстремальні технології.
Проект називається Multimodal Large Language Model Guided Image Editing (MGIE). Сьогодні на ринку є багато програм для редагування фотографій штучного інтелекту. Photoshop тепер має вбудовані інструменти штучного інтелекту, а інші, такі як DALL-E від OpenAI, дозволяють редагувати зображення, а також створювати їх із цілої тканини. Однак, якщо ви пробували використовувати їх раніше, ви знаєте, що це може бути трохи неприємно. У багатьох випадках штучному інтелекту важко зрозуміти, що саме ви шукаєте.
Інновація в MGIE додає ще один рівень інтерпретації ШІ. Коли ви повідомляєте штучному інтелекту, що хочете бачити, MGIE спочатку використовує текстовий штучний інтелект, щоб зробити ваші інструкції більш зрозумілими та описовими. «Результати експерименту показують, що виразні інструкції є важливими для редагування зображень на основі інструкцій», — йдеться в статті дослідників. папір Опубліковано на arXiv. «MGIE може призвести до значного покращення».
Apple опублікувала версію програмного забезпечення з відкритим кодом на github. Якщо ви кмітливі, ви можете отримати запущену копію MGIE самостійно, але дослідники налаштували інструмент на… Обіймати обличчя. Він працює трохи повільно, коли ним користується багато людей, але це весело.
Такі технічні гіганти, як Apple, витрачають мільярди доларів на проекти, які ніхто ніколи не побачить, тому цілком можливо, що так званий інструмент MGIE ніколи не отримає офіційного випуску. Apple не відразу відповіла на запит про коментар.
Ми спробували його тут, в офісі Gizmodo. Я завантажив фотографію мого колеги та найближчого радника Кайла Барра в дивних темних окулярах, яку я зробив на Netflix у… Виставка побутової електроніки цього року. Я сказав Amnesty International: «Чоловік стоїть у пустелі». Перед створенням зображення MGIE екстраполює наступне:
«Чоловік одягнений у металевий шолом і стоїть у пустелі. Навколишнє середовище безплідне та безплідне, а піщані дюни простягаються настільки далеко, наскільки сягає око».
Після роботи з інструментом набагато довше, ніж слід було, стало зрозуміло, що він підпадає під багато тих самих обмежень, що й будь-який інший генератор зображень ШІ. Часто результати дивні й зовсім не схожі на те, що ви замовили. Але в деяких випадках він виконував вражаючу роботу, а в захисті програмного забезпечення ШІ працював краще зі знайомими темами. «Знайомі» — це не те, що можна назвати темними окулярами Кайла.
“Загальний ніндзя в соціальних мережах. Інтроверт. Творець. Шанувальник телебачення. Підприємець, що отримує нагороди. Веб-ботанік. Сертифікований читач”