Гонка штучного інтелекту озброєнь Big Tech із новою мовною парадигмою розпалюється

24 лютого (Reuters) – Meta Platforms Inc (METAO) заявила в п’ятницю, що представить дослідникам нову велику мовну модель, базову програму для нової системи штучного інтелекту, посилюючи гонку озброєнь ШІ, оскільки великі технологічні компанії поспішають до інтегрувати технологію у свої продукти та вразити інвесторів.

Громадська боротьба за контроль над технологічним простором штучного інтелекту почалася наприкінці минулого року із запуском програмного забезпечення ChatGPT OpenAI за підтримки Microsoft і спонукала технічних гігантів від Alphabet Inc (GOOGL.O) до китайської Baidu (9888.HK) до рекламувати власні пропозиції. .

Meta LLaMA, скорочення від Large Language Model Meta AI, буде доступна за некомерційною ліцензією для дослідників, державних установ, громадянського суспільства та академічних кіл. Блог.

Великі мовні моделі видобувають величезну кількість тексту, щоб узагальнити інформацію та створити вміст. Вони можуть відповідати на запитання, наприклад, реченнями, які можна прочитати так, ніби їх написали люди.

Останні оновлення

Переглянути ще 2 історії

Модель, яка, за словами Мети, потребувала «значно меншої» обчислювальної потужності, ніж попередні демонстрації, була навчена 20 мовами з наголосом на мовах з латинським і кириличним алфавітами.

«Сьогоднішній анонс Meta, здається, є кроком у тестуванні їхніх генеративних можливостей штучного інтелекту, щоб вони могли впровадити їх у свої продукти в майбутньому», — сказала Джил Лурія, старший аналітик програмного забезпечення DA Davidson.

«Generative AI — це нова програма штучного інтелекту, з якою Meta має менше досвіду, але вона явно важлива для майбутнього їхнього бізнесу».

Штучний інтелект став яскравою точкою для інвестицій у технологічну галузь, повільне зростання якої призвело до масових звільнень і зниження експериментальних ставок.

Мета сказав, що LLaMA може перевершити конкурентів, досліджуючи більше параметрів або змінних, які враховує алгоритм.

READ "Armored Core 6" пропонує гравцям подрібнювач деревини з головним посібником

Зокрема, він сказав, що версія LLaMA з 13 мільярдами параметрів може перевершити GPT-3, недавнього попередника моделі, на якій побудовано ChatGPT.

Він описав модель LLaMA з 65 мільярдів змінних як «конкурентоспроможну» з Chinchilla70B і PaLM-540B від Google, які більші за модель, яку Google використовував для показу пошуку Bard у чаті.

Прес-секретар Meta пояснила продуктивність «чистішою» більшою кількістю даних і «архітектурними вдосконаленнями» в моделі, які підвищили стабільність навчання.

У травні минулого року Meta випустила велику мовну модель OPT-175B, також призначену для дослідників, яка стала основою для нової ітерації чат-бота BlenderBot.

Пізніше вона представила модель під назвою Galactica, яка могла писати наукові статті та розв’язувати математичні задачі, але швидко забрала демонстрацію після того, як вона породила помилкові, здавалося б, достовірні відповіді.

Додаткові звіти Ювраджа Маліка та Єви Метьюз у Бенгалуру та Кеті Пол у Нью-Йорку; Монтаж Шейлеша Купера та Гранта Макколла

Наші стандарти: Принципи довіри Thomson Reuters.

Philbert Page

“Загальний ніндзя в соціальних мережах. Інтроверт. Творець. Шанувальник телебачення. Підприємець, що отримує нагороди. Веб-ботанік. Сертифікований читач”