Коротко
- Google випустив Gemma 4, сімейство відкритих моделей під ліцензією Apache 2.0.
- Лінійка з чотирьох моделей охоплює телефони та дата-центри, при цьому модель 31B вже займає 3 місце у світі.
- Відкритий ШІ США отримує необхідний імпульс, оскільки Gemma 4 — за підтримки DeepMind — позиціонує себе як найсильніший американський конкурент DeepSeek, Qwen та інших китайських лідерів.
Амбіції Google щодо відкритого ШІ стали сьогодні набагато серйознішими. Компанія випустила Gemma 4, сімейство з чотирьох моделей з відкритими вагами, побудованих на тих самих дослідженнях, що й Gemini 3, і ліцензованих під Apache 2.0 — значне відхилення від більш обмежувальних умов попередніх версій Gemma.
Розробники завантажили попередні покоління Gemma понад 400 мільйонів разів, створивши понад 100 000 варіантів спільноти. Цей реліз є найамбітнішим на сьогодні.
Протягом минулого року рейтинг відкритого ШІ був переважно китайською справою. DeepSeek, Minimax, GLM і Qwen домінували на топових позиціях, залишаючи американські альтернативи боротися за актуальність. Як повідомляв Decrypt минулого року, китайські відкриті моделі зросли з ледь 1,2% глобального використання відкритих моделей наприкінці 2024 року до приблизно 30% до кінця 2025 року, при цьому Qwen від Alibaba навіть випередив Llama від Meta як найбільш використовувану самохостову модель у всьому світі.
Llama від Meta раніше був стандартним вибором для розробників, які хотіли потужну локально керовану модель. Ця репутація похитнулася — ліцензія Llama, контрольована Meta, викликала питання щодо його справжнього статусу відкритого коду, а його продуктивність відстала від китайської конкуренції. Сімейство OLMo від Allen Institute намагалося заповнити прогалину, але не змогло отримати значного поширення. OpenAI випустив свої моделі gpt-oss у серпні 2025 року, що дало екосистемі ковток свіжого повітря, але вони ніколи не були розроблені як передові конкуренти.
А вчора американський стартап з 30 осіб під назвою Arcee AI випустив Trinity, відкриту модель з 400 мільярдами параметрів, яка зробила переконливу заяву, що американська сцена не повністю мертва. Gemma 4 підхоплює цей імпульс, цього разу з повною підтримкою Google DeepMind, перетворюючи її на, мабуть, найкращу американську модель у сцені відкритого ШІ.
Модель «побудована на тих самих світового рівня дослідженнях і технології, що й Gemini 3», — сказав Google у своєму оголошенні. Gemma 4 постачається в чотирьох розмірах: Effective 2B і 4B для телефонів та периферійних пристроїв, модель 26B Mixture of Experts, орієнтована на швидкість, і модель 31B Dense, оптимізована для максимальної якості.
31B Dense наразі займає третє місце серед усіх відкритих моделей у текстовому рейтингу Arena AI. 26B MoE займає шосте місце. Google стверджує, що обидві перевершують моделі, що в 20 разів більші за їх розмір — твердження, яке підтверджується, принаймні відповідно до показників Arena AI, де китайські моделі все ще займають перші два місця.
Ми протестували Gemma 4. Вона здатна, з деякими застереженнями. Модель застосовує міркування навіть до завдань, які цього не вимагають, що може зробити відповіді надмірно складними для простих запитів. Креативне письмо пристойне — прийнятне, але не надихаюче — і, ймовірно, покращується з більш конкретним керівництвом і інженерією запитів.
Найяскравіше вона проявила себе в коді. Коли попросили створити гру, результат не був особливо яскравим чи витонченим, але він працював без помилок з першої спроби. Непогано для моделі з 41 мільярдом параметрів. Ця надійність з нуля, можливо, цінніша, ніж гарніший результат, який потребує налагодження.
Ви можете спробувати (базову, але функціональну) гру тут.
Чотири варіанти охоплюють весь спектр обладнання. Моделі E2B і E4B створені для телефонів Android, Raspberry Pi та периферійних пристроїв, працюючи повністю офлайн з майже нульовою затримкою, нативним аудіовходом і контекстним вікном 128K. Моделі 26B і 31B орієнтовані на робочі станції та хмарні розгортання, розширюючи контекст до 256K і додаючи нативний виклик функцій і структурований вихід JSON для створення автономних агентів. Усі чотири моделі нативно обробляють зображення та відео. Ваги повної точності більших моделей вміщуються на одному GPU NVIDIA H100 80GB; квантовані версії працюють на споживчому обладнанні.
Ліцензія Apache 2.0 є іншим заголовком. Попередні випуски Gemma від Google використовували спеціальну ліцензію, яка створювала юридичну неоднозначність для комерційних продуктів. Apache 2.0 повністю усуває це тертя — розробники можуть модифікувати, розповсюджувати та комерціалізувати, не турбуючись про те, що Google згодом змінить умови. Співзасновник Hugging Face Клеман Деланг похвалив це, сказавши, що «Локальний ШІ переживає свій момент», і це майбутнє індустрії ШІ. Генеральний директор Google DeepMind Деміс Хассабіс пішов далі, назвавши Gemma 4 «найкращими відкритими моделями у світі для їх відповідних розмірів».
Це сильна заява. Власні системи від Anthropic, OpenAI та власний Gemini від Google все ще лідирують у найскладніших тестах. Але для моделей з відкритими вагами, які ви можете запускати локально, вільно модифікувати та розгортати на власній інфраструктурі? Конкуренція щойно стала значно меншою. Ви можете спробувати Gemma 4 зараз у Google AI Studio (31B і 26B) або Google AI Edge Gallery (E2B і E4B). Ваги моделей також доступні на Hugging Face, Kaggle та Ollama.
Щоденна розсилка новин
Починайте кожен день з найважливіших новин прямо зараз, а також оригінальних матеріалів, подкастів, відео та багато іншого.
Джерело: https://decrypt.co/363178/google-gemma-4-open-source-ai








