Google непомітно розмістив у iOS App Store безплатний офлайн-застосунок для AI-диктування «AI Edge Eloquent». У ньому використовується модель Gemma ASR на стороні пристрою: аудіо повністю не залишає пристрій, і, що рідко трапляється, ця функція спершу з’явилася на платформі iOS, а не на Android.
(Передісторія: Google випустив найрозумнішу відкриту модель Gemma 4! Повністю перейшов на ліцензію Apache 2.0, продуктивність прямо на рівні великих закритих AI)
(Додаткова довідка: зламати монополію Nvidia? Google — найсильніша на Землі AI-модель «Gemma 3» на 1 H100, перемагає DeepSeek, OpenAI)
Зміст
Toggle
Без пресконференцій і без будь-яких офіційних оголошень Google буквально цього тижня трохи раніше непомітно виклав «AI Edge Eloquent» у iOS App Store. Цей повністю безплатний додаток для AI-диктування, ключовий акцент — офлайн-розпізнавання мови. За лаштунками працює власна від Google 端侧 ASR (автоматичне розпізнавання мовлення) модель Gemma на стороні пристрою: усі обробки аудіо виконуються локально на пристрої, без потреби в інтернеті.
Логіка роботи «AI Edge Eloquent» дуже інтуїтивна: відкрий застосунок, говори у мікрофон — на екрані миттєво з’являється текст і хвильова форма звуку. Після зупинки запису App автоматично фільтрує розмовні «паразитні слова» на кшталт «е-ем», виправляє розбиття на речення, приводить сказане до чистого, придатного для використання тексту й автоматично копіює його в буфер обміну.
Конфіденційність — один із ключових аргументів цієї програми. У режимі суто офлайн аудіодані не виходять за межі iPhone користувача: вони не передаються на жодні сервери. Google також надає опцію «хмарного режиму»: розпізнавання все одно виконується на стороні пристрою, а в хмарну модель Gemini надсилається лише розпізнаний текст (а не вихідне аудіо) для додаткового очищення — якість вища.
Уся послуга повністю безплатна: без підписки, без обмеження за обсягом використання.
Паралельно технологічні медіа звернули увагу на рідкісне явище: продукти Google майже завжди спершу виходять на Android. Особливо це стосується функцій AI на стороні пристрою — зазвичай вони запускаються в парі з пристроями Pixel і моделлю Gemini Nano. Цього разу «AI Edge Eloquent» пішов навпаки: у описі в App Store навіть прямо зазначено, що версія для Android буде випущена.
Аналітики мають два тлумачення. Перше — тест ринку: Google, можливо, навмисно обрав iOS як «не свою» платформу для експерименту, щоб, не заважаючи екосистемі Android, оцінити, наскільки споживачі приймають і як користуються диктуванням із AI на стороні пристрою.
Друге — технічна готовність: модель Gemma ASR для iOS, ймовірно, раніше за Android досягла стадії оптимізації, на якій її можна використовувати на практиці. Тому Google вирішив одразу виставити застосунок, не чекаючи синхронного виходу на обох платформах.
З технічної точки зору «AI Edge Eloquent» важить більше, ніж просто інструмент для диктування. Gemma — це серія відкритих легких AI-моделей від Google; її задум — ефективно працювати в середовищах із обмеженими ресурсами, зокрема на мобільних пристроях. А AI Edge — це рамка від Google, що дає розробникам можливість запускати моделі машинного навчання безпосередньо на стороні пристрою.
Цей застосунок по суті переносить здібності Gemma до інференсу на стороні пристрою в звичайні щоденні сценарії використання для споживачів.
Для розробників AI Edge Eloquent також є зразковим кейсом: він показує, як модель Gemma приземляється в продуктах споживчого класу, і як гібридна архітектура офлайн і в хмарі може досягати балансу між конфіденційністю та якістю.