Google запустила миттєвий голосовий переклад на понад 70 мов

Google випустила Gemini 3.5 Live Translate — нову аудіомодель для перекладу мовлення в реальному часі, яка автоматично розпізнає понад 70 мов і зберігає інтонацію спікера. 

Читайте также: Міноборони кодифікувало NEO-1 — робота для розмінування та логістичних місій — фото

Що сталося

Google представила Gemini 3.5 Live Translate — модель для усного перекладу в реальному часі. Компанія каже, що вона не чекає завершення фрази, а перекладає мовлення безперервно. Через це звук має бути плавнішим, а затримка — лише кілька секунд. Також модель зберігає темп, інтонацію та висоту голосу співрозмовника.

Для розробників Gemini 3.5 Live Translate вже доступна в публічному попередньому доступі через Gemini Live API та Google AI Studio. Для бізнес-клієнтів Google Workspace модель відкривають у закритому попередньому доступі в Google Meet вже цього місяця. Для всіх користувачів функцію почали розгортати в Google Translate на Android та iOS.

Принагідно нагадуємо, що у червні минулого року Google оголосила про впровадження нової функції в Google Meet, яка дозволяє користувачам транслювати відео безпосередньо із зовнішніх камер, таких як документ камери, мікроскопи або професійні відеосистеми.

Читайте также: LinkedIn створила рекламний бізнес із амбіцією на $100 млн на рік — що відомо

Чому це цікаво

Google наголошує, що модель краще працює в шумному середовищі й не потребує ручного налаштування мови. На платформі Meet компанія обіцяє підтримку понад 70 мов замість попередніх п’яти. Також сервіс має працювати з понад 2000 мовних комбінацій в одній зустрічі. Раніше переклад там був значно обмеженішим і здебільшого зав’язувався на англійську. Повного переліку всіх мов, які підтримуватиме платформа Google Meet не зазначено, проте відомо про такі мови як англійська, іспанська, китайська, шведська та корейська.

У Google Translate модель працюватиме через функцію live translate. На Android ще запускають «режим прослуховування» — переклад можна буде чути прямо через телефон або навушники. Google також одразу додає запобіжник проти зловживань. Увесь звук, який створюють її моделі, маркується водяним знаком SynthID. Він непомітний для людини, але має допомагати виявляти AI-згенерований контент і зменшувати ризики дезінформації.

Нагадаємо, що до 20-річчя «Google Перекладача» компанія додала у Google Translate нову функцію для практики вимови прямо в застосунку. Фіча аналізуватиме мову користувача та даватиме зворотний зв’язок для вдосконалення вимови.

Читайте также: Mastercard запускає гроші для AI: агенти зможуть платити один одному без участі людей

Коментарі

Коментарів ще немає. Будьте першим, хто розпочне обговорення!

    Залишити відповідь

    Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *