ВКонтакте откроет доступ к собственной технологии распознавания речи сторонним разработчикам - «Новости» » Интернет технологии
sitename
Комментарии в профилях Steam используются для управления малварью - «Новости»
Комментарии в профилях Steam используются для управления малварью - «Новости»
В VS Code нашли 0-day-уязвимость, позволявшую похищать токены GitHub - «Новости»
В VS Code нашли 0-day-уязвимость, позволявшую похищать токены GitHub - «Новости»
F6: группировка SiribClone атакует российских военных через Telegram и шпионское ПО - «Новости»
F6: группировка SiribClone атакует российских военных через Telegram и шпионское ПО - «Новости»
В Microsoft заявили, что не будут преследовать исследователей за публикацию 0-day-эксплоитов - «Новости»
В Microsoft заявили, что не будут преследовать исследователей за публикацию 0-day-эксплоитов - «Новости»
Второй ежеквартальный номер «Хакера» уже едет к читателям - «Новости»
Второй ежеквартальный номер «Хакера» уже едет к читателям - «Новости»
«Достойный наследник Dark Messiah of Might and Magic»: ролевой экшен Fatekeeper порадовал пользователей Steam, но не всех - «Новости сети»
«Достойный наследник Dark Messiah of Might and Magic»: ролевой экшен Fatekeeper порадовал пользователей Steam, но не всех - «Новости сети»
Второе сюжетное дополнение к Vampire: The Masquerade — Bloodlines 2 завершит поддержку игры — трейлер и дата выхода The Flower & The Flame - «Новости сети»
Второе сюжетное дополнение к Vampire: The Masquerade — Bloodlines 2 завершит поддержку игры — трейлер и дата выхода The Flower & The Flame - «Новости сети»
Wildberries разрабатывает отечественный мессенджер — его уже используют сотрудники - «Новости сети»
Wildberries разрабатывает отечественный мессенджер — его уже используют сотрудники - «Новости сети»
Google выпустила мультимодальную ИИ-модель Gemma 4 12B, которая запустится прямо на ноутбуке - «Новости сети»
Google выпустила мультимодальную ИИ-модель Gemma 4 12B, которая запустится прямо на ноутбуке - «Новости сети»
Мессенджер MAX удалили из Apple App Store — VK подтвердила, что попробует вернуть его на iPhone - «Новости сети»
Мессенджер MAX удалили из Apple App Store — VK подтвердила, что попробует вернуть его на iPhone - «Новости сети»
Как заработать денег, не выходя из дома, мы вам поможем с этим разобраться » Новости » Новости мира Интернет » ВКонтакте откроет доступ к собственной технологии распознавания речи сторонним разработчикам - «Новости»

Технический директор ВКонтакте Александр Тоболь на открытии конференции Saint HighLoad++, сообщил что теперь у разработчиков есть возможность бесплатно использовать технологию ВКонтакте, которая считывает голос и переводит его в текст.


ASR (Automatic Speech Recognition) или технологию распознавания речи, можно внедрить в несколько кликов.



На выбор доступно две модели для распознавания можно:



  • нейтральная — для разборчивой речи, как в телешоу или интервью;

  • спонтанная — для обыденной речи со сленгом и ненормативной лексикой.


Нейросети ВК быстро обрабатывают аудиофайлы, удаляют из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».


Обработку аудио до 100 минут в сутки можно применять для любых целей, а для безлимитного доступа нужно отправить заявку на электронную почту. Начать использовать технологию можно через веб-интерфейс на специальной странице или настроить интеграцию через публичный API ВКонтакте. Решение должно быть востребовано в стартапах, небольших инди-проектах, а также в личных проектах.


В самой соцсети ASR используется для расшифровки голосовых сообщений, генерации субтитров в видео, персональных рекомендаций и многого другого. Решение включает в себя три нейросети: для распознавания речи, поиска подходящих слов и расстановки знаков препинания.


Ранее ВКонтакте показал новый дизайн профиля в приложении.


Технический директор ВКонтакте Александр Тоболь на открытии конференции Saint HighLoad , сообщил что теперь у разработчиков есть возможность бесплатно использовать технологию ВКонтакте, которая считывает голос и переводит его в текст. ASR (Automatic Speech Recognition) или технологию распознавания речи, можно внедрить в несколько кликов. На выбор доступно две модели для распознавания можно: нейтральная — для разборчивой речи, как в телешоу или интервью; спонтанная — для обыденной речи со сленгом и ненормативной лексикой. Нейросети ВК быстро обрабатывают аудиофайлы, удаляют из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ». Обработку аудио до 100 минут в сутки можно применять для любых целей, а для безлимитного доступа нужно отправить заявку на электронную почту. Начать использовать технологию можно через веб-интерфейс на специальной странице или настроить интеграцию через публичный API ВКонтакте. Решение должно быть востребовано в стартапах, небольших инди-проектах, а также в личных проектах. В самой соцсети ASR используется для расшифровки голосовых сообщений, генерации субтитров в видео, персональных рекомендаций и многого другого. Решение включает в себя три нейросети: для распознавания речи, поиска подходящих слов и расстановки знаков препинания. Ранее ВКонтакте показал новый дизайн профиля в приложении.
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))



Войти через: