Доклад " Bugg " / " Особенности запроса "

Переписка SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Работа с общедоступным аудио- и видеозаписями не поддерживается.

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Сбрасывать файл здесь или щёлкнуть для просмотра

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — до 2GB

Загрузка нескольких файлов с про

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Модернизация в целях повышения квалификации

В реальном времени речь в текст. AI автоматически корректирует, как вы говорите — точность улучшается с помощью более длинной речи.

Сначала проверьте микрофон.

10 мин./сутки 600 мин. без регистрации Нет кредитной карты Зашифровано

Запишитесь бесплатно. →

5.5%

WER

Знание языков

50.0x

Скорость

MIT

Лицензия

О том, что SenseVoice

SenseVoice — это модель фундамента речи из FunAudioLM, которая выходит за рамки транскрипции. Она поддерживает язык 50+ и включает в себя возможности для распознавания эмоций, распознавания звуковых событий и обратной текстовой нормализации в одной модели.

Языки, поддерживаемые SenseVoice

Английский

Испанский

Французский

Немецкий

Китайский

Японский

Корейский

Португальский

Арабский

Хинди

Русский

Итальянский

Нидерландский

Турецкий

Польский

Шведский

Индонезийский

Тайский

Вьетнамский

Чешский

Греческий

Румынский

Венгерский

Иврит

Датский

Финский

Норвежский

Украинский

Малайский

Бенгальский

Модель

ПоставщикFunAudioLLM
Архитектура-
ЛицензияMIT
ОбновленныеMar 2026

Смежные модели

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Часто задаваемые вопросы

SenseVoice — это речевая модель на FunAudioLLM. STT.ai носит SenseVoice на нашей инфраструктуре GPU, так что вы можете использовать ее без обеспечения собственного оборудования — загружать аудио- или видео и выбирать SenseVoice из сборщика модели.

При стандартных контрольных параметрах SenseVoice достигает примерно 5.5% скорости ошибок в Word. Точность в реальном мире зависит от качества звука, акцента и языка; для шумных или заостренных записей ожидается, что на несколько процентных пунктов выше WER.

SenseVoice работает на бесплатной ярусе STT.ai — каждый посетитель получает 600 минут, чтобы начать бесплатно.

SenseVoice выпущено на MIT год, разрешительная лицензия с открытым исходным кодом. Вы можете самостоятельно принять SenseVoice на вашем собственном оборудовании или использовать нашу приёмную версию — оба они могут быть использованы на коммерческой основе.

SenseVoice поддерживает 50 язык. Автообнаружение выбирает правильный язык для большинства звуков; вы также можете указать его вручную для небольшого лифта с точностью.

SenseVoice обрабатывает аудио примерно 50.0x в режиме реального времени на наших GPU. 1-часовой аудио файл заканчивается меньше чем за 1 минуты; более длинный список файлов и уведомление по электронной почте, когда он будет сделан.

SenseVoice имеет параметры 234M. Большие модели, как правило, более точны, но медленнее; STT.ai носит SenseVoice на GPU, так что число параметров не влияет на производительность вашего клиента.

SenseVoice принимает каждый формат STT.ai поддержки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие.

Да, диааризация спикера проводится вместе с SenseVoice за каждую транскрипцию — каждый оратор помечен ярлыком, и после этого вы можете переименовать их в редактора.

Да. SenseVoice прогонов в нашей регулируемой среде — аудио обрабатывается и удаляется по умолчанию и никогда не используется для обучения без прямого выбора. Про-планы добавляют шифрование клиентом для расшифровки стенограмм.

Используйте инструмент для сравнения с SenseVoice против любой другой поддерживаемой модели на одном и том же аудио — вы увидите WER, число сегментов, ярлыки громкостей и оценки достоверности одновременно. Сопоставление SenseVoice vs Whisper Крупный V3 — наиболее частое сравнение.

Да. Указать "sensevoice" в качестве параметра модели на конечных точках /v1/tranarip. Python и Node.js SDKs включают SenseVoice примеры. Свободный API уровень включает 100 минут в месяц.

Да, так как SenseVoice имеет MIT-лицензию, вы можете самостоятельно завести его. На странице с открытым исходным кодом STT.ai перечисляются репо и весы проекта. Большинство производственных команд используют нашу хост-версия, чтобы пропустить закупки GPU, свопы моделей и операции.

Переписка SenseVoice

О том, что SenseVoice

Языки, поддерживаемые SenseVoice

Модель

Смежные модели

Часто задаваемые вопросы

Что такое SenseVoice?

Насколько точно SenseVoice?

SenseVoice можно использовать?

Какие лицензии используют SenseVoice?

Сколько языков поддерживает SenseVoice?

Как быстро SenseVoice?

Насколько большая модель SenseVoice?

Какие аудиоформаты могут писать SenseVoice?

SenseVoice обнаруживает несколько колонок?

Мои данные закрыты при использовании SenseVoice?

Как SenseVoice сравниваются с другими моделями STT?

Могу я использовать SenseVoice через API?

Могу я запустить SenseVoice на своем собственном сервере?