Извести за барање за бубачка / карактеристика

Транкрипувај со SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Работи со јавно достапно аудио и видео. Содржината заштитена од DRM не е поддржана.

Надоградба за подобрено

Приватен препис

Разговарај со преписот

Отклучи со про →

Испуштете ја датотеката тука или кликнете за да прелистувате

MP3, WAV, M4A, FLAC, MP4, MKV, MIV, WebM — до 2GB

Пакетно вчитување на повеќе датотеки со проф.

Надоградба за подобрено

Приватен препис

Разговарај со преписот

Отклучи со про →

Надоградба за подобрено

Зборот во реално време на текстот. Авто- корекции на AI додека зборувате — точноста се подобрува со подолг говор.

Прво тестирај го микрофонот

10 слободен мин/ден 600 минути бесплатно со пријава Нема кредитна картичка Криптирано

Запиши се бесплатно →

5.5%

WER

Јазици

50.0x

Брзина

MIT

Лиценца

За SenseVoice

SenseVoice е модел на темел на говор од FunuAudioLLM кој е надвор од транскрипцијата. Тој поддржува 50+ јазици и ги вклучува способностите за препознавање на емоции, откривање на аудио настани и реверзна нормализација на текстот во еден модел.

Јазиците што ги поддржува SenseVoice

Англиски

Шпански

Француски

Германски

Кинески

Јапонски

Корејски

Португалски

Арапски

Хинди

Руски

Италијански

Холандски

Турски

Полски

Шведски

Индонезиски

Тајландски

Виетнамски

Чешки

Грчки

Романски

Унгарски

Хебрејски

Дански

Фински

Норвешки

Украински

Малајски

Бенгалски

Инфо за моделот

ДоставувачFunAudioLLM
Архитектура-
ЛиценцаMIT
АжурираноMar 2026

Соодветни модели

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Често поставувани прашања

SenseVoice е модел од говор до текст со FunAudioLLM. STT.ai домаќини SenseVoice на нашата инфраструктура на ГПУ за да можете да го користите без да го снабдите сопствениот хардвер — да внесете аудио или видео и да изберете SenseVoice од моделот.

Според стандардните стандарди, SenseVoice постигнуваат околу 5.5% проценка на грешките на зборовите. Прецизноста на реалниот свет зависи од квалитетот на звукот, акцентот и јазикот; за бучни или акцентирани снимки, очекуваат неколку проценти повисоко од ВЕР.

SenseVoice работи на безплатен број STT.ai — секој посетител добива 600 минути за да почне без цена.

SenseVoice е ослободен под MIT, попустлива лиценца со отворен извор. SenseVoice може да се води на сопствен хардвер или да се користи нашата домаќинска верзија — и двете се комерцијално употребливи.

SenseVoice поддржува 50 јазици. Авто- детекција го избира вистинскиот јазик за повеќето аудио; исто така можете рачно да го наведете за малку прецизност.

SenseVoice процесира аудио на околу 50.0x во реално време на нашите GPU. 1- часовна аудио датотека завршува за помалку од 8802 минути; подолга редица на датотеки и известува со е- пошта кога ќе биде завршена.

SenseVoice има 8802 параметри. Поголемите модели се поточни, но побавни; STT.ai домаќини SenseVoice на GPU за броењето на параметрите да не влијае на перформансите на вашиот клиент.

SenseVoice го прифаќа секој формат STT.ai потпори — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и други.

Дијаризирањето на звучникот оди заедно со SenseVoice за секоја транскрипција — секој говорник е означен и потоа можете да ги преименувате во уредникот.

Да. SenseVoice работи во нашата управувана средина — аудиото е обработено и избришано стандардно и никогаш не се користи за обука без експлицитна опти-ин. Про плановите додаваат енкрипција на страна на клиентот за преписи во мир.

Користете ја алатката споредба-ст за извршување SenseVoice против било кој друг поддржан модел на истиот аудио — ќе го видите WER, бројот на сегменти, звучниците и самодоверливите резултати од страна на страна. Поравнувањето SenseVoice против Whisper Large V3 е најчесто извршено.

Да. Наведете „ sensevoice “ како параметар на моделот на крајната точка / v1/transcribe. Python и Node.js SDKs вклучуваат SenseVoice примери. Слободната API низа вклучува 100 минути/месечно.

Бидејќи SenseVoice е 8802-лицензирана, можеш да го водиш. STT.ai-те страници со отворен извор ги набројуваат репо и тежини на проектот. Повеќето производствени тимови ја користат нашата домаќинска верзија за да ја прескокнат набавката на ГПУ, размената на модели и опс.

Транкрипувај со SenseVoice

За SenseVoice

Јазиците што ги поддржува SenseVoice

Инфо за моделот

Соодветни модели

Често поставувани прашања

Колку е SenseVoice?

Колку точно е SenseVoice?

Дали SenseVoice се слободни за употреба?

Која дозвола користи SenseVoice?

Колку јазици поддржува SenseVoice?

Колку брзо е SenseVoice?

Колку е голем моделот SenseVoice?

Кои аудио формати можат да ги опишат SenseVoice?

Дали SenseVoice детектираат повеќе звучници?

Дали моите податоци се приватни кога користат SenseVoice?

Како се споредува SenseVoice со други модели на СТТ?

Можам ли да користам SenseVoice преку АПИ?

Можам ли да проверам SenseVoice на мојот сервер?