Паведаміць пра памылку / запыт на магчымасць

Перапісаць з SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Працуе з публічна даступнымі аўдыё і відэа. Змест, абаронены DRM, не падтрымліваецца.

Абнавіць для пашыраных

Прыватная транскрыпцыя

Чат з транскрыптам

Разблакаваць з Pro →

Перамясціце файл сюды або націсніце, каб прагледзець

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — да 2 Гб

Пакетная загрузка некалькіх файлаў з Pro

Абнавіць для пашыраных

Прыватная транскрыпцыя

Чат з транскрыптам

Разблакаваць з Pro →

Абнавіць для пашыраных

Праграма перакладу мовы ў тэкст у рэальным часе. Шчыльны разумны код аўтаматычна выпраўляе памылкі падчас гутаркі.

Спачатку праверце мікрафон

10 вольных хвілін/ дзень 600 мін. бясплатна пры рэгістрацыі Крэдытная карта Зашыфравана

Зарэгіструйцеся бясплатна →

5.5%

WER

Мовы

50.0x

Хуткасць

MIT

Ліцэнзія

Пра SenseVoice

SenseVoice - гэта мадэль маўлення FunAudioLLM, якая выходзіць за рамкі транскрыпцыі. Яна падтрымлівае больш за 50 моў і ўключае ў сябе магчымасці для распазнавання эмоцый, выяўлення гукавых падзеяў і зваротнай нармалізацыі тэксту ў адным модулі.

Мовы, якія падтрымліваюцца SenseVoice

Англійская

Іспанская

Французская

Нямецкая

Кітайская

Японская

Карэйская

Партугальская

Арабская

Хіндзі

Руская

Італьянская

Нідэрландская

Турэцкая

Польская

Шведская

Інданезійская

Тайская

В’етнамская

Чэшская

Грэчаская

Румынская

Венгерская

Іўрыт

Дацкая

Фінская

Нарвежская

Украінская

Малайская

Бенгальская

Звесткі пра мадэль

ПастаўшчыкFunAudioLLM
Архітэктура-
ЛіцэнзіяMIT
АбнавіцьMar 2026

Падобныя мадэлі

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Часта задаваемыя пытанні

SenseVoice - гэта мадэль пераўтварэння мовы ў тэкст ад FunAudioLLM. STT.ai размяшчае SenseVoice на нашай інфраструктуры GPU, таму вы можаце выкарыстоўваць яго без стварэння свайго апаратнага забеспячэння - загрузіце аўдыё або відэа і выберыце SenseVoice з выбару мадэлі.

На стандартных тэставанні, SenseVoice дасягае каля 5.5% Word Error Rate. Рэальная дакладнасць залежыць ад якасці гуку, акцэнту і мовы; для шумных або акцэнтаваных запісаў чакайце на некалькі працэнтных пунктаў вышэй WER.

SenseVoice працуе на бясплатным узроўні STT.ai - кожны наведвальнік атрымлівае 600 хвілін, каб пачаць без платы. Плацежныя планы дадаюць большыя абмежаванні на файл, прыватныя транскрыпты і прыярытэтныя чаргі.

SenseVoice выпушчаны пад ліцэнзіяй MIT, дазваляе адкрыты код. Вы можаце самастойна ўсталяваць SenseVoice на вашым камп' ютары або выкарыстоўваць нашу версію - абодва могуць быць выкарыстаны ў камерцыйных мэтах.

SenseVoice падтрымлівае 50 моў. Аўтаматычнае выяўленне выбірае правільную мову для большасці гукаў; вы таксама можаце вызначыць яе ўручную для невялікага павышэння дакладнасці.

SenseVoice апрацоўвае аўдыё з хуткасцю 50.0x у рэальным часе на нашых GPU. 1- гадзінны аўдыё файл скончыцца менш чым за 1 хвіліны; даўжэйшыя файлы будуць адпраўляцца ў чаргу і абвяшчаць па электроннай пошце, калі яны будуць завершаны.

SenseVoice мае параметры 234M. Большыя мадэлі больш дакладныя, але павольнейшыя; STT.ai мае SenseVoice на GPU, таму колькасць параметраў не ўплывае на хуткасць працы кліента.

SenseVoice прымае ўсе фарматы, якія падтрымлівае STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI і іншыя. Вывад у фармаце TXT, SRT, VTT, DOCX, JSON або PDF.

Так. Дыярызацыя гукавых файлаў працуе разам з SenseVoice для кожнай транскрыпцыі - кожны гукавы файл мае этыкетку, і вы можаце змяніць яго назву ў рэдактара пасля.

Так. SenseVoice працуе ў нашым кіруемым асяроддзі - гук апрацоўваецца і выдаляецца па змаўчанні і ніколі не выкарыстоўваецца для трэніровак без выразнага дазволу. Планы Pro дадаюць шыфраванне з боку кліента для транскрыптаў у спакоі.

Выкарыстоўвайце інструмент compare-stt, каб правесці параўнанне SenseVoice з любым іншым падтрымліваемым мадэллю на тым жа аўдыё - вы ўбачыце WER, колькасць сегментаў, этыкеткі дынамікаў і рэйтынгі даверу бок аб бок. Параўнанне SenseVoice супраць Whisper Large V3 - гэта найбольш частае параўнанне.

Так. Вызначце "sensevoice" як параметр мадэлі ў канечнай кропцы /v1/transcribe. Python і Node.js SDK ўключаюць прыклады SenseVoice. Бясплатны ўзровень API ўключае 100 хвілін / месяц.

Так. Паколькі SenseVoice мае ліцэнзію MIT, вы можаце самастойна яго ўсталяваць. На старонцы адкрытага кода STT.ai паказаны рэпазітары і вагі праекту. Большасць каманд выкарыстаюць нашу ўсталяваную версію, каб прапусціць закупку GPU, абмен мадэлямі і аперацыі.

Перапісаць з SenseVoice

Пра SenseVoice

Мовы, якія падтрымліваюцца SenseVoice

Звесткі пра мадэль

Падобныя мадэлі

Часта задаваемыя пытанні

Насельніцтва 88,8 тыс. чал.

Насельніцтва 88,8 тыс. чал.

SenseVoice карыстаюцца бясплатна?

Якая ліцэнзія выкарыстоўваецца для SenseVoice?

Колькі моў падтрымлівае SenseVoice?

Насельніцтва 88,8 тыс. чал.

Насельніцтва 88,0 тыс. чал.

Усяго ў ёй SenseVoice артыкулаў.

SenseVoice карыстальнікаў.

Ці прыватныя мае дадзеныя, калі я карыстаюся SenseVoice?

У 880 годзе ўступіў у саюз з Візантыяй.

Ці магу я выкарыстоўваць SenseVoice праз API?

Ці магу я запусціць SenseVoice на сваім серверы?