Transcribe with SenseVoice

Ради са јавно доступним аудио & видеом. Садржај заштићен ДРМ није подржан.

Надоградња за побољшане
Private transcript
Ћаскање са транскриптом
Откључај помоћу проф. →
Спусти фајл овде или кликните да прегледате
МП3, ВАВ, М4А, ФЛАЦ, МП4, МКВ, МОВ, ВебМ — до 2ГБ
Надоградња за побољшане
Private transcript
Ћаскање са транскриптом
Откључај помоћу проф. →
Надоградња за побољшане
Снимање: 0:00
реално вр› ијеме Воск (инстант)
побољшано Вхиспер (прецизно)
Јавне везе: 24х, само текст · Упиши се за 7d + аудио · Проф. за приватне везе

Говор у реално време за текст. Ауто- исправља док говорите — тачност се побољшава са дужем говором.

Прво тестирај микрофон.
❤️ Love STT.ai? Tell your friends!
Ви сте користили своје бесплатне транскрипције

Пријавите се бесплатно да добијете 600 минута месечно, или надоградите за неограничене транскрипције.

10 слободног мин/дан 600 минута бесплатно са пријавом Нема кредитне картице шифровано
Упиши се бесплатно →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Често постављана питања

SenseVoice је модел говор-текст од FunAudioLLM. STT.ai домаћина SenseVoice на нашој ГПУ инфраструктури тако да га можете користити без обезбеђења сопственог хардвера — слање аудио или видео и одабирање SenseVoice из модела берача.

На стандардним стандардним стандардима, SenseVoice постиже око 5.5% процена грешака речи. Прецизност реалног света зависи од квалитета звука, акцента и језика; за бучне или акцентиране снимке, очекује се неколико процената вишег ВЕР‐ а.

SenseVoice ради на STT.ai-овом слободном нивоу — сваки посетилац добија 600 минута месечно без трошкова. Плаћени планови додају више граница по фајлу, приватне транскрипте и приоритетне редоследе.

SenseVoice је ослобођено под MIT, попустљива дозвола отвореног извора, можете да водите SenseVoice на сопственом хардверу или да користите нашу верзију домаћина — оба су комерцијално коришћена.

SenseVoice подржава 50 језике. Аутоматско откривање изабира прави језик за већину звука; такође га ручно можете задати за мали лифт тачности.

SenseVoice процесира звук на око 50.0x реално време на нашим ГПУ‐ овима. Један сат аудио фајла завршава испод 8802 минута; дуже фајлове у реду и обавештење е‐ поштом.

SenseVoice има 8802 параметра. Већи модели обично су прецизнији, али спорији; STT.ai домаћина SenseVoice на ГПУ, тако да број параметара не утиче на перформансе вашег клијента.

SenseVoice прихвата сваки формат STT.ai подршке — МП3, ВАВ, М4А, ФЛАЦ, ОГГ, МП4, МКВ, МОВ, ВебМ, АВИ и остали. Излаз као ТХТ, СРТ, ВТТ, ДОКС, ЈСОН или ПДФ.

Дијаризација звучника ради поред SenseVoice за сваку транскрипцију — сваки звучник је означен и можете да их преименујете у уређивачу после тога.

Да. SenseVoice ради у нашем управљеном окружењу — аудио се обрађује и обрише подразум› ијевано и никада се не користи за обуку без експлицитне опције. Про планови додају шифровање са стране клијента за транскрипте у миру.

Користите алатку за упоређивање да покренете SenseVoice против било ког другог подржаног модела на истом звуку — видећете ВЕР, број сегмента, налепнице звучника и поверљиве резултате са стране поред. Најчешће је поређење SenseVoice против Whisper Велики В3.

Да. Задајте „ sensevoice “ као параметар модела на крајњој тачки /v1/transcribed. Питон и Node.js СДК укључују SenseVoice примера. Слободни АПИ низ укључује 100 минута/месечно.

Да, зато што је SenseVoice 8802-лицензиран, можете да га водите. STT.ai отворене странице набраја репо и тежине пројекта. Већина продуцентских тимова користи нашу домаћинску верзију да прескочите ГПУ набавке, замене модела и операције.