Senhalament de bòg / demanda de foncionalitat

Transcriure amb SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Funciona amb de fichièrs àudio e vidèo publics. Lo contengut protegit per DRM es pas suportat.

@ info: status

Discutir amb transcripcion

Desverrollar amb Pro →

@ info: status

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - fins a 2 Go

Descarga de fichièrs multiples with Pro

@ info: status

Discutir amb transcripcion

Desverrollar amb Pro →

@ info: status

Transformar la votz en tèxt en temps real. L'IA se corrigís automaticament mentre que parlatz - la precision melhora amb la durada de la votz.

Testatz lo vòstre microfòn en primièr

10 minutas liuras/ jorn 600 min gratuit amb inscripcion Pas cap de carta de credit EncriptatComment

Inscriure' s →

5.5%

WER

Lengas

50.0x

Velocitat

MIT

Licéncia

A prepaus de SenseVoice

SenseVoice es un modèl de foncionament de la votz de FunAudioLLM que va mai luènh que la transcripcion. Pren en carga mai de 50 lengas e compren de capacitats de reconeissença d'emocions, de deteccion d'eveniments audio e de normalizacion inversa del tèxt dins un sol modèl.

Lengas SenseVoice

Anglés

Spanish

French

German

Chinese

Japanese

Korean

Portuguese

Arabic

Hindi

Russian

Italian

Dutch

Turkish

Polish

Swedish

Indonesian

Thai

Vietnamese

Czech

Greek

Romanian

Hungarian

Hebrew

Danish

Finnish

Norwegian

Ukrainian

Malay

Bangla

Entresenhas sul modèl

ProvesidorFunAudioLLM
Arquitectura-
LicénciaMIT
ActualizatMar 2026

Models

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Questions frequentas

SenseVoice is a speech-to-text model by FunAudioLLM. STT.ai hosts SenseVoice on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick SenseVoice from the model picker.

@ info

SenseVoice s'exécuta sus la basa liura de STT.ai - cada visitaire a 600 minutas per començar sens còst. Los plans pagats apondon de limitas mai longas per fichièr, de transcripcions privadas e de filas de espera prioritarias.

SenseVoice es publicat jos la licéncia MIT, una licéncia de còde dobèrt permissiva. Podètz auto-ostejar SenseVoice sus vòstre pròpri maquinari o utilizar nòstra version ostejada — ambedos son comercialament utilizables.

SenseVoice pren en carga 50 lengas. La deteccion automatica causís la lenga correcta per la majoritat dels sons; podètz tanben la especificar manualament per una precision melhorada.

SenseVoice traça l'audio a aperaquí 50.0x en temps real sus nòstras GPU. Un fichièr àudio d'una ora se acaba en mens de 1 minutas; los fichièrs mai longs son plaçats en fila e notificats per corrièr electronic quand son acabats.

SenseVoice a de paramètres 234M. Los modèls mai grands son mai precises mas mai lents; STT.ai òste SenseVoice sul GPU, doncas lo compte de paramètres afecta pas vòstras performanças del costat client.

SenseVoice accepta totes los formats que pren en carga STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e d'autres. Sortida coma TXT, SRT, VTT, DOX, JSON, o PDF.

@ info: shell

@ info

Utilizatz l'aisina compare-stt per comparar SenseVoice amb quin autre modèl suportat sul meteis audio — veiretz WER, lo comptatge de segments, las etiquetas dels parlants e las pontuacions de fiabilitat a costat. La comparason SenseVoice vs Whisper Large V3 es la mai comuna.

Òc. Especifiquez "sensevoice" coma paramètre del modèl sul punt de fin /v1/transcribe. Los SDK Python e Node.js incluson d'exemples SenseVoice. Lo nivèl API liure inclutz 100 minutas/mes.

Òc. Perque SenseVoice es licenciat amb MIT, podètz l'albergar. La pagina de còde dobèrt de STT.ai lista lo repositori e los pes del projècte. La majoritat de las equipas de produccion utilizan nòstra version albergada per passar l'aquisicion de GPU, los escambis de modèls e las operacions.

Transcriure amb SenseVoice

A prepaus de SenseVoice

Lengas SenseVoice

Entresenhas sul modèl

Models

Questions frequentas

Qu'ei SenseVoice?

Qu'es exacte SenseVoice?

SenseVoice es liure d'utilizar?

Quina licéncia utiliza SenseVoice?

Quinas lengas pren en carga SenseVoice?

Qu'es rapid SenseVoice?

Quina es la talha del modèl SenseVoice?

De quins formats audio pòt transcriure SenseVoice?

Lo SenseVoice detecta de parlants multiples?

Las meunas donadas son privadas quand emplego SenseVoice?

SenseVoice es un nombre natural seguent 87000 e precedissent 86000.

Puei, lo SenseVoice es utilizat per l'API.

Puei, lo SenseVoice es disponible sus mon servidor.