Transcribe with NVIDIA Canary

Работи со јавно достапно аудио и видео. Содржината заштитена од DRM не е поддржана.

Надоградба за подобрено
Private transcript
Разговарај со преписот
Отклучи со про →
Испуштете ја датотеката тука или кликнете за да прелистувате
MP3, WAV, M4A, FLAC, MP4, MKV, MIV, WebM — до 2GB
Надоградба за подобрено
Private transcript
Разговарај со преписот
Отклучи со про →
Надоградба за подобрено
Снимање: 0:00
Реално- време Воск (инстант)
Подобрено Шепоти (точно)
Јавни врски: 24h, само текст · Запиши се. за 7d + аудио · Проф. за приватни врски

Зборот во реално време на текстот. Авто- корекции на AI додека зборувате — точноста се подобрува со подолг говор.

Прво тестирај го микрофонот
❤️ Love STT.ai? Tell your friends!
Си ги користел твоите слободни транскрипции.

Запиши се бесплатно за да добиеш 600 минути месечно, или да се надградиш за неограничени транскрипции.

10 слободен мин/ден 600 минути бесплатно со пријава Нема кредитна картичка Криптирано
Запиши се бесплатно →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Често поставувани прашања

NVIDIA Canary е модел од говор до текст со NVIDIA. STT.ai домаќини NVIDIA Canary на нашата инфраструктура на ГПУ за да можете да го користите без да го снабдите сопствениот хардвер — да внесете аудио или видео и да изберете NVIDIA Canary од моделот.

Според стандардните стандарди, NVIDIA Canary постигнуваат околу 3.5% проценка на грешките на зборовите. Прецизноста на реалниот свет зависи од квалитетот на звукот, акцентот и јазикот; за бучни или акцентирани снимки, очекуваат неколку проценти повисоко од ВЕР.

NVIDIA Canary работи на слободен степен на STT.ai — секој посетител добива 600 минути/месечно без цена. Платените планови додаваат повеќе граници по датотеки, приватни транскрипти и приоритетни редици.

NVIDIA Canary е ослободен под CC-BY-4.0, попустлива лиценца со отворен извор. NVIDIA Canary може да се води на сопствен хардвер или да се користи нашата домаќинска верзија — и двете се комерцијално употребливи.

NVIDIA Canary поддржува 4 јазици. Авто- детекција го избира вистинскиот јазик за повеќето аудио; исто така можете рачно да го наведете за малку прецизност.

NVIDIA Canary процесира аудио на околу 45.0x во реално време на нашите GPU. 1- часовна аудио датотека завршува за помалку од 8802 минути; подолга редица на датотеки и известува со е- пошта кога ќе биде завршена.

NVIDIA Canary има 8802 параметри. Поголемите модели се поточни, но побавни; STT.ai домаќини NVIDIA Canary на GPU за броењето на параметрите да не влијае на перформансите на вашиот клиент.

NVIDIA Canary го прифаќа секој формат STT.ai потпори — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и други.

Дијаризирањето на звучникот оди заедно со NVIDIA Canary за секоја транскрипција — секој говорник е означен и потоа можете да ги преименувате во уредникот.

Да. NVIDIA Canary работи во нашата управувана средина — аудиото е обработено и избришано стандардно и никогаш не се користи за обука без експлицитна опти-ин. Про плановите додаваат енкрипција на страна на клиентот за преписи во мир.

Користете ја алатката споредба-ст за извршување NVIDIA Canary против било кој друг поддржан модел на истиот аудио — ќе го видите WER, бројот на сегменти, звучниците и самодоверливите резултати од страна на страна. Поравнувањето NVIDIA Canary против Whisper Large V3 е најчесто извршено.

Да. Наведете „ nvidia-canary “ како параметар на моделот на крајната точка / v1/transcribe. Python и Node.js SDKs вклучуваат NVIDIA Canary примери. Слободната API низа вклучува 100 минути/месечно.

Бидејќи NVIDIA Canary е 8802-лицензирана, можеш да го водиш. STT.ai-те страници со отворен извор ги набројуваат репо и тежини на проектот. Повеќето производствени тимови ја користат нашата домаќинска верзија за да ја прескокнат набавката на ГПУ, размената на модели и опс.