Transcribe with NVIDIA Canary

Робота з загальнодоступним аудіо- відео. Вміст захищеного DRM не підтримується.

Оновлення для розширень
Private transcript
Спілкування з трансграфом
Розблокувати за допомогою Pro →
Скинути файл сюди або натиснути, щоб переглянути
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM } up до 2GB
Оновлення для розширень
Private transcript
Спілкування з трансграфом
Розблокувати за допомогою Pro →
Оновлення для розширень
Запис: 0:00
Реальний час Vosk (переклад)
Покращений Whiper (точно)
Громадські посилання: 24h, лише текст · Підписатися для 7d + audio · Pro для особистих посилань

У режимі реального часу мовлення з текстом. Під час вашого виступу AI автоматично виправляється точність з довшою мовою.

Спочатку перевіряйте мікрофон
❤️ Обожаю STT.ai?
Ви використали вільні документи

Запишіться безкоштовно, щоб отримати 600 хвилин/місяць або оновити необмежені записи.

10 вільних хв/ дня 600 хв без підпису Немає кредитної картки Зашифровано
Вільна підписка →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Часті запитання

NVIDIA Canary - це модель тексту мовлення від 8 8002. STT.ai вузлів - NVIDIA Canary на нашій інфраструктурі GPU, отже ви можете використовувати її без забезпечення власного апаратного завантаження звуку або відео і вибрати NVIDIA Canary з інструменту вибору моделі.

За стандартними полями NVIDIA Canary досягає приблизно 3.5% Частота помилок за словами. Точність реального світу залежить від якості звуку, акценту та мови; для галасливих або акцентованих записів очікується на декількох відсоткових пунктах вищого WER.

NVIDIA Canary працює на свободній краватці STT.ai - кожен відвідувач отримує 600 хвилин/ місяців за будь- яку ціну. Плани паудів додають більше за обмеження файлів, приватні архіви і черги пріоритетів.

NVIDIA Canary is released under CC-BY-4.0, a permissive open-source license. You can self-host NVIDIA Canary on your own hardware or use our hosted version — both are commercially usable.

NVIDIA Canary підтримують 4 мови. Автовиявлення обирає правильну мову для більшості звукових файлів; ви також можете вказати її вручну для невеличкого підйому точності.

NVIDIA Canary оброблює звукові дані у режимі реального часу близько 45.0x у нашому GPU. Одногодинний звуковий файл завершується у менш ніж 8 8002 хвилини; довші файли у черзі і сповіщення електронною поштою.

NVIDIA Canary має 8882 параметри. Великі моделі зазвичай є точнішими, але повільнішими; STT.ai вузлів - NVIDIA Canary на GPU, отже кількість параметрів не впливає на швидкодію вашого клієнта.

NVIDIA Canary приймає кожен формат STT.ai підтримує MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI та інші. Вивід у вигляді TXT, SRT, VTT, DOCX, JSON або PDF.

Так. diamer diaarization працює поряд NVIDIA Canary на кожен запис, кожен з промов буде позначено, і ви зможете перейменувати їх у редакторі після цього.

Yes. NVIDIA Canary runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.

Скористайтеся інструментом порівняння- stest, щоб запустити NVIDIA Canary у порівнянні з будь- якою іншою моделлю, що підтримується, на одному і тому ж звуковому каналі, ви побачите WER, кількість сегментів, надписи промовців, а також результати довіри збоку. Порівняння NVIDIA Canary проти Wisper Великий V3 є найбільш поширеним.

Так. Вкажіть " nvidia-canary " як параметр моделі у теці / v1/ trancess кінцевій точці. У назвах Python і вузла. js SDKs містяться NVIDIA Canary приклади. У вільний інтерфейс API міститься 100 хвилин/ місяців.

Так. Оскільки NVIDIA Canary має 8882- ліцензію, ви можете виконати її. STT.ai - на сторінці з відкритим кодом наведено список експропріаторів та ваг. Більшість команд з виробництва використовують нашу власницьку версію для того, щоб пропустити закупівлю на GPU, моделі свопінгу і ops.