સાથે ટ્રાન્સક્રાઇબ NVIDIA Parakeet

જાહેર ઉપલબ્ધ ઓડિયો અને વિડિયો સાથે કામ કરે છે. DRM-સુરક્ષિત સમાવિષ્ટો આધારભૂત નથી.

વધારા માટે સુધારો
Private transcript
ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો
Pro સાથે તાળુ ખોલો →
ફાઇલ અહીં મૂકો અથવા બ્રાઉઝ કરવા માટે ક્લિક કરો
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ૨GB સુધી
વધારા માટે સુધારો
Private transcript
ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો
Pro સાથે તાળુ ખોલો →
વધારા માટે સુધારો
રેકોર્ડિંગ: 0:00
વાસ્તવિક સમય વૉશ (તરત)
વધારાયેલ Whisper (ચોક્કસ)
જાહેર કડીઓ: ૨૪ કલાક, માત્ર લખાણ · નોંધણી કરો 7d + ઓડિયો માટે · પ્રો ખાનગી કડીઓ માટે

લખાણમાં વાસ્તવિક સમયની બોલી. AI આપોઆપ-સમાધાન કરે છે જેમ તમે બોલો છો - લાંબી બોલી સાથે ચોકસાઈ સુધરે છે.

તમારું માઇક્રોફોન પહેલેથી ચકાસો
❤️ STT.ai ને પ્રેમ કરો છો? તમારા મિત્રોને કહી દો!
તમે તમારી મુક્ત લખાણો વાપરી છે

600 મિનિટ/મહિના મેળવવા માટે મફત નોંધણી કરો, અથવા અસીમાત લખાણો માટે અપગ્રેડ કરો.

૧૦ મુક્ત મિનિટ/દિવસ નોંધણી સાથે 600 મિનિટ મુક્ત ક્રેડિટ કાર્ડ નથી એનક્રિપ્ટ થયેલ
મફત નોંધણી કરો →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

વિશે NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.

સમર્થિત ભાષાઓ NVIDIA Parakeet

વારંવાર પૂછાતા પ્રશ્નો

NVIDIA Parakeet is a speech-to-text model by NVIDIA. STT.ai hosts NVIDIA Parakeet on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick NVIDIA Parakeet from the model picker.

પ્રમાણભૂત બેન્ચમાર્ક પર, NVIDIA Parakeet એ 3.0% શબ્દ ભૂલ દરને આસપાસ મેળવે છે. વાસ્તવિક-વિશ્વની ચોકસાઈ ઓડિયો ગુણવત્તા, ઉચ્ચારણ અને ભાષા પર આધારિત છે; ધુમાડાવાળા અથવા ઉચ્ચારણવાળા રેકોર્ડિંગ માટે, થોડા ટકા પોઇન્ટ્સ ઊંચા WER ની અપેક્ષા રાખો.

NVIDIA Parakeet STT.ai ની મુક્ત સ્તરે ચાલે છે - દરેક મુલાકાતીને કોઈ ખર્ચ વગર 600 મિનિટ/મહિના મળે છે. ચૂકવેલ યોજનાઓ લાંબી ફાઇલ મર્યાદા, ખાનગી ટ્રાન્સક્રિપ્ટ્સ અને પ્રાથમિકતા કતાર લગાવવી ઉમેરે છે.

NVIDIA Parakeet CC-BY-4.0 ની નીચે બહાર પાડવામાં આવે છે, એક પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ. તમે તમારા પોતાના હાર્ડવેરમાં NVIDIA Parakeet ને સ્વયં-હોસ્ટ કરી શકો છો અથવા અમારી હોસ્ટ કરેલ આવૃત્તિનો ઉપયોગ કરી શકો છો - બંને વાણિજ્યિક રીતે ઉપયોગી છે.

NVIDIA Parakeet 1 ભાષાઓને આધાર આપે છે. આપમેળે-શોધ એ મોટાભાગના ઓડિયો માટે સાચી ભાષા પસંદ કરે છે; તમે તેને નાની ચોકસાઈ માટે જાતે પણ સ્પષ્ટ કરી શકો છો.

NVIDIA Parakeet ઓડિયો પ્રક્રિયાઓ અમારા GPUs પર 55.0x વાસ્તવિક સમય પર. 1-કલાકની ઓડિયો ફાઈલ 1 મિનિટમાં સમાપ્ત થાય છે; લાંબી ફાઈલો કતારમાં અને જ્યારે પૂર્ણ થાય ત્યારે ઈમેઈલ દ્વારા સૂચિત કરે છે.

NVIDIA Parakeet પાસે 1.1B પરિમાણો છે. મોટા મોડેલો વધુ ચોક્કસ હોય છે પરંતુ ધીમા; STT.ai GPU પર NVIDIA Parakeet યજમાન છે તેથી પરિમાણ ગણતરી તમારી ક્લાયન્ટ-સાઇડ કાર્યક્ષમતા અસર કરતી નથી.

NVIDIA Parakeet દરેક બંધારણને સ્વીકારે છે કે જે STT.ai આધાર આપે છે — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, અને અન્ય. આઉટપુટ TXT, SRT, VTT, DOCX, JSON, અથવા PDF તરીકે.

હા. સ્પીકર ડેટાબેઝ દરેક અનુવાદ માટે NVIDIA Parakeet ની સાથે ચાલે છે - દરેક સ્પીકર ને લેબલ કરેલ છે અને તમે પછી સંપાદકમાં તેનું નામ બદલી શકો છો.

હા. NVIDIA Parakeet અમારા સંચાલિત વાતાવરણમાં ચાલે છે - ઓડિયો મૂળભૂત રીતે પ્રક્રિયા કરેલ છે અને કાઢી નાખવામાં આવે છે અને સ્પષ્ટ રીતે પસંદગી કર્યા વિના તાલીમ માટે ક્યારેય વપરાય નહિં. પ્રો યોજનાઓ અસ્થિર ટ્રાન્સક્રિપ્ટ્સ માટે ક્લાયન્ટ-સાઇડ એનક્રિપ્શન ઉમેરે છે.

NVIDIA Parakeet ને કોઈપણ અન્ય આધારભૂત મોડેલ સામે એ જ ઓડિયો પર ચલાવવા માટે સરખામણી-stt સાધનનો ઉપયોગ કરો - તમે WER, સેગમેન્ટ ગણતરી, સ્પીકર લેબલ્સ, અને વિશ્વાસ સ્કોર બાજુ-બે-બાજુ જોશો. NVIDIA Parakeet વિ Whisper Large V3 સરખામણી સૌથી સામાન્ય રીતે ચલાવે છે.

હા. /v1/transcribe અંતિમબિંદુ પર મોડેલ પરિમાણ તરીકે "nvidia-parakeet" ને સ્પષ્ટ કરો. Python અને Node.js SDKs NVIDIA Parakeet ઉદાહરણો સમાવે છે. મુક્ત API સ્તરમાં 100 મિનિટ/મહિના સમાવે છે.

હા. કારણ કે NVIDIA Parakeet એ CC-BY-4.0-લાઇસન્સ થયેલ છે, તમે તેને સ્વયં-હોસ્ટ કરી શકો છો. STT.ai નું ઓપન-સોર્સ પાનું પ્રોજેક્ટ રેપો અને વજનોની યાદી કરે છે. મોટાભાગના ઉત્પાદન ટીમો GPU ખરીદી, મોડેલ સ્વેપ અને ઓપસને છોડવા માટે અમારી યજમાન આવૃત્તિ વાપરે છે.