के साथ स्केल करें SenseVoice

Name: SenseVoice
Author: FunAudioLLM

सार्वजनिक उपलब्ध ऑडियो व वीडियो के साथ कार्य करता है. वीएनसी सामग्री समर्थित नहीं है.

उन्नत बनाने के लिए उन्नत बनाएँ

निजी उच्चारण

चेक के साथ गपशप करें

योजना के साथ ताला खोलें →

फ़ाइल यहाँ क्लिक करें या ब्राउज़ करने के लिए क्लिक करें

एमपी3, W4A, FLAC, एमपी4, एमकेवी, एम. वी.

बहुत से फ़ाइलों को डाउनलोड किया जा रहा है प्रारंभ में

उन्नत बनाने के लिए उन्नत बनाएँ

निजी उच्चारण

चेक के साथ गपशप करें

योजना के साथ ताला खोलें →

उन्नत बनाने के लिए उन्नत बनाएँ

पाठ को सही तरह से बोलने के लिए सही समय. एआई स्वचालित सुधार जैसे आप बोलते हैं - सही भाषा के साथ सुधार.

अपना माइक्रोफोन पहले टेस्ट करें

10 खाली मि. / दिन साइन अप के साथ 600 मिनट मुक्त कोई क्रेडिट कार्ड नहीं गुप्त

मुक्त साइन अप →

5.5%

WER

भाषाएँ

50.0x

गति

MIT

लाइसेंस

के बारे में SenseVoice

शिक्षण एक ऐसी बोली है जो संगीत से बाहर जाती है. यह 50+1 भाषाओं को समर्थन देता है और इसमें भावना, ऑडियो घटना का पता लगाने, और पाठ को किसी एक मॉडल में लागू करने की क्षमता भी शामिल है.

भाषाएँ जो समर्थित है SenseVoice

अंग्रेज़ी

स्पेनिश

फ़्रेंच

जर्मन

चीनी

जापानी

कोरियाई

पुर्तगाली

अरबी

हिन्दी

रूसी

इतालवी

डच

तुर्की

पोलिश

स्वीडिश

इंडोनेशियाई

थाई

वियतनामी

चेक

यूनानी

रोमानियाई

हंगेरियाई

हिब्रू

डेनिश

फ़िनिश

नॉर्वेजियाई

यूक्रेनियाई

मलय

बंगाली

मॉडल जानकारी

प्रदाताFunAudioLLM
स्फीति-
लाइसेंसMIT
अद्यतन किया गयाMar 2026

अक्सर पूछे जाने वाले प्रश्न

SenseVoice एक भाषण मॉडल है FunAudioLLM द्वारा. STT.ai सेना SenseVoice हमारे जीपी में SenseVoice पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.

मानक Stars पर, ८८०% वचन दर के आसपास SenseVoice प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.

SenseVoice runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

SenseVoice को MIT के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.

SenseVoice 50 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.

SenseVoice प्रक्रियाओं के बारे में 50.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.

SenseVoice में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना SenseVoice GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.

SenseVoice accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

वक्‍ता ने हर भाषण के लिए SenseVoice लोगों के पास दौड़ता है — हर वक्‍ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।

जी. SenseVoice हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.

एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए SenseVoice उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। SenseVoice v3 बड़ा V3 तुलना आम तौर पर चल रहा है।

हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है SenseVoice उदाहरण.

हाँ. क्योंकि SenseVoice है MIT-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.

के साथ स्केल करें SenseVoice

के बारे में SenseVoice

भाषाएँ जो समर्थित है SenseVoice

मॉडल जानकारी

संबंधित मॉडल

अक्सर पूछे जाने वाले प्रश्न

SenseVoice क्या है?

कितना सही है SenseVoice?

क्या SenseVoice का उपयोग करने के लिए स्वतंत्र है?

88,000 लोगों का लाइसेंस क्या है?

कितनी भाषाओं में 88,000 का समर्थन होता है?

कितना तेज SenseVoice है?

SenseVoice मॉडल कितना बड़ा है?

कौन - से ऑडियो फ़ॉर्मेट ८८००० कैंचन को पढ़ सकते हैं?

क्या SenseVoice कई स्पीकरों का पता लगा है?

जब SenseVoice का उपयोग कर मेरा डेटा निजी है?

SenseVoice की तुलना अन्य स्वर्ट मॉडल से कैसे होती है?

क्या मैं एपीआई के माध्यम से SenseVoice का उपयोग कर सकते हैं?

मैं अपने ही सर्वर पर SenseVoice000 चला सकते हैं?