เขียนเป็นลำดับ SenseVoice

Name: SenseVoice
Author: FunAudioLLM

ทำงานกับวิดีโอและเสียงที่เปิดให้ใช้โดยทั่วไป ไม่รองรับเนื้อหาที่ได้รับการปกป้องด้วย DRM

ปรับปรุงสำหรับ Enhanced

ส่วนตัว

คุยกับแปล

เปิดล็อคด้วยโปร →

วางแฟ้มที่นี่ หรือคลิกเพื่อค้นหา

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - สูงสุด 2GB

โหลดแฟ้มหลายแฟ้มเป็นกลุ่ม กับโปร

ปรับปรุงสำหรับ Enhanced

ส่วนตัว

คุยกับแปล

เปิดล็อคด้วยโปร →

ปรับปรุงสำหรับ Enhanced

คำพูดเป็นข้อความแบบเรียลไทม์ AI ปรับปรุงอัตโนมัติเมื่อคุณพูด - ความแม่นยำจะดีขึ้นเมื่อคุณพูดนานขึ้น

ทดสอบไมโครโฟนก่อน

10 นาทีฟรี/ วัน 600 นาทีฟรี กับการสมัคร ไม่มีบัตรเครดิต เข้ารหัสไว้

ลงทะเบียนฟรี →

5.5%

WER

ภาษา

50.0x

ความเร็ว

MIT

ใบอนุญาต

เกี่ยวกับ SenseVoice

SenseVoice เป็นโมเดลพื้นฐานของการพูดจาก FunAudioLLM ที่ยิ่งไปกว่าการแปลภาษา มันสนับสนุนภาษามากกว่า 50 ภาษา และรวมถึงความสามารถในการรับรู้อารมณ์ การตรวจจับเหตุการณ์เสียง และการปรับให้เป็นปกติของข้อความในโมเดลเดียว

ภาษาที่รองรับ SenseVoice

อังกฤษ

สเปน

ฝรั่งเศส

เยอรมัน

จีน

ญี่ปุ่น

เกาหลี

โปรตุเกส

อาหรับ

ฮินดี

รัสเซีย

อิตาลี

ดัตช์

ตุรกี

โปแลนด์

สวีเดน

อินโดนีเซีย

ไทย

เวียดนาม

เช็ก

กรีก

โรมาเนีย

ฮังการี

ฮิบรู

เดนมาร์ก

ฟินแลนด์

นอร์เวย์

ยูเครน

มาเลย์

บังกลา

ข้อมูลรุ่น

ตัวจัดหาFunAudioLLM
สถาปัตยกรรม-
ใบอนุญาตMIT
ปรับปรุงใหม่Mar 2026

โมเดลที่เกี่ยวข้อง

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

คำถามที่พบบ่อย

SenseVoice เป็นโมเดลการแปลงเสียงเป็นข้อความของ FunAudioLLM STT.ai ใช้โครงสร้างพื้นฐานของ GPU ของเรา ดังนั้นคุณสามารถใช้มันได้โดยไม่ต้องจัดหาฮาร์ดแวร์ของคุณเอง — โหลดเสียงหรือวิดีโอ และเลือก SenseVoice จากตัวเลือกโมเดล

ตามมาตรฐานการทดสอบ SenseVoice สามารถทำได้ราว 5.5% ของอัตราความผิดพลาดของคำ ความแม่นยำในโลกจริงขึ้นอยู่กับคุณภาพเสียง สำเนียง และภาษา สำหรับเสียงรบกวนหรือสำเนียงที่บันทึกไว้ ควรจะคาดหวังให้ WER สูงกว่า WER หลายเปอร์เซ็นต์

SenseVoice ทำงานบน STT.ai ระดับฟรี - ผู้เข้าชมทุกคนได้รับ 600 นาทีเพื่อเริ่มต้นโดยไม่มีค่าใช้จ่าย แผนจ่ายเพิ่มการ จำกัด ต่อไฟล์ ส่วนตัวและคิวที่สำคัญ

SenseVoice ถูกปล่อยออกมาภายใต้ MIT ใบอนุญาตโอเพนซอร์สที่อนุญาตให้คุณสามารถใช้ SenseVoice บนฮาร์ดแวร์ของคุณเอง หรือใช้เวอร์ชั่นที่เราจัดเตรียมไว้ — ทั้งหมดนี้สามารถใช้ได้ในเชิงพาณิชย์

SenseVoice รองรับภาษา 50 ตัวตรวจจับอัตโนมัติจะเลือกภาษาที่ถูกต้องสำหรับเสียงส่วนใหญ่ คุณสามารถกำหนดเองได้ด้วยเพื่อเพิ่มความแม่นยำเล็กน้อย

SenseVoice ประมวลผลเสียงด้วยความเร็วประมาณ 50.0x ตามเวลาจริงบน GPU ของเรา แฟ้มเสียง 1 ชั่วโมง จะใช้เวลาไม่ถึง 1 นาที ส่วนแฟ้มที่ยาวกว่าจะถูกจัดเป็นคิวและแจ้งให้ทราบทางอีเมลเมื่อเสร็จสิ้น

SenseVoice มีพารามิเตอร์ 234M รุ่นที่ใหญ่กว่าจะมีแนวโน้มที่จะแม่นยำกว่า แต่ช้ากว่า; STT.ai ใช้ SenseVoice บน GPU ดังนั้น การนับพารามิเตอร์จะไม่ส่งผลต่อประสิทธิภาพด้านคลาวด์ของคุณ

SenseVoice รองรับทุกรูปแบบที่ STT.ai รองรับ — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI และอื่นๆ อีกมากมาย นำออกมาเป็น TXT, SRT, VTT, DOCX, JSON หรือ PDF

ใช่ การจัดเรียงผู้พูด ทำงานร่วมกับ SenseVoice สำหรับทุกการแปล ทุกคนที่พูดมีฉลาก และคุณสามารถเปลี่ยนชื่อพวกเขาในเครื่องมือแก้ไข

ใช่ SenseVoice ทำงานในสภาพแวดล้อมที่จัดการได้ของเรา - เสียงจะถูกประมวลผลและลบโดยปริยาย และไม่เคยใช้สำหรับการฝึกอบรมโดยไม่ต้องเลือกอย่างชัดเจน แพ็คเกจโปรเพิ่มการเข้ารหัสด้านคลาวด์สำหรับแปลภาษาที่พัก

ใช้เครื่องมือ compare- stt เพื่อประมวลผล SenseVoice กับรุ่นอื่นที่รองรับบนเครื่องเสียงเดียวกัน คุณจะเห็น WER, จำนวนเซกเมนต์, แท็กลำโพง และคะแนนความเชื่อมั่น ติดกัน การเปรียบเทียบ SenseVoice กับ Whisper Large V3 นั้นเป็นวิธีที่ใช้กันมากที่สุด

ใช่ ระบุ "sensevoice" เป็นพารามิเตอร์แบบจำลองบนจุดจบ /v1/transcribe Python และ Node.js SDKs รวมถึงตัวอย่าง SenseVoice ระดับ API ฟรี รวมถึง 100 นาที/เดือน

ใช่ เพราะ SenseVoice ได้รับอนุญาตจาก MIT คุณสามารถโฮสต์มันเองได้ หน้าโอเพนซอร์สของ STT.ai แสดงรายการโครงการและน้ำหนัก ทีมผลิตส่วนใหญ่ใช้เวอร์ชั่นโฮสต์ของเรา ข้ามการซื้อ GPU แบบจำลองสลับและปฏิบัติการ

เขียนเป็นลำดับ SenseVoice

เกี่ยวกับ SenseVoice

ภาษาที่รองรับ SenseVoice

ข้อมูลรุ่น

โมเดลที่เกี่ยวข้อง

คำถามที่พบบ่อย

SenseVoice คืออะไร

88,000 มันถูกต้องแค่ไหน

SenseVoice ใช้ฟรีไหม

SenseVoice ใช้ใบอนุญาตอะไร

SenseVoice รองรับภาษากี่ภาษา

SenseVoice เร็วแค่ไหน

ขนาดของ SenseVoice เท่าไหร่

SenseVoice สามารถแปลงเสียงได้ยังไง

SenseVoice สามารถตรวจจับเสียงหลายคนได้ไหม

ข้อมูลส่วนตัวของฉัน ถ้าใช้ SenseVoice

SenseVoice มันเทียบกับ STT รุ่นอื่นๆได้ยังไง

ฉันใช้ SenseVoice ผ่าน API ได้ไหม

ฉันสามารถใช้ SenseVoice บนเซิร์ฟเวอร์ของฉันได้ไหม?