เขียนเป็นลำดับ Moonshine

Name: Moonshine
Author: Useful Sensors

ทำงานกับวิดีโอและเสียงที่เปิดให้ใช้โดยทั่วไป ไม่รองรับเนื้อหาที่ได้รับการปกป้องด้วย DRM

ปรับปรุงสำหรับ Enhanced

ส่วนตัว

คุยกับแปล

เปิดล็อคด้วยโปร →

วางแฟ้มที่นี่ หรือคลิกเพื่อค้นหา

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - สูงสุด 2GB

โหลดแฟ้มหลายแฟ้มเป็นกลุ่ม กับโปร

ปรับปรุงสำหรับ Enhanced

ส่วนตัว

คุยกับแปล

เปิดล็อคด้วยโปร →

ปรับปรุงสำหรับ Enhanced

คำพูดเป็นข้อความแบบเรียลไทม์ AI ปรับปรุงอัตโนมัติเมื่อคุณพูด - ความแม่นยำจะดีขึ้นเมื่อคุณพูดนานขึ้น

ทดสอบไมโครโฟนก่อน

10 นาทีฟรี/ วัน 600 นาทีฟรี กับการสมัคร ไม่มีบัตรเครดิต เข้ารหัสไว้

ลงทะเบียนฟรี →

7.8%

WER

ภาษา

80.0x

ความเร็ว

MIT

ใบอนุญาต

เกี่ยวกับ Moonshine

Moonshine เป็นโมเดลการแปลงเสียงเป็นข้อความที่เล็กมาก ออกแบบมาสำหรับสภาพแวดล้อมที่มีทรัพยากรจำกัด ด้วยพารามิเตอร์เพียง 61M มันทำงานได้อย่างมีประสิทธิภาพบนอุปกรณ์ด้านข้างเช่น Raspberry Pi ในขณะที่ยังคงความแม่นยำในการแปลงภาษาอังกฤษที่สมเหตุสมผล

ภาษาที่รองรับ Moonshine

อังกฤษ

ข้อมูลรุ่น

ตัวจัดหาUseful Sensors
สถาปัตยกรรม-
ใบอนุญาตMIT
ปรับปรุงใหม่Mar 2026

โมเดลที่เกี่ยวข้อง

3.2% WER

4.2% WER

5.1% WER

3.5% WER

3.0% WER

คำถามที่พบบ่อย

Moonshine เป็นโมเดลการแปลงเสียงเป็นข้อความของ Useful Sensors STT.ai ใช้โครงสร้างพื้นฐานของ GPU ของเรา ดังนั้นคุณสามารถใช้มันได้โดยไม่ต้องจัดหาฮาร์ดแวร์ของคุณเอง — โหลดเสียงหรือวิดีโอ และเลือก Moonshine จากตัวเลือกโมเดล

ตามมาตรฐานการทดสอบ Moonshine สามารถทำได้ราว 7.8% ของอัตราความผิดพลาดของคำ ความแม่นยำในโลกจริงขึ้นอยู่กับคุณภาพเสียง สำเนียง และภาษา สำหรับเสียงรบกวนหรือสำเนียงที่บันทึกไว้ ควรจะคาดหวังให้ WER สูงกว่า WER หลายเปอร์เซ็นต์

Moonshine ทำงานบน STT.ai ระดับฟรี - ผู้เข้าชมทุกคนได้รับ 600 นาทีเพื่อเริ่มต้นโดยไม่มีค่าใช้จ่าย แผนจ่ายเพิ่มการ จำกัด ต่อไฟล์ ส่วนตัวและคิวที่สำคัญ

Moonshine ถูกปล่อยออกมาภายใต้ MIT ใบอนุญาตโอเพนซอร์สที่อนุญาตให้คุณสามารถใช้ Moonshine บนฮาร์ดแวร์ของคุณเอง หรือใช้เวอร์ชั่นที่เราจัดเตรียมไว้ — ทั้งหมดนี้สามารถใช้ได้ในเชิงพาณิชย์

Moonshine รองรับภาษา 1 ตัวตรวจจับอัตโนมัติจะเลือกภาษาที่ถูกต้องสำหรับเสียงส่วนใหญ่ คุณสามารถกำหนดเองได้ด้วยเพื่อเพิ่มความแม่นยำเล็กน้อย

Moonshine ประมวลผลเสียงด้วยความเร็วประมาณ 80.0x ตามเวลาจริงบน GPU ของเรา แฟ้มเสียง 1 ชั่วโมง จะใช้เวลาไม่ถึง 1 นาที ส่วนแฟ้มที่ยาวกว่าจะถูกจัดเป็นคิวและแจ้งให้ทราบทางอีเมลเมื่อเสร็จสิ้น

Moonshine มีพารามิเตอร์ 61M รุ่นที่ใหญ่กว่าจะมีแนวโน้มที่จะแม่นยำกว่า แต่ช้ากว่า; STT.ai ใช้ Moonshine บน GPU ดังนั้น การนับพารามิเตอร์จะไม่ส่งผลต่อประสิทธิภาพด้านคลาวด์ของคุณ

Moonshine รองรับทุกรูปแบบที่ STT.ai รองรับ — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI และอื่นๆ อีกมากมาย นำออกมาเป็น TXT, SRT, VTT, DOCX, JSON หรือ PDF

ใช่ การจัดเรียงผู้พูด ทำงานร่วมกับ Moonshine สำหรับทุกการแปล ทุกคนที่พูดมีฉลาก และคุณสามารถเปลี่ยนชื่อพวกเขาในเครื่องมือแก้ไข

ใช่ Moonshine ทำงานในสภาพแวดล้อมที่จัดการได้ของเรา - เสียงจะถูกประมวลผลและลบโดยปริยาย และไม่เคยใช้สำหรับการฝึกอบรมโดยไม่ต้องเลือกอย่างชัดเจน แพ็คเกจโปรเพิ่มการเข้ารหัสด้านคลาวด์สำหรับแปลภาษาที่พัก

ใช้เครื่องมือ compare- stt เพื่อประมวลผล Moonshine กับรุ่นอื่นที่รองรับบนเครื่องเสียงเดียวกัน คุณจะเห็น WER, จำนวนเซกเมนต์, แท็กลำโพง และคะแนนความเชื่อมั่น ติดกัน การเปรียบเทียบ Moonshine กับ Whisper Large V3 นั้นเป็นวิธีที่ใช้กันมากที่สุด

ใช่ ระบุ "moonshine" เป็นพารามิเตอร์แบบจำลองบนจุดจบ /v1/transcribe Python และ Node.js SDKs รวมถึงตัวอย่าง Moonshine ระดับ API ฟรี รวมถึง 100 นาที/เดือน

ใช่ เพราะ Moonshine ได้รับอนุญาตจาก MIT คุณสามารถโฮสต์มันเองได้ หน้าโอเพนซอร์สของ STT.ai แสดงรายการโครงการและน้ำหนัก ทีมผลิตส่วนใหญ่ใช้เวอร์ชั่นโฮสต์ของเรา ข้ามการซื้อ GPU แบบจำลองสลับและปฏิบัติการ

เขียนเป็นลำดับ Moonshine

เกี่ยวกับ Moonshine

ภาษาที่รองรับ Moonshine

ข้อมูลรุ่น

โมเดลที่เกี่ยวข้อง

คำถามที่พบบ่อย

Moonshine คืออะไร

88,000 มันถูกต้องแค่ไหน

Moonshine ใช้ฟรีไหม

Moonshine ใช้ใบอนุญาตอะไร

Moonshine รองรับภาษากี่ภาษา

Moonshine เร็วแค่ไหน

ขนาดของ Moonshine เท่าไหร่

Moonshine สามารถแปลงเสียงได้ยังไง

Moonshine สามารถตรวจจับเสียงหลายคนได้ไหม

ข้อมูลส่วนตัวของฉัน ถ้าใช้ Moonshine

Moonshine มันเทียบกับ STT รุ่นอื่นๆได้ยังไง

ฉันใช้ Moonshine ผ่าน API ได้ไหม

ฉันสามารถใช้ Moonshine บนเซิร์ฟเวอร์ของฉันได้ไหม?