เขียนเป็นลำดับ Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

ทำงานกับวิดีโอและเสียงที่เปิดให้ใช้โดยทั่วไป ไม่รองรับเนื้อหาที่ได้รับการปกป้องด้วย DRM

ปรับปรุงสำหรับ Enhanced

ส่วนตัว

คุยกับแปล

เปิดล็อคด้วยโปร →

วางแฟ้มที่นี่ หรือคลิกเพื่อค้นหา

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - สูงสุด 2GB

โหลดแฟ้มหลายแฟ้มเป็นกลุ่ม กับโปร

ปรับปรุงสำหรับ Enhanced

ส่วนตัว

คุยกับแปล

เปิดล็อคด้วยโปร →

ปรับปรุงสำหรับ Enhanced

คำพูดเป็นข้อความแบบเรียลไทม์ AI ปรับปรุงอัตโนมัติเมื่อคุณพูด - ความแม่นยำจะดีขึ้นเมื่อคุณพูดนานขึ้น

ทดสอบไมโครโฟนก่อน

10 นาทีฟรี/ วัน 600 นาทีฟรี กับการสมัคร ไม่มีบัตรเครดิต เข้ารหัสไว้

ลงทะเบียนฟรี →

4.2%

WER

ภาษา

8.0x

ความเร็ว

MIT

ใบอนุญาต

เกี่ยวกับ Whisper Large V3

วิสเปอร์ แลกซ์ วี3 เป็นโมเดลการรับรู้เสียงแบบเปิดซอร์สของโอเพนเอไอ ที่มีพารามิเตอร์ 1.55 พันล้านตัว มันให้ความแม่นยำที่ยอดเยี่ยม ผ่านภาษา 99 ภาษา มันใช้สถาปัตยกรรมของเครื่องเข้ารหัส-ออกรหัสที่ถูกฝึกมาแล้ว 680,000 ชั่วโมงของข้อมูลเสียงหลายภาษา

ภาษาที่รองรับ Whisper Large V3

อังกฤษ

สเปน

ฝรั่งเศส

เยอรมัน

จีน

ญี่ปุ่น

เกาหลี

โปรตุเกส

อาหรับ

ฮินดี

รัสเซีย

อิตาลี

ดัตช์

ตุรกี

โปแลนด์

สวีเดน

อินโดนีเซีย

ไทย

เวียดนาม

เช็ก

กรีก

โรมาเนีย

ฮังการี

ฮิบรู

เดนมาร์ก

ฟินแลนด์

นอร์เวย์

ยูเครน

มาเลย์

บังกลา

ข้อมูลรุ่น

ตัวจัดหาOpenAI
สถาปัตยกรรม-
ใบอนุญาตMIT
ปรับปรุงใหม่Mar 2026

โมเดลที่เกี่ยวข้อง

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

คำถามที่พบบ่อย

Whisper Large V3 เป็นโมเดลการแปลงเสียงเป็นข้อความของ OpenAI STT.ai ใช้โครงสร้างพื้นฐานของ GPU ของเรา ดังนั้นคุณสามารถใช้มันได้โดยไม่ต้องจัดหาฮาร์ดแวร์ของคุณเอง — โหลดเสียงหรือวิดีโอ และเลือก Whisper Large V3 จากตัวเลือกโมเดล

ตามมาตรฐานการทดสอบ Whisper Large V3 สามารถทำได้ราว 4.2% ของอัตราความผิดพลาดของคำ ความแม่นยำในโลกจริงขึ้นอยู่กับคุณภาพเสียง สำเนียง และภาษา สำหรับเสียงรบกวนหรือสำเนียงที่บันทึกไว้ ควรจะคาดหวังให้ WER สูงกว่า WER หลายเปอร์เซ็นต์

Whisper Large V3 ทำงานบน STT.ai ระดับฟรี - ผู้เข้าชมทุกคนได้รับ 600 นาทีเพื่อเริ่มต้นโดยไม่มีค่าใช้จ่าย แผนจ่ายเพิ่มการ จำกัด ต่อไฟล์ ส่วนตัวและคิวที่สำคัญ

Whisper Large V3 ถูกปล่อยออกมาภายใต้ MIT ใบอนุญาตโอเพนซอร์สที่อนุญาตให้คุณสามารถใช้ Whisper Large V3 บนฮาร์ดแวร์ของคุณเอง หรือใช้เวอร์ชั่นที่เราจัดเตรียมไว้ — ทั้งหมดนี้สามารถใช้ได้ในเชิงพาณิชย์

Whisper Large V3 รองรับภาษา 99 ตัวตรวจจับอัตโนมัติจะเลือกภาษาที่ถูกต้องสำหรับเสียงส่วนใหญ่ คุณสามารถกำหนดเองได้ด้วยเพื่อเพิ่มความแม่นยำเล็กน้อย

Whisper Large V3 ประมวลผลเสียงด้วยความเร็วประมาณ 8.0x ตามเวลาจริงบน GPU ของเรา แฟ้มเสียง 1 ชั่วโมง จะใช้เวลาไม่ถึง 7 นาที ส่วนแฟ้มที่ยาวกว่าจะถูกจัดเป็นคิวและแจ้งให้ทราบทางอีเมลเมื่อเสร็จสิ้น

Whisper Large V3 มีพารามิเตอร์ 1.55B รุ่นที่ใหญ่กว่าจะมีแนวโน้มที่จะแม่นยำกว่า แต่ช้ากว่า; STT.ai ใช้ Whisper Large V3 บน GPU ดังนั้น การนับพารามิเตอร์จะไม่ส่งผลต่อประสิทธิภาพด้านคลาวด์ของคุณ

Whisper Large V3 รองรับทุกรูปแบบที่ STT.ai รองรับ — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI และอื่นๆ อีกมากมาย นำออกมาเป็น TXT, SRT, VTT, DOCX, JSON หรือ PDF

ใช่ การจัดเรียงผู้พูด ทำงานร่วมกับ Whisper Large V3 สำหรับทุกการแปล ทุกคนที่พูดมีฉลาก และคุณสามารถเปลี่ยนชื่อพวกเขาในเครื่องมือแก้ไข

ใช่ Whisper Large V3 ทำงานในสภาพแวดล้อมที่จัดการได้ของเรา - เสียงจะถูกประมวลผลและลบโดยปริยาย และไม่เคยใช้สำหรับการฝึกอบรมโดยไม่ต้องเลือกอย่างชัดเจน แพ็คเกจโปรเพิ่มการเข้ารหัสด้านคลาวด์สำหรับแปลภาษาที่พัก

ใช้เครื่องมือ compare- stt เพื่อประมวลผล Whisper Large V3 กับรุ่นอื่นที่รองรับบนเครื่องเสียงเดียวกัน คุณจะเห็น WER, จำนวนเซกเมนต์, แท็กลำโพง และคะแนนความเชื่อมั่น ติดกัน การเปรียบเทียบ Whisper Large V3 กับ Whisper Large V3 นั้นเป็นวิธีที่ใช้กันมากที่สุด

ใช่ ระบุ "whisper-large-v3" เป็นพารามิเตอร์แบบจำลองบนจุดจบ /v1/transcribe Python และ Node.js SDKs รวมถึงตัวอย่าง Whisper Large V3 ระดับ API ฟรี รวมถึง 100 นาที/เดือน

ใช่ เพราะ Whisper Large V3 ได้รับอนุญาตจาก MIT คุณสามารถโฮสต์มันเองได้ หน้าโอเพนซอร์สของ STT.ai แสดงรายการโครงการและน้ำหนัก ทีมผลิตส่วนใหญ่ใช้เวอร์ชั่นโฮสต์ของเรา ข้ามการซื้อ GPU แบบจำลองสลับและปฏิบัติการ

เขียนเป็นลำดับ Whisper Large V3

เกี่ยวกับ Whisper Large V3

ภาษาที่รองรับ Whisper Large V3

ข้อมูลรุ่น

โมเดลที่เกี่ยวข้อง

คำถามที่พบบ่อย

Whisper Large V3 คืออะไร

88,000 มันถูกต้องแค่ไหน

Whisper Large V3 ใช้ฟรีไหม

Whisper Large V3 ใช้ใบอนุญาตอะไร

Whisper Large V3 รองรับภาษากี่ภาษา

Whisper Large V3 เร็วแค่ไหน

ขนาดของ Whisper Large V3 เท่าไหร่

Whisper Large V3 สามารถแปลงเสียงได้ยังไง

Whisper Large V3 สามารถตรวจจับเสียงหลายคนได้ไหม

ข้อมูลส่วนตัวของฉัน ถ้าใช้ Whisper Large V3

Whisper Large V3 มันเทียบกับ STT รุ่นอื่นๆได้ยังไง

ฉันใช้ Whisper Large V3 ผ่าน API ได้ไหม

ฉันสามารถใช้ Whisper Large V3 บนเซิร์ฟเวอร์ของฉันได้ไหม?