Model	WER	Speed	ភាសា	ល្អបំផុតសម្រាប់
STT.ai Enhanced	3.2%	160.0x	100	STT.ai's flagship speech-to-text model with best-in-class accuracy and speed. Optimized …
Whisper Large V3	4.2%	8.0x	99	OpenAI's largest and most accurate Whisper model. Excellent multilingual support …
Whisper Turbo	5.1%	32.0x	99	OpenAI's speed-optimized Whisper variant. 4x faster than Large V3 with …
NVIDIA Canary	3.5%	45.0x	4	NVIDIA's multi-task ASR model with top-tier accuracy on English. Built …
Moonshine	7.8%	80.0x	1	Ultra-lightweight ASR model designed for edge devices. Runs on Raspberry …
NVIDIA Parakeet	3.0%	55.0x	1	NVIDIA's CTC-based English ASR model. One of the most accurate …
SenseVoice	5.5%	50.0x	50	Multilingual speech understanding model with emotion recognition and audio event …
Distil-Whisper	5.8%	48.0x	99	Distilled version of Whisper Large V3. 6x faster with 49% …
Vosk	12.0%	100.0x	20	Lightweight offline speech recognition. Works without internet, ideal for privacy-sensitive …

តើអ្វីទៅជា WER (អត្រាកំហុសពាក្យ)?

អត្រាកំហុសពាក្យ (WER) គឺជាម៉ែត្រស្តង់ដារសម្រាប់វាស់ភាពត្រឹមត្រូវនៃការទទួលស្គាល់ការនិយាយ & # 160; ។ វាគណនាភាគរយនៃពាក្យក្នុងការបកប្រែដែលខុសពីសេចក្ដីយោង & # 160; ។ WER របស់ ៥% មានន័យថាប្រហែលជា៥ ក្នុងចំណោមពាក្យទាំងអស់ដែលមានកំហុស & # 160; ។ ទាបជាងនេះគឺល្អ & # 160; ។

ជំនាញបម្លែងមនុស្សជាទូទៅសម្រេចបាននូវ WER នៃ 4-5%. ម៉ូដែល AI ល្អបំផុតឥឡូវនេះផ្គូផ្គងឬជិតស្និទ្ធភាពកម្រិតមនុស្សលើអូឌីយ៉ូស្អាត.

មិនប្រាកដថាម៉ូដែលណាត្រូវប្រើទេ & # 160;?

ព្យាយាមលំនាំដើមរបស់យើង - Whisper ធំ V3 Turbo ផ្ដល់នូវតុល្យភាពល្អបំផុតនៃល្បឿននិងភាពត្រឹមត្រូវ. ឥតគិតថ្លៃដើម្បីចាប់ផ្តើម, គ្មានការចុះឈ្មោះចាំបាច់.

ចាប់ផ្ដើមបម្លែងជាសំឡេងដោយឥតគិតថ្លៃ

AI Models

STT.ai Enhanced

Whisper Large V3

Whisper Turbo

NVIDIA Canary

Moonshine

NVIDIA Parakeet

SenseVoice

Distil-Whisper

Vosk

របៀប​ជ្រើស​ម៉ូដែល​ត្រឹមត្រូវ

តើអ្វីទៅជា WER (អត្រាកំហុសពាក្យ)?

មិន​ប្រាកដ​ថា​ម៉ូដែល​ណា​ត្រូវ​ប្រើ​ទេ & # 160;?

របៀបជ្រើសម៉ូដែលត្រឹមត្រូវ

មិនប្រាកដថាម៉ូដែលណាត្រូវប្រើទេ & # 160;?