ຕົວຖ່າຍສຽງ AI
ສ້າງສຽງໃດກໍໄດ້ຈາກຄລິບສຽງສັ້ນໆ. ສົ່ງຂໍ້ຄວາມທີ່ມີໄລຍະເວລາ 3-10 ວິນາທີ, ພິມຂໍ້ຄວາມຂອງທ່ານ ແລະ ສ້າງສຽງດ້ວຍສຽງດຽວກັນ.
Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.
ສົ່ງສຽງອ້າງອີງໄປຍັງໄຟລ໌
MP3, WAV, M4A, FLAC
VibeVoice presets cover English, German, French, Japanese, Korean, Polish, Portuguese, Spanish, Italian, Dutch.
ສູງສຸດ 500 តួអក្សរ
0/500
ໃຊ້ເຄຣດິດ 1 ເທື່ອຕໍ່ການສ້າງ
ວິທີການເຮັດວຽກ
1
ສົ່ງຂໍ້ມູນອ້າງອີງຂຶ້ນໄປ
ສົ່ງສຽງທີ່ຊັດເຈນ 3-10 ວິນາທີ ຈາກສຽງທີ່ທ່ານຕ້ອງການທີ່ຈະກລອນ.
2
AI ວິເຄາະສຽງ
F5-TTS ຖອດຄຸນລັກສະນະສຽງ: ສຽງ, ລະດັບ, ແບບເວົ້າ, ສຽງອ່ອນ.
3
ສ້າງການເວົ້າ
ຂໍ້ຄວາມຂອງທ່ານຈະຖືກເວົ້າດ້ວຍສຽງທີ່ສ້າງເປັນຄລີນ. ດາວໂຫລດຜົນໄດ້ຮັບເປັນ WAV.
ການກັ່ນຕອງສຽງແມ່ນເພື່ອໃຊ້ສ່ວນຕົວ ແລະ ໄດ້ຮັບອະນຸຍາດເທົ່ານັ້ນ. อย่ากรองเสียงโดยไม่อนุญาตของผู้พูด
Frequently Asked Questions
ສົ່ງໄຟລ໌ສຽງຫຼືວິດີໂອຂອງທ່ານໄປທີ່ STT.ai, ປ້າຍ URL, ຫຼືບັນທຶກສົດ. ເລືອກແບບ AI ທີ່ທ່ານມັກແລະຄລິກໃສ່ ແປ. ໄຟລ໌ສ່ວນໃຫຍ່ແມ່ນສໍາເລັດໃນ5ນາທີ. ສົ່ງອອກເປັນ TXT, SRT, VTT, DOCX, JSON, ຫຼື PDF.
ຍິນດີຕ້ອນຮັບ - STT.ai ເຮັດໃຫ້ຜູ້ເຂົ້າຊົມທຸກໆຄົນ 600 ນາທີຟຣີ / ເດືອນໂດຍບໍ່ມີການລົງທະບຽນທີ່ຕ້ອງການສໍາລັບເອກະສານທໍາອິດຂອງທ່ານ. ແຜນທີ່ຈ່າຍເລີ່ມຕົ້ນທີ່ $5/ເດືອນເປີດໄຟລ໌ຍາວກວ່າ, ບົດບັນທຶກສ່ວນຕົວ, ແລະການຈັດລຽງລໍາດັບຄວາມສໍາຄັນ.
ຄວາມຖືກຕ້ອງແມ່ນຂຶ້ນກັບແບບແລະຄຸນນະພາບສຽງ. ແບບທີ່ດີທີ່ສຸດຂອງພວກເຮົາບັນລຸ 3-5% ອັດຕາຄວາມຜິດພາດໃນຄໍາເວົ້າກ່ຽວກັບ benchmarks - 95-97% ຄວາມຖືກຕ້ອງກ່ຽວກັບຄໍາເວົ້າທີ່ສະອາດ. ເຄື່ອງມືທຽບ-stt ອະນຸຍາດໃຫ້ທ່ານແລ່ນຫຼາຍແບບໃນເອກະສານດຽວກັນແລະເລືອກອັນທີ່ດີທີ່ສຸດ.
STT.ai ສະຫນອງ 10+ ແບບ — STT.ai ເພີ່ມ (ທີ່ຖືກຕ້ອງທີ່ສຸດຂອງພວກເຮົາ), Whisper ໃຫຍ່ V3 (ພາສາ 99), NVIDIA Canary (#1 WER ກ່ຽວກັບການສະຫນັບສະຫນູນ langs), Whisper Turbo (ໄວ), Moonshine (ເບົາ), ແລະອື່ນໆ. ທຸກໆຫນ້າແບບມີລາຍລະອຽດ.
ຍິນດີຕ້ອນຮັບ. ສົ່ງອອກ transcript ຂອງທ່ານເປັນ SRT ຫຼື VTT ເອກະສານບົດຄວາມ - ພວກເຂົາເຮັດວຽກກັບ YouTube, Vimeo, TikTok, VLC, ແລະຜູ້ຫຼິ້ນວິດີໂອໃຫຍ່ທຸກ. ເຄື່ອງມື Burn-ບົດຄວາມ overlays ເຂົາເຈົ້າໃສ່ວິດີໂອເປັນ hardsubs.
ຍອມຮັບ. ການຈັດລາຍຊື່ຜູ້ເວົ້າຈະວາງស្លាກສຽງແຕ່ລະສຽງໂດຍອັດຕະໂນມັດ (ຜູ້ເວົ້າ 1, ຜູ້ເວົ້າ2...), ແລະ ທ່ານສາມາດປ່ຽນຊື່ພວກມັນໃນຕົວຈັດການລາຍຊື່ສຽງໄດ້. ເຮັດວຽກໄດ້ກັບທຸກແບບ ແລະ ພາສາ.
ໄຟລ໌ສ່ວນໃຫຍ່ແມ່ນຖືກແປເປັນພາສາໃນ5ນາທີ. ໄຟລ໌ສຽງ 1 ຊົ່ວໂມງປົກກະຕິແລ້ວຈະສໍາເລັດໃນ 2-3 ນາທີກັບແບບທີ່ໄວທີ່ສຸດຂອງພວກເຮົາ. ຄວາມໄວແມ່ນຂຶ້ນກັບການເລືອກແບບແລະການໂຫຼດປະຈຸບັນ.
STT.ai ສະຫນັບສະຫນູນ 20+ ຮູບແບບການເຂົ້າລະຫັດ - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ແລະອື່ນໆ. ຜົນຜະລິດເປັນ TXT, SRT, VTT, DOCX, JSON, ແລະ PDF.
ຍິນດີຕ້ອນຮັບ. ໄຟລ໌ສຽງແມ່ນຖືກປະມວນຜົນແລະລຶບໂດຍ default. ແຜນ Pro ເພີ່ມການເຂົ້າລະຫັດດ້ານລູກຄ້າ - ເຖິງແມ່ນວ່າຖ້າຫາກວ່າຖານຂໍ້ມູນຂອງພວກເຮົາຖືກລະເມີດ, ບົດບັນທຶກຂອງທ່ານແມ່ນບໍ່ສາມາດອ່ານໄດ້ໂດຍບໍ່ມີກ່ອງຂອງທ່ານ. ຂໍ້ມູນແມ່ນບໍ່ເຄີຍຖືກນໍາໃຊ້ສໍາລັບການຝຶກອົບຮົມແບບຢ່າງໂດຍບໍ່ມີການ opt-in ຢ່າງຈະແຈ້ງ.
STT.ai ສະຫນອງການ API REST ກັບ Python ແລະ Node.js SDKs, ນອກນັ້ນຍັງມີ MCP ສໍາລັບ Claude ແລະ Cursor. ຊັ້ນ API ຟຣີປະກອບມີ 100 ນາທີ / ເດືອນ.
ຍິນດີ. ບົດບັນທຶກທຸກໆບົດຈະຖືກເປີດໃນຕົວແກ້ໄຂທີ່ຕິດຕັ້ງໄວ້ຂອງພວກເຮົາບ່ອນທີ່ທ່ານສາມາດແກ້ໄຂຄໍາ, ປ່ຽນຊື່ຜູ້ເວົ້າ, ປັບເວລາແລະເພີ່ມຂໍ້ຄວາມ. ການປ່ຽນແປງທັງ ໝົດ ຈະຖືກບັນທຶກໄວ້ໂດຍອັດຕະໂນມັດ.
ທຸກ transcript ໄດ້ຮັບ URL ແບ່ງປັນທີ່ເປັນເອກະລັກ. ສົ່ງອອກໄປ DOCX ຫຼື PDF ສຳ ລັບອີເມວ. ແຜນງານ Pro ເພີ່ມການປົກປ້ອງລະຫັດຜ່ານແລະເຊື່ອມຕໍ່ທີ່ ໝັ້ນ ຄົງ - ມີປະໂຫຍດ ສຳ ລັບວຽກຂອງລູກຄ້າ.
STT.ai ສະຫນັບສະຫນູນ 1,300+ ເວທີລວມທັງ YouTube, Vimeo, TikTok, SoundCloud, ແລະອື່ນໆ. ການແປ URL ເຮັດວຽກກັບເນື້ອຫາທີ່ມີຢູ່ທົ່ວໄປເທົ່ານັ້ນ - ແຫຼ່ງທີ່ປົກປ້ອງ DRM ບໍ່ສາມາດແປໄດ້.