ถอดเสียงเสียงและวิดีโอบนคอมพิวเตอร์ของคุณ

วางไฟล์บันทึก เลือกภาษา รับข้อความสะอาดหรือคำบรรยาย ไม่มีอะไรถูกอัปโหลดขึ้นอินเทอร์เน็ต — โมเดลทำงานในเครื่อง

อะไรที่ทำให้แตกต่าง

ประมวลผลในเครื่อง 100%

ไฟล์ของคุณไม่เคยออกจากเครื่องคุณ ไม่อัปโหลด ไม่ผ่านคลาวด์ ไม่ต้องรอคิว ทำงานแบบออฟไลน์ได้หลังจากดาวน์โหลดโมเดลครั้งแรก

99 ภาษา

OpenAI Whisper รองรับภาษาเกือบร้อยภาษาด้วยความแม่นยำสูง โดยค่าเริ่มต้นจะตรวจจับอัตโนมัติ เลือกภาษาเฉพาะได้ถ้าต้องการบังคับ

เร่งการทำงานด้วย GPU (เสริม)

ติ๊กช่องเดียวก็สลับการประมวลผลไปที่ GPU ผ่าน Vulkan — NVIDIA, AMD, Intel — และจะถอยกลับไปที่ CPU เงียบ ๆ ถ้าไดรเวอร์ไม่รองรับ

ส่งออกเป็น TXT และ SRT

บันทึกข้อความสะอาด คำบรรยายพร้อมใช้ หรือทั้งสองอย่างในครั้งเดียว — งานหนักถูกประมวลผลแค่ครั้งเดียว

ทุกฟอร์แมตเสียง/วิดีโอที่พบบ่อย

ข้อความเสียง WhatsApp (.opus, .ogg), บันทึก OBS (.mkv), ไฟล์ดาวน์โหลด YouTube (.webm), MP3, MP4, MOV, WAV, FLAC, M4A — ffmpeg จัดการได้ทั้งหมด

เทเลเมทรีน้อยที่สุดและไม่ระบุตัวตน

เสียงและบทถอดเสียงของคุณไม่เคยออกจากเครื่อง แอปส่ง ping ครั้งเดียวต่อการติดตั้ง — ID สุ่ม เวอร์ชันแอป และภาษาของระบบ — เพื่อให้รู้ว่าควรโฟกัสที่ประเทศและภาษาไหน นั่นคือทั้งหมด ส่วนประกอบที่ใช้ (FFmpeg, whisper.cpp, Whisper.net, .NET) เป็นโอเพนซอร์สและตรวจสอบได้อย่างอิสระ

วิธีการทำงาน

  1. 1. เลือกไฟล์

    เลือกไฟล์เสียงหรือวิดีโอใด ๆ บนดิสก์และโฟลเดอร์ที่จะบันทึกบทถอดเสียง

  2. 2. เลือกภาษาและโมเดล

    คงไว้ที่ตรวจจับอัตโนมัติ หรือล็อกเป็นภาษาเฉพาะ เลือกขนาดโมเดล Whisper (Tiny เน้นความเร็ว, Medium หรือ LargeV3 เน้นความแม่นยำบนไฟล์ยาว)

  3. 3. ถอดเสียง

    แอปจะดึงแทร็กเสียงที่สะอาด รัน Whisper แล้วเขียน .txt และ/หรือ .srt ลงในโฟลเดอร์ที่คุณเลือก นั่นคือทั้งหมด

ภายใต้ฝากระโปรง

สร้างด้วย .NET 8 บน Windows ใช้ ffmpeg (LGPL) ในการถอดรหัสฟอร์แมต และ Whisper.net (MIT) ห่อหุ้ม whisper.cpp (MIT) สำหรับการประมวลผล ใช้ Vulkan runtime สำหรับ GPU, CPU พร้อม AVX สำรองสำหรับส่วนที่เหลือ ไฟล์โมเดลดาวน์โหลดครั้งเดียวจาก Hugging Face (ggerganov/whisper.cpp) และแคชไว้ใต้ %LOCALAPPDATA%

ขนาดโมเดล

  • Tiny · 77 MB · เร็วที่สุด · ร่างเร็ว
  • Base · 142 MB · ก้าวเล็ก ๆ ไปอีกขั้น
  • Small · 466 MB · สมดุลที่แนะนำ
  • Medium · 1.5 GB · ความแม่นยำสูงกับไฟล์ยาว
  • Large-v3 · 3.1 GB · คุณภาพดีที่สุด ช้าที่สุด

คำถามที่พบบ่อย

ฟรีไหม?

ใช่ แอปนี้ฟรี Microsoft Store อาจคิดค่าธรรมเนียมครั้งเดียวเล็กน้อยในบางภูมิภาค — เป็นค่าจัดจำหน่าย ไม่ใช่ค่าซอฟต์แวร์

ใช้งานออฟไลน์ได้ไหม?

ได้ ตั้งแต่การใช้งานครั้งที่สองเป็นต้นไป ครั้งแรกที่คุณใช้โมเดล Whisper แอปจะดาวน์โหลดจาก Hugging Face หลังจากนั้นทุกอย่างอยู่ในเครื่อง

ความแม่นยำเป็นอย่างไร?

ขึ้นอยู่กับขนาดโมเดลและคุณภาพเสียง สำหรับเสียงพูดชัดเจนในภาษาที่รองรับ Medium และ LargeV3 ใกล้เคียงบริการถอดเสียงระดับมืออาชีพ สำหรับการบันทึกเสียงโทรศัพท์ที่เสียงดังและภาษาปะปนกัน ให้คาดหวังเป็นร่างคร่าว ๆ

คุณเห็นไฟล์ของฉันไหม?

ไม่ แอปไม่มีเซิร์ฟเวอร์ ไฟล์ถูกถอดรหัส ถอดเสียง และบันทึกทั้งหมดบนเครื่องของคุณ การเชื่อมต่อภายนอกเพียงอย่างเดียวคือการดาวน์โหลดโมเดล Whisper ในครั้งแรกที่คุณใช้แต่ละขนาด

ดาวน์โหลดแอป

มีให้บน Microsoft Store สำหรับ Windows 10 และ 11 รุ่น Store เป็นแบบในตัวเอง — ไม่ต้องติดตั้ง .NET runtime

ดาวน์โหลดจาก Microsoft Store