Ses ve videoyu bilgisayarınızda metne çevirin.

Bir kayıt bırakın, dili seçin, temiz metin veya altyazı alın. Hiçbir şey internete yüklenmez — model yerel olarak çalışır.

Onu farklı kılan şey

%100 yerel işleme

Dosyalarınız makinenizden asla ayrılmaz. Yükleme yok, bulut yok, sıra bekleme yok. İlk model indirmesinden sonra çevrimdışı çalışır.

99 dil

OpenAI Whisper neredeyse yüz dili yüksek doğrulukla destekler. Varsayılan olarak otomatik algılama; belirli bir dili zorlamak isterseniz seçin.

İsteğe bağlı GPU hızlandırması

Tek bir onay kutusu, çıkarımı Vulkan üzerinden GPU'nuza taşır — NVIDIA, AMD, Intel — ve sürücü iş birliği yapmazsa sessizce CPU'ya geri döner.

TXT ve SRT çıkışı

Temiz metin, kullanıma hazır altyazılar veya ikisini birden tek bir çalıştırmada kaydedin — ağır çıkarım yalnızca bir kez gerçekleşir.

Yaygın her ses/video formatı

WhatsApp sesli notları (.opus, .ogg), OBS kayıtları (.mkv), YouTube indirmeleri (.webm), MP3, MP4, MOV, WAV, FLAC, M4A — ffmpeg hepsini işler.

Asgari, anonim telemetri

Sesiniz ve transkriptleriniz makinenizden asla ayrılmaz. Uygulama, yükleme başına yalnızca tek bir ping gönderir — rastgele bir kimlik, uygulama sürümü ve sistem dili — hangi ülkelere ve dillere odaklanmak gerektiğini görmek için. Hepsi bu. Kullanılan bileşenler (FFmpeg, whisper.cpp, Whisper.net, .NET) açık kaynak kodludur ve bağımsız olarak denetlenebilir.

Nasıl çalışır

  1. 1. Bir dosya seçin

    Diskteki herhangi bir ses veya video dosyasını ve transkriptin kaydedileceği klasörü seçin.

  2. 2. Dil ve model seçin

    Otomatik algılamayı koruyun veya belirli bir dile kilitleyin. Whisper model boyutunu seçin (hız için Tiny, uzun kayıtlar için Medium veya LargeV3).

  3. 3. Transkripsiyon yapın

    Uygulama temiz bir ses parçası çıkarır, Whisper'ı çalıştırır ve seçtiğiniz klasöre .txt ve/veya .srt yazar. Hepsi bu.

Kaputun altında

Windows üzerinde .NET 8 ile yapıldı. Format çözümleme için ffmpeg (LGPL) ve çıkarım için whisper.cpp'yi (MIT) saran Whisper.net (MIT) kullanır. GPU için Vulkan runtime, geri kalan her şey için AVX yedekli CPU. Model dosyaları Hugging Face'ten (ggerganov/whisper.cpp) bir kez indirilir ve %LOCALAPPDATA% altında önbelleğe alınır.

Model boyutları

  • Tiny · 77 MB · en hızlı · hızlı taslaklar
  • Base · 142 MB · küçük bir adım ileri
  • Small · 466 MB · önerilen denge
  • Medium · 1,5 GB · uzun dosyalarda yüksek doğruluk
  • Large-v3 · 3,1 GB · en iyi kalite, en yavaş

Sık sorulan sorular

Ücretsiz mi?

Evet. Uygulama ücretsizdir. Microsoft Store bazı bölgelerde küçük bir tek seferlik ücret alabilir — bu dağıtım ücretidir, yazılımın kendisi değildir.

Çevrimdışı çalışır mı?

Evet, ilk çalıştırmadan sonra. Bir Whisper modelini ilk kez kullandığınızda uygulama onu Hugging Face'ten indirir. Ondan sonra her şey yereldir.

Ne kadar doğru?

Model boyutuna ve ses kalitesine bağlıdır. Desteklenen bir dildeki temiz konuşmada Medium ve LargeV3 profesyonel transkripsiyon hizmetlerine yakındır. Gürültülü telefon kayıtlarında ve karışık dillerde kaba taslaklar bekleyin.

Dosyalarımı görüyor musunuz?

Hayır. Uygulamanın sunucusu yoktur. Dosyalar tamamen makinenizde çözülür, transkriptlenir ve kaydedilir. Tek dış bağlantı, her boyutu ilk kez kullandığınızda Whisper modelini indirmektir.

Uygulamayı edinin

Windows 10 ve 11 için Microsoft Store'da mevcut. Store yapısı kendi kendine yeterlidir — .NET runtime'ı gerekmez.

Microsoft Store'dan alın