Przetwarzanie w 100% lokalne
Twoje pliki nigdy nie opuszczają twojego komputera. Bez wysyłania, bez chmury, bez czekania w kolejce. Działa offline po pierwszym pobraniu modelu.
Przeciągnij nagranie, wybierz język, otrzymaj czysty tekst lub napisy. Nic nie trafia do internetu — model działa lokalnie.
Twoje pliki nigdy nie opuszczają twojego komputera. Bez wysyłania, bez chmury, bez czekania w kolejce. Działa offline po pierwszym pobraniu modelu.
OpenAI Whisper obsługuje niemal sto języków z dobrą dokładnością. Domyślnie automatyczne wykrywanie; wybierz konkretny język, jeśli chcesz go wymusić.
Jeden checkbox przełącza obliczenia na twój GPU przez Vulkan — NVIDIA, AMD, Intel — i po cichu wraca do CPU, jeśli sterownik nie współpracuje.
Zapisz czysty tekst, gotowe do użycia napisy albo jedno i drugie w jednym uruchomieniu — ciężkie obliczenia wykonują się tylko raz.
Wiadomości głosowe WhatsApp (.opus, .ogg), nagrania OBS (.mkv), pobrania z YouTube (.webm), MP3, MP4, MOV, WAV, FLAC, M4A — ffmpeg obsługuje wszystkie.
Twój dźwięk i transkrypcje nigdy nie opuszczają twojego komputera. Aplikacja wysyła jedno pingnięcie na instalację — losowe ID, wersję aplikacji i język systemu — żeby dało się zobaczyć, na jakie kraje i języki warto się skupić. To wszystko. Używane komponenty (FFmpeg, whisper.cpp, Whisper.net, .NET) są open source i można je niezależnie zweryfikować.
Wybierz dowolny plik audio lub wideo z dysku oraz folder, w którym ma zostać zapisana transkrypcja.
Zostaw automatyczne wykrywanie albo zablokuj konkretny język. Wybierz rozmiar modelu Whisper (Tiny dla szybkości, Medium lub LargeV3 dla długich nagrań).
Aplikacja wyodrębnia czystą ścieżkę dźwiękową, uruchamia Whisper i zapisuje .txt i/lub .srt w wybranym przez ciebie folderze. To wszystko.
Zbudowane w .NET 8 na Windows. Używa ffmpeg (LGPL) do dekodowania formatów oraz Whisper.net (MIT), który opakowuje whisper.cpp (MIT), do inferencji. Vulkan runtime dla GPU, CPU z fallbackiem AVX dla reszty. Pliki modeli są pobierane raz z Hugging Face (ggerganov/whisper.cpp) i cache’owane w %LOCALAPPDATA%.
Tak. Aplikacja jest darmowa. Microsoft Store może w niektórych regionach pobrać małą jednorazową opłatę — to koszt dystrybucji, nie samego oprogramowania.
Tak, od drugiego uruchomienia. Gdy pierwszy raz używasz modelu Whisper, aplikacja pobiera go z Hugging Face. Potem wszystko dzieje się lokalnie.
Zależy od rozmiaru modelu i jakości dźwięku. Dla czystej mowy w obsługiwanym języku Medium i LargeV3 są blisko profesjonalnych usług transkrypcji. Dla głośnych nagrań z telefonu i wielu mieszanych języków spodziewaj się szkicu.
Nie. Aplikacja nie ma serwera. Pliki są dekodowane, transkrybowane i zapisywane w całości na twoim komputerze. Jedyne zewnętrzne połączenie to pobranie modelu Whisper przy pierwszym użyciu danego rozmiaru.
Dostępna w Microsoft Store dla Windows 10 i 11. Wersja ze Store jest samodzielna — nie trzeba instalować runtime’u .NET.
Pobierz z Microsoft Store