Trascrivi audio e video, sul tuo computer.

Trascina una registrazione, scegli una lingua, ottieni testo pulito o sottotitoli. Niente viene caricato — il modello gira in locale.

Ottieni su Microsoft Store

Cosa lo rende diverso

Elaborazione 100% locale

I tuoi file non lasciano mai la tua macchina. Nessun upload, nessun cloud, nessuna coda. Funziona offline dopo il primo download del modello.

99 lingue

OpenAI Whisper supporta quasi cento lingue con buona precisione. Rilevamento automatico di default; scegli una lingua specifica per forzarla.

Accelerazione GPU opzionale

Una casella sposta l'inferenza sulla tua GPU tramite Vulkan — NVIDIA, AMD, Intel — e torna silenziosamente alla CPU se il driver non collabora.

Output TXT e SRT

Salva una trascrizione di testo pulito, sottotitoli pronti all'uso, o entrambi in una sola esecuzione — l'inferenza pesante avviene una sola volta.

Ogni formato audio/video comune

Messaggi vocali WhatsApp (.opus, .ogg), registrazioni OBS (.mkv), download YouTube (.webm), MP3, MP4, MOV, WAV, FLAC, M4A — ffmpeg li gestisce tutti.

Telemetria minima e anonima

Né il tuo audio né le trascrizioni lasciano la tua macchina. L'app invia un solo ping per installazione — un ID casuale, la versione dell'app e la lingua del sistema — per capire su quali paesi e lingue concentrarsi. Tutto qui. I componenti utilizzati (FFmpeg, whisper.cpp, Whisper.net, .NET) sono open source e verificabili in modo indipendente.

Come funziona

1. Scegli un file

Seleziona qualsiasi file audio o video sul disco e la cartella dove salvare la trascrizione.
2. Scegli lingua e modello

Mantieni il rilevamento automatico o blocca una lingua specifica. Scegli la dimensione del modello Whisper (Tiny per velocità, Medium o LargeV3 per registrazioni lunghe).
3. Trascrivi

L'app estrae l'audio pulito, esegue Whisper e scrive il .txt e/o lo .srt nella cartella scelta. Tutto qui.

Sotto il cofano

Realizzato con .NET 8 su Windows. Usa ffmpeg (LGPL) per la decodifica dei formati e Whisper.net (MIT) che avvolge whisper.cpp (MIT) per l'inferenza. Runtime Vulkan per la GPU, CPU con fallback AVX per tutto il resto. I file modello vengono scaricati una volta da Hugging Face (ggerganov/whisper.cpp) e messi in cache in %LOCALAPPDATA%.

Dimensioni del modello

Tiny · 77 MB · il più veloce · bozze
Base · 142 MB · piccolo passo avanti
Small · 466 MB · equilibrio consigliato
Medium · 1,5 GB · buona precisione su file lunghi
Large-v3 · 3,1 GB · qualità migliore, più lento

Domande frequenti

È gratuito?

Sì. L'app è gratuita. Il Microsoft Store potrebbe richiedere una piccola tariffa una tantum in alcune regioni — copre la distribuzione, non il software.

Funziona offline?

Sì, dalla seconda esecuzione. La prima volta che scegli un modello Whisper, l'app lo scarica da Hugging Face. Dopo è tutto locale.

Quanto è accurata?

Dipende dalla dimensione del modello e dalla qualità audio. Con parlato pulito in una lingua supportata, Medium e LargeV3 si avvicinano ai servizi professionali. Con registrazioni rumorose da cellulare e lingue miste, aspettati bozze.

Vedi i miei file?

No. L'app non ha server. I file vengono decodificati, trascritti e salvati interamente sulla tua macchina. L'unica connessione esterna è il download del modello Whisper la prima volta che usi una data dimensione.

Ottieni l'app

Disponibile sul Microsoft Store per Windows 10 e 11. La build dello Store è autonoma — non serve installare .NET.