Transcrivez audio et vidéo, sur votre ordinateur.

Déposez un enregistrement, choisissez une langue, récupérez du texte propre ou des sous-titres. Rien n'est envoyé — le modèle tourne localement.

Obtenir sur Microsoft Store

Ce qui fait la différence

Traitement 100% local

Vos fichiers ne quittent jamais votre machine. Pas d'envoi, pas de cloud, pas d'attente en file. Fonctionne hors ligne après le premier téléchargement du modèle.

99 langues

OpenAI Whisper prend en charge près de cent langues avec une bonne précision. Détection automatique par défaut ; choisissez une langue précise pour la forcer.

Accélération GPU optionnelle

Une case bascule l'inférence sur votre GPU via Vulkan — NVIDIA, AMD, Intel — et retombe silencieusement sur le CPU si le pilote ne coopère pas.

Sortie TXT et SRT

Sauvegardez une transcription texte propre, des sous-titres prêts à l'emploi, ou les deux en une seule exécution — l'inférence lourde n'a lieu qu'une fois.

Tous les formats audio/vidéo courants

Messages vocaux WhatsApp (.opus, .ogg), enregistrements OBS (.mkv), téléchargements YouTube (.webm), MP3, MP4, MOV, WAV, FLAC, M4A — ffmpeg gère tout.

Télémétrie minimale et anonyme

Ni votre audio ni vos transcriptions ne quittent votre machine. L'app envoie un seul ping par installation — un ID aléatoire, la version de l'app et la langue du système — afin de savoir sur quels pays et quelles langues se concentrer. C'est tout. Les composants utilisés (FFmpeg, whisper.cpp, Whisper.net, .NET) sont open source et auditables indépendamment.

Comment ça marche

1. Choisissez un fichier

Sélectionnez n'importe quel fichier audio ou vidéo sur le disque et le dossier où la transcription sera enregistrée.
2. Choisissez la langue et le modèle

Laissez la détection automatique ou verrouillez une langue précise. Choisissez la taille du modèle Whisper (Tiny pour la vitesse, Medium ou LargeV3 pour les enregistrements longs).
3. Transcrivez

L'app extrait une piste audio propre, exécute Whisper et écrit le .txt et/ou le .srt dans le dossier choisi. C'est tout.

Sous le capot

Construit avec .NET 8 sur Windows. Utilise ffmpeg (LGPL) pour le décodage des formats et Whisper.net (MIT) encapsulant whisper.cpp (MIT) pour l'inférence. Runtime Vulkan pour le GPU, CPU avec fallback AVX pour le reste. Les fichiers de modèle sont téléchargés une fois depuis Hugging Face (ggerganov/whisper.cpp) et mis en cache dans %LOCALAPPDATA%.

Tailles de modèle

Tiny · 77 Mo · le plus rapide · brouillons
Base · 142 Mo · léger progrès
Small · 466 Mo · équilibre recommandé
Medium · 1,5 Go · bonne précision sur les longs fichiers
Large-v3 · 3,1 Go · meilleure qualité, plus lent

Questions fréquentes

Est-ce gratuit ?

Oui. L'app est gratuite. Le Microsoft Store peut facturer un petit frais unique dans certaines régions — cela couvre la distribution, pas le logiciel.

Fonctionne-t-elle hors ligne ?

Oui, à partir de la seconde exécution. La première fois que vous choisissez un modèle Whisper, l'app le télécharge depuis Hugging Face. Ensuite, tout est local.

Quelle est la précision ?

Cela dépend de la taille du modèle et de la qualité audio. Pour une parole claire dans une langue prise en charge, Medium et LargeV3 approchent les services professionnels. Pour un enregistrement mobile bruyant et des langues mélangées, attendez-vous à des brouillons.

Voyez-vous mes fichiers ?

Non. L'app n'a pas de serveur. Les fichiers sont décodés, transcrits et enregistrés entièrement sur votre machine. La seule connexion externe est le téléchargement du modèle Whisper la première fois que vous utilisez une taille donnée.

Obtenir l'app

Disponible sur le Microsoft Store pour Windows 10 et 11. La version Store est autonome — pas besoin d'installer .NET.