Загружайте аудио или видео — инструмент транскрибирует через Whisper, создаст карточку для словаря и сгенерирует таймкоды.
ffmpeg -i input.mp4 -vn -ar 16000 -ac 1 -b:a 32k out.mp3