Prefix audio + transcription, puis texte à synthétiser. Optionnel: appliquer un IST (Initial Stage Tuning) via un cache.
Scanné dans IST_DIR=ist (fichiers .pt).