Esta web con código fuente disponible (se puede alojar localmente) permite subir un fichero de audio cualquiera y recibir una transcripción y/o traducción en texto. Utiliza por detrás el API Whisper de OpenAI. Fuente en GitHub:
github.com/beyondcode/writeout.ai