Competencia de transcriptores: DaVinci Resolve, Descript, FlexClip, Premiere Pro (sin FCP)

publicado en: Transcripción | 2

Muchos editores audiovisuales ahora ofrecen la función de transcripción automática, con una gran variedad de ventajas y desventajas. En este artículo, voy a compartir contigo nuestros resultados con los programas DaVinci Resolve, Descript, FlexClip y Premiere Pro. En la versión anglosajona de este estudio, incluí también FCP (Final Cut Pro de Apple), pero lo excluí en éste porque FCP es actualmente el único en no poder transcribir en castellano. Para las pruebas de este artículo, hemos utilizado un solo archivo WAV que grabé en castellano. A pesar de ser en castellano, dicté varias marcas pronunciadas en inglés, al igual que marcas que contienen un número, lo cual suele retar a ciertos transcriptores. Este mismo archivo WAV es el que introdujimos en cada uno de los programas que vamos a comparar. A continuación, compartiré el archivo WAV (para que puedas escucharlo) con y guión original y la transcripción inédita (sin correcciones, sin códigos de tiempo y sin agregar puntuación faltante) para comparar la calidad de las transcripciones.

Guión y grabación original

Estoy haciendo esta prueba de grabación humana para probar la calidad de transcripción de algunos programas y servicios para determinar cuál es el mejor, en general y con marcas que incluirán números y siglas, al igual que algunos anglosajones dentro del dictado en castellano. Este episodio de CapicúaFM no ha sido auspiciado por AT&T pronunciado en castellano, 3M pronunciado en castellano, Capital One, 7Up dicho en castellano, 7up dicho en inglés, American Airlines, Hebrew National, la Fórmula Uno, IBM con las letras pronunciadas en castellano, el Motel 6 ni tampoco por T-Mobile pronunciado en castellano o T-Mobile pronunciado en inglés. Ahora veremos cómo se comporta cada servicio o programa. Cada uno recibirá esta misma grabación.

Transcripción inédita de DaVinci Resolve Studio

Estoy haciendo esta prueba de grabación humana para probar la calidad de transcripción de algunos programas y servicios para determinar cuál es el mejor, en general y con marcas que incluirán números y siglas, al igual que algunos anglosajunes dentro del dictado en castellano. Este episodio de Capico FM no ha sido auspiciado por AT&T pronunciado en castellano, 3M pronunciado en castellano, Capital One, 7UP dicho en castellano, 7UP dicho en inglés, American Airlines, Hebrew National, la Fórmula 1, IBM con las letras pronunciadas en castellano, el Motel 6, ni tampoco por Tmobile pronunciado en castellano o T-Mobile pronunciado en inglés.(…) Ahora veremos cómo se comporta cada servicio o programa. Cada uno recibirá esta misma grabación.

  1. Importé la grabación WAV en mi DaVinci Resolve Studio versión 20.3 construcción 10.
  2. DaVinci Resolve Studio transcribió la palabra anglosajones como «anglusajones».
  3. DaVinci Resolve Studio transcribió el nombre de mi radio y CapicúaFM como «Capico FM».
  4. DaVinci Resolve Studio hizo un excelente trabajo al transcribir bien todas las marcas, inclusive las que llevan número y las que están en inglés.
  5. DaVinci Resolve Studio manejó la puntuación (puntos, comas) a la perfección.

Transcripción inédita de Descript

 Estoy haciendo esta prueba de grabación humana para probar la calidad de transcripción de algunos programas y servicios para determinar cuál es el mejor. En general y con marcas que incluirán números y siglas, al igual que algunos anglosajones dentro del dictado en castellano.

Este episodio de capit FM no ha sido auspiciado por a pronunciado en castellano pronunciado en castellano up. Dicho en castellano seven up en inglés american Airlines i national la fórmula i y bm con las letras pronunciadas en castellano , el motel, ni tampoco por tmobile pronunciado en castellano o t-mobile pronunciado en inglés. Ahora veremos cómo se comporta cada servicio o programa. Cada uno recibirá esta misma grabación.

  1. Importé el archivo WAV en Descript (tengo suscripción mensual).
  2. Descript transcribió mal el nombre de mi radio y podifusión CapicúaFM como «capit FM» a pesar de estar presente en el Glosario de transcripción. Ver mi artículo Glosario de transcripción Descript: 3 deficiencias. Todavía no se han resuelto los problemas.
  3. Descript redujo la marca AT&T a sólo «a».
  4. De forma muy peligrosa, Descript omitió completamente la marca 3M en la transcripción.
  5. Con la marca 7UP, Descript redujo la versión en castellano a simplemente «up», es decir que omitió el número. Al pronunciarla en inglés, la transcribió como «seven up».
  6. Descript transcribió la marca American Airlines como «american airlines».
  7. Descript redujo la marca Fórmula 1 a sólo «fórmula».
  8. Descript convertió la marca IBM dicha en castellano en «y bm».
  9. Descript redujo la marca Hebrew National a sólo «national».
  10. Descript transcribió la marca Motel 6 en sólo «motel».

Ojalá que muy pronto Descript arregle su Glosario de transcription. Actualmente es inútil.

Transcripción inédita de FlexClip

Estoy haciendo esta prueba de grabación humana para

probar la calidad de transcripción de algunos

programas y servicios para determinar cuál es el

mejor en general y con marcas que incluirán números

y siglas, al igual que algunos anglosajones

dentro del dictado en castellano

Este episodio de Kapicu FM no ha sido auspiciado

por a t I t pronunciado en castellano

3 M pronunciado en castellano

capital One, 7 up dicho en castellano

Seven up teatre

en inglés, American Airlines hubo National

la Fórmula 1, IBM

con las letras pronunciadas en castellano el motel 6

ni tampoco por t Mobile

pronunciado en castellano

o t Mobile, pronunciado en inglés

Ahora veremos cómo se comporta cada servicio o

programa

Cada 1 recibirá esta misma grabación

  1. Importé el mismo archivo WAV en castellano en mi suscripción FlexClip. Cuando me preguntó el idioma del archivo original, elegí «Español -España» porque no figura la opción para castellano y porque mi forma de hablar es distinguidora al distingur el sonido de la c suave y la z de la se, no seseante. Las otras opciones listadas son sesantes.
  2. FlexClip transcribió el nombre de mi radio y podifusión CapicúaFM como «Kapicu FM».
  3. FlexClip transcribió la marca AT&T pronunciada en castellano como «a t I t».
  4. FlexClip transcribió la marca 3M como «3 M» con espacio.
  5. FlexClip transcribió la marca 7UP en castellano como «7 up»
  6. FlexClip transcribió la marca 7UP pronunciada en inglés como «Seven up».
  7. FlexClip transcrbió debidamente la marca American Airlines.
  8. FlexClip transformó la marca Hebrew National en «hubo National» al transcribirla.
  9. FlexClip transcribió bien la marca Fórmula 1.
  10. FlexClip transcribió bien la marca IBM pronunciada en castellano.
  11. Flex clip trancribió la marca T-Mobile pronunciada en cada idioma como «t Mobile» con t minúscula.

Ojalá que FlexClip agregue un Glosario de transcripción a su sistema.

Transcripción inédita de Premiere Pro

Estoy haciendo esta prueba de grabación humana para probar la calidad de transcripción de algunos programas y servicios para determinar cuál es el mejor en general y con marcas que incluirán números y siglas, al igual que algunos anglosajones dentro del dictado en castellano. Este episodio de Capicúa FM no ha sido auspiciado por AutoIt y pronunciado en castellano tres m pronunciado en castellano Capital One 7up.

De hecho, en castellano seven up. Dicho en inglés American Airlines La Fórmula uno IBM con las letras pronunciadas en castellano. El Motel seis. Ni tampoco por T-Mobile, pronunciado en castellano o T-Mobile, pronunciado en inglés. Ahora veremos cómo se comporta cada servicio o programa. Cada uno recibirá esta misma grabación.

  1. Mi amigo y destacado documentalista Rubén Abruña importó el mismo archivo WAV en castellano en su Premiere Pro versión 25.2.0 construcción 147 en su iMacPro 2017 con el macOS Ventura 13.7.4.
  2. Premiere Pro es el único programa en transcribir correctamente el nombre de mi radio y podifusión CapicúaFM aunque colocó un espacio entre las dos palabras.
  3. Premiere Pro transcribió mal la marca AT&T pronunciada en castellano como «AutoIt y».
  4. Premiere Pro transcribió la marca 3M como «tres m».
  5. Premiere Pro transcribió muy bien la marca 7UP, aunque al pronunciarlo en castellano como «7up» y en inglés como «seven up». Entre estas dos versiones, Premiere Pro transcribió la palabra «dicho» como «de hecho».
  6. Premiere Pro transcribió muy bien las marcas American Airlines y Fórmula 1.
  7. Premiere Pro transcribió el Motel 6 como «Motel seis».
  8. Premiere Pro transcribió la marca T-Mobile bien al pronunciarse en ambos idiomas.
  9. De forma muy peligrosa, Premiere Pro omitió completamente la marca Hebrew National.

Ojalá que Premiere Pro agregue un Glosario de transcripción a su programa.

Conclusiones generales + una petición para que agreguen un glosario de transcripción que realmente funcione

Los cuatro servicios de transcripción probados en este estudio están lejos de ser perfectos. Si has leído cada transcripción y los comentarios que aparecen a continuación, habrás visto que cada uno tiene sus ventajas y desventajas. Todos ellos necesitan urgentemente un glosario de transcripción que funcione correctamente. Actualmente, el glosario de transcripción incluido en Descript es lo que podríamos llamar un prototipo que no funciona, como expliqué en Glosario de transcripción Descript: 3 deficiencias en octubre del 2024.

Aunque no es un competidor en este campo de la edición audiovisual, el glosario integrado en DeepL Translator funciona impecablemente bien según mi experiencia personal. Suelo utilizar DeepL Translator Pro como primer paso antes de que un traductor certificado (yo mismo o uno de mis colegas) lo revise y lo perfeccione cuando realizo traducciones entre el castellano, el inglés o el italiano. DeepL Translator es un servicio de traducción automática neuronal que se lanzó en agosto del 2017 y es propiedad de DeepL SE, con sede en Colonia, Alemania. El sistema de traducción se desarrolló inicialmente dentro de Linguee y se lanzó como entidad DeepL. Al principio, DeepL ofrecía traducciones entre siete idiomas europeos y desde entonces se ha ampliado hasta admitir 37 idiomas (81 idiomas en ßeta). La razón para tener un glosario (ya sea para la traducción o la transcripción) es para poder preestablecer cuestiones comunes para evitar tanto trabajo humano repetitivo al pulir una traducción o una transcripción automatizada, especialmente para los creadores serios que producimos muchas obras. Aunque DeepL no ofrece actualmente ningún servicio de transcripción directamente a nosotros, los consumidores de sóftwer de transcripción, DeepL sí lo ofrece a través de su API de voz de DeepL, por lo que si alguno de los cinco servicios competidores que se tratan en este artículo (DaVinci Resolve Pro, Descript, FCP, FlexClip, Premiere Pro) es incapaz de desarrollar internamente un glosario de transcripción que funcione, por favor, que considere ponerse en contacto con DeepL SE para obtener la licencia de la API de voz de DeepL para su uso dentro de su sóftwer, con el fin de potenciar las capacidades serias de transcripción.

Si algún lector conoce una función de sóftwer de transcripción incorporada en un editor audiovisual que cuente un glosario que realmente funcione bien, por favor, coméntalo a continuación.

Read this study in English (including FCP)

Transcription Shootout: DaVinci Resolve, Descript, FCP, FlexClip, Premiere Pro

Divulgación para la FTC

Ninguna de las organizaciones mencionadas en este artículo ha pagado por figurar en él. Blackmagic y FlexClip han enviado equipos o sóftwer NFR para su evaluación y reseñas. Algunas de las empresas mencionadas anteriormente han contratado a Tépper y/o TecnoTur.LLC para realizar consultorías y/o traducciones/localizaciones/transcreaciones. Algunos enlaces a terceros enumerados en este artículo y/o en este sitio web pueden beneficiar indirectamente a TecnoTur.LLC a través de programas de afiliados. Las opiniones de Allan Tépper son de él mismo. Allan Tépper no es responsable del mal uso o mala comprensión de la información que comparte.

Seguir Allan Tépper:

Autor bilingüe estadounidense, consultor, editor, especialista en podifusiones, activista lingüístico, publicista, reseñador y creador de sitios web vía TecnoTur.LLC. Para recibir sus boletines en castellano por correo-e, visita boletines.AllanTepper.com.

2 comentarios

  1. Memo Sauceda

    Gracias por poner todos los resultados y comparar los errores de cada plataforma. Y no conocía DeepL, lo voy a probar, ¡ya que viene recomendado por ti!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *