Más equipos de capacitación están probando voces y avatares de IA para acelerar la producción de videos y reducir costos, pero todavía hay dudas. ¿Los alumnos tomarán en serio estos formatos? ¿Podrían parecer baratos o molestos? ¿Y qué pasa si la gente se desconecta?
Para ir más allá de la opinión, el equipo de Camtasia llevó a cabo dos estudios globales de espectadores centrados en vídeos instructivos.
Los participantes vieron clips cortos de capacitación que eran idénticos excepto por la voz de la narración o el formato del presentador. Luego calificaron el profesionalismo, la confianza y el compromiso y completaron un breve cuestionario para medir la retención.
El objetivo era comprender cómo responden los alumnos reales a las voces y avatares de la IA en un entorno controlado. Esto es lo que descubrimos sobre dónde ayuda cada formato, dónde falla y cómo influye realmente en los resultados del aprendizaje.
Conclusiones clave
- Las voces de alta calidad, ya sean de IA o humanas, aumentaron constantemente la percepción de profesionalismo y mejoraron la retención. El audio robótico de baja calidad era el verdadero problema.
- Los alumnos a menudo no podían distinguir si una voz de IA de alta calidad era de IA o humana, especialmente cuando el audio sonaba natural y pulido.
- En todos los formatos, los videos de avatares de IA fueron calificados como profesionales y reproducibles, pero la imagen en imagen de avatar produjo la mayor retención de aprendizaje para la instrucción basada en pantalla.
- Los avatares en pantalla completa facilitaron a los espectadores notar los rasgos robóticos, lo que redujo las calificaciones de calidad y desvió la atención de la tarea.
- El formato de avatar de imagen dentro de imagen mostró una comprensión significativamente mayor, lo que sugiere que el tamaño y la ubicación del presentador influyen en el aprendizaje.
Lleva este estudio contigo.
Descargue el estudio de IA en formato PDF para leerlo sin conexión y planifique su estrategia de vídeo de IA sin pestañas.
Al enviar su dirección de correo electrónico, acepta recibir correos electrónicos de TechSmith. Puedes darte de baja en cualquier momento.
Lo que nos dice nuestro estudio AI Voices sobre la voz en los vídeos de formación
¿Pueden los alumnos realmente distinguir entre una voz humana y una de IA? En nuestro estudio de AI Voices, los espectadores vieron el mismo breve vídeo instructivo en la Búsqueda avanzada de Google; solo cambió la voz.
Había cuatro versiones:una voz humana de alta calidad, una voz humana de baja calidad, una voz de IA de alta calidad y una voz de IA de baja calidad. Todo lo demás permaneció igual, por lo que solo se pudo evaluar la narración.
La audiencia incluyó a 768 trabajadores a tiempo completo de entre 18 y 64 años que habían visto al menos un video instructivo en los últimos 30 días. Los participantes procedían de EE. UU., Reino Unido, Canadá y Australia.
Por qué la calidad de la voz es más importante que la IA frente a la humana
¿Qué es lo que realmente hace que los alumnos presten atención? Una voz que suena clara, cálida y pulida, no importa si es humana o IA. A medida que la calidad de la voz mejoró en el estudio, también mejoraron las calificaciones de profesionalismo. De hecho, el 92% de los espectadores dijo que la voz de IA de alta calidad hizo que el video pareciera producido profesionalmente.
Para los líderes de aprendizaje y desarrollo (L&D) y capacitación, el riesgo real no es la IA en sí. Su mala calidad de audio, lo que puede hacer que el contenido sea más difícil de seguir (y aprender de él) y que distraiga más.
Aquí es donde herramientas como Camtasia ayudan a los creadores a dar en el blanco. Puede capturar y editar audio limpio, reducir el ruido de fondo o utilizar opciones de conversión de texto a voz con tecnología de inteligencia artificial que suenan naturales y profesionales, todo sin una configuración de estudio.
¿Las voces de la IA ayudan o perjudican la retención del aprendizaje?
Los resultados de la parte del “examen sorpresa” de nuestro estudio dejan claro el patrón:las respuestas correctas aumentaron a medida que mejoró la calidad de la voz. De hecho, la voz de IA de alta calidad produjo las cifras de retención más altas, aparte de un caso humano atípico de baja calidad.
¿Por qué sucede esto? Creemos que un audio deficiente introduce fricción. Cuando la narración suena desigual, artificial o difícil de escuchar, los alumnos tienen que esforzarse más para entender lo que se dice, lo que añade carga cognitiva. El audio claro y fluido permite a los espectadores centrarse en los pasos y conceptos en lugar de en la entrega. Una voz de IA de alta calidad puede favorecer el aprendizaje tan bien (si no mejor) que una grabación humana mediocre.
Pero, ¿las voces de la IA distraen en general? Eso depende. Las voces sintéticas de baja calidad son inconfundibles y desvían la atención del contenido. Cuando la voz de la IA suena natural, muchos espectadores no pueden distinguirla de una voz humana. La diferencia es menos discordante y la retención de información se mantiene estable o incluso mejora.
El siguiente paso práctico es realizar una prueba piloto. Compare el rendimiento de las pruebas y los comentarios de los alumnos entre las versiones de IA y voz humana antes de implementar programas completos. Esto ayuda a confirmar si una voz de IA respalda el aprendizaje sin agregar esfuerzos innecesarios.
Comodidad del alumno, expectativas de divulgación y diferencias regionales
En nuestro estudio, muchos estudiantes no podían distinguir si una voz de IA de alta calidad era de IA o humana, lo que hace que la transparencia sea una consideración importante. Ese nivel de naturalidad es impresionante, pero también introduce preguntas importantes sobre la divulgación.
Los espectadores de los países de habla inglesa tendieron a preferir que se revelara que se utilizaba una voz de IA, mientras que los participantes de Alemania estaban menos preocupados. El Reino Unido se destacó en particular:los estudiantes allí estaban especialmente abiertos a videos narrados por IA. Estas diferencias son importantes a la hora de diseñar formación para audiencias globales.
Para los equipos de capacitación y desarrollo, la divulgación funciona mejor como una opción para generar confianza más que como una formalidad legal. Una nota breve como “Narrado con voz de IA” en la descripción del video o al comienzo de un módulo puede tranquilizar a los alumnos sin distraerlos del contenido.
Tener en cuenta las expectativas culturales desde el principio hace que sea más fácil ampliar la narración de IA en un catálogo de formación más amplio. Cuando los alumnos saben qué esperar y se sienten informados, se involucran más y se adaptan más rápidamente a los formatos compatibles con la IA.
Esto también se relaciona con el costo y la eficiencia. Una vez que los alumnos se sientan cómodos con la narración de voz de IA, los equipos pueden ampliar su uso en más programas de capacitación sin sacrificar la confianza o la retención. Una divulgación bien pensada, combinada con un audio de alta calidad, mantiene la atención en las instrucciones mismas.
Dónde la voz con IA ahorra tiempo (y cómo reinvertirlo)
Nota:Los estudios mencionados anteriormente no midieron la eficiencia de la producción. Lo siguiente refleja prácticas y flujos de trabajo comunes observados en los equipos de capacitación en lugar de resultados de investigaciones.
Las voces de IA pueden ahorrar una cantidad significativa de tiempo en la producción de formación. No es necesario programar presentadores ni reservar tiempo de grabación, y los guiones se pueden actualizar y regenerar al instante. La localización a varios idiomas también resulta mucho más sencilla sin tener que volver a grabar cada versión.
El tiempo ahorrado puede destinarse directamente a mejorar la experiencia de aprendizaje. Los equipos pueden mejorar las imágenes en Camtasia con subtítulos más claros, énfasis del cursor y un ritmo más fluido. Pueden agregar más ejemplos basados en escenarios, crear cuestionarios y puntos de control, o actualizar el contenido con más frecuencia para mantener la capacitación alineada con los cambios de productos y procesos.
La voz de IA no elimina el trabajo; dirige el esfuerzo hacia una mejor instrucción y elementos visuales en lugar de repetidas sesiones de locución.
Mantenga los videos de capacitación precisos. Evite el "descuido de la IA".
Cree contenido de capacitación más rápido sin sacrificar la calidad. HUMAN Framework es una estrategia de cinco pasos para integrar la IA de forma eficaz.
Obtenga la guía
Lo que nos dice nuestro estudio AI Avatar sobre la IA visual en el entrenamiento
Nuestro estudio de AI Avatar siguió una estructura similar a la investigación de voz, con los espectadores mirando el mismo tema instructivo central presentado en cinco formatos:imagen en imagen (PiP) humana, pantalla completa humana, PiP de avatar de AI, pantalla completa de avatar de AI y una versión con un visualizador de audio.
Este estudio utilizó trabajadores de tiempo completo de varios países de habla inglesa que recientemente habían visto un video instructivo. Midió las reacciones a la calidad de la producción, la intención de volver a ver, la confianza y la retención del aprendizaje.
En todos los formatos, más del 92 % de los espectadores calificaron los vídeos como profesionales y dijeron que verían otro vídeo del mismo creador. También se sintieron seguros de que podrían completar los pasos sin ayuda adicional.
Esto establece una base importante:el uso de un avatar de IA no hace que un vídeo parezca barato o poco confiable automáticamente. Cuando la calidad de la producción es sólida, los alumnos interactúan con el contenido y confían en él tanto como lo hacen con un vídeo dirigido por humanos.
Cuando los avatares de IA fortalecen el aprendizaje (y por qué la imagen dentro de la imagen conduce)
Menos puede ser más cuando se trata de avatares de IA. En nuestro estudio, el formato avatar PiP proporcionó la mayor retención de aprendizaje:alrededor del 76 % de los espectadores respondieron correctamente las preguntas del cuestionario, aproximadamente 10 puntos más que otros formatos. Y lo hicieron incluso después de ver un vídeo de 43 segundos varios minutos antes sin posibilidad de rebobinar.
PiP mantiene el contenido de la pantalla al frente y al centro y al mismo tiempo proporciona una pequeña guía en pantalla. El avatar es visible sin resultar abrumador, lo que ayuda a los alumnos a mantenerse centrados en los pasos y sentirse guiados a lo largo del proceso.
Para un entrenamiento paso a paso con mucha pantalla, avatar PiP es una buena opción predeterminada. Herramientas como Camtasia hacen que este diseño sea fácil de crear, permitiendo que el avatar se encuentre en un marco pequeño mientras la pantalla principal permanece clara y legible.
Cuando los avatares de IA distraen (y por qué el tamaño importa)
Los avatares de IA no distraen de forma predeterminada, pero el tamaño sí importa. Cuando un avatar llena la pantalla, es más probable que los espectadores noten rasgos robóticos como problemas de sincronización de labios, contacto visual, movimientos faciales limitados, parpadeos incómodos o respiración poco natural.
En estos formatos de pantalla completa, más participantes identificaron correctamente el avatar como IA. Ese escrutinio adicional desvía la atención de la tarea o concepto hacia el avatar mismo. Para temas serios, esto puede hacer que la experiencia parezca extraña o desagradable.
Mantener los avatares de IA pequeños y secundarios es la mejor opción para la mayoría de los videos instructivos. Los diseños de imagen dentro de imagen o marcos pequeños permiten que el avatar proporcione orientación y una sensación de presencia sin dominar la pantalla.
Los casos de uso correctos para los avatares de IA en el contenido de formación
No todos los formatos de vídeo se benefician por igual de un avatar de IA. En nuestro estudio, los espectadores se sentían más cómodos con los avatares de IA en contenido instructivo basado en pantalla. Se sentían menos cómodos cuando se esperaba una presencia personal, como un vídeo de bienvenida del director ejecutivo o un vídeo de actualización del equipo. Para obtener mejores resultados, sea intencional al alinear el uso de su avatar con sus casos de uso específicos.
Usar avatares de IA para:
- Tutoriales y tutoriales de software
- Capacitación sobre procesos estrechamente vinculada a los pasos en pantalla
- Actualizaciones escaladas donde la coherencia importa más que la presencia personal
Utilice presentadores humanos para:
- Mensajes de liderazgo y comunicaciones de cambio
- Temas delicados que requieren matices emocionales y confianza
- Actualizaciones del equipo donde es importante ver al gerente o líder real
Con herramientas como Camtasia Audiate, los equipos pueden combinar avatares de IA con grabaciones de pantalla para crear contenido de capacitación eficiente y atractivo, y al mismo tiempo capturar videos dirigidos por humanos donde la autenticidad es esencial.
Cómo medir la interacción con vídeos de formación basados en IA
Si la IA está cambiando la forma en que se crean sus videos de capacitación, también debería influir en la forma en que evalúa la participación de los alumnos. Las métricas principales siguen siendo las mismas para los formatos AI y no AI:
- Tasas de finalización y puntos de entrega
- Volver a observar el comportamiento de las secciones clave
- Rendimiento de cuestionarios y análisis a nivel de preguntas
- Encuestas de comentarios o encuestas rápidas
Lo que cambia es la comparación. En lugar de revisar una única versión de forma aislada, puede evaluar la IA y los formatos dirigidos por humanos uno al lado del otro para ver en qué se diferencian en la retención y el sentimiento del alumno. También puede realizar un seguimiento de si los flujos de trabajo habilitados para IA ayudan a los equipos a publicar actualizaciones relevantes y más frecuentes.
Comience con un pequeño experimento. Seleccione uno o dos módulos de alto valor, cree una versión de voz humana y de voz de IA (o una versión PiP de presentador humano versus avatar de IA) y mida la finalización y los resultados de las pruebas durante algunas semanas.
Crea tu próximo vídeo de formación con Camtasia
Graba tu pantalla o cámara. Luego, use el editor de video para agregar brillo y claridad.
Más información
Cómo la IA reduce los costes de formación y amplía las actualizaciones de contenido
El uso de voces y avatares de IA ofrece ahorros directos y una mayor flexibilidad operativa.
Los ahorros directos incluyen:
- Eliminar el tiempo (de estudio) haciendo grabaciones de locución
- No es necesario volver a grabar vídeos completos después de pequeños cambios en el guión
- Coste marginal más bajo para crear versiones localizadas
Las ganancias indirectas incluyen:
- Respuesta más rápida a actualizaciones de productos o políticas
- La capacidad de mantener actualizado un catálogo de formación más amplio
En lugar de tomar atajos, la IA elimina los cuellos de botella en la producción. Los equipos pueden reinvertir ese tiempo y presupuesto en un mejor diseño visual, escenarios más sólidos, ciclos de retroalimentación más claros y actualizaciones más frecuentes.
Directrices prácticas para elegir avatares humanos, de voz con IA y de IA
El formato correcto depende del propósito de su video. Utilice esta guía de decisión rápida:
- Contenido con mucha pantalla, de procedimientos y que se actualiza con frecuencia :voz AI de alta calidad con grabación de pantalla, además de un avatar AI opcional en PiP.
- Contenido emocionalmente sensible, que establece una cultura o está impulsado por el liderazgo :Presentador humano con voz humana.
- Aprendizaje prolongado y con muchos conceptos :Una combinación:módulos dirigidos por humanos para ideas centrales, respaldados por microlecciones y repasos con voz de IA.
No importa el formato, siempre se aplican algunos principios. Establezca estándares de alta calidad para cada voz, ya sea de IA o humana. Utilice IA donde la velocidad, la escala y la coherencia sean más importantes. Pruebe nuevos formatos con regularidad y recopile comentarios de los alumnos.
Dentro del ecosistema de Camtasia, los equipos pueden ajustar los diseños y el ritmo, usar herramientas de voz o avatar de IA para locuciones o narraciones.
Nuestros estudios muestran que cuando la calidad es alta y el formato se adapta a la tarea, los alumnos se sienten cómodos con las voces y los avatares de la IA.
Una forma práctica de avanzar es empezar poco a poco y seguir basándose en datos. Combine uno o dos tutoriales de alto impacto con una voz de IA de alta calidad o un avatar PiP, respaldado por una sólida instrucción basada en escenas, y vea cómo responden los alumnos. Realice un seguimiento de la finalización, la retención y el sentimiento a lo largo del camino, luego ajuste donde la IA o la presencia humana tengan más sentido.
Cuando esté listo para experimentar, Camtasia ofrece las herramientas para crear, perfeccionar y escalar contenido de capacitación, más rápido y con mayor coherencia.
¿Listo para empezar? Crea tu próximo vídeo de formación con Camtasia
Preguntas frecuentes
¿Las voces de IA funcionan tan bien como la narración humana en los vídeos de formación?
En nuestro estudio de AI Voices, la calidad de la voz importaba más que si la voz era de IA o humana. Las puntuaciones de las pruebas fueron ligeramente mejores para los espectadores que vieron vídeos con AI Voices. La voz de IA de alta calidad produjo los mejores resultados de retención, mientras que las voces de baja calidad y claramente sintéticas distraían más y eran más fáciles de identificar como IA para los estudiantes.
¿Los avatares de IA distraen demasiado cuando se tratan temas serios o complejos?
No por defecto. Todos los formatos de avatar obtuvieron puntuaciones muy altas en profesionalismo, capacidad de repetición y confianza del alumno. La distracción sólo se convirtió en un problema cuando el avatar llenó la pantalla y los espectadores pudieron ver fácilmente los rasgos faciales robóticos. Para entrenamientos serios o complejos, los datos permiten mantener los avatares pequeños en diseños de imagen dentro de imagen y reservar formatos de pantalla completa para presentadores humanos.
¿Deberíamos revelar cuándo utilizamos una voz o un avatar de IA en el contenido de capacitación?
Los encuestados de los países de habla inglesa generalmente preferían la divulgación cuando se utilizaba una voz o un avatar de IA. Una simple nota, como “Narrada con voz de IA”, suele ser suficiente para mantener la confianza. La divulgación es principalmente una opción de transparencia, especialmente cuando se implementa la narración de IA a escala.
¿Cómo deberíamos medir el impacto de las voces y avatares de la IA en el aprendizaje?
Utilice las mismas métricas de participación y retención en las que ya confía:tasa de finalización, puntos de abandono, comportamiento de repetición, desempeño en cuestionarios y encuestas rápidas de retroalimentación. Los formatos de IA simplemente facilitan la ejecución de pruebas A/B, como comparar versiones con voz humana y con voz de IA, para ver cuál funciona mejor.
¿Dónde tienen más sentido las voces y los avatares de IA en un catálogo de formación?
La mejor opción es el contenido procedimental con mucha pantalla, donde la claridad y la coherencia son importantes. La voz de IA de alta calidad combinada con grabaciones de pantalla y una imagen en imagen de avatar opcional funciona bien para recorridos, capacitación de procesos y actualizaciones frecuentes. Los presentadores humanos siguen siendo la mejor opción para mensajes de liderazgo, contenido cultural y temas que requieren matices emocionales.
¿El uso de formatos de IA hará que nuestra capacitación parezca menos personal o confiable?
Depende de cómo se utilicen. Cuando el audio y las imágenes son de alta calidad y el formato se ajusta al caso de uso, los estudiantes calificaron los videos de IA como profesionales y dijeron que verían más del mismo creador. La confianza tiende a disminuir solo cuando se utiliza la IA en lugares donde la gente espera una presencia humana real o cuando el avatar o la voz parece y suena claramente artificial.