El uso de Inteligencia Artificial para tareas creativas es la gran polémica del 2023, pero no será la única ni mucho menos relacionada con esta tecnología.
[Cómo usar Midjourney para crear imágenes espectaculares de forma rápida]
La creación de contenido con Inteligencia Artificial alcanza no sólo a la creación de fotografías u obras de arte, es decir, al espectro visual; también al espectro auditivo. Y es que el aprendizaje automático no funciona sólo con datos visuales, también con sonidos, y la IA puede imitarlos igual de bien.
La IA que copia nuestra voz
El proyecto de Eleven Labs es el más sorprendente que hemos visto hasta ahora centrado en la generación de voz artificial, por lo realista que suena; realmente es como si hubiese una persona leyendo lo que has escrito, aunque evidentemente no es posible.
El proyecto de síntesis de voz de Eleven Labs aún está en beta, pero ya se puede probar de manera gratuita; y si estamos convencidos, también podemos pagar una suscripción para eliminar las limitaciones que tiene. Pero si quieres hacerte una idea de lo que es posible hoy en día, la cuenta gratuita (podemos iniciar sesión con Google o Facebook) es perfectamente válida.
Al entrar, nos encontraremos con algo tan sencillo como un cuadro de texto en el que escribir lo que queramos; y en la parte superior podemos configurar la voz. Tenemos varias voces entre las que elegir, aunque todas tienen acento americano por ahora. Es interesante que podamos cambiar detalles como la claridad de la voz o la estabilidad; esto último puede conseguir una voz más expresiva y que variará más entre una palabra y otra. Todo depende del tipo de “persona virtual” que queramos crear.
Pero eso no es todo. Tal vez la función más llamativa (y polémica) es la posibilidad de clonar la voz. Encontraremos esta opción si pulsamos en “Add voice”, un botón que nos llevará a la creación de voces; lo único que necesitamos para “clonar” una voz es una muestra de la persona hablando sin ruidos ni música de fondo, en un archivo de 10 MB como máximo en formatos MP3, OGG o WAV. Podemos añadir varias muestras para mejorar el resultado final. A partir de ahí, la IA “aprenderá” a hablar como la persona que suena en el archivo, y podremos hacer que diga lo que queramos.
Es una herramienta sorprendente, aunque por el momento esté limitada al inglés; en mis pruebas, las frases en español no suenan nada bien, aunque dan el pego como alguien que no conoce el idioma.
Te puede interesar
- INTELIGENCIA ARTIFICIAL: 10 claves para que entiendas la próxima revolución
- Llega a España un nuevo rival de Google basado en Inteligencia Artificial: así es Neeva
- Una IA escribió artículos en secreto para una de las webs más importantes: así le fue
- Google presenta su propio ChatGPT, una IA que puede responder todas tus preguntas