Eve Andersson (Google): "La IA es realmente útil cuando logra adaptar la tecnología a todos"
Entrevistamos a la directora de producto de inclusión y accesibilidad de Google, que aplica diferentes procesos para llevar la tecnología a todos.
16 julio, 2022 18:28El término Inteligencia Artificial (IA) ha pasado de ser una innovación casi de ciencia ficción a ser un mantra en ocasiones mal utilizado por especialistas o comentaristas. Para saber qué abarca realmente —y dónde se aplica este término realmente— en EL ESPAÑOL - Omicrono charlamos con Eve Andersson, Senior Director of Product Inclusion, Equity & Accessibility de Google.
Andersson explica que esta inteligencia artificial en realidad no es tan inteligente como se pinta, que sus aplicaciones son mucho más diversas de lo que podemos pensar, así como su verdadero potencial está en acercar a la tecnología al día a día del ser humano. Tanto, que casi no note que está interactuando con ella.
Para ponerlo de ejemplo, la propia Eve explica cómo funciones de diferentes aplicaciones de Google han nacido de necesidades de usuarios de accesibilidad, discapacidad o rendimiento. Innovaciones que hasta ese momento no se habían necesitado —o podido hacer— y que gracias a la inteligencia artificial se han convertido en realidad.
Muchas veces se habla de la inteligencia artificial como un concepto etéreo, ¿cómo se puede explicar qué es la IA para entender su desarrollo en un ambiente práctico?
A pesar de su nombre, la inteligencia artificial no es de verdad "inteligente". Es tan solo una forma de crear algoritmos diferente de otros métodos más antiguos de programación. En la clase de IA más común, en lugar de que un programador escriba una secuencia de instrucciones (el "algoritmo"), lo que hacemos es proporcionarle a un ordenador una gran cantidad de datos, para que este desarrolle el algoritmo que mejor se ajuste a esos datos. Eso ha hecho posibles cosas como el reconocimiento del habla con alta precisión. Le damos al ordenador un montón de muestras de habla y las correspondientes transcripciones y el ordenador desarrolla un algoritmo para convertir cada muestra de habla en su transcripción.
Hace unos años me diagnosticaron una lesión por esfuerzo repetitivo (LER) que, en mi caso, me produce dolor si me paso mucho tiempo tecleando. A raíz de esta lesión, empecé a utilizar habitualmente el dictado en Google Docs para diferentes tareas de mi trabajo, cómo tomar notas o redactar documentos. El dictado es un producto que utiliza tecnología de conversión de voz en texto empleando inteligencia artificial. De manera más general, la inteligencia artificial engloba todas las formas en que podemos entrenar modelos de aprendizaje automático (machine learning) utilizando diferentes ejemplos o conjuntos de datos. En este caso, el dictado utiliza un modelo de aprendizaje automático que hemos entrenado a base de mostrarle diferentes ejemplos, de modo que sea capaz de reconocer una palabra que alguien pronuncia y transcribirla en forma de texto en un documento, en tiempo real.
¿Puede la IA ayudar a personas con discapacidad?
La IA está propiciando una gran variedad de avances tecnológicos que, a su vez, están haciendo el mundo más accesible. Uno de esos avances es el reconocimiento del habla y los asistentes de voz, que han hecho posibles las funciones de conversión del habla que existen hoy en día, como la escritura por voz en Google Docs o el dictado en Chrome OS; ambos permiten escribir con la voz.
Este avance también ha abierto la puerta a la creación de aplicaciones como Live Transcribe, que permite que la gente vea transcripciones en vivo de sus conversaciones en tiempo real. O como el Proyecto Relate, que es una aplicación que permite crear modelos de reconocimiento de voz personalizados para personas con trastornos del habla, con el fin de transcribir lo que dicen, repetirlo en voz alta e interaccionar con el asistente de Google. También ha sido posible lanzar Live Caption para Android y Google Chrome, una función que subtitula en tiempo real las conversaciones telefónicas y contenidos de audio y vídeo en teléfonos Android o en el navegador Chrome.
La IA está propiciando una gran variedad de avances tecnológicos que, a su vez, están haciendo el mundo más accesible.
Los móviles son cada vez más inteligentes y aprenden más del usuario. ¿Cómo se adapta la tecnología a las necesidades especiales?
Según mi experiencia, una de las cosas para las que la IA resulta más útil es para hacer la tecnología más adaptable a las necesidades de las personas. Por su propia naturaleza, la IA hace que los ordenadores sean capaces de aprender a partir de los ejemplos y los datos que les suministramos. Las ventajas pueden verse claramente a través de aplicaciones como Lookout. Hace unos años, lanzamos Lookout, una aplicación para Android que ayuda a las personas ciegas o con baja visión a realizar tareas cotidianas.
Esta aplicación puede hacer muchas cosas con la ayuda de IA, por ejemplo, es capaz de identificar objetos, escanear documentos o leer las etiquetas de envases de alimentos. Recientemente hemos lanzado un modo de imágenes, que utiliza el modelo de aprendizaje automático más avanzado de Google para interpretar imágenes. Solo hay que abrir una imagen en cualquier aplicación para escuchar una descripción de ella. Además, esta aplicación funciona totalmente desde el dispositivo, algo muy práctico para personas que no tienen acceso a una buena conexión a internet o datos ilimitados.
¿Puede la inteligencia artificial ajustarse a las necesidades manteniendo la privacidad del usuario?
Como empresa, siempre hemos sido conscientes de que debemos respetar la privacidad de los usuarios en todos nuestros productos e iniciativas de investigación. Nuestro trabajo en el ámbito de la accesibilidad no es diferente en ese sentido, con independencia de que utilice o no inteligencia artificial.
Todos y cada uno de nuestros productos pueden ser ajustados por el usuario individual para adaptarlos a sus necesidades. En algunos casos, los productos están diseñados para que estos ajustes se hagan con la ayuda de otra persona. Lo que buscamos con ello es que cada persona pueda utilizar nuestros productos de la manera que mejor se adapte a sus necesidades cotidianas.
Siempre hemos sido conscientes de que debemos respetar la privacidad de los usuarios en todos nuestros productos e iniciativas de investigación.
¿Cómo los sistemas de IA pueden centrarse en mejoras personales aprendiendo de una gran cantidad de los datos de una gran cantidad de usuarios?
En general, es importante entrenar los modelos de aprendizaje automático con un gran número de ejemplos o datos de una gran variedad de personas. Con ello se dota al modelo de una mayor capacidad para comprender la enorme variedad de información que se le puede presentar en el mundo real. Cuando hablamos de accesibilidad, es especialmente importante disponer de datos inclusivos y diversos. En muchos casos, los modelos de aprendizaje automático no se exponen a ejemplos representativos de personas con discapacidades. Como resultado, la tecnología derivada de esos modelos no es tan accesible como nos gustaría.
En cambio, si somos capaces de crear modelos de aprendizaje automático que, de partida, son más inclusivos, se nos abre una puerta para afinarlos y personalizarlos a la medida de cada individuo. Una de las formas en que hemos podido hacerlo es a través del Proyecto Euphonia, que pusimos en marcha en 2019 como una línea de investigación de modelos de reconocimiento del habla más accesibles para personas con trastornos del habla.
Esta investigación se llevó a cabo inicialmente en inglés; el año pasado conseguimos reunir suficientes muestras de habla de personas con diferentes tipos de trastornos y discapacidades del habla como para entrenar un modelo de reconocimiento del habla más inclusivo en inglés. Con esta base, nuestro equipo lanzó el Proyecto Relate que he mencionado antes, una aplicación para Android que, a partir de este modelo de referencia, obtiene unas 500 muestras de habla específicas de una persona. Con esa información, genera un modelo de reconocimiento del habla personalizado, capaz de entender los patrones de habla de esa persona en concreto. Ahora hemos ampliado el Proyecto Euphonia al español, con el objetivo de obtener resultados similares en otros idiomas.
¿Es la Inteligencia Artificial la forma de romper la brecha de accesibilidad a la tecnología?
Es cierto que la IA ha permitido a nuestros equipos crear productos de accesibilidad francamente útiles y prácticos. Pero no siempre es la solución. Las personas con discapacidades presentan una extraordinaria diversidad, con una gran variabilidad en lo que necesitan de la tecnología. Por eso, es muy importante incorporar siempre a personas con discapacidades en todos los procesos de desarrollo de productos, líneas de investigación o iniciativas, desde las primeras fases, en calidad de empleados, consultores y usuarios. El hecho de crear productos contando con personas con discapacidades —y pensando en que los usen— ha propiciado nuevas innovaciones o ha mejorado innovaciones que ya existían. En conjunto, ha servido para crear una tecnología mejor.
Creo firmemente en esta forma de trabajar, que nos ha llevado a redactar directrices de diseño y a poner a punto recursos dirigidos a desarrolladores web y desarrolladores de aplicaciones, para ayudarles a aplicar en su trabajo las mejores prácticas de accesibilidad. Porque la idea no es solo hacer un producto accesible sino uno que, de manera general, ofrezca una buena experiencia de uso a las personas con discapacidades.
La idea no es hacer un producto accesible sino uno que, de manera general, ofrezca una buena experiencia de uso a las personas con discapacidades.
¿Se verá una adopción masiva de esta tecnología en objetos que ni planteamos ahora mismo?
La inteligencia artificial podría ser útil de muchas formas en herramientas creadas con participación de personas con discapacidad y dirigidas a ellas. Por ejemplo, la IA se está incorporando de forma creciente a los dispositivos inteligentes para el hogar, como cámaras, videoporteros, luces y termostatos. Eso es algo especialmente interesante en lo tocante a la accesibilidad, porque podría generar oportunidades de personalización para atender necesidades de personas con discapacidad. Supongamos que una persona con discapacidad utiliza habitualmente un dispositivo Google Nest para realizar una determinada tarea a una hora dada, como cambiar la temperatura del termostato antes de acostarse. Quizás algún día, Google Nest podría poner en cola esa acción y realizarla automáticamente a partir de ese momento.
¿Cómo se pueden trasladar los sistemas de accesibilidad a otras plataformas webs que todos tenemos que usar como la administración pública?
La accesibilidad es una inversión importante para cualquier servicio, programa o plataforma, y muy especialmente para los de las administraciones públicas. Ahora que muchos servicios se están trasladando a internet, hay que pensar no solo en la accesibilidad física de las oficinas o actividades, sino en la accesibilidad digital de los sitios web, las presentaciones y las herramientas de cualquier plataforma. Yo animaría a todas estas plataformas a que reflexionen sobre cómo es la interacción con sus servicios cuando tienes alguna discapacidad, y a que trabajen directamente con la comunidad de discapacitados para subsanar cualquier carencia. Desde luego, deben crear servicios que sean compatibles con las tecnologías de asistencia, como los lectores de pantalla. Pero, además, sus plataformas deben ofrecer una experiencia equitativa a las personas con discapacidad.
¿Hacia dónde cree que evolucionará la inteligencia artificial?
Eso es algo en lo que me encanta pensar y especular sobre todas las posibilidades que se abren para la accesibilidad en el futuro. Un campo al que prestamos cada vez más atención es cómo capitalizar la tecnología para que resulte más útil a las personas con discapacidades cognitivas. Ese es un espacio increíblemente diverso que abarca necesidades variadísimas, y que está en gran medida inexplorado. Por ejemplo, ¿habría alguna forma de condensar información difícil de entender en un resumen con una estructura sencilla? Y, si hubiera una herramienta así, ¿resultaría útil en el día a día de la gente, cuando se encuentra ante una página llena de información? Se trata de un campo en el que, como empresa, ya estamos trabajando con nuevas funciones como la posibilidad de mostrar un resumen en la parte superior de un texto de Google Docs. En cuanto a la accesibilidad, es un campo en el que estamos investigando y pensando en cómo podemos mejorar la experiencia de uso de la tecnología de una forma práctica.