Image: Big Data

Image: Big Data

Letras

Big Data

Viktor Mayer-Schönberger y Kenneth Cukier

26 julio, 2013 02:00

Gran centro de datos de Google, en los Ángeles. Foto: Archivo

Traducción de Antonio iriarte. Turner. Madrid, 2013. 278 páginas, 22 €.

La Sociedad de la Información produce una masa ingente de datos y dispone de la capacidad técnica para procesarlos e interpretarlos. Esta cantidad inmensa de fragmentos digitales puede servir a nuevos propósitos que desafíen nuestra manera de pensar y cambien nuestras instituciones. Como se afirma en este volumen, elbig data ha transformado ya la percepción del mundo. Como red de comunicación e información, Internet no tiene precedente. Hasta hace unos años las redes requerían algún tipo de control centralizado. El sistema telefónico global, por poner un ejemplo, está administrado por la International Telecommunication Union. Fundada en 1865, forma parte de la familia de organizaciones de Naciones Unidas y se atiene a todo un sistema de reglas y tratados.

Internet es muy diferente. Ninguna persona, compañía, organización o gobierno se responsabiliza de su funcionamiento. Bien es cierto que está coordinada por una organización privada sin ánimo de lucro denominada Internet Corporation for Assigned Names and Numbers, cuya sede se encuentra en Los Ángeles. A la Casa Blanca, el crecimiento de las redes que interactúan en Internet le ha producido un malestar que ha ido en aumento, y desde la cumbre de la Sociedad de la Información mantenida en Ginebra en 2003 busca conseguir, sin todavía lograrlo, un tratado internacional regulatorio al que se oponen países como China, Brasil o Zimbabue por razones diversas. La preocupación del gobierno norteamericano se entiende muy bien si se tiene en cuenta que desde mediados de los años 90 Internet ha tenido un impacto revolucionario en la cultura, el comercio, la política y un sinfín de actividades. Foros, blogs, redes sociales, investigación o educación utilizan y desarrollan una red global de información que, por otro lado, ha cambiado el panorama de los medios de comunicación en todo el mundo. A día de hoy la expansión de Internet sigue imparable y la masa de información on line crece y crece sin que aparezcan los instrumentos necesarios de lo que los politólogos denominan "gobernanza" y regulación el resto de los mortales.

En este complejo horizonte, los analistas de Internet comenzaron a interesarse por la masa de información que circulaba por la red. Meta Group (ahora Gartner) colgó en la red un informe en el que sentaron algunos principios del análisis de datos en circulación. En su opinión, el aumento del volumen de los datos, su velocidad de movimiento y la variedad del tipo de datos, de sus fuentes y de sus texturas creaba una nueva tipología para la que acuñaron el término "big data". Gartner redefinió en 2012 dicho término: "Big data es gran volumen, gran velocidad y gran variedad de información que requiere nuevas formas de procesamiento que permiten mejorar la toma de decisiones y descubrir nuevos procesos de optimización". A estas tres uves -volumen, velocidad y variedad- algunas organizaciones han añadido la v de veracidad.

Con este apasionante horizonte como fondo, Viktor Mayer-Schönberger y Kenneth Cukier se pusieron a ordenar y urbanizar un territorio hollado apenas por un puñado de ingenieros y especialistas en Internet. El resultado es un volumen que, con una sistematización admirable y un lenguaje al alcance de cualquier lego, pone a disposición del lector una de las grandes cuestiones de comienzos del siglo XXI.

Nacido en 1966 en Austria, Mayer-Schönberger estudió derecho en Salzburgo y completó su formación en la Universidad de Harvard, al tiempo que se convertía en un experto en nuevas tecnologías e Internet. En la actualidad es profesor de Regulación y Gestión de Internet en el Internet Institute de la Universidad de Oxford. Ofrece conferencias por todo el mundo y su anterior libro, Delete, publicado nada menos que por Princeton University Press en 2009, ha sido todo un éxito. Kenneth Cukier es el editor, en el sentido anglosajón del término -el que le da forma y lo redacta. Ha trabajado para el Wall Street Journal y el International Herald Tribune y es editor de datos del influyente semanario The Economist.

La idea de la que parten ambos autores es, en realidad, bastante evidente: estamos sumergidos en una masa de información que crece y crece sin mesura. Google procesa más de 24 petabytes de datos al día, un volumen superior en miles de veces al material impreso de la Biblioteca del Congreso de Estados Unidos. A Facebook se suben más de 10 millones de fotos cada hora. Sus usuarios presionan el botón de "me gusta" o hacen comentarios casi 3.000 millones de veces al día, dejando una huella digital que la compañía utiliza para analizar sus preferencias. Al mismo tiempo, los 800 millones de usuarios mensuales del servicio YouTube de Google suben más de una hora de vídeo por segundo. El número de mensajes de Twitter aumenta alrededor de un 200% al año, y en 2012 se habían superado los 400 millones de tuits diarios. Añadamos que los portales de encuentros dedicados a emparejamientos mueven información personal, que Amazon conoce nuestros gustos literarios, y que LinkedIn está al tanto de nuestras relaciones profesionales. Con todo ello nos iremos haciendo cargo de que "flota" en la web una grandiosa masa de información.

Tras mostrar al lector la existencia masiva de datos, los autores comienzan a desgranar los distintos modos en que esta nueva situación nos modifica personalmente y cambia el mundo actual. El primer escenario que se transforma es el estadístico. El sistema de muestreo queda sustituido por una nueva muestra en la que están "todos los datos". Dicho cambio permite apreciar detalles que eran invisibles cuando se utilizaban muestras pequeñas. Ahora puede detectarse lo granular aunque, eso sí, se pierda exactitud. "Lo que perdemos en exactitud en el nivel micro, lo ganamos en percepción en el nivel macro", afirman los autores.

Desde esta consideración, Mayer-Schönberger y Cukier suben un escalón y afirman que como consecuencia de manejar "todos" los datos nos alejamos de la tradicional búsqueda de la causalidad. Podemos saber que "algo" está pasando, pero no sabemos "por qué" está ocurriendo. Al manejar "todos" los datos se pueden establecer nuevas e insospechadas conexiones. Algunos fondos de inversión analizan Twitter para predecir la evolución del mercado de valores. Amazon y Netflix basan sus recomendaciones de productos en una miríada de interacciones de los usuarios de sus páginas web.

Ambos autores denominan "datificación" al manejo de la recopilación de toda la información disponible y muestran de qué modo la datificación permite hacer predicciones. El análisis predictivo, a partir de los datos masivos, va a modificar la naturaleza de los negocios, los mercados, la sociedad y el gobierno de los estados. Si antes Walmart y Capital One fueron pioneros en el empleo de datos masivos en la venta y en la banca, ahora el efecto de la datificación sobre la sociedad será más extenso y profundo.

Se cierra esta provocativa visión del efecto de la utilización de los datos masivos con la consideración de sus posibles consecuencias éticas y morales. La primera radica en el desvanecimiento de la figura del experto, que queda desplazada por un nuevo personaje que nuestros autores denominan el "algoritmista", un profesional experto en las áreas de ciencias de la computación, las matemáticas y la estadística. Constituidos los algoritmistas en revisores de análisis y predicciones desde los datos masivos, la vida anónima y el libre albedrío quedan amenazados. La utilización por parte de las agencias gubernamentales del big data encierra tambien considerables riesgos para la privacidad. En el contraplano del entusiasmo de nuestros autores por el big data quedan los individuos con cuyos datos se mercadea sin su autorización expresa. Nociones como privacidad o intimidad quedan, como mínimo, en cuestión.