Por: Rodrigo Restrepo* Bogotá.
La página web de Narrative Science recibe al cibernauta con una imagen que recuerda al primer fotograma de Matrix: hileras verticales de letras y números que brillan en el verde esmeralda de los computadores viejos. La página es extremadamente sobria, casi fría, con frases cortas y telegráficas, lo que le da el aire enrarecido de un cuento de Bradbury. Y la verdad es que toda esta historia más parece un cuento de ciencia ficción que una realidad.
“La tecnología de Narrative Science es una integración poderosa de inteligencia artificial y análisis de grandes datos, capaz de transformar datos en historias que son indistinguibles de aquellas escritas por personas”, dice la Web. En otras palabras, se trata de un potente software de autoría: un robot que escribe. El software convierte grandes cantidades de información en artículos periodísticos, a una escala y velocidad imposible de igualar por un escritor de carne y hueso. Narrative Science es capaz de presentar en tiempo real múltiples versiones de una misma historia, desde largos reportes hasta tweets. Además, está programado para adaptar el contenido a diferentes audiencias, pues es capaz de usar diversos tonos, estilos y voces de escritura. “Podemos crear contenido prácticamente sobre cualquier tema incluyendo finanzas, deportes, finca raíz y política”.
No, no es ciencia ficción: los medios ya empezaron a usar al robot periodista. Nada menos que la revista Forbes publica en su versión web varios reportes diarios, escritos por el algoritmo, sobre los perfiles financieros y las proyecciones económicas de grandes empresas en la bolsa.
Para el ingeniero Kris Hammond, uno de sus creadores, estas historias son apenas el primer paso de lo que se convertirá en un universo periodístico en la Web, dominado por artículos escritos por el algoritmo. Hammond predice que en quince años más del noventa por ciento de las noticias serán escritas por computadores. Más aún, se atreve a afirmar que en cinco años Narrative Science ganará su primer Pulitzer. Sin embargo, los periodistas de a pie no tienen nada de qué preocuparse. Según el optimista ingeniero, este tsunami informativo no tornará obsoletos a los actuales reporteros de oficina. En lugar de ello, el universo de las noticias escritas se expandirá de manera espectacular, a medida que los computadores exploren, extraigan e interpreten las gigantescas cantidades de datos que genera la Red.
Periodismo automático
El proceso de escritura de Narrative Science es en esencia simple. Primero, debe amasar una gran cantidad de información de buena calidad. Esto lo consigue realizando “minería en la red”, o extrayendo información de grandes bases de datos. De ahí que sus áreas fuertes sean las finanzas y los deportes, en donde las cifras nacen, crecen y fluctúan a gran velocidad. En segundo lugar, el algoritmo debe ordenar la información dentro de un contexto que le dé sentido. Por ejemplo, en un partido cualquiera, debe programarse que el equipo con mayor número de anotaciones es el ganador del juego, o que la disminución en las utilidades de una compañía significa pérdidas. Por eso los ingenieros establecen una serie de “reglas” para cada tema.
Entonces llega el momento crucial: convertir la información bruta en prosa digerible y agradable. La compañía contrató a un equipo de “metaescritores”, periodistas que han creado una gama de plantillas que van desde extensos reportes con tablas y fotografías hasta notas breves o titulares. Casi todas las historias periodísticas tienen una estructura predecible. Los metaperiodistas han tomado frases, párrafos y giros típicos de los grandes escritores de no ficción, de modo que las plantillas están escritas con diferentes tonos y voces. Pueden tener el tono de escuetos informes financieros o el estilo familiar de una entrada de blog, pueden mostrar la ironía de una crítica o la complejidad de un texto argumentativo. Además, el programa es “entrenado” por los programadores y los metaescritores para encontrar el ángulo de la historia como ¿quién es el ganador del partido?
Uno de los campos mejor desarrollados por Narrative Science es el periodismo deportivo. De hecho, ese fue su origen, como el resultado final de una clase de la Universidad de Northwestern en el 2009, que reunía a programadores de software y jóvenes periodistas. A la fecha de escribir este artículo, uno de los mayores clientes de Narrative Science era la Big Ten Network, una gigantesca cadena que cubre campeonatos universitarios en Estados Unidos y que publica los reportajes que de sus juegos escribe el algoritmo. Que se sepa, ninguna cadena deportiva ha decidido despedir a algún reportero para reemplazarlo por el algoritmo. Lo que sí está haciendo la compañía es incursionar en lugares donde ningún periodista está. Sus creadores desarrollaron una aplicación para iPhone que reporta con lujo de detalles los partidos de la Little League, la liga internacional de béisbol escolar más grande del mundo.
No es de extrañar que las finanzas y los deportes –áreas llenas de testosterona, datos y pensamiento estratégico– sean las especialidades del robot periodista. Su potencial, sin embargo, tiende al infinito. Cuando el programa estaba aún en sus primeras etapas, los metaescritores debían “educarlo” cada vez que se necesitaba escribir sobre un nuevo tema. Pero pronto desarrollaron una plataforma para que el mismo programa “aprendiera” sobre nuevos tópicos y pudiese investigarlos con cierta autonomía. Uno de los meta-escritores decidió programar una pequeña pieza sobre los mejores restaurantes en una determinada ciudad. Su base de datos consistía en las reseñas y guías turísticas de la Red. El metaescritor “educó” al programa para que identificara los elementos más relevantes: servicio, calidad de la comida y comentarios de clientes satisfechos. Y lo programó con unas cuantas frases trilladas de las guías de restaurantes. En pocas horas tenía una aplicación que podía escribir una infinidad de artículos cortos sobre cualquier restaurante del mundo.
Cambios de la información
Hammond no niega que Narrative Science reemplazará y superará cierto tipo de periodismo que hasta hoy era exclusivamente humano. Sin embargo, pone el énfasis en el potencial de colaboración hombre-máquina y cree que cada vez serán más los metaescritores que crearán redes de artículos posibles, y en lugar de concentrarse en una sola historia serán capaces de generar millones. Los esfuerzos de la compañía, no obstante, se están orientando hacia las historias que los periodistas no cubren, simplemente porque no pueden. El problema actual con WikiLeaks, por ejemplo, es que la cantidad de información que alberga es tal que llevaría décadas enteras a un grupo de seres humanos leerla y analizarla. Narrative Science, sostiene Hammond, podrá “leer” toda esa información en apenas horas.
Otro de los frentes posibles es el análisis de las redes sociales. Los programadores ya están trabajando en una aplicación que sigue las tendencias en todo Twitter, pero en poco tiempo, dicen, existirá una herramienta para analizar las tendencias hipermasivas de las redes sociales y saber, en tiempo real, qué están pensando millones de personas en el mundo.
Uno de los mayores esfuerzos de la compañía es escribir artículos que solo sean relevantes para una sola persona, lo que Hammond llama una “audiencia de uno”. Esto supondría llevar a su máximo límite la tendencia actual del periodismo de volverse, cada vez más, un asunto de nicho. Al parecer, no está lejos el día en que los resultados médicos dejen de ser una maraña de datos incomprensibles para convertirse en claros reportes sobre el estado de salud del paciente. O que recibamos artículos informativos sobre las cuentas bancarias personales, con consejos sobre cómo gastar el propio dinero. Esta posibilidad trae, no obstante, un riesgo enorme. Como escribió en un reciente post el analista Evgeny Morozov, este microperiodismo automatizado puede resultar en una peligrosa ratificación del sesgo de autoconfirmación. Es decir, que me digan lo que quiero saber, en el lenguaje en que me gusta leerlo, sin enterarme de lo que está sucediendo tras mi placentera cortina de humo. Nada más peligroso para la libertad de información y los derechos ciudadanos. Y el peligro parece aún mayor en tanto que Internet se está moviendo rápidamente hacia una experiencia al gusto del consumidor. El propio Google, dice Morozov, no solamente conoce los hábitos de información de todos los cibernautas, sino que opera el popular Google News, programado para presentarle al consumidor solo las noticias de su gusto. Pues bien: Narrative Science trabaja para las compañías de web-marketing que se lucran con nuestros datos en la Red.
Otro de los objetivos prioritarios de Hammond es lograr que el software pueda llegar a conclusiones propias. Por el momento esto no es posible, pues solo es capaz de “ver” lo que sus creadores lo programan para ver. Pero según el ingeniero no pasará mucho tiempo antes de que el algoritmo logre por sí mismo deducciones que sus programadores ni siquiera sospechan. Y ahí no acaba la historia: Narrative Science está trabajando para ir más allá de los números. Aunque de momento el software está especializado en datos numéricos, ya es capaz de “leer” titulares financieros. La compañía, no obstante, está invirtiendo seriamente en que sus sistemas “entiendan” de manera más precisa el lenguaje humano, lo cual abriría las posibilidades del algoritmo. Tomadas en conjunto, estas dos características –leer datos lingüísticos no estructurados y sacar conclusiones propias– generarían una pasmosa plataforma de inteligencia artificial. Algo así como el Frankenstein de los intelectuales: un software capaz de “estudiar” incansables tomos de teoría en una sola tarde y postular algunas hipótesis originales.
Y entonces nos acercamos al límite. En un reciente artículo para la revista The Atlantic, Hammond asegura que, en teoría, es posible para el algoritmo escribir un cuento “perfecto”, basado en los criterios de la teoría y la crítica literaria. Podemos tolerar que una máquina escriba simples artículos deportivos o complejos informes financieros. Podemos incluso aceptar que escriba guías turísticas y reportes médicos, o que nos muestre tendencias noticiosas. Pero hay una cualidad en el arte –incluso en el arte del reportaje– que los computadores nunca entenderán, una cualidad, si se quiere, metafísica, espiritual o puramente humana. Y la máquina no lo entenderá por muy precisos, complejos e independientes que sean sus algoritmos. Quizá Narrative Science nos impulse, por el contrario, a “desmaquinizar” el periodismo. Frente a la máquina que nosotros mismos hemos programado, quizá la mejor estrategia sea, justamente, desprogramarnos. Al final de cuentas, Narrative Science no ganará el Pulizter.