Big data y economía en tiempos de coronavirus | Daniel Aromí y Julián Cristiá

01 Jun 2020
Nota de opinión en el blog Alquimias Económicas

Integrante/es: Aromí, Daniel
La actual crisis global asociada a la pandemia ha generado un importante aumento en la incertidumbre sobre la evolución de las condiciones económicas, sociales y sanitarias en todo el mundo. En estos días, sabemos menos que lo que usualmente se sabe sobre variables económicas clave. Por ejemplo, ¿cuál es el nivel de actividad económica? ¿Cuánto ha caído el empleo? ¿Cuáles son los sectores de la economía y la sociedad más afectados?

Adicionalmente, la pandemia ha despertado un fuerte interés por nuevos indicadores que brinden información sobre tasas de contagio, la adopción de medidas de distanciamiento social y el nivel de apoyo a las políticas públicas. Por ejemplo, ¿qué información puede mejorar nuestra capacidad para anticipar las fluctuaciones en las tasas de contagio? ¿Cuál es el impacto de las cuarentenas obligatorias sobre los comportamientos de la población? ¿Cómo afectan estos cambios de comportamiento las tasas de contagio? Respuestas a estas preguntas podrían ser útiles para la asignación de recursos en el sistema de salud y para la evaluación de diversas medidas de política.

Frente a estas demandas, surge una renovada oportunidad para el uso de grandes volúmenes de información comúnmente asociados al concepto de “big data”. Entre estos grandes volúmenes de información se encuentran bases de datos de transacciones recolectadas por el sistema financiero, información georreferenciada asociada a la telefonía celular, los contenidos de las redes sociales y las búsquedas y visitas de los usuarios de internet. Estos datos constituyen una fuente no tradicional de información y pueden ser usados para medir actividades económicas, desplazamientos geográficos y opiniones de la población.

¿Qué pueden ofrecer estos datos? ¿Cómo se diferencian de fuentes tradicionales de información? En esta breve nota presentamos una discusión que, en parte, refleja lo presentado en la “5ta Conferencia Online del IIEP: Big Data, Coronavirus y Economía” (pueden mirar la conferencia en https://youtu.be/XLVUYnaS0BE). En esta charla participamos los autores de esta nota y se sumaron dos economistas que están involucrados con este tipo de datos: Nicolás Ajzenman (Sao Paolo School of Economics-FGV) y Marcos Dal Bianco (BBVA).

Una importante ventaja de este tipo de datos es la rapidez con la que se encuentran disponibles. En contraste con las estadísticas tradicionales, las fuentes alternativas de datos pueden ofrecer información casi en tiempo real. Por ejemplo, Opportunity Insights generó un valioso portal para el seguimiento de la economía de Estados Unidos en base a datos de rápido acceso como niveles de facturación o anuncios de puestos de trabajo (https://opportunityinsights.org/updates/economic-tracker/). En el ámbito de la salud, se ha mostrado que la tasa de contagios puede ser pronosticada con un alto nivel de desagregación geográfica a partir de visitas a hospitales que son detectadas usando información generada por teléfonos móviles (https://connection.mit.edu/sites/default/files/publication-pdfs/Covid19-Prediction-5-10-20_0.pdf).

Sin embargo, la velocidad no es la única ventaja. En algunos casos, estos datos permiten medir en forma precisa y detallada fenómenos de dificultosa medición bajo métodos tradicionales. Un caso prominente en estos días es la medición de la movilidad de las personas a partir de datos georreferenciados generados por celulares. Por ejemplo, a través de una iniciativa que nos involucra, se ha creado un portal con datos sobre movilidad de las personas para países de Latinoamérica (https://www.iadb.org/es/investigacion-y-datos/movilidad-covid). Siguiendo esta línea, en un reciente trabajo, Ajzenman y coautores utilizan información georreferenciada de teléfonos móviles para evaluar cambios en los niveles de distanciamiento social en respuesta a declaraciones públicas de líderes políticos (https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3582908).

Más allá de la movilidad per se, en la medida que la movilidad y la actividad económica estén relacionadas, los datos de telefonía móvil pueden informar sobre el nivel de actividad económica. Utilizando estos datos, indicadores con un alto nivel de desagregación geográfica o sectorial podrían ser llevados adelante. En este sentido, el análisis económico seguiría los pasos ya implementados por firmas de estudio de mercado que han fomentado el desarrollo de estas bases de datos.

El estudio de las opiniones de las personas y su estado de ánimo es otro ámbito en el que el procesamiento de grandes volúmenes de información puede ser de utilidad. Por ejemplo, se ha mostrado que el análisis automático de los contenidos difundidos por los diarios (https://www.sciencedirect.com/science/article/abs/pii/S0169207019302511) y la clasificación algorítmica de las emociones transmitidas por fotos en la prensa (https://aaep.org.ar/anales/works/works2019/aromi.pdf) pueden resultar en indicadores útiles para anticipar cambios en los niveles agregados de actividad económica. En estas aplicaciones se destaca la complementariedad entre la disponibilidad de grandes cantidades de información con el creciente acceso a modelos de aprendizaje estadístico asociados al procesamiento de lenguaje natural y al procesamiento de imágenes.

Por supuesto existen limitaciones asociadas a este tipo de ejercicios. En primer lugar, estos datos no fueron generados para realizar ejercicios como los descriptos arriba. Por lo tanto, existen imperfecciones en el proceso de recolección de datos que pueden ser más severas que las observadas en el caso de las estadísticas tradicionales comúnmente generadas por organismos oficiales de estadísticas. Por ejemplo, los usuarios activos de celulares son una muestra seleccionada y, de la misma manera, las transacciones recolectadas por el sistema bancario constituyen un subconjunto de las transacciones realizadas en una economía. Si bien estas imperfecciones pueden ser mitigadas a través de ajustes metodológicos, resulta claro que estos indicadores están lejos de constituir un sustituto de los indicadores tradicionales.

Otra desventaja de este tipo de información está asociada a su interpretación. Esta dificultad es particularmente evidente en el caso del procesamiento de textos. El lenguaje natural es practicado en base a un conjunto de reglas no escritas que cambian con el tiempo y según el contexto. Por ejemplo, el lenguaje utilizado en una red social como Twitter es muy distinto del lenguaje utilizado en la prensa económica y, de esta manera, la forma en que se interpretan estos textos debe variar según el contexto. El procesamiento de lenguaje natural es un área de ciencias de la computación que constantemente aporta nuevos modelos de aprendizaje que, conjuntamente con el creciente acceso a grandes repositorios de textos, permite avanzar en la resolución de estos problemas de interpretación.

Un aspecto adicional a contemplar está dado por las preocupaciones con respecto a la privacidad. Es importante que estas grandes bases de datos comerciales sean resguardadas por fuertes medidas de protección. Complementariamente, es importante que los análisis y los datos reportados no comprometan la privacidad de las personas.

Estas consideraciones ayudan a moderar el entusiasmo que muchas veces resulta exagerado ante la emergencia de nuevas herramientas. Sin embargo, es evidente que estos datos llegaron aquí para quedarse. Constituyen una manifestación de los cambios en el funcionamiento de las economías y, más ampliamente, las sociedades. Cambió la forma en que las firmas monitorean a sus clientes y a su competencia. También cambió la forma en que nos comunicamos con nuestras amistades y familiares. Naturalmente, estos cambios se han acelerado en el contexto de la presente pandemia. Al mismo tiempo, está cambiando la forma en que estudiamos fenómenos sociales. Los datos alternativos brindan un conjunto creciente de herramientas que se complementan con las fuentes de datos tradicionales y, de esa manera, permiten medir más y mejor. Siempre que hagamos uso adecuado de estos recursos y no perdamos de vista los problemas importantes, sólo podemos esperar avances en la capacidad para entender nuestras sociedades.

Compartir