Big data para predecir a la sociedad. Reiniciando las ciencias sociales

Big data para predecir a la sociedad. Reiniciando las ciencias sociales
Algunos científicos suscriben al paradigma de que el comportamiento humano es aleatorio, impredecible, indeterminado, episódico, irregular y que por eso se debe estudiar los hechos de modo particular con el mayor nivel de abstracción posible. Albert-Lászlo Barabási en Bursts. The hidden patterns behind everything we do (2010) afirma que esta teoría es errónea. Según Barabási, internalizamos patrones y predecimos eventos que obedecen a las leyes de la naturaleza, lo cuál la predicción del tiempo comenzó a ser efectiva cuando se pudo gestionar y procesar con rapidez toda los datos y variables existentes, o sea las “explosiones de actividad humana” (el turismo será una de las actividades más críticas a medir con el tracking social. Foto de HPK: ruinas de Chichén Itzá, 2017). Los eventos humanos son difíciles de predecir. Pero difícil no es imposible. En el pasado no teníamos herramientas para explorar el comportamiento humano y hoy, con todo el poder computacional que nos rodea y trackea nuestros actos, esto resulta más accesible a los científicos.

¿Habrá que redefinir completamente el trabajo de los cientistas sociales? ¿Qué esperan las universidades de Iberoamérica para enseñar tracking social, big data, matemáticas complejas y otras herramientas de comprensión de datos complejos en los doctorados de ciencias sociales? De aquí a poco, al cientista social no le bastará ya con unas encuestas y una lectura ensayística de la realidad. Necesitará mucho más.

En El oficio de científico. Ciencia de la ciencia y reflexividad (2003), Pierre Bourdieu, se propone des-idealizar las rutinas de la comunidad científica, para que se comprendan mejor “los mecanismos sociales que orientan la práctica científica y convertir (a los investigadores) en dueños y señores no sólo de la naturaleza de su práctica sino también del mundo social en el que se produce”. Ese aprendizaje es muy valioso para investigadores jóvenes porque, según Bourdieu, los científicos no politizados y sin visión empresarial corren el riesgo de quedar marginados delante de las grandes maquinarias científicas promovidas por empresas o instituciones públicas.

La visión empresarial y la eficiencia política hoy son comprender e investigar bajo lógicas de big data. En las nuevas ciencias sociales, se podría luchar por el monopolio de la producción de la verdad, hoy en manos de las ciencias duras. No sirve más la encuesta a 100 estudiantes de una universidad para comprobar hipótesis en una tesis doctoral. Las condiciones históricas determinan el hecho científico. Y hoy estas condiciones son y serán la manipulación y el análisis de grandes volúmenes de datos.

Me recuerda a los textos de Tapscott y Prensky sobre los nativos digitales presentados como ciencia social, cuando sólo eran ensayos divulgativos con una débil metodología de investigación. Sin embargo han hecho daño al rigor de las ciencias sociales, porque el concepto de nativos digitales se ha popularizado y los medios hablan de él con débil pertinencia y menor rigor.

En Burst, Barabási analiza que podemos predecir cómo se moverá un electrón y enviar un robot a Marte, pero nos cuesta explicar o predecir el comportamiento de los seres humanos, incluso en un mundo con muchos homebodies rutinarios y algunos pocos globetrotters nómadas que rompen los patrones. Aunque la mayoría de nuestras acciones están conducidas por leyes, patrones y mecanismos similares en predicción y reproducción a las que existen en la naturaleza, estudiar qué es normal y qué es único en la actividad humana es de una enorme complejidad pero con el análisis de los grandes volúmenes de datos y el machine learning, esto y será cada vez más eficiente.

Para ejemplo nos sirven los movimientos estratégicos de Google con la creación de Alphabet. Desde que asumió en agosto de 2015 como CEO de Google, Sundar Pichai viene diciendo que el principal modelo de negocio futuro de su empresa no será el buscador sino los datos y el machine learning. Recomiendo leer este análisis en Fast Company de finales de 2016. La estrategia de Pichai acerca a la compañía a su histórica misión corporativa: “Organizar toda la información del mundo, y hacerla universalmente accesible y útil”. Sin embargo, si el principal modelo de negocio de Google será construir un mapa del comportamiento humano, habrá que estar muy atentos al cumplimiento de su lema Don’t be evil y de su natural tendencia a monopolizar o fagocitar mercados. Las tecnologías digitales crean un laboratorio que en complejidad y detalles supera a toda los datos accesible hasta ahora.

El poder informacional global creado por los cuatro grandes de la industria digital -Amazon, Apple, Facebook y Google- es un debate que venimos teniendo hace años y al que dediqué un capítulo en mi último libro Opportunity Valley. Lecciones no aprendidas de treinta años de contracultura digital (2014).

Sabemos que el nuevo gran problema que gobiernos, legisladores y sociedades deben atender es ¿quién es el dueño de la información cotidiana que generamos en los entornos digitales? Aunque quizás nos quede un poco lejos de los debates de nuestro tiempo, podríamos profundizar en la pregunta pensando en la privacidad prospectiva, o sea ¿quién será el dueño de nuestra información de futuro?

 

 

Retomando el análisis de Barabási, las x cantidad de veces que clickamos sobre la Web en un día dado no se distribuyen con uniformidad, sino que son concentrados en pocos bursts distintivos. Lo mismo sucede con los correos electrónicos. La mayoría de correos son enviados en ráfagas de tiempo, no en forma constante durante todo el día. Así es con todas las actividades que realizamos. Más allá de movimientos exóticos, la mayoría de la vida de los individuos está confinada a un círculo físico estable, limitando nuestra movilidad a unos pocos y delineados lugares. El caso es que ahora podemos medir con eficiencia también la entropía. El deseo constante del ser humano de moverse todo el tiempo en base a tareas, motivaciones y responsabilidades y los sistemas estacionarios y repetitivos son los que dan cierta estabilidad a nuestras vidas. Pero la historia no es repetitiva, ni lo son nuestros deseos y motivaciones.

Podríamos tomar cientos de ejemplos de tracking social a través de la geolocalización. Como ejemplos, Barabási analizaba ya hace 7 años dos casos ya clásicos: 1) el genial proyecto de Hasan Elaki, quien a partir de ser perseguido por el FBI por su condición de musulmán, compartía todos sus movimientos cotidianos y transmitía sus patrones de comportamiento en la red;

2) whereisgeorge.com un trabajo que estudiaba el recorrido de billetes de dólar en EEUU. El estudio de la trayectoria aleatoria de los billetes sugería que nuestros patrones de movimiento son impredecibles.

Un ejemplo interesante que analiza Barabási es Researches on the Probability of Criminal and Civil Verdicts, la investigación de Siméon-Denis Poisson en 1837 (para fans de este tema, sugiero este trabajo de John Tabak (2004)). En ella, se demuestra que 4 de cada 1000 personas juzgadas como culpables son inocentes, según el cálculo de probabilidades. Tu puedes ser la persona más inteligente y suspicaz o las más limitada, pero si formas parte en un jurado, reconocerás la verdad de un crimen en el 90% de los casos. Pero nunca sabemos cuál se ha equivocado y cuál estuvo correcto. El cálculo de probabilidades no analiza individualmente, sino la acción colectiva y esto le otorga predecibilidad.

 

 

Submit a Comment

Your email address will not be published. Required fields are marked *

2 × three =

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>


Nei casi di sovradosaggio bisogna consultare un Nei casi di sovradosaggio bisogna consultare un buy original Australian cialis Cialis Tadalafil kopen Buy cheap Generic Viagra Online in South Africa viagra