Análisis de redes sociales: Detectando los bots del Kremlin con NodeXL y Gephi

lunes, 22 de febrero de 2016

Detectando los bots del Kremlin con NodeXL y Gephi

Análisis de redes sociales revela escala completa de la campaña de los bots twitteros del Kremlin

Global Voices

Fotos de los perfiles de una gran red de cuentas pro-Kremlin de Twitter. Imagen de Lawrence Alexander.

Con la ayuda de herramientas de código abierto, el investigador de Internet Lawrence Alexander reunió y visualizó los datos de casi 20.500 cuentas pro-Kremlin de Twitter, revelando la escala masiva de intentos de manipulación de la información sobre RuNet. En lo que es la primera parte de un análisis en dos partes, explica cómo lo hizo y lo que encontró.

RuNet Echo ha escrito anteriormente sobre los esfuerzos del "Ejército Troll" de la Federación de Rusia para inyectar las redes sociales y sitios web de medios de comunicación en línea con la retórica pro Kremlin. Twitter no es una excepción, y varios usuarios han observado cuentas de Twitter twitteando declaraciones similares durante y alrededor noticias de última hora y los eventos clave. Cada vez más activo a lo largo intervenciones de Rusia en Ucrania, estos "bots" se han diseñado para parecerse a los usuarios reales de Twitter, completas con los avatares.

Pero la evidencia en esta serie de dos puntos de análisis a su papel en un amplio programa de desinformación.

Alec Luhn, un periodista estadounidense presentación de informes sobre los asuntos rusos, observó cómo pocas horas después del tiroteo de Boris Nemtsov el 27 de febrero, un grupo de cuentas de Twitter que ya estaban tratando de influir en la narrativa:

Con la herramienta NodeXL de código abierto, recogí e importado una lista completa de las cuentas piar la frase exacta en una hoja de cálculo. De esa lista, también se reunieron y se importa una extensa comunidad de usuarios de Twitter, compuesto por los amigos y seguidores de cada cuenta. Que iba a ser una prueba interesante: si los insultos contra Nemtsov eran sólo un caso menor de difusión de rumores, que probablemente no provenir de más de unas pocas docenas de usuarios.

Pero una vez que el software había terminado el juntado de datos, la escala completa de la red fue revelada: la asombrosa cifra de 2.900 cuentas. Esta cifra es tal vez comprensible: para una falsa cuenta en Twitter sea creíble, que necesita un montón de seguidores-que a su vez requiere más robots de apoyo.

Luego utiliza Gephi, otra herramienta de análisis de datos de forma gratuita, para visualizar los datos como un gráfico de entidad-relación. Los círculos de colores-llamados nodos representan las cuentas de Twitter, y las líneas de intersección conocida como Bordes-se refieren a conexiones Siga / Seguidor entre cuentas. Las cuentas se agrupan en grupos de comunidades con código de color basado en el algoritmo de modularidad, que detecta grupos estrechamente interconectadas. El tamaño de cada nodo se basa en el número de conexiones que cuenta tiene con otros en la red.

La red extendida de 2.900 robots de Twitter tomadas de la muestra del thread Nemtsov. Imagen de Lawrence Alexander.

Es claro a partir de la forma densa y cerca uno del otro los nodos están en el gráfico que se trata de una red grande y muy conectado. La mayoría de los robots de seguir muchos otros, dándoles a cada uno una alta seguidor / recuento seguido. En la periferia, hay algunos anillos de cuentas conectadas menor, quizás, lo que indica que la red "bot" se sigue siendo "grande" en el momento de su captura; usted podría pensar en él como un árbol, con ramas extendidas hacia el exterior.

Pero había una cuestión crucial en este análisis: ¿cómo era posible para asegurarse de que la red consistía principalmente en los robots y no los seres humanos reales?

NodeXL no se limita a recoger información sobre quién sigue a quién. También adquiere metadatos los datos disponibles al público de cada cuenta de Twitter y su comportamiento. Esto demuestra que fuera de la red de 2.900 efectivos, 87% de los perfiles no tenía información zona horaria y el 92% no tiene favoritos de Twitter. Pero en una muestra aleatoria de 11.282 usuarios de Twitter promedio (basados en las cuentas que había twitteado la palabra "y") sólo el 51% no tenía ninguna zona horaria y revelador, sólo el 15% no tenía favoritos (ambos rasgos de lo que podría ser clasificado como "humano" comportamiento).

Para la comparación añadido, un gráfico de relaciones entre entidades de la red de control de usuario de Twitter aleatorizado se muestra a continuación. En contraste con la visualización robots, esta red tiene varios grupos inconexos y aislados: los grupos de usuarios de Twitter que no están vinculados entre sí, un acontecimiento perfectamente normal en un grupo aleatorio de usuarios.

Uso compartido de la palabra "y" resultados en grupos inconexos, aisladas en un grupo de usuarios al azar Twitter. Imagen de Lawrence Alexander.

Después de haber descubierto una red de este tipo a gran escala a partir de una única fuente, decidí tomar la cacería de bots más en profundidad. La búsqueda de Twitter para frases tales como "bots Kremlin", "trolls pro-rusos" y "sockpuppets Putin," me encontré con varios usuarios que comparten imágenes de una supuesta actividad bot. Algunos también utilizan los hashtag #Kremlinbots (# Кремлеботы) reportar avistamientos.

Usando el mismo método que con los tweets anti-Nemtsov, reuní las redes de cuentas basadas en el uso de algunas de las frases más importantes comunicados que reveló las comunidades más grandes -o, en algunos casos, sólo una lista de usuarios que aparecen en la pantalla. Estos fueron divididos en grupos etiquetados como A, B, C y D. (I se extenderá sobre la razón de esta agrupación en la segunda parte del análisis.)

@PressRuissa Es una cuenta de la parodia (actualmente suspendida) por suplantación de un medio de comunicación pro-ruso, una mezcla de sátira y el comentario de la desinformación y los prejuicios. Uno de sus tuits fue la fuente a partir de la red del Grupo:

El Grupo B vino de diferentes fuentes de cuentas bot sospechosos cuyo comportamiento parecía coincidir con las muestras anteriores. Algunos fueron identificados por su tendencia a cambiar de idioma ruso al Inglés con el mensaje solo error "RSS en modo fuera de línea", presumiblemente causada por una falla en su software de control.

RSS in offline mode

— Леонид Верхратский (@GCL2BUugsq4n5JL) April 1, 2015

Para las fuentes restantes, un tweet por Devin Ackles, analista de laboratorio de ideas CASO Ucrania sirvió de base para el Grupo C.
Y, por último, Vitaliy Moroz de Internews Ucrania compartió una screencap de cuentas bot que se formó la muestra para el Grupo D.

Los cuatro grupos se fusionaron en un solo conjunto de datos, lo que resulta en un total de 17.590 cuentas de Twitter. Al igual que con los que producen los tweets anti-Nemtsov, los metadatos confirmó que la gran mayoría eran de hecho los robots. 93% no mostró ninguna localización en su perfil, el 96% no tenía ninguna información de zona horaria y el 97% no tenía favoritos de Twitter se guardan.

Además, a pesar de haber producido una media de 2.830 tweets, las cuentas casi nunca interactuaron con otros usuarios de Twitter a través de @replies ó @mentions.

Los robots de los tweets de difusión, pero no interactúan. Imagen de Lawrence Alexander.
Curiosamente, muchos de los robots se les había dado nombres que suenan occidentales como barnardgrant, terancebarnaby, terencecoward y duncanstarks.

Pero un resultado aún más sorprendente vino cuando visualicé relaciones seguimiento de los grupos de bots. A pesar de que las muestras habían sido tomadas de cuatro fuentes separadas, se encontró que la red combinada de ser intensamente interconectado.

Todas las 17.590 cuentas de las cuatro fuentes. Tenga en cuenta las interconexiones apretados y la falta de grupos aislados. Imagen de Lawrence Alexander.

Esto contrasta fuertemente con la muestra de control aleatorio: el último conjunto de datos no mostró grupos aislados o atípicos en absoluto. Esto apoya firmemente la idea de que los robots fueron creados por una agencia común- y el peso de la evidencia apunta firmemente hacia Moscú.

En mi próximo post voy a mirar en la línea de tiempo de la creación de los robots, y ver cómo se correlaciona con acontecimientos políticos en Rusia y Ucrania.

Análisis de redes sociales

Páginas

lunes, 22 de febrero de 2016

Detectando los bots del Kremlin con NodeXL y Gephi

No hay comentarios:

Publicar un comentario