Muchas gracias a todos por vuestro interés y por vuestras preguntas. Si os animáis a realizar análisis de datos sociales dadle un vistazo a las herramientas que tengo publicadas en github github.com/congosto, así no empezareis desde cero. Para análisis de redes os recomiendo gephi.
Un abrazo
Hola! Creo que la fiebre de las redes sociales se pasará y que le daremos un uso más racional. No creo que la vida virtual se imponga sobre la analógica. Las cosas cambian muy rápido en Internet y pueden surgir cosas nuevas pero perteneceremos a un territorio no a una nube
#58 No sé si lo he entendido bien.
Si te refieres a que la atención se divida entre un evento político y otro de entretenimiento, ganará este segundo sin ninguna duda. La atención se reparte mal. Las cosas ocurren en un contexto y hay que tenerlo en cuenta en el análisis
Si te refieres que pueden tener HT que comparta un evento político y uno de entretenimiento, entonces habrá que filtrar los falsos positivos
Eran dos millones de tweets. el grafo lo tuve que hacer de un solo día (el (8M) me tardo siglos en mi ordenador pero pude separar las distintas comunidades y de allí sacar los más difundido de cada comunidad y las fotos más difundidas. con mucha paciencia se puede construir el mapa de lo que ocurrió, como se movió y qué impacto.
A mano solo miro al final, procuro que en la clasificación por RTs entren todos los usuarios. Si no entran se puede seleccionar los usuarios más activos-mas difundidos, por ejemplo los 500.000 de mayor grado, que eso si entra en gephi
El grafo de Rts de va a dar una clasificación bastante ajustada dad la naturaleza endogamia de la retransmisión
Creo que el camino es:
Separar por comunidades
analizar por comunidades: discurso, fotos, infuencers de la comunidad
Si hay algo que te llame la atención, profundizar en ello
En el 2018 me quedaban PP,CS y VOX en la misma comunidad
Mucha suerte con el TFM
f
#42 No he entrado en ese tipo de tecnologías porque para entrenar el modelo tienen que tener muchos datos y son muy cambiantes de una caso a otro. Por ahora la clasificación de perfiles usando análisis de red me da muy buen resultado. No descarto enredar con estas tecnología si tengo gatos suficientes y tiempo para entrenar
#37 Contra la sincronización externa se puede aplicar un análisis temporal y de concurrencia de ciertos perfiles. Con unos cuantos TT de un partido se podrían detectar patrones de funcionamiento y los agentes que los mueven. Con ML lo veo complicado para alimentar el modelo por el uso de ciertos tópicos (varían mucho y son impredecibles) pero veo más factible tener identificados los posibles perfiles organizados y ver cuando su comportamiento se sale del patrón normal y entran en "campaña"
Las tendencias son campañas y por tanto se organizan con mejores o peores prácticas. En marketing interesan mucho porque dan una visibilidad más allá de la red de contactos.
#31 Hola! me alegro que lo preguntes. Las herramientas que uso para bajar datos de Twitter y procesarlos están disponibles en github (github.com/congosto). Luego se puede usar Gephi para análisis de redes y alguna herramienta de visualización como tableau public para análisis de series temporales. No es demasiado complicado hacer estos análisis
#30 La AI y su dilema ético da para otro debate. A mi me preocupa que haya algoritmos de AI que no son transparentes y sobre los que se tomen decisiones. Los datos son una arma de doble filo, pueden servir para mejorarnos la vida y evitar riesgos (la trilogía de la Fundación) o para controlar al ciudadano, cómo se está haciendo en China. Por ahora, Europa es el más respetuoso con el uso de los datos.
#29 Los datos no tienen opinión, solo miden. Lo que se mide por Twitter no tiene nada que ver con los resultados finales porque hay mucha sobreactuación de unos y silencio de otros. De los datos podemos sacar una foto de un periodo de bombardeo de mensajes y de cómo reaccionamos ante ellos.
#22 Se suele echar la culpa a elementos externos y no se mira en casa. Conspiraciones las ha habido siempre, pero creo que el mundo es tan complejo que no se puede simplificar así, echándole la culpa a un grupo de poder. El dinero mueve mucho pero no puede controlar todas las variables aunque intentará que la coyuntura social le sea favorable.
Creo que las redes sociales en sus inicios hasta el 2012 eran una válvula de escape a ese poder pero ahora cada vez lo son menos.
Confío que el INE nos de los datos sin sesgo. Otra cosa es internar bajarlos de su portal, que no es nada fácil ni intuitivo
#21 Como muchas personas que creen el bulo que si te pica un mosquito te quedas embarazada. Te sorprendería la de personas que creen que no hemos ido a la luna y cosas similares. Si se ha repetido un bulo hasta la saciedad, al final lo dar por cierto. Además, la gente se cree lo que reafirma sus ideas.
Normalmente los desmentidos tienen menos recorrido que la propagación de la mentira
#17 Hola! cuando se hacen análisis hay que tener en cuenta el ruido y como también se tiene historia de tiempos menos ruidosos se puede comparar. Las redes sociales amplían los canales de comunicación con poco coste. Esto hace que cada causa intente difundir su mensaje lo más posible con buenas o malas prácticas. Antes en Twitter predominaban opiniones progresistas pero desde una año a esta parte eso ha cambiado y podemos ver mensajes xenofónos, antifeministas u homófobos muy explícitos. Esto puede hacer que ciertas personas que no tuvieran una opinión muy formada en estos temas, las adopten. y otras que viendo que es una corriente de opinión en auge se dejen llevar. No sé si esto tendrá un límite
#11 Antes del big data los políticos se han guiado por las encuestas. Ahora tienen más posibilidades para averiguar que queremos oír. Nos va a llegar un mensaje adaptado más al corazón que a la razón y muy segmentado. Datos y tecnología existen para hacerlo. En el caso de Twitter la segmentación no está resuelta pero en Facebook se puede hacer llegar el mensaje muy segmentado. En nuestra mano está el creerlo o no
#14 lHola! Las granjas de bots y los perfiles falsos intentan convencernos de ciertas opciones políticas tienen muchos seguidores. Algo tan antiguo como la entrada de clac los teatros para aplaudir pero en este caso a escala industrial. Hay pistas para identificarlos: fecha reciente de creación del perfil (creado para la campaña). fecha antigua con pocos tuits (cuenta comprada). foto de perfil de un banco de imágenes, incoherencia entre foto, descripción o contenidos. Uso de herramientas de escritorio como tweetdeck, etc..Hay que ignóralos, no entrar en polémica con los trols y no darles visibilidad. Tenemos que tener actitudes más analógicas como leer los programas y reflexionar sobre nuestro voto. Las redes sociales no es buen lugar para dejarse llevar.
#9 Las redes abiertas es lo único que tenemos para investigar. Tienen mucho ruido y va en aumento pero hay que buscar mecanismos para identificarlo. Yo estoy en ello. Las plataformas no va a ayudar pero la gente va siendo consciente de ese ruido y lo va identificando. La comunicación es poder y siempre existirá la manipulación, pero no por eso hay que tirar la toalla y dejar de averiguar que pasa
Un abrazo
Mariluz