Uno de los problemas que afectan hoy a nivel mundial es la propagación de noticias falsas o “fake news” a través de las redes sociales. Es por ello que diversas plataformas como Facebook o Twitter, diseñan nuevos métodos para combatir este fenómeno.

Un sistema basado en algoritmos que identifique señales lingüísticas reveladoras en noticias falsas podría proporcionar agregador de noticias y sitios de redes sociales como Google News con una nueva arma en la lucha contra la desinformación.

Los investigadores de la Universidad de Michigan que desarrollaron el sistema y han demostrado que es comparable y, a veces, mejor que los humanos para identificar correctamente las noticias falsas.

En un estudio reciente, encontró falsificaciones con éxito hasta el 76 por ciento del tiempo, en comparación con una tasa de éxito humano del 70 por ciento. Además, su enfoque de análisis lingüístico podría utilizarse para identificar artículos de noticias falsas que son demasiado nuevos para ser desacreditados al hacer referencias cruzadas de sus hechos con otras historias.

Rada Mihalcea, el profesor de informática e ingeniería de U-M detrás del proyecto, dijo que una solución automatizada podría ser una herramienta importante para los sitios que luchan por lidiar con una avalancha de noticias falsas, a menudo creadas para generar clics o manipular la opinión pública.

Captar historias falsas antes de que tengan consecuencias reales puede ser difícil, ya que los sitios de agregadores y redes sociales actuales dependen en gran medida de editores humanos que a menudo no pueden mantenerse al día con la afluencia de noticias. Además, las técnicas de depuración actuales a menudo dependen de la verificación externa de los hechos, lo que puede ser difícil con las historias más recientes. A menudo, cuando una historia se prueba como falsa, el daño ya está hecho.

El análisis lingüístico toma un enfoque diferente, analizando atributos cuantificables como la estructura gramatical, la elección de palabras, la puntuación y la complejidad. Funciona más rápido que los humanos y se puede usar con una variedad de diferentes tipos de noticias.

 

“Puedes imaginar cualquier cantidad de aplicaciones para esto en la parte delantera o trasera de un sitio de noticias o redes sociales”, dijo Mihalcea. “Podría proporcionar a los usuarios una estimación de la confiabilidad de historias individuales o un sitio de noticias completo. O podría ser una primera línea de defensa en la parte posterior de un sitio de noticias, marcando historias sospechosas para su posterior revisión. Una tasa de éxito del 76 por ciento deja un margen de error bastante grande, pero aún puede proporcionar información valiosa cuando se usa junto con los humanos “.

Los algoritmos lingüísticos que analizan el discurso escrito son bastante comunes en la actualidad, dijo Mihalcea. El desafío de construir un detector de noticias falso no reside en construir el algoritmo en sí mismo, sino en encontrar los datos correctos para entrenar ese algoritmo.

Las noticias falsas aparecen y desaparecen rápidamente, lo que dificulta su recopilación. También viene en muchos géneros, complicando aún más el proceso de recolección. Las noticias satíricas, por ejemplo, son fáciles de recopilar, pero su uso de la ironía y el absurdo lo hacen menos útil para entrenar un algoritmo para detectar noticias falsas que están destinadas a inducir a error.

En última instancia, el equipo de Mihalcea creó sus propios datos, colaborando con un equipo en línea que realizó ingeniería inversa de noticias auténticas verificadas en falsificaciones. Así es como la mayoría de las noticias falsas reales se crean, dijo Mihalcea, por personas que las escriben rápidamente a cambio de una recompensa monetaria.

A los participantes del estudio, reclutados con la ayuda de Amazon Mechanical Turk, se les pagó para convertir noticias breves y reales en noticias similares pero falsas, imitando el estilo periodístico de los artículos. Al final del proceso, el equipo de investigación tenía un conjunto de datos de 500 noticias reales y falsas.

Luego alimentaron estos pares de historias etiquetadas con un algoritmo que realizó un análisis lingüístico, enseñándose a sí mismo a distinguir entre las noticias reales y las falsas. Finalmente, el equipo convirtió los algoritmos en un conjunto de datos de noticias reales y falsas extraídas directamente de la web, con una tasa de éxito del 76%.

Los detalles del nuevo sistema y el conjunto de datos que el equipo usó para construirlo están disponibles gratuitamente, y Mihalcea dice que podrían ser utilizados por sitios de noticias u otras entidades para construir sus propios sistemas de detección de noticias falsos. Ella dice que los sistemas futuros podrían perfeccionarse aún más mediante la incorporación de metadatos, como los enlaces y los comentarios asociados con una determinada noticia en línea.

Un documento que detalla el sistema será presentado el 24 de agosto en la 27ª Conferencia Internacional de Lingüística Computacional en Santa Fe, NM. Mihalcea trabajó con la investigadora asistente de ingeniería e ingeniería de la UM Veronica Pérez-Rosas, el investigador de psicología Bennett Kleinberg en la Universidad de Amsterdam y Estudiante de pregrado de la UM Alexandra Lefevre.

El documento se titula “Detección automática de noticias falsas”. La investigación fue respaldada por el Instituto de Ciencias de Datos de Michigan de U-M y por la National Science Foundation (número de concesión 1344257).

Con información de: Umich

Por chiquenito_2

Justicia e Igualdad para todos, por un cambio en donde México prospere en todos los sentidos, no más corrupción, no más corruptos.