Uso de las historias de April Fools para identificar "noticias falsas" maliciosas

0
18
views

Mejora tu posicionamiento en las redes sociales con COOMMU!



<div _ngcontent-c14 = "" innerhtml = "

Los investigadores & nbsp; están desarrollando nuevas formas de identificar historias de noticias engañosas en línea.

Pixabay

Resulta el 1 de abril st ] bueno para al menos una cosa: ayudar a los investigadores de idiomas a identificar “noticias falsas” más maliciosas. No es broma.

El estudiante de doctorado Edward Dearden y su asesor, el Dr. Alistair Baron, de la Escuela de Computación y Comunicaciones de la Universidad de Lancaster, & nbsp; han ideado una manera constructiva de utilizar las historias de engaño de April Fools Day que aparecen en Internet. La pareja las está utilizando para estudiar un lenguaje engañoso con la esperanza de ofrecer una perspectiva de cómo detectar lo que muchos han llegado a llame a "noticias falsas".

Por supuesto, noticias falsas es un término complicado, que incluso puede volverse peligroso cuando se compara con autores y lectores que simplemente tienen una perspectiva diferente. En este caso, la definición es más restringida y se refiere a deliberada y malversación maliciosa Información disfrazada de periodismo legítimo.

Dearden señala que los artículos de April Fools proporcionaron " un cuerpo verificable de textos engañosos ”y se aclararon en un correo electrónico:

También existe el problema de la subjetividad y el derecho de las personas a expresar sus opiniones. . Etiquetar las cosas como verdaderas o falsas puede ser una pendiente resbaladiza para bajar. Una cosa atractiva de los engaños de April Fools es que todos pueden estar de acuerdo en que no son ciertos.

 

Los autores, que estudian la desinformación y el engaño en línea de manera más general, recopilaron artículos de April Fools de más de 370 sitios web por valor de 14 años. Terminaron con más de 500 artículos y compararon estas piezas de engaño con artículos legítimos escritos en el mismo período de tiempo general. Su análisis reveló que aquellos que intentan escribir ficción disfrazada de hecho utilizan algunas de las mismas técnicas estilísticas.

Al comparar los artículos falsificados con noticias legítimas, Dearden y Baron prestaron especial atención a la cantidad de detalles utilizados, la vaguedad del lenguaje. , la formalidad del estilo de escritura del autor y la complejidad de su lenguaje.

A continuación, tomaron un conjunto de datos de un estudio de 2017 sobre "noticias falsas" (y, más específicamente, cómo las historias se titulan) que identificaron las características comunes de las noticias engañosas y maliciosas. Si bien no es una forma segura de identificar tales historias, los investigadores encontraron que muchas "noticias falsas", en comparación con noticias legítimas y no engañosas, son más cortas, más fáciles de leer, escritas en un lenguaje simplista y menos formales (a menudo se usan nombre de pila). Estas historias (y sus títulos) también contienen más nombres propios, pronombres en primera persona, profanidad y errores de ortografía, y menos signos de puntuación y fechas.

En comparación con las noticias no diseñadas para engañar a los lectores Las historias de April Fools también fueron más cortas, más fáciles de leer y usaron más pronombres en primera persona. Pero también contenían más palabras únicas, oraciones más largas y menos nombres propios. Las historias falsas también tienden a referirse a eventos vagos en el futuro, contienen más referencias al presente y mencionan menos eventos pasados.

No es sorprendente que los nombres, lugares y fechas y horarios específicos, sean parte integral de contextualizar una noticia. historia: aparece con menos frecuencia tanto en las historias de April Fools como en las "noticias falsas". También tiene sentido que los nombres propios, como los nombres de los políticos, se encuentren más comúnmente en "noticias falsas".

Pero los investigadores señalaron que el uso de los pronombres en primera persona, como "nosotros", fue inesperadamente prominente en las historias engañosas, ya que aquellos que intentan ocultar la verdad tienden a no usarlos.

La siguiente tarea de Dearden y Baron fue crear un clasificador de aprendizaje automático para identificar si un artículo fue un engaño de April Fools, noticias falsas o noticias genuinas. Su algoritmo logró identificar los artículos de April Fools con precisión el 75% del tiempo y las noticias falsas con una tasa de precisión del 72%.

Pero el verdadero desafío era ver si podían capacitar al clasificador en los datos de las historias de April Fools y luego usarlo para predecir noticias falsas: eso mostraría cuán útiles serán esas historias del 1 de abril para mejorar nuestra comprensión de las similitudes lingüísticas entre los dos tipos de historias. Al final, los datos de April Fools permitieron al clasificador identificar otras noticias falsas con una tasa de precisión superior al 65%.

Existe una gran cantidad de investigaciones sobre la categoría de investigación de inteligencia artificial que trata sobre sistemas de aprendizaje automático que procesan procesos naturales. idioma. Los sistemas basados ​​en algoritmos que identifican señales lingüísticas están en desarrollo en varias universidades y empresas con la esperanza de desarrollar detectores de "noticias falsas" para luchar contra la desinformación descarada y deliberada. Los editores humanos simplemente no pueden mantenerse al día, por lo que los investigadores están trabajando activamente para combatir algunas de las campañas de engaño más peligrosas, que a menudo se propagan rápidamente a través de las redes sociales. Las máquinas que pueden realizar análisis lingüísticos en atributos cuantificables como la gramática, la selección de palabras y la puntuación tienen muchas más posibilidades de interceptar historias potencialmente perjudiciales.

Pero los investigadores también son conscientes de las dificultades en para juzgar lo que cuenta como "Falso" o legítimo. Una de las razones por las que aún no tenemos una gran cantidad de detectores de noticias falsas en las que confiar es que los investigadores se han comprometido a realizar pruebas más rigurosas de los algoritmos de AI, así como a formas de recopilar datos para capacitar a los sistemas. [19659004] Como me explicó Dearden, su investigación es solo una pieza del rompecabezas y no una lista de verificación exhaustiva que las personas puedan usar de manera confiable para identificar copias engañosas con perfecta precisión:

El objetivo de nuestra investigación es tratar de entender el idioma utilizado en artículos de noticias falsas y para ver cómo esto se relaciona con los tipos de desinformación a los que hemos llegado a referirnos como 'noticias falsas'. Ninguna de las características que analizamos en nuestro artículo es la bala de plata para detectar noticias falsas. [19659020] Pero la investigación puede ayudar a las personas a detectar algunos signos de advertencia y ser más conscientes de lo que están leyendo. Mientras que instruir a las personas sobre formas de pensar críticamente y verificar las noticias está más allá del alcance de este estudio de investigación en particular, Dearden mencionó que su trabajo en la enseñanza de computadoras para detectar textos engañosos es una pieza importante del rompecabezas.

Hay una gran cantidad de Trabajo realmente interesante en la lucha contra la desinformación en este momento. Es particularmente importante porque la sociedad está realmente luchando para adaptarse al volumen de información que ahora está disponible y tiene consecuencias reales. Con suerte, la comunidad de investigación puede desarrollar métodos que nos ayuden a abordar este problema y minimizar sus efectos en el futuro.

Dearden y Baron presentarán esta investigación en la 20ª Conferencia Internacional sobre Lingüística Computacional y Procesamiento de Texto Inteligente, que se celebrará en La Rochelle, Francia, más tarde en abril.

">

Los investigadores están desarrollando nuevas formas de identificar historias de noticias engañosas en línea.

Pixabay

Resulta que el 1 de abril st es bueno para Al menos una cosa: ayudar a los investigadores de idiomas a identificar “noticias falsas” más maliciosas. No es broma.

El estudiante de doctorado Edward Dearden y su asesor, el Dr. Alistair Baron, de la Escuela de Computación y Comunicaciones de la Universidad de Lancaster, han ideado un forma constructiva de utilizar las historias de engaño de April Fools Day que aparecen en Internet. La pareja las está utilizando para estudiar el lenguaje engañoso con la esperanza de ofrecer una perspectiva de cómo detectar lo que muchos Por supuesto, las noticias falsas son un término complicado, que incluso puede volverse peligroso cuando se compara con autores y lectores que simplemente tienen una perspectiva diferente. En este caso, la definición es más restringida y se refiere a información errónea deliberada y maliciosa disfrazada de periodismo legítimo.

Dearden señala que los artículos de April Fools proporcionaron "un cuerpo verificable de textos engañosos" y se aclararon en un correo electrónico:

También el problema de la subjetividad y el derecho de las personas a expresar sus opiniones. Etiquetar las cosas como verdaderas o falsas puede ser una pendiente resbaladiza para bajar. Una cosa atractiva de los engaños de April Fools es que todos pueden estar de acuerdo en que no son ciertas.

Los autores, que estudian la desinformación y el engaño en línea de manera más general, recopilaron artículos de April Fools de más de 14 años en más de 370 sitios web. Terminaron con más de 500 artículos y compararon estas piezas de engaño con artículos legítimos escritos en el mismo período general. El análisis reveló que aquellos que intentan escribir ficción disfrazada como un hecho utilizan algunas de las mismas técnicas estilísticas.

Al comparar los artículos falsificados con noticias legítimas, De Arden y Baron prestaron especial atención a la cantidad de detalles utilizados, la vaguedad del lenguaje, la formalidad del estilo de escritura del autor y la complejidad de su idioma.

A continuación, tomaron un conjunto de datos de a 2017 el estudio sobre "noticias falsas" (y, más específicamente, sobre cómo se titulan tales historias) que identificó las características comunes de las noticias engañosas y maliciosas. Si bien no es una forma segura de identificar tales historias, los investigadores encontraron que muchas "noticias falsas", en comparación con noticias legítimas y no engañosas, son más cortas, más fáciles de leer, escritas en un lenguaje simplista y menos formales (a menudo se usan nombre de pila). Estas historias (y sus títulos) también contienen más nombres propios, pronombres en primera persona, profanidad y errores de ortografía, y menos signos de puntuación y fechas.

En comparación con las noticias no diseñadas para engañar a los lectores Las historias de April Fools también fueron más cortas, más fáciles de leer y usaron más pronombres en primera persona. Pero también contenían más palabras únicas, oraciones más largas y menos nombres propios. Las historias falsas también tienden a referirse a eventos vagos en el futuro, contienen más referencias al presente y mencionan menos eventos pasados.

No es sorprendente que los nombres, lugares y fechas y horarios específicos, sean parte integral de contextualizar una noticia. historia: aparece con menos frecuencia tanto en las historias de April Fools como en las "noticias falsas". También tiene sentido que los nombres propios, como los nombres de los políticos, se encuentren más comúnmente en "noticias falsas".

Pero los investigadores señalaron que el uso de los pronombres en primera persona, como "nosotros", fue inesperadamente prominente en las historias engañosas, ya que aquellos que intentan ocultar la verdad tienden a no usarlos.

La siguiente tarea de Dearden y Baron fue crear un clasificador de aprendizaje automático para identificar si un artículo fue un engaño de April Fools, noticias falsas o noticias genuinas. Su algoritmo logró identificar los artículos de April Fools con precisión el 75% del tiempo y las noticias falsas con una tasa de precisión del 72%.

Pero el verdadero desafío era ver si podían capacitar al clasificador en los datos de las historias de April Fools y luego usarlo para predecir noticias falsas: eso mostraría cuán útiles serán esas historias del 1 de abril para mejorar nuestra comprensión de las similitudes lingüísticas entre los dos tipos de historias. Al final, los datos de April Fools permitieron al clasificador identificar otras noticias falsas con una tasa de precisión superior al 65%.

Existe una gran cantidad de investigaciones sobre la categoría de investigación de inteligencia artificial que trata sobre sistemas de aprendizaje automático que procesan procesos naturales. idioma. Los sistemas basados ​​en algoritmos que identifican señales lingüísticas están en desarrollo en varias universidades y empresas con la esperanza de desarrollar detectores de "noticias falsas" para luchar contra la desinformación descarada y deliberada. Los editores humanos simplemente no pueden mantenerse al día, por lo que los investigadores están trabajando activamente para combatir algunas de las campañas de engaño más peligrosas, que a menudo se propagan rápidamente a través de las redes sociales. Las máquinas que pueden realizar análisis lingüísticos en atributos cuantificables como la gramática, la selección de palabras y la puntuación tienen muchas más posibilidades de interceptar historias potencialmente perjudiciales.

Pero los investigadores también son conscientes de las dificultades en para juzgar lo que cuenta como "Falso" o legítimo. Una de las razones por las que aún no tenemos una gran cantidad de detectores de noticias falsas en las que confiar es que los investigadores se han comprometido a realizar pruebas más rigurosas de los algoritmos de AI, así como a formas de recopilar datos para capacitar a los sistemas. [19659004] Como me explicó Dearden, su investigación es solo una pieza del rompecabezas y no una lista de verificación exhaustiva que las personas puedan usar de manera confiable para identificar copias engañosas con perfecta precisión:

El objetivo de nuestra investigación es tratar de entender el idioma utilizado en artículos de noticias falsas y para ver cómo esto se relaciona con los tipos de desinformación a los que hemos llegado a referirnos como 'noticias falsas'. Ninguna de las características que analizamos en nuestro artículo es la bala de plata para detectar noticias falsas. [19659020] Pero la investigación puede ayudar a las personas a detectar algunos signos de advertencia y ser más conscientes de lo que están leyendo. Mientras que instruir a las personas sobre formas de pensar críticamente y verificar las noticias está más allá del alcance de este estudio de investigación en particular, Dearden mencionó que su trabajo en la enseñanza de computadoras para detectar textos engañosos es una pieza importante del rompecabezas.

Hay una gran cantidad de Trabajo realmente interesante en la lucha contra la desinformación en este momento. Es particularmente importante porque la sociedad está realmente luchando para adaptarse al volumen de información que ahora está disponible y tiene consecuencias reales. Con suerte, la comunidad de investigación puede desarrollar métodos que nos ayuden a abordar este problema y minimizar sus efectos en el futuro.

Dearden y Baron presentarán esta investigación en la 20ª Conferencia Internacional sobre Lingüística Computacional y Procesamiento de Texto Inteligente, que se celebrará en La Rochelle, Francia a finales de abril.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here