社交媒体中谣言的检测与消解外文翻译资料

 2023-03-13 12:03

社交媒体中谣言的检测与消解

原文作者 Arkaitz Zubiaga;ensp;Ahmet Aker;ensp;Kalina Bontcheva;ensp;Maria Liakata;ensp;Rob Procter 单位 University of Warwick, UK;ensp;University of Sheffield, UK and University of Duisburg-Essen, Germany;ensp;University of Sheffield, UK;ensp;University of Warwick and Alan Turing Institute, UK

摘要:尽管社交媒体平台越来越多地用于信息和新闻的收集,但其无节制的性质往往导致谣言的产生和传播,即发布时未经证实的信息项目。同时,社交媒体平台的开放性为研究用户如何分享和讨论谣言提供了机会,并利用自然语言处理和数据挖掘技术探讨如何自动评估谣言的准确性。本文介绍和讨论了在社交媒体上流传的两种谣言:长期流传的谣言和在快节奏的新闻事件中产生的新的谣言,这些谣言都是零碎的,而且在早期往往是身份不明的。本文对社交媒体谣言的研究现状进行了综述。

关键词:谣言检测;虚假信息;错误信息;谣言分类

1介绍

社交媒体平台越来越多地被用作收集信息的工具,例如,社会问题,并了解最新的发展在突发新闻报道中。这是可能的,因为这些平台让任何拥有联网设备的人都能实时分享自己的想法并且/或者发布他们可能正在目睹的事件的最新进展。因此,社会媒体已成为记者的有力工具也适用于普通公民。然而,虽然社交媒体提供了访问前所未有的信息来源,缺乏系统的平台努力来调节帖子也会导致错误信息的传播然后需要额外的努力来确定他们的来源和真实性。更新与突发新闻往往是零零碎碎地发布的,这就产生了很大的比例这些更新在发布时未经验证,其中一些可能会被证明是假。在没有权威声明证实或驳斥的情况下这是一个持续的谣言,据观察,社交媒体用户经常会在上面分享自己的想法它的真实性通过一个集体的,主观间的意义制造过程可能导致谣言背后的真相被曝光。然而,尽管社交媒体具有明显的健壮性,但它却越来越倾向于捐赠谣言的产生推动了系统的开发,通过收集和分析用户的集体判断,能够通过加速意义构建过程来减少谣言的传播和。一个谣言检测系统识别在其早期阶段,帖子的真实性状态是不确定的,可以有效地使用警告用户,他们的信息可能是错误的。同样的,一个谣言分类系统可以聚合用户发布的不断发展的、集体的判断帮助追踪谣言的真实性,因为它暴露在这个集体的意义构建过程中。在本文中,我们概述了开发所需的组件这样一个谣言分类系统,并讨论到目前为止,努力建立它的成功。

1.1谣言的定义和特征

谣言的定义。最近的研究文献中已经使用了谣言的定义它们彼此不同。例如,最近的一些研究错误地将谣言定义为一个项目,而大多数在文献中,谣言被定义为“未经证实的、有工具价值的相关信息”流通中的声明”(DiFonzo和Bordia, 2007年)。在我们的文章中,我们采用了谣言在发布时未经证实的定义特征,这是一致的根据《牛津英语词典》等主流词典对谣言的定义,该词典将谣言定义为“事实不确定或可疑的、目前广为流传的故事或报道”

韦氏词典将其定义为“不为人知的陈述或报告”权威为其真理”2。这些未经核实的信息可能是真实的,或部分或全部是真实的虚假的;或者,它也可能仍然悬而未决。因此,在本文中,我们始终坚持谣言的流行定义是将其归类为“一种传播信息的项目,其。在发布时,其准确性还有待验证。”这个定义的选择与社交媒体研究的一些最新文献;然而,它与主要的字典和社会科学的长期研究领域一致谣言可以被理解为尚未被证实的信息。因此,当它流通时,它的真值仍未得到解决。谣言被定义为未经证实,即没有证据支持或没有权威机构的官方确认来源(例如,那些被认为是值得信赖的)或可能具有可信度的来源在特定的背景下(例如,目击者)。谣言类型。有许多不同的因素可以按类型对谣言进行分类,包括谣言的类型最终的准确性值(真、假或未解决)或其可信度(例如,高或低)。另一种根据类型对谣言进行分类的方法是将谣言分为三类:(1)“白日梦式”的谣言:也就是说,导致一厢情愿想法的谣言;(2)“恐怖”谣言:即那些增加焦虑的谣言或恐惧;(3)“楔子驱动”谣言:即那些产生仇恨的谣言。当涉及到谣言分类体系的发展,在很大程度上决定了传播途径的走向被利用的是他们的时间特征:突发新闻中出现的新谣言。谣言出现在突发新闻通常是以前没有观察到的。因此,谣言需要自动检测,一个谣言分类系统需要能够处理新的,看不见的谣言,考虑到训练数据可用到系统可能与它以后所观察到的有所不同。在这些情况下,及早发现和解决谣言是至关重要的,需要实时处理一系列的帖子。一个在突发新闻中出现的谣言的例子是当一个人的身份疑似恐怖分子。谣言分类系统可能观察到其他类似的恐怖嫌疑人案件,但案件和涉及的姓名将最有可能是不同的。因此,在这些情况下设计一个谣言分类器将需要考虑新病例的出现,以及它们可能带来的新词汇。(2)长期存在,讨论时间较长的谣言。有些谣言可能会流传很长一段时间,但其真实性却无法确定。这些谣言激起了巨大的、持续的兴趣,尽管(或者也许正因为)难以确定实际情况。例如,有谣言称巴拉克bull;奥巴马(Barack Obama)是穆斯林。虽然这一说法未经证实,但似乎没有证据能帮助揭穿这个谎言,让每个人都满意的谣言就像这些,一个谣言分类系统可能不需要检测谣言,因为它可能是先天的。此外,本系统还可以利用历史上对该问题的讨论谣言将正在进行的讨论分类,在这些讨论中,词汇差异不大,因此,建立在旧数据上的分类器仍然可以用于新数据。相比新出现的谣言,对于长期存在的谣言,处理通常是回顾性的,因此,帖子不一定需要实时处理。在整篇文章中,我们都提到了这两种类型的谣言,并描述了如何用不同的方法来处理它们。

1.2研究谣言:从早期研究到社交媒体

一个简短的历史。谣言和相关现象从许多不同的角度被研究,从心理学研究到计算分析)。传统上,研究人的性格是非常困难的对谣言的反应,考虑到这将涉及实时收集作为谣言的反应展开,假设参与者已经被招募。为了克服这一障碍,Allport进行了战时背景下的早期调查谣言。他指出了研究谣言的重要性,并强调“有新闻价值的事件”

是否有可能滋生谣言”,以及“谣言的数量会随着当事人对当事人的重要性而变化,与证据的模糊性有关?争论的话题。rsquo;这让他提出了一个有待解答的动机性问题:“可以吗?科学地理解和控制谣言?(奥尔波特与邮差1946)。他1947年的实验揭示了一个关于谣言传播和信念的有趣事实。他研究了美国总统富兰克林·d·罗斯福是如何减轻关于美国遭受损失的谣言的1941年,美国海军在日本偷袭珍珠港事件上的表现。研究表明,在总统发表演讲的时候,69%的大学生认为损失是大于官方声明的;但五天后,总统在此期间做了演讲,只有46%的学生相信这种说法是正确的。本研究显示一个有名望的人发表官方声明对塑造社会观念的重要性关于谣言的准确性。早期的研究侧重于不同的目标。一些研究着眼于决定谣言传播的因素,例如,包括谣言可信度的影响谣言对其随后的传播,其中可信度指的是谣言的程度可能会被认为是诚实的。普拉萨德(1935)和辛哈(1952)的早期研究就提出了这一假设在自然灾害的背景下,可信度并不是影响谣言传播的一个因素。更多的然而,最近Jaeger等人(1980)发现,谣言传播更频繁的时间可信度很高。此外,Jaeger et al.(1980)和Scanlon(1977)发现,接收者感知到的谣言的重要性是决定其是否属实的一个因素传播,最不重要的谣言传播得更多。网上的谣言。互联网的广泛应用使中国进入了一个新阶段自然主义背景下的谣言研究(Bordia 1996),具有特别重要的意义社交媒体的出现,不仅为分享信息提供了强大的新工具但也便于从大量参与者中收集数据。例如,Takayasu等人。利用社交媒体研究了2011年日本的一个谣言的传播地震后的降雨可能含有有害化学物质并导致人们被警告要带伞。作者研究了早期的转发报道这一谣言的推文,以及后来报道这是假的推文。虽然他们的研究表明,后期更正推文的出现减少了推文报道的扩散对于虚假谣言,分析仅限于单个谣言,并没有提供足够的洞见了解社交媒体上谣言的本质。然而,他们的案例研究确实显示了这一点这是一个对社会产生重要影响的谣言的例子,因为公民们都在追随关于地震的最新消息,确保安全。社交媒体上的谣言。社交媒体作为谣言研究的一个来源已经开始流行起来近年来,这两个原因都是因为它是一个有趣的数据源,用于收集相关的大型数据集谣言四起,也因为它庞大的用户基础和分享的便利这是谣言滋生的沃土。研究普遍发现,Twitter在这方面做得很好,作为用户,通过众包的自我修正特性来揭穿不准确的信息分享观点、猜想、观点和证据。例如,Castillo等人发现比率。在2010年的智利地震中,支持和驳斥虚假谣言的推文比例为1:1(支持和驳斥的推文比例为1比1)。Procter等人(2013b)在分析2011年英国骚乱期间的虚假谣言时得出了类似的结论自我纠正的效果可能很慢。相比之下,在他们对2013年波士顿马拉松赛的研究中发现Twitter用户在区分真相和恶作剧方面做得不太好。研究了三种不同的谣言后,他们发现44:1, 18:1和5:1支持支持虚假谣言的推文。深入研究时间在谣言扩散和支持方面,Zubiaga等人对9个突发新闻事件中传播的谣言进行了分析。本研究的结论是,虽然总体趋势是对于在早期阶段支持未经证实的谣言的用户来说,有一种转向支持真实的趋势谣言和揭穿虚假谣言随着时间的推移。社交媒体的聚合能力一个庞大的社区用户的判断从而激发了进一步的研究机器学习方法改进谣言分类系统。尽管挑战谣言和错误信息的传播造成了这种系统的发展,打破了将开发过程分解为更小的组件,并使用适当的技术是否在开发有效的系统以帮助人们的方面取得了令人鼓舞的进展决定评估从社交媒体收集的信息的真实性。

1.3范围和组织

这篇调查文章的动机是越来越多的使用社交媒体平台,如Facebook或者在Twitter上发布和发现信息。虽然我们承认它们在收集独家信息方面毫无疑问的有用性,但它们的开放性、缺乏节制性和易用性有了它,信息可以从任何地方,任何时间发布无疑会导致重

剩余内容已隐藏,支付完成后下载完整资料


Detection and Resolution of Rumours in Social Media: A Survey

ARKAITZ ZUBIAGA, University of Warwick, UK 32

AHMET AKER, University of Sheffield, UK and University of Duisburg-Essen, Germany

KALINA BONTCHEVA, University of Sheffield, UK

MARIA LIAKATA and ROB PROCTER, University of Warwick and Alan Turing Institute, UK

Despite the increasing use of social media platforms for information and news gathering, its unmoderated nature often leads to the emergence and spread of rumours, i.e., items of information that are unverified at the time of posting. At the same time, the openness of social media platforms provides opportunities to study how users share and discuss rumours, and to explore how to automatically assess their veracity, using natural language processing and data mining techniques. In this article, we introduce and discuss two types of rumours that circulate on social media: long-standing rumours that circulate for long periods of time, and newly emerging rumours spawned during fast-paced events such as breaking news, where reports are released piecemeal and often with an unverified status in their early stages. We provide an overview of research into social media rumours with the ultimate goal of developing a rumour classification system that consists of four components: rumour detection, rumour tracking, rumour stance classification, and rumour veracity classification. We delve into the approaches presented in the scientific literature for the development of each of these four components. We summarise the efforts and achievements so far toward the development of rumour classification systems and conclude with suggestions for avenues for future research in social media mining for the detection and resolution of rumours.

CCS Concepts: bull; Information systems Social networking sites; bull; Human-centered computing Collaborative and social computing;bull; Computing methodologies Natural language processing; Machine learning;

Additional Key Words and Phrases: Rumour detection, rumour resolution, rumour classification, misinfor- mation, disinformation, veracity, social media

ACM Reference format:

Arkaitz Zubiaga, Ahmet Aker, Kalina Bontcheva, Maria Liakata, and Rob Procter. 2018. Detection and Reso- lution of Rumours in Social Media: A Survey. ACM Comput. Surv. 51, 2, Article 32 (February 2018), 36 pages. https://doi.org/10.1145/3161603

This article has been supported by the PHEME FP7 Project (Grant No. 611233), the EPSRC Career Acceleration Fellowship No. EP/I004327/1, the COMRADES H2020 Project (Grant No. 687847), and the SoBigData Research Infrastructure (Grant No. 654024). We wish to thank the Alan Turing Institute for its support.

Authorsrsquo; addresses: A. Zubiaga, M. Liakata, and R. Procter, University of Warwick, Department of Computer Science, Gibbet Hill Road, Coventry CV4 7AL, United Kingdom; emails: {a.zubiaga, m.liakata, rob.procter}@warwick.ac.uk; A. Aker, Univer- sitauml;t Duisburg-Essen, Campus Duisburg, Arbeitsgruppe “Informationssysteme”, Fakultauml;t fuuml;r Ingenieurwissenschaften, Abt. Informatik und Angew. Kognitionswissenschaft, 47048 Duisburg, Germany; email: a.aker@is.inf.uni-due.de; K. Bontcheva, University of Sheffield, Department of Computer Science, Regent Court, 211 Portobello, Sheffield S1 4DP, United Kingdom; email: k.bontcheva@sheffield.ac.uk.

This work is licensed under a Creative Commons Attribution International 4.0 License.

2018 Copyright is held by the owner/author(s). ACM 0360-0300/2018/02-ART32 $15.00

https://doi.org/10.1145/3161603

INTRODUCTION

Social media platforms are increasingly being used as a tool for gathering information about, for example, societal issues (Lazer et al. 2009), and to find out about the latest developments during breaking news stories (Phuvipadawat and Murata 2010). This is possible because these platforms enable anyone with an internet-connected device to share in real-time their thoughts and/or to post an update about an unfolding event that they may be witnessing. Hence, social media has become a powerful tool for journalists (Diakopoulos et al. 2012; Tolmie et al. 2017) but also for ordinary citizens (Hermida 2010). However, while social media provides access to an unprecedented source of information, the absence of systematic efforts by platforms to moderate posts also leads to the spread of misinformation (Procter et al. 2013b; Webb et al. 2016), which then requires extra effort to establish their provenance and veracity. Updates associated with breaking news stories are often released piecemeal, which gives rise to a significant proportion of those updates being unverified at the time of posting, some of which may later be proven to be false (Silverman 2015a). In the absence of an authoritative statement corroborating or debunking an ongoing rumour, it is observed that social media users will often share their own thoughts on its veracity via a process of collective, inter-subjective sense-making (Tolmie et al. 2018) that may lead to the exposure of the truth behind the rumour (Procter et al. 2013a; Li and Sakamoto 2015). Nevertheless, despite this apparent robustness of social media, its increasing tendency to give rise to rumours motivates the development of systems that, by gathering and analysing the collec- tive judgements of users (Lukasik et al. 2016), are able to reduce the spread of rumours by acceler- ating the sense-making process (Derczynski and Bontcheva 2014). A rumour detection system that identifies,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[596822],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。