火星科技网您的位置:首页 >科创 >

通过人工智能在线查找错误信息

导读 我们生活在一个信息太多的时代——无休止的状态更新、模因、转发、信息图、报价和标签每天都在我们的社交媒体上滚动,旨在表达观点、鼓励团

我们生活在一个信息太多的时代——无休止的状态更新、模因、转发、信息图、报价和标签每天都在我们的社交媒体上滚动,旨在表达观点、鼓励团结、提供信息、改变想法或引起争议。

问题在于,普通的在线浏览器/社交媒体用户没有时间或金钱去调查他们的Feed上显示的所有内容的合法性或来源。正是这个漏洞,让不太谨慎的内容生产者利用这些漏洞传播错误信息。结果可能是从一点点尴尬到彻底改变人生或者可能致命的后果。

对于加州大学圣巴巴拉分校的计算机科学家金威廉来说,这片混乱的沼泽是探索的沃土。王先生认为,当在文本和超链接网络上的在线帖子和新闻文章中部署深度学习技能时,可以帮助我们解决一些批判性思维。这个概念是他为期三年的项目“发电机:动态多通道误差信息建模”的核心。

“所以现在的问题是,给定一个帖子,你怎么能理解它是否是具体的误导,或者它是否是一个真实的帖子?”王说。“此外,由于网络的结构,什么可以被识别为传播错误信息,它与标准或非标准文章有何不同?”

非常高的等级。

这是一项艰巨的任务,尤其是在社交媒体领域。它已经开始了合法和已建立的新闻网站和可疑网站之间的竞争。这些网站都想尽办法看官网或者吸引用户的情绪和他们的信息,然后再去退货和质疑出处。

然而,由于自然语言处理是王的专长,这些帖子和文章中的文字可以用来揭示创作者和传播者的信息,如他们的关系,意识形态和出版动机,以及他们的目标受众可能是谁。该算法可以浏览匿名用户在Twitter和Reddit平台上发布的数百万篇新闻文章,并检查它们的标题、内容和链接。目的是不仅要了解它们背后的实体,还要了解它们在整个网络中的传播方式。

我们中的许多人认为网站是理所当然的,并随意转发或发布错误的信息。这就是它如何传播,级联和传播病毒,”王说。我们要问的一些最重要的问题是:模型是什么?有哪些激励措施?"

为了找到答案,他和他的团队提出了一种学习机制,这种机制除了可以解释内容本身是真是假之外,还可以解释为什么有些故事会被重新发布或转发。王说,在这个过程中,他们可以找出谁参与了错误信息的传播,以及在这个过程中可能出现的模式。他补充说,图像也将成为数据集的一部分。

后来,研究人员计划将他们工作的其他方面与错误信息相结合,例如clickbait,它使用有吸引力的,通常是耸人听闻的标题来引诱读者点击链接,最多将他们发送到一个狡猾的网站,最糟糕的是,窃取他们的信息。

“Clickbait主要是一篇低质量的文章,其中可能确实包含许多错误信息和虚假信息,因为它们必须被夸大,”王说。计算机科学博士吴佳伟(Jiawei Wu)开发了一种称为“强化协作训练”的方法,该方法采用了一种有效的系统来标记数百篇文章,然后用于训练机器学习分类器来标记它认为可能是一个巨大的clickbait,一个百万字的数据集。

“然后我们采用这些新标记的例子,重新训练分类器,”王说。“这个迭代过程允许我们随着时间的推移收集更多的标签数据,”他补充说,这提高了工具的准确性。

使用人工智能来理解和发现我们每天发送的文本的潮汐模式,可以让我们了解我们是如何有意或无意地传播错误信息的。

“这真是自然语言处理和机器学习的美妙之处,”王说。“我们有大量不同格式的数据,问题是:如何将非结构化数据转化为结构化知识?这是深度学习和数据科学的目标之一。

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。