新闻网站评级工具发布2023年6月的错误信息监控结果

2024-03-31

这些网站在很少有人监督的情况下运行，平均每天生成数千篇文章，其中包含错误信息，尤其是误导用户的医疗和健康信息。

科技媒体The表示，人工智能正在扼杀旧网络，而新网络却在艰难诞生。 “生成人工智能模型正在改变网络的经济性，使生成低质量内容的成本变得更便宜。我们才刚刚开始看到这些变化。” 影响。”

发现 217 个不可靠的人工智能生成的新闻和信息网站

分析发现，在人工智能生成的内容网站上发布的广告似乎是以编程方式生成的，这意味着该公司没有选择将其广告放置在这些网站上，而是由提供广告的系统自动定位。大多数广告都是通过的工具投放的。

不可靠的人工智能生成的新闻和信息网站 (UAIN) 被定义为在很少或没有人类监督的情况下运行并发布主要或完全由机器人撰写的文章的网站。就在上个月，分析师将新推出的 UAIN 网站跟踪器上的网站数量从 49 个更新为 217 个。

尽管许多广告商及其广告代理商维护着“品牌不安全”网站的“排除列表”，但这些列表通常没有及时更新，并且显然没有跟上 UAIN 网站的激增速度。

2023 年 5 月和 6 月，分析师确定了来自 141 个主要品牌的 393 个程序化广告（广告，使用技术实现数字广告买卖的过程），这些广告出现在 55 日确定的 217 个 UAIN 网站上。所发现的广告被提供给四个国家的互联网分析师：美国、德国、法国和意大利。

一家运动服装公司的广告出现在 .br 上，这是一个 UAIN 网站，发布人工智能生成的有关巴西就业机会的新闻。用黑色块屏蔽此程序化广告。

虽然没有透露提供这些广告的公司名称，但其中包括各种各样的蓝筹广告商：六家大型银行和金融服务公司、四家奢侈品百货公司、三个领先的运动服装品牌、三个家电制造商、两家全球最大的消费技术公司世界，两家全球电子商务公司，两家美国顶级宽带提供商，美国广播网络提供的 3 项流媒体服务，一个硅谷数字平台和一家大型欧洲连锁超市。

程序化广告使用算法和先进的拍卖流程，将高度针对性的数字广告直接提供给个人用户，而不是特定的网站。这意味着广告在用户浏览互联网时有效地“关注”他们。由于这个过程非常不透明，品牌可能不知道他们正在资助 UAIN 网站的传播，因为广告是通过第三方购买的，并涉及多个中介机构。

假作者传播可疑的健康信息

发现的所有 393 个广告都直接出现在包含人工智能生成的错误信息的文章旁边。

一些似乎包含主要品牌广告的 UAIN 网站似乎使用人工智能工具重写主流新闻媒体的文章。例如，发表的一篇文章似乎是英国小报《太阳报》美国版文章的人工智能重写版本，具有相似的图像和措辞。文章中往往会包含作者姓名，如“今年以来，该‘作者’已发表文章4,364篇，其中仅2023年6月15日就发表了108篇文章。

有些网站平均每天生成 1,200 多篇文章，几乎没有明显的人工编辑监督。相比之下，根据 2022 年 4 月的数据，《纽约时报》通常每天发布约 150 篇文章。

大多数人工智能生成的网站质量较低，但不会传播错误信息。然而网站制作，人们发现，未经证实且可能有害的自然健康疗法以“柠檬可以治疗皮肤过敏吗？”等标题进行宣传。 “治疗多动症的 5 种自然疗法是什么？” 和“如何自然地预防癌症”。

UAIN 网站快速将其内容货币化非常简单。在谷歌的登陆页面上，谷歌表示网站可以轻松赚取程序化广告收入：“你所要做的就是将代码放入你的网站，它会立即开始工作。”

自 2023 年 5 月首次开始跟踪 UAIN 网站以来，它每周都会发现约 25 个新网站，而 5 月初，其报告仅发现了 49 个“似乎几乎完全由人工智能软件编写”的网站。 UAIN网站总数可能远高于目前确定的217个。

上出现了一家全球汽车租赁公司的广告网站制作，是一个 UAIN 网站，发布人工智能生成的有关食品的文章。使用黑块来阻止这些程序化广告。

如果一个网站满足以下所有 4 个标准，则被视为不可靠的人工智能生成的新闻和信息网站：首先，有明确证据表明该网站的很大一部分内容是由人工智能生成的；其次，有强有力的证据表明该内容是在没有人工监督的情况下发布的；第三，网站的呈现方式让普通读者相信其内容是由人类作家或记者制作的；第四，网站未明确披露其内容由人工智能制作。

这不一定是坏事

近几个月来，多家媒体报道称人工智能生成的内容正在污染互联网。当地时间6月26日，资深记者詹姆斯·文森特（）发表了一篇措辞激烈的评论文章。他写道：“它被用来生成充满垃圾的网站。 Etsy（一个工艺品电子商务网站）充满了“人工智能生成的垃圾”。聊天机器人在混乱的错误信息中互相引用。人工智能被用来刺激疲倦的用户。并希望当你的朋友不在身边时，机器人可以与你交谈……互联网档案馆正在与数据抓取者作斗争，而人工智能正在撕裂维基百科。旧的网络正在消亡，新的网络正在艰难诞生。”

当然，文森特认为，网络多年来一直在消亡，被那些将流量从网站上转移的应用程序或奖励“缩短注意力的时间”的算法所扼杀。但到了 2023 年，它再次消亡，而一个新的催化剂正在发挥作用：人工智能。

他打了一个比方：“网站创建了流畅、功能丰富的平台，并向任何人敞开大门加入。他们把盒子放在我们面前，我们在这些盒子里填满文字和图片，然后人们过来看看那些盒子里有什么。这些公司追逐规模，因为一旦有足够多的人聚集在任何地方网站制作，通常就有办法从中赚钱。但人工智能改变了这些假设。”

因为，考虑到资金和计算能力，人工智能系统，尤其是当前流行的生成模型，可以毫不费力地扩展。他们产生大量的文本和图像，很快也会产生音乐和视频。其产出有潜力超越或胜过人们现在依赖的新闻、信息和娱乐平台。但这些系统的质量往往很差。 “这些模型是根据上一个互联网时代奠定的数据层进行训练的，并且它们对这些数据的再现是不完美的。公司从开放网络中抓取信息并将其提炼成机器生成的内容，这些内容生成成本低，但可靠性较差。然后该产品会与之前的平台和用户争夺注意力，”文森特指出。

最成功的网站往往是那些利用规模优势的网站，要么通过增加社交联系或产品选择，要么通过对构成互联网本身的大量信息进行编目，但这种规模依赖于大量的人类来创造在大规模生产方面，人类的潜在价值显然无法击败人工智能。

但文森特最终表示，这不一定是坏事。 “有些人会说这就是世界运转的方式，并指出网络本身杀死了之前的事物，通常是为了变得更好。例如网站制作，印刷版百科全书几乎已经绝迹，但我更喜欢维基百科可访问性的广度和广度，而不是比大英百科全书的厚重和安全性还要高。与人工智能生成的写作有关的所有事情一样，也有很多方法可以改进它——从改进的引文功能到更多的人类监督。此外，即使网络上充斥着人工智能垃圾“这可能会被证明是有益的，从而刺激资金更充足的平台的发展。例如，如果谷歌不断为您提供糟糕的搜索结果，您可能会更倾向于付费访问您信任的资源。”

归根结底，目前由人工智能引起的变化只是网络历史上长期斗争中的最新一个。从本质上讲，这是一场信息之战——谁生产信息、如何获取信息以及谁获得报酬。