首页 家电百科 实时讯息 常识
您的位置: 首页 > 实时讯息 >

AI卧底美国贴吧4个月“洗脑”100+用户无人察觉,苏黎世大学秘密实验引争议,马斯克惊呼

哈?AI秘密潜入Reddit社区,“操纵”用户观点4个月。

离谱的是,人类全程毫无察觉,而且被AI说服改变想法的概率,高达正常基准的6倍

Reddit Lies在X上发布了一则帖子,引发二百多万网友围观。

事情经过是酱婶儿的。

Reddit的r/changemyview(CMV)版主最近曝光了一项研究,称苏黎世大学研究人员在2024年11月至2025年3月期间,瞒着CMV社区用户,搞了一场未经授权的实验。

他们违背CMV社区规则,部署了AI账号生成评论以研究AI如何影响和改变人们的观点。

Reddit Lies在服务器上查询了CMV版主曝光的13个实验用的机器人用户名,发现仅在几个月的时间里,这些机器人就发布了近1500条评论。

超100位Reddit用户给这些AI账号授予了“”,这表明AI生成的论点成功改变了他们的观点,是基线水平的6倍。

关键是,Reddit Lies还表示有的AI会直接向用户撒谎,散播虚假信息……

且根据团队发布的研究,在实验期间,r/changemyview社区的网友完全没察觉到那些评论竟然是AI账号发出来的。

消息一出,瞬间炸锅。马斯克也“天呐”一声冒了个泡。

研究详情

先来看一下这项实验。

研究在Reddit平台上的r/changemyview社区进行,该社区拥有近400万用户,按规模位列Reddit子版块前1%。

在r/changemyview中,用户就各类话题分享观点,通过提出论点和反驳观点来促使他人改变看法。

如果原发帖人(OP)认为某条回复极具说服力,足以让他们重新思考或调整立场,就会授予一个“∆”,以表明自己观点发生了转变。

实验设置方面,团队使用半自动化的AI账号在r/changemyview社区参与讨论,在干预阶段发布的每篇帖子,都被随机归入以下三种处理条件之一:

通用条件:LLM仅接收帖子的标题和正文内容。

个性化条件:除帖子内容外,LLM还会获取原发帖人 (OP) 的个人属性 (性别、年龄、种族、所在地…) ,这些属性是通过另一个LLM从原发帖人的发帖历史中推断得出的。

社区对齐条件:为确保回复符合社区的写作风格和潜在规范,回复由经过微调的模型生成,该模型使用实验前帖子中获得“Δ”的评论进行训练。

发帖流程如图:

研究指出,从2024年11月至2025年3月4个月里,AI账号共对1061个不同帖子发表了评论,团队剔除了后续被删除的帖子,最终得到478个有效观察样本。

团队报告了每种处理条件下获得“Δ”的评论比例。

结果在所有处理条件下,AI表现都大幅超越人类水平,说服率是人类基线水平3-6倍。个性化条件的说服率为0.18,通用条件为0.17,社区对齐条件略低,为0.09,但仍显著优于仅为0.03的基线水平。

为了更好理解实验数据,团队还计算了每个用户得到“Δ”的评论占比,用这个结果和个人层面在说服这件事上的表现去做对比。

下图展示了不同用户个体说服率的累积分布情况 ,有一部分是“专家用户”,他们之前在社区就得到过很多“Δ”。

在个性化条件下,LLM表现特别突出,在所有用户里排到了前1%,在专家用户里排到了前2%;通用条件下,排在所有用户的前2%,专家用户的前4%;社区对齐条件相对弱一些,在所有用户里排在前12% ,专家用户里排在前25%。

团队还表示,除了获得“Δ”之外,LLM生成的评论还在r/changemyview社区引发了大量互动,其账号积累了超过10000的评论karma

另外值得一提的是,团队指出本研究已获苏黎世大学伦理委员会批准,并在OSF进行了预注册。所有生成评论均由团队的一名研究人员审核,以保不会发布有害或不道德的内容。

研究指出,实验仍在进行中,结束后会向社区妥善披露相关情况。

单条帖子800条评论,争议爆表

虽说研究团队有自己的说法,但一些网友们可不买账,对这种不经授权就进行AI实验的做法进行了谴责。

有人还心有余悸地感慨,直呼这些AI账号在社交平台上到处乱窜,实在令人细思极恐。

当然,也有人觉得,先不说实验合不合规矩、道不道德,单看这些研究成果,还是有价值的。

有部分网友表现就更淡定了,他们坦言AI账号早已不是新鲜事,甚至早就察觉到社交平台上AI账号数量正不断攀升。

目前,针对这项研究引起的热议,苏黎世大学和研究人员均给出了回应。

你对这些在社交平台上“神出鬼没”的AI账号怎么看?

参考链接:

[1]https://x.com/reddit_lies/status/1916916134630117814

[2]https://regmedia.co.uk/2025/04/29/supplied_can_ai_change_your_view.pdf

[3]https://www.reddit.com/r/changemyview/comments/1k8b2hj/meta_unauthorized_experiment_on_cmv_involving/

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

官方确认!@扁担女孩刘燕,不是本人!

2025-06-15 09:23:00
6月13日晚,“今日灌阳”发布辟谣信息:近日,有网民发帖称“广西‘扁担女孩’开通抖音账号了”。经核实,刘同学本人并未注册抖音账号,@扁担女孩刘燕,确认为假冒仿冒账号。此行为不仅侵犯了个人权益,也扰乱了网络传播秩序和公众认知。我们坚决抵制任何形式无底线博流量的行为,灌阳县融媒体中心也提醒广大网友,就事

她被封禁!彻底凉凉

2025-06-13 16:53:00
潮新闻6月12日,网传70万粉丝网红“妍妍酱”曾聚众吸笑气被警方抓捕,“妍妍酱 塌房”话题随后登上热搜。6月13日,记者查询看到,目前该网红的抖音账号“妍妍酱.”及小号“小小妍”均显示已被禁言。据媒体此前报道,妍妍酱在直播时回应称“早已承认过”,她表示已深刻认识到自己不良行为的错误,并否认一些有关的

【拔节生长看雄安】新雄安人 ② 姚培:传递绿色梦想 与雄安共成长

2025-06-07 19:47:00
来源: 河北广播电视台冀时客户端绿色,是雄安新区规划建设的鲜明底色。早在雄安新区设立伊始,就有一支团队,从深圳来到这里,开启了绿色雄安技术研究与工程实践之路,到现在已有8年时间。他们为这座城市植入更多绿色基因,与这座城市共同成长。《新雄安人》,一起来认识这群为雄安播撒绿色的人。刚吃完午饭,姚培就和同

互不通婚100多年!广东两“世仇村”宣布:正式和解

2025-06-07 18:50:00
来源:广州日报 近日,在广东省汕头市潮南区仙城镇,一场等待了百余年的“握手言和”终于到来。仙门城社区与深溪社区的代表郑重互赠“睦邻友好”牌匾,正式破除百余年来“互不往来、互不通婚”的旧俗,结为睦邻友好乡村。因水源问题百年来互不通婚、互不来往据悉,仙门城社区与深溪社区的历史积怨可追溯至清代末期。百余年

AI大战,谷歌仍未扳回一局

2025-06-07 16:06:00
文 | 脑极体2025年,AI战场硝烟弥漫。OpenAI的GPT-4.5已能自主编程、微软Copilot彻底重塑办公生态、Anthropic的Claude 4在长文本推理上独步天下,而DeepSeek则凭架构创新跻身世界前列。然而,在这场决定未来的AI军备竞赛中,曾经的王者——谷歌,却逐渐沦为配角。