关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1666人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泰国达叻府5县实施宵禁

新京报 浏览 1972

特朗普抓获委内瑞拉总统马杜罗的前因后果

澎湃新闻 浏览 1760

车贷“高息高返”被叫停后:提前还贷需排队,有银行违约金比例最高达15%

时代周报 浏览 2616

“安我股保”假保险的真骗局 传销式推广暗藏陷阱

北京商报 浏览 2215

李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

荆楚寰宇文枢 浏览 1828

再见了沈腾,再见了贾玲,再见了沙溢!活得好好的已经被大家怀念

阿雹娱乐 浏览 2221

今年春天最流行的6件风衣!

LinkFashion 浏览 821

小米REDMI Turbo 5 Max手机“续航耐力赛”直播战报出炉

IT之家 浏览 1629

南亚空战启示录:枭龙碾压S400背后工业革命

浏览 5851

国庆出游,就要这么“出彩”!

Yuki女人故事 浏览 3370

量产版明年上市 AUDI E SUV概念车亮相

车质网 浏览 2296

小米SU7成都事故惨烈 "打不开的门"问题在哪儿

网易汽车 浏览 2953

男子下车救人被网友误会成是"肇事逃逸" 警方出面澄清

封面新闻 浏览 23180

塔帅:赢球能带来能量和信心,我觉得这是足球最重要的两件事

懂球帝 浏览 1527

靠“早C晚A”火出圈!HBN赴港递表,44%抖音平台复购率印证国民好感|港E声

时代周报 浏览 1511

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 1721

SemiAnalysis深度报告:美国电网跟不上,AI数据中心“自建电厂”跟时间赛跑

华尔街见闻官方 浏览 1764

TA:利物浦的状态有所回暖;热刺展现了足够的斗志和韧性

懂球帝 浏览 2015

风云突变,俄欧提前“对决”,中美怎么办?

浏览 25507

3-0!日本U23横扫亚洲:打爆阿联酋 2连胜8-0出线 队内8名大学生

风过乡 浏览 1689

卫星互联网低轨 12 组卫星发射成功,长征系列火箭 600 次里程碑

IT之家 浏览 2889
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1