关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3540人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

涉债权1600亿,中信信托“啃”下金科重整服务信托资产包

密探财经 浏览 5102

传奇数学家放弃美国高校终身教职 为00后中国女孩打工

新民周刊 浏览 18863

固态电池量产提速!超千万新能源车主,竟成被割的 “老韭菜”?

数字财经智库 浏览 5224

马斯克的「移动客厅」又火了:20人座无方向盘,每公里才3毛钱

机器之心Pro 浏览 3888

那些外国博主们,怎么突然开始吹中国手机了???

差评XPIN 浏览 3489

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 3899

连刷6集,这部新剧太刺激了

来看美剧 浏览 2845

5月开车撞利物浦球迷的司机承认故意撞人,预计12月15日宣判

懂球帝 浏览 4077

隐形大佬入主3年后,紫光集团怎样了?

华商韬略 浏览 4667

拉总:诺坎普改叫梅西球场?不合适

体坛周报 浏览 3885

老而弥坚,追梦:我还能再打4-5年,新赛季我仍充满动力

懂球帝 浏览 4461

E句话| 恭喜,他们生三娃了!

仙女事件簿 浏览 4411

迈向智能化 广汽丰田雷凌L新老款车型对比

车质网 浏览 3474

欧洲称正考虑反制美国方案 被指手握"10万亿美元武器"

财联社 浏览 3536

内塔尼亚胡被指传话无意攻击伊朗 与其公开表态相背离

红星新闻 浏览 9934

赵丽颖都救不了!央视新剧《逍遥》播出被吐槽

烈史 浏览 2963

A股“达链”或再增一员,高通前高级工程师要上市敲钟了|读懂IPO

时代周报 浏览 3629

《四渡》选角热议背后,藏着历史片的审美变迁

幕味儿 浏览 807

MCON推出滑盖外接手柄,致敬PSP Go/Xperia Play滑盖掌机

IT之家 浏览 4897

被采取刑事强制措施后,善水科技董事长宣布“婚变”、辞职,前妻成实控人

红星资本局 浏览 4418

李亚鹏宣布离婚!跟海哈金喜结婚不到5年,网友质疑是为了躲债

萌神木木 浏览 3708
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1