关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3190人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

许利民末节DNP斯佩尔曼引热议:固执己见+无调整 杰曼8中1背锅

颜小白的篮球梦 浏览 3047

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄

封面新闻 浏览 4023

“这件衣服”今年春天爆火!时髦的人都在穿

LinkFashion 浏览 2314

曼联压哨绝平!629天首次5场不败,8战热刺不胜,延续2魔咒

奥拜尔 浏览 4054

一切为了销量、利润,消息称三星决定不提高Galaxy S26系列售价

IT之家 浏览 3378

失业13个月 35岁巴神官宣登陆西亚2级联赛 已换13队+10年转会10次

我爱英超 浏览 3088

北约举行一年一度“坚定正午”核演习

极目新闻 浏览 4268

特朗普涉俄乌冲突再次表态:有时候必须让他们打到底

鲁中晨报 浏览 9039

西贝深圳一门店被指未获同意提前“逃场”,回应:撤店属实,双方已达成方案

红星资本局 浏览 3059

原来他就是李湘前夫,如今52岁锒铛入狱

楠楠自语 浏览 3439

广汽华为启境任命刘嘉铭为CEO 合作进入实质阶段

太平洋汽车 浏览 4758

乔伟光:从中乙打回中超,我一生引以为荣,没给青岛丢人

懂球帝 浏览 266

世体:拉菲尼亚将坐在替补席额外座位上,为球队提供支持

懂球帝 浏览 4120

上海独居女子离世引关注,超百万元房产无人继承,记者实探→

每日经济新闻 浏览 3444

推广|| 用完立马复购!百元get大牌肤感

黎贝卡的异想世界 浏览 3433

德国Mindfactory平台数据:AMD处理器周销量是英特尔10倍多

IT之家 浏览 3818

Cariad不再是“灵魂”担当,大众请外援能否赌赢未来?

禾颜阅车 浏览 4417

摩洛哥队长赛斯自宣从国家队退役,共代表摩洛哥出场86次

懂球帝 浏览 2634

悦达起亚4月汽车销量破2万辆 环比增长11.5%

网易汽车 浏览 860

切尔西首发:若昂·佩德罗出战

体坛周报 浏览 4820

农妇遭错判寻衅滋事罪被羁押507天 获30万元国家赔偿

扬子晚报 浏览 5531
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1