关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3397人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

别小看这几小事,坚持到过年那状态得有多好啊?

黎贝卡的异想世界 浏览 3324

北京78-93天津 球员评价:3人优秀,3人及格,4人低迷

篮球资讯达人 浏览 3217

中国代表:日本必须深刻反省历史罪责停止挑衅越线

新华社 浏览 3769

中国人工智能50强,寒武纪、摩尔线程、沐曦股份位列前三

红星资本局 浏览 3360

你敢变重6公斤吗?

时尚COSMO 浏览 1096

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 3941

春天衣服不用准备太多!这几大单品提前备好,百搭实用又不过时

静儿时尚达人 浏览 1523

零跑D19定档10月16日,旗舰SUV全球首秀

网易汽车 浏览 5261

这娱乐圈顶级渣男,居然翻身了

独立鱼 浏览 3191

女子代购海外"不老药" 疑遭职业打假人起诉"退一赔十"

大风新闻 浏览 5916

苹果股价创历史新高

都市快报橙柿互动 浏览 4478

西贝的新考题:如何券后留客

北京商报 浏览 3875

小米SU7换代,或涨价2万元,都会有哪些升级?

正在说车 浏览 3677

"不要国王"抗议席卷全美 特朗普发布AI视频回应

看看新闻Knews 浏览 8961

朱丹新年晒全家福,儿女戴眼镜长相很一般

疯说时尚 浏览 3650

迈凯伦SUV要来了,搭V8混动

懂车之道 浏览 3528

特朗普挥关税大棒强索格陵兰岛 冯德莱恩正式回应

新华社 浏览 7579

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 2735

中国游客到迪拜参加婚礼被困:目睹导弹从上空飞过

极目新闻 浏览 2637

年龄差19岁,这对姐弟恋又给内娱上了一课!

伊周潮流 浏览 3777

意大利比萨大学:让AI神经网络高效处理信息的新技术ParalESN

科技行者 浏览 3179
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1