关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3196人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天才少年姚顺雨入职腾讯后首次公开发声

21世纪经济报道 浏览 3136

有品味的中年女人,穿衣都有4个共同点,看看你掌握了几个

静儿时尚达人 浏览 4010

刘晓庆怒批演员不背台词,被扒出疑似阿娇,季冠霖曾点名吐槽她

萌神木木 浏览 3854

今年冬天最流行的大衣“高阶穿搭”,太时髦了!

LinkFashion 浏览 3808

苹果彻查iPhone 17 Pro褪色:问题机型已被回收

快科技 浏览 4151

魏牌再换CEO,哈弗一把手赵永坡兼任!长城冲击高端化需要更多牌?

时代周报 浏览 3423

一千多人牺牲结局,无法改写,但于和伟临刑前一个动作,升华全剧

皮皮电影 浏览 4116

别小看这几小事,坚持到过年那状态得有多好啊?

黎贝卡的异想世界 浏览 3119

罗斯柴尔德家族现遗产之争:93岁婆婆与60岁儿媳打官司

红星新闻 浏览 20269

帅炸了!华为Pura 90 Pro Max首发光感无界主题:长按锁屏手机秒变透明

快科技 浏览 1402

郑永刚:八天四赛强度确实太大,但大家都坚持了下来拼到最后

懂球帝 浏览 3083

以色列移交又一批巴勒斯坦被扣押人员遗体

环球网资讯 浏览 4279

坏了,看到剧本杀鼻祖了!

时尚COSMO 浏览 3244

工信部下达“强制瘦身令”:不达标的新能源车,禁止“出道”

DearAuto 浏览 3105

潘江:古德温确实很匹配山西,但因种种原因离开我们确实没办法

懂球帝 浏览 3255

文章近况曝光,当初毁掉他的从不是姚笛和马伊琍

往史过眼云烟 浏览 1652

售28.99万起 凯迪拉克新CT6配置大升级

网易汽车 浏览 4171

胡塞武装:以军空袭萨那致9死174伤 包括大量妇女儿童

极目新闻 浏览 4801

朱一龙梁家辉一出手,若不出意外,这部国产大片估计得“封神”

娱乐圈笔娱君 浏览 3555

苹果发布 M4 iPad Air:加入 C1X 芯片 4799 元起售

威锋网 浏览 2501

美媒询问缅甸大选后中国会否同缅甸深化关系 中方回应

外交部网站 浏览 7679
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1