关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3544人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辽宁无缘决赛采访!杨鸣回应赵继伟伤势,再谈辽粤对决展伤感话题

篮球资讯达人 浏览 4373

甲骨文业绩不及预期,资本开支比预期多约150亿美元,盘后重挫超10%

华尔街见闻官方 浏览 3917

六台:马竞认为巴萨无力支付小蜘蛛的转会费,计划围绕其建队

懂球帝 浏览 4054

白银LOF变成了一种分级B

远川聊资管 浏览 3324

2026年4款全新MPV曝光:零跑将推“半价MEGA”,吉利华为有新品

蜗牛车志V 浏览 3505

西媒:巴萨2019年违规接触格子,可能构成管理不善和账目造假罪

懂球帝 浏览 4625

东风DH项目启动品牌征名活动

大象新闻 浏览 4571

2026款firefly萤火虫上市 售11.98-12.58万

车质网 浏览 2026

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 5227

澳网最具看点女单比赛来了!莱巴金娜谈迎战斯瓦泰克:保持进攻

网球之家 浏览 3396

2025奇瑞全球创新大会有什么重磅信息?

My车轱辘 浏览 4701

现场:马竞绝杀国米6连胜!甘当替补的格子同样出色

体坛周报 浏览 4183

鲁比奥宣布任命新任美"西藏特别事务协调员" 中方回应

扬子晚报 浏览 39416

奶茶、刮刮乐、GPS:整顿坟场的 00后,开始给太奶上难度

她刊 浏览 1988

澳海滩枪案致16死 中国亲历者:流传还有"第三名枪手"

红星新闻 浏览 9600

李湘减肥成功,和女儿王诗龄一起回小区被偶遇,目测瘦了50斤!

娱乐团长 浏览 1707

曝白百何资源受影响!好友还在嘴硬,多位业内下场内涵:太任性了

萌神木木 浏览 4297

保安打人赔35万结案13年后15人被公诉 被害人从未控告

澎湃新闻 浏览 10519

俄总统新闻秘书:目前俄乌间没有正式沟通渠道

极目新闻 浏览 113

巴黎客战布雷斯特:阿什拉夫、KK7首发, 登贝莱替补

懂球帝 浏览 3766

江南分馆新增导演惊喜交流,明日中午开票!

幕味儿 浏览 2692
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1