关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3393人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

又一国产车企官宣:正式全面停产、停售燃油车!

电动知家 浏览 3538

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

量子位 浏览 4402

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

扬子晚报 浏览 10901

真爱大牌破价|| 回购多年,这次竟然破天荒200+

黎贝卡的异想世界 浏览 4370

苏丹快速支援部队宣布同意实行人道主义停火

国际在线 浏览 4138

徐帆带徐朵参加活动,徐朵发文回应质疑

无处不风景love 浏览 3312

乐福鞋,这样穿最文艺

Yuki女人故事 浏览 4248

以数字化锻造发展引擎!财信证券书写“五篇大文章”

券商中国 浏览 4499

共建链上数商生态,推动区块链与实体经济深度融合

文汇报 浏览 4360

印媒:印度将在印巴边境地区启动大规模三军联合演习

环球网资讯 浏览 4168

贝克汉姆家闹出大瓜!豪门大戏再添新章

观察鉴娱 浏览 4888

蓝宝石高管首度回应显卡16Pin烧毁:就算解决、名声也臭了

快科技 浏览 3802

白酒巨头一季报业绩普降,白酒拐点临近还是拐点远未到来?

郭施亮 浏览 1339

独家|接盘露笑弃子藏暗雷?美克家居豪赌AI算力,标的实控人控股企业被曝欠税4205万元

时代周报 浏览 3411

14岁休学少女进拓展营后死亡 曾哭喊"妈妈我不想死"

新京报 浏览 38725

港股无人矿卡第一股诞生!大疆教父李泽湘敲钟,红杉百度联手押注

车东西 浏览 3089

让代旭来演霸总的人,真是一个天才!

娱乐圈笔娱君 浏览 3344

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 5099

大湾区晚会收视出炉!小沈阳父女拿下最高点,王源和时团联手赶客

萌神木木 浏览 4975

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

红星新闻 浏览 7712

特斯拉 Model Y L 交流外供电适配器上架,售价 599 元

IT之家 浏览 4121
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1