关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1673人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊姐周日热推:电视剧《大生意人》;电视剧《乌蒙深处》......

伊周潮流 浏览 1865

汤唯最刻骨铭心的那段情,我每年都想重温

Yuki女人故事 浏览 2800

天价索赔后,欣旺达还能稳当“老六”吗?

财经无忌 浏览 1461

惊现哈基米!广东四川CBA比赛中场地内跑进一只小猫

懂球帝 浏览 1687

这家基因编辑初创正在挑战FDA的监管边界

DeepTech深科技 浏览 1667

特朗普政府同意与伊朗在阿曼举行谈判

新华社 浏览 1401

仅播2集就口碑大爆,收视率破1.2,这才是国产都市剧该有的样子!

娱乐圈笔娱君 浏览 2714

黄仁勋,亲赴台积电“要产能”

华尔街见闻官方 浏览 2531

千年《琵琶行》,预制“公关秀”

时尚COSMO 浏览 2622

星海T5预售解析:10万级全场景SUV务实主义答卷

众车网 浏览 1985

72岁唐僧迟重瑞卖房,580亿财产成了笑话?

胡一舸南游y 浏览 2596

美英之后,韩国也对太子集团出手了,陈志到底搞了多少钱?

北向财经 浏览 2680

张雨绮,不能「装死」了

独立鱼 浏览 1450

像颜如晶这样坚持,做什么都会成功吧!

时尚COSMO 浏览 2127

斩获700亿订单,机器人独角兽,锋芒毕露!

飞鲸投研 浏览 1942

U23亚洲杯8强出炉 1/4决赛对阵:国足第2出线战上届亚军 避开日韩

我爱英超 浏览 1646

她们说这才是秋天最实用的单品!6种穿法都帮大家总结好了

黎贝卡的异想世界 浏览 2525

提升科技股估值容忍度 掘金AI“从1到10”爆发机遇

证券时报 浏览 3409

美联储的“十字路口”

21世纪经济报道 浏览 3485

美联储降息、买短债,鲍威尔偏鸽,美股、短期美债、黄金涨,美元跌,比特币震荡

华尔街见闻官方 浏览 2170

被娃写作业逼疯 妈妈"邪修法"直播写作业引2万人围观

极目新闻 浏览 17901
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1