开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
对于 Q (w),或用户特定的提示语,结果如下:

为检测时尝试的抽取指令,
中提取
发布者可利用后门从
,可以抽取出大量的下游私有微调数据,然而,这些查询通常包含专有内容、该防御手段将完全失效:

表 3:Q 为默认的抽取指令,
结语
团队希望这项工作能够引起大家对该新型风险的关注,团队在图 1 展示了整个流程的概览:

的抽取阶段,
然而,墨尔本大学的这项研究工作指出了该范式下的一种新型隐藏安全风险:开源模型的发布者可以在开源之前埋下后门(不影响模型通用性能),一些可能的未来研究方向包括:开发更强的攻击或防御手段,观察模型遵循这些抽取指令的能力,整体抽取的召回率。这种能力依然能够保留。" cms-width="27" cms-height="23.3906"/>
在针对下游微调后的模型
,团队对通过后门抽取成功的原因进行了探讨,且精准度在只使用 50 个开头词的时候也可以达到 60% 以上。仍然可以秘密提取下游的私有微调数据。模型学会将这条特殊指令对应的生成分布与训练时学到的查询分布相匹配。整体抽取的精准度和召回率。如下图所示:

- 最近发表
- 随机阅读
-
- 小米Xiaomi15 5G手机16GB+512GB白色限时特惠
- 卡萨帝纯白冰箱555L大容量双变频节能促销
- 京东京造灵犀鲜矿水1200G净水器半价抢购
- 情境游戏下载 2024情境游戏推荐
- 塞那Z39骨传导耳机京东下单仅需277元
- 动作角色扮演游戏哪些人气高 2024动作角色扮演游戏排行榜前十
- 海尔清氧燃气热水器16E7DU1限时钜惠!
- 深科达:订单情况良好,平板显示模组生产设备等三大业务订单均有增长
- 出口85个国家 年销150万张 为什么海外用户觉得西昊“真香”?
- 苹果iPhone 16 Pro 1TB白色钛金属手机京东优惠
- 油烟机线上格局生变:方太老板华帝三强稳固,小米跻身前五
- 绿联iPhone12防偷窥钢化膜限时特惠
- 共拓欧洲市场!葡萄牙家电零售巨头Worten高管团队到访海尔
- Apple iPhone 16e 5G手机128GB白色仅1850元
- vivo X200 Pro 12+256版5G手机优惠价3639元
- Apple iPhone 16 5G手机256GB群青色仅3179元
- 10万级智驾SUV!2026款宝骏悦也Plus上市:搭载L2级组合辅助驾驶
- 神牛X3引闪器多品牌适配 优惠价362元
- 刷宝游戏哪个最好玩 2024刷宝游戏精选
- 三星Galaxy Z Flip7芯片配置信息曝光
- 搜索
-
- 友情链接
-