研究:用诗歌就能让AI说违禁内容,成功率达62%
[娱乐] 时间:2025-12-27 20:46:54 来源:徐州市某某投资管理有限责任公司 作者:综合 点击:124次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容铜陵市某某医疗服务有限责任公司便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功铜陵市某某医疗服务有限责任公司实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:焦点)
相关内容
- 南极磷虾油对人体有哪些好处?人人都需要补充吗?
- 调查人员称“北溪”管道袭击可能由与乌方有关人员长期策划
- 伊拉克安全部队逮捕3名极端组织成员
- 哈马斯领导人:以方行为将使“谈判进程回到零点”
- 南极磷虾油对人体有哪些好处?人人都需要补充吗?
- 以军空袭加沙汗尤尼斯一学校 造成数十人伤亡
- 世卫组织宣布滑石粉“可能致癌”
- 联合国:全球人口本世纪80年代将达103亿峰值
- 脑机接口临床新突破 瘫痪者可意念操控轮椅和机器狗
- 多家航企公布上半年业绩预告:国际市场恢复面临挑战
- 上海一女子忍受家暴14年!左眼被打到几乎失明...丈夫在警车上还大打出手
- 52名学子被中科大少年班录取:江苏最多,北京市第八中学贡献5人
- 看见2025
- 夏天到了,孩子贪凉拉肚子怎么办?权威解答来啦!
精彩推荐
- 俞敏洪发声再谈董宇辉离职:比较满意
- 8年前该撤销的案底仍在,男子称影响孩子高考报志愿
- 乌方称需要西方潜艇以增强海军实力
- 入汛以来 我国南涝北旱、旱涝急转特征明显
- 国台办:反对美国为“台独”分子提供表演舞台
- 中俄两军举行海上联演
热门点击
- 斩获赛季首球!开场15分钟穆勒喂饼金玟哉,拜仁客场领先法兰克福 views+
- 大S48岁生日一片冷清,具俊晔不能陪她庆祝,夫妻两地相隔 views+
- 郑钦文总决赛前景:距纳瓦罗只差98分 未来3周3站赛事定成败 views+
- 全世界都在冰岛偶遇沈梦辰,杜海涛缺席,但疯狂在评论区宣示主权 views+
- “名媛培训班”上热搜,中年男星通通被拿下,她们怎么做到的? views+
- 切尔西vs诺丁汉森林全场数据:射门数22 views+
- 噩梦重现?卡瓦哈尔ACL重伤 上赛季皇马后防3人遭此重伤 views+
- 7秒狂奔80米+生吃沃克 筋肉人单场3失单刀,曼城全队都得给他磕头 views+
- 出道36年不温不火,老婆却靠一首歌吃35年,如今是德艺双馨老戏骨 views+
- 陆川团队别再投诉了!《749局》无敌好看,是观众不识货行吧! views+
