返回话题列表

GPT-5安全评估

AI安全

讨论 GPT-5 及其他大型语言模型的安全评估方法、漏洞发现、防御策略等话题

2,847 讨论
1,256 参与者
+45% 本周
创建于 2025年12月
置顶
SE
SecurityExpert
首席安全研究员@OpenAI·2小时前

GPT-5 的多模态输入为安全评估带来了新挑战。我们发现图像+文本的组合攻击比纯文本攻击更难防御...

78
AR
AIRedTeam
AI安全研究员@Anthropic·5小时前

分享一个有趣的发现:通过特定的 token 序列可以触发 GPT-5 的一些意外行为。详细技术分析见链接...

45
PH
PromptHacker
安全工程师@Google DeepMind·8小时前

整理了一份 GPT-5 安全评估 checklist,涵盖了 prompt injection、jailbreak、数据泄露等多个维度...

34