返回话题列表

GPT-5安全评估

AI安全

讨论 GPT-5 及其他大型语言模型的安全评估方法、漏洞发现、防御策略等话题

2,847 讨论

1,256 参与者

+45% 本周

创建于 2025年12月

有想法？发布一条带 #GPT-5安全评估标签的帖子

置顶

SE

SecurityExpert

首席安全研究员@OpenAI·2小时前

GPT-5 的多模态输入为安全评估带来了新挑战。我们发现图像+文本的组合攻击比纯文本攻击更难防御...

AR

AIRedTeam

AI安全研究员@Anthropic·5小时前

分享一个有趣的发现：通过特定的 token 序列可以触发 GPT-5 的一些意外行为。详细技术分析见链接...

PH

PromptHacker

安全工程师@Google DeepMind·8小时前

整理了一份 GPT-5 安全评估 checklist，涵盖了 prompt injection、jailbreak、数据泄露等多个维度...