专注于大模型安全研究,对 Prompt 注入和模型越狱有深入研究。热爱分享,欢迎交流!
刚完成对 GPT-5 的安全评估报告,发现了一些有趣的 Prompt 注入漏洞模式...
整理了一份大模型安全测试 checklist,涵盖了15个关键维度...
发现一个有趣的现象:某些特定的 token 组合可以触发模型的意外行为...