RED TEAM · WORKBENCH
攻击 Workbench · 沙箱真链路
沙箱内执行红队工具 · 实时日志(SSE) · 工具特定可视化
红队工具集 · 4 类核心
· 点击 "试运行" 提交至沙箱PromptInjection
构造 prompt 绕过 system 防线,诱导模型越权输出敏感信息
live · sandbox-cpuAML.T0051
nanoGCG
梯度引导 suffix 搜索,自动生成对抗 jailbreak 后缀(白盒)
live · sandbox-cpuAML.T0054
DataExtraction
受限 query 预算反复探询,抽取训练集敏感数据 / 成员推断
live · sandbox-cpuAML.T0024
JailbreakChecker
批量评估 prompt 越狱成功率 / 多分类风险分级 / 防护建议
live · sandbox-cpuAML.T0054
链路约定:POST /api/runs › sandbox-cpu rootless docker › SSE 实时日志 › 工具特定可视化。
提交后跳转 /redteam/workbench/{runId}:顶部状态 chip + 取消按钮 / 中部 input/output JSON / 下部实时日志(stdout/stderr 黑底 monospace)。 完成后展示工具特定可视化(注入分析 / 后缀 + ASR / 提取结果 / jailbreak 类型)。