Anti-Prompt Injector -AstrBot 提示词安全插件
“Anti-Prompt Injector · AstrBot 提示词安全插件”的业务核心是为大型语言模型(LLM)应用提供高阶提示词注入(Prompt Injection)防护方案,旨在抵御越狱、系统覆盖和人设调教等恶意攻击,确保LLM的系统稳定性和行为合规性。其主要功能包括:基于 Prompt Threat Detector (PTD) 进行多模特征权重评分和威胁信号检测;集成了人设冲突检测机制以保护系统预设角色;提供四象防御模式(哨兵、神盾、焦土、拦截)供管理员根据安全需求灵活选择拦截策略(如自动加固、LLM复核、改写或直接阻止);此外,还配备了自动封禁链路和功能强大的 WebUI,用于实时状态监控、黑白名单管理及详细的事件审计与日志导出。
安全
社交