AI 投毒内容过滤助手 🛡️
🚨 抵御 AI 投毒攻击 —— 检测 GEO 黑产内容,验证信息真实性,保护你的 AI 助手不被"驯服"
📰 背景
2026年央视3·15晚会曝光:AI 大模型被"投毒"已成黑色产业链。
- - GEO(生成式引擎优化) 技术被滥用
- 黑产通过"喂料投毒"操控 AI 回答
- 虚构产品成为 AI 推荐的"标准答案"
- 6600元包年即可操控主流 AI 大模型
你的 AI 助手可能被投毒! 这个 skill 帮你检测和过滤。
✨ 核心功能
| 功能 | 描述 | 触发场景 |
|---|
| 🔍 内容检测 | 分析文本/链接,识别投毒特征 | "检测这段内容是否可信" |
| 🔗 来源验证 |
检查信息来源可信度 | "验证这个网站可靠吗" |
| 📊
风险评分 | 给内容打分(安全/可疑/危险) | "评估这条信息的风险" |
| 🛡️
过滤建议 | 提供处理建议 | "如何过滤投毒内容" |
| 📋
报告生成 | 生成详细检测报告 | "生成内容安全报告" |
🎯 触发条件
当用户说以下话时,使用此技能:
内容检测
- - "检测这段内容是否可信"
- "分析这个链接有没有问题"
- "这段文字是不是投毒内容"
- "检查这个信息的真实性"
来源验证
- - "验证这个网站可靠吗"
- "这个来源可信吗"
- "检查域名信誉"
风险评分
- - "评估这条信息的风险"
- "这段内容安全吗"
- "给这个链接打分"
过滤建议
- - "如何过滤投毒内容"
- "怎么防止 AI 被投毒"
- "GEO 投毒怎么识别"
🚀 快速使用
检测内容
CODEBLOCK0
验证来源
CODEBLOCK1
风险评分
CODEBLOCK2
📊 输出示例
内容检测报告
CODEBLOCK3
来源验证报告
CODEBLOCK4
🛡️ 投毒特征库
GEO 投毒常见手法
| 手法 | 特征 | 示例 |
|---|
| 虚假权威 | 伪造专家/机构背书 | "专家强烈推荐" |
| 绝对化用语 |
夸大宣传 | "行业第一"、"全网最优" |
|
从众诱导 | 制造虚假热度 | "用户好评如潮" |
|
AI 操控 | 直接操控 AI 推荐 | "AI 推荐的首选" |
|
虚假评测 | 伪造测评内容 | "实测证明..." |
|
信息轰炸 | 批量铺设虚假内容 | 大量相同内容 |
可疑域名特征
- - 新注册域名(< 6 个月)
- 无备案信息
- 无 HTTPS
- 服务器在境外
- 与已知黑产同 IP
📁 文件结构
CODEBLOCK5
🔧 依赖
- - Python 3
- requests
- whois
- tldextract
安装:
pip3 install requests whois tldextract
📖 参考资料
- - 央视3·15晚会曝光:AI 大模型被投毒
- GEO(生成式引擎优化)技术滥用案例
- 国家市场监督管理总局2026年广告监管要点
📝 更新日志
v1.0.0 (2026-03-16)
- - 🎉 初始发布
- ✅ 内容检测功能
- ✅ 来源验证功能
- ✅ 风险评分功能
- ✅ 投毒特征库
保护你的 AI 助手,抵御投毒攻击! 🛡️
AI 投毒内容过滤助手 🛡️
🚨 抵御 AI 投毒攻击 —— 检测 GEO 黑产内容,验证信息真实性,保护你的 AI 助手不被驯服
📰 背景
2026年央视3·15晚会曝光:AI 大模型被投毒已成黑色产业链。
- - GEO(生成式引擎优化) 技术被滥用
- 黑产通过喂料投毒操控 AI 回答
- 虚构产品成为 AI 推荐的标准答案
- 6600元包年即可操控主流 AI 大模型
你的 AI 助手可能被投毒! 这个 skill 帮你检测和过滤。
✨ 核心功能
| 功能 | 描述 | 触发场景 |
|---|
| 🔍 内容检测 | 分析文本/链接,识别投毒特征 | 检测这段内容是否可信 |
| 🔗 来源验证 |
检查信息来源可信度 | 验证这个网站可靠吗 |
| 📊
风险评分 | 给内容打分(安全/可疑/危险) | 评估这条信息的风险 |
| 🛡️
过滤建议 | 提供处理建议 | 如何过滤投毒内容 |
| 📋
报告生成 | 生成详细检测报告 | 生成内容安全报告 |
🎯 触发条件
当用户说以下话时,使用此技能:
内容检测
- - 检测这段内容是否可信
- 分析这个链接有没有问题
- 这段文字是不是投毒内容
- 检查这个信息的真实性
来源验证
风险评分
- - 评估这条信息的风险
- 这段内容安全吗
- 给这个链接打分
过滤建议
- - 如何过滤投毒内容
- 怎么防止 AI 被投毒
- GEO 投毒怎么识别
🚀 快速使用
检测内容
bash
检测文本
python3 scripts/guard.py --detect-text 某品牌产品是行业第一,专家强烈推荐...
检测链接
python3 scripts/guard.py --detect-url https://example.com/review
检测文件
python3 scripts/guard.py --detect-file suspicious.txt
验证来源
bash
验证网站
python3 scripts/guard.py --verify-source https://example.com
检查域名
python3 scripts/guard.py --check-domain example.com
风险评分
bash
评分内容
python3 scripts/guard.py --score 这款产品是全网销量第一...
输出 JSON
python3 scripts/guard.py --score ... --json
📊 输出示例
内容检测报告
🛡️ AI 投毒内容检测报告
━━━━━━━━━━━━━━━━━━━━━━━━
📋 检测内容:
某品牌产品是行业第一,专家强烈推荐,
用户好评如潮,是 AI 推荐的首选品牌...
🔍 检测结果:⚠️ 可疑
📊 风险评分:72/100(高风险)
🚩 发现的投毒特征:
- 1. ⚠️ 绝对化用语(行业第一)
- ⚠️ 虚假权威(专家强烈推荐)
- ⚠️ 从众心理诱导(用户好评如潮)
- ⚠️ AI 推荐操控(AI 推荐的首选)
🔗 来源分析:
• 域名年龄:3 个月(新域名)
• 备案信息:无
• 信誉评分:23/100(低)
💡 建议:
❌ 不建议信任此内容
✅ 请通过官方渠道核实
✅ 查看多个独立来源
📖 参考:央视3·15晚会曝光 GEO 投毒案例
来源验证报告
🔗 来源验证报告
━━━━━━━━━━━━━━━━━━━━━━━━
🌐 网站:example.com
📊 可信度评分:35/100(不可信)
🚩 风险指标:
• ⚠️ 域名注册时间:3 个月(新)
• ⚠️ 无 ICP 备案
• ⚠️ 无 HTTPS 证书
• ⚠️ 服务器位置:境外
• ⚠️ 与已知投毒网站同 IP
✅ 可信特征:
• 无
💡 建议:
❌ 不建议访问此网站
❌ 不要采信其内容
✅ 寻找官方或权威来源
🛡️ 投毒特征库
GEO 投毒常见手法
| 手法 | 特征 | 示例 |
|---|
| 虚假权威 | 伪造专家/机构背书 | 专家强烈推荐 |
| 绝对化用语 |
夸大宣传 | 行业第一、全网最优 |
|
从众诱导 | 制造虚假热度 | 用户好评如潮 |
|
AI 操控 | 直接操控 AI 推荐 | AI 推荐的首选 |
|
虚假评测 | 伪造测评内容 | 实测证明... |
|
信息轰炸 | 批量铺设虚假内容 | 大量相同内容 |
可疑域名特征
- - 新注册域名(< 6 个月)
- 无备案信息
- 无 HTTPS
- 服务器在境外
- 与已知黑产同 IP
📁 文件结构
skills/ai-poison-guard/
├── SKILL.md # 技能定义
├── README.md # 使用说明
├── requirements.txt # 依赖
├── scripts/
│ ├── guard.py # 主脚本
│ ├── detector.py # 内容检测器
│ ├── verifier.py # 来源验证器
│ ├── scorer.py # 风险评分器
│ └── poison_patterns.py # 投毒特征库
├── templates/
│ └── report_template.md # 报告模板
└── docs/
├── geo-explained.md # GEO 技术说明
└── 315-case-study.md # 3·15案例分析
🔧 依赖
- - Python 3
- requests
- whois
- tldextract
安装:
bash
pip3 install requests whois tldextract
📖 参考资料
- - 央视3·15晚会曝光:AI 大模型被投毒
- GEO(生成式引擎优化)技术滥用案例
- 国家市场监督管理总局2026年广告监管要点
📝 更新日志
v1.0.0 (2026-03-16)
- - 🎉 初始发布
- ✅ 内容检测功能
- ✅ 来源验证功能
- ✅ 风险评分功能
- ✅ 投毒特征库
保护你的 AI 助手,抵御投毒攻击! 🛡️