ai-content-detection
Use this skill whenever a user wants to verify whether content (text, images, audio, video, or documents) was created by AI; detect deepfakes or AI-synthesized voices; use tools like GPTZero, Turnitin, ELA error analysis, or spectral analysis for authenticity checking; understand what percentage of online content is AI-generated; create a structured detection report with confidence scores; or defend against a false AI-writing accusation. Also applies when users suspect received materials (articles, promotional copy, contracts) may be AI-generated and want guidance on how to tell. Relevant regardless of language — including Chinese (检测AI生成内容、AI合成语音、深度伪造、ELA图片篡改分析、置信度报告、AI内容占比统计).
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/chat2dev/ai-content-detectionAI内容检测完整指南
概述
本技能提供对AI生成内容(文本、图片、视频、音频、文档、链接)的系统性检测方法,包含技术证据指标、置信度框架、工具对比及当前AI内容占比统计数据(截至2025年3月)。
快速导航
| 检测目标 | 直接跳转 |
|---|---|
| 文章/文本是否AI生成 | → 第2.1节(文本检测) |
| 图片是否AI生成/伪造 | → 第2.2节(图片检测) |
| 视频是否Deepfake | → 第2.3节(视频检测) |
| 语音/音频是否合成 | → 第2.4节(音频检测) |
| 文档/合同是否篡改 | → 第2.5节(文档检测) |
| 链接/流量是否Bot | → 第2.6节(链接检测) |
| AI内容占比统计数据 | → 第一部分 |
| 生成检测报告 | → 第四部分(报告模板) |
第一部分:AI内容现状统计
| 统计项 | 数值 | 来源 |
|---|---|---|
| 新发布网页含AI内容比例 | 74.2% | Ahrefs 2025年4月研究(90万页样本) |
| 所有在线文章中AI撰写比例 | 52% | Graphite SEO 2025数据 |
| 全部在线文本中AI辅助/生成比例 | ~57% | 综合分析 |
| 2026年预测AI内容比例 | ~90% | Europol/欧盟预测 |
| ChatGPT发布前AI内容比例(2022年末) | ~10% | 历史基线 |
| 金融科技行业2023年Deepfake事件增长 | 700% | 行业报告 |
| AI生成文档欺诈占比(欧洲2025) | 12%(2022年<2%) | Deloitte 2025 |
第二部分:按内容类型的检测方法
2.1 文本检测(Text Detection)
核心检测指标
| 指标 | 说明 | AI特征 | 置信权重 |
|---|---|---|---|
| 困惑度(Perplexity) | 衡量文本的语言不可预测性 | AI文本困惑度低(5-10),人类文本高(20-50) | 高(但受语言水平影响) |
| 突发性(Burstiness) | 句子长度/风格的变异程度 | AI文本突发性低,节奏均匀 | 中(现代AI可模仿) |
| 词汇多样性 | 词汇重复率和词汇密度 | AI倾向使用固定词汇组合 | 中 |
| 语义一致性 | 段落间逻辑连贯程度 | AI过度连贯,缺乏人类的思维跳跃 | 中 |
| 水印信号 | 隐藏统计模式/Unicode字符 | 生成时嵌入(可被释义绕过) | 高(若未被篡改) |
| N-gram分布 | 短语使用频率模式 | 与已知AI模型输出分布匹配 | 高 |
| 风格一致性 | 整篇文章风格变化 | AI风格高度一致,人类有自然波动 | 中 |
重要证据(高置信度)
强证据(单项即可怀疑):
✓ 检测到合法水印信号(如C2PA标准)
✓ N-gram分析匹配已知LLM输出分布
✓ 困惑度持续低于10分(标准英文基准)
中等证据(需多项组合):
✓ 全文突发性标准差<0.3(异常均匀)
✓ 句子长度标准差<5词(机械规律)
✓ 无拼写错误、无口语化错误
✓ 标点使用完全符合规范(人类有自然偏差)
辅助证据(仅作参考):
✓ 逻辑结构过于完整(引言-正文-结论)
✓ 缺乏个人经历、情感波动、偏见
✓ 回避争议性立场
2.2 图片检测(Image Detection)
核心检测指标
| 指标 | 说明 | 检测方法 | 置信权重 |
|---|---|---|---|
| 视觉伪影(Visual Artifacts) | 像素排列异常、边缘失真 | 像素级检查、局部放大 | 高 |
| GAN棋盘格纹 | GAN生成特有的棋盘状噪声 | 频域分析(FFT/DCT) | 高(对GAN图像) |
| 频域异常 | DCT/DWT变换后的低频异常 | HiFE网络分析 | 高 |
| ELA误差分析 | 不同区域JPEG压缩级别差异 | Error Level Analysis工具 | 高(篡改检测) |
| 元数据检查 | EXIF中相机型号、GPS、时间戳 | ExifTool等 | 中(可被清除) |
| 光照/阴影一致性 | 光源方向与阴影方向矛盾 | 人工/AI综合判断 | 中 |
| 皮肤纹理 | 面部边缘异常融合、不自然过渡 | 局部放大检查 | 高 |
| 手指/文字 | AI图像常见手指数量异常、文字变形 | 人工检查 | 中高 |
重要证据
强证据:
✓ FFT/DCT分析发现低频域周期性异常
✓ ELA显示局部区域再压缩痕迹
✓ 皮肤/毛发边缘高度局部放大后出现混合伪影
✓ 检测到C2PA/Content Credentials内容凭据
中等证据:
✓ EXIF元数据完全缺失(现代相机必有)
✓ 手指数量≠5或手指形状异常
✓ 背景中文字无法辨认或逻辑混乱
✓ 眼睛/牙齿区域不自然的对称性
辅助证据:
✓ 整体风格过于"完美"(无噪点、无自然缺陷)
✓ 珠宝、眼镜等配件细节异常
2.3 视频检测(Video Detection)
核心检测指标
| 指标 | 说明 | 检测方法 | 置信权重 |
|---|---|---|---|
| 面部特征漂移(FFD) | 连续帧之间面部特征微妙漂移抖动 | 帧间比较 | 高 |
| 时域频率伪影 | 频域时间轴上的不可见伪影 | 像素级时序频率分析(ICCV 2025) | 高 |
| 光流异常 | 运动轨迹违反物理规律 | 双分支RGB+光流残差模型 | 高 |
| 闪烁/抖动 | 面部局部闪烁(眼、鼻、嘴区域) | 逐帧分析(0.25x速度) | 中高 |
| 时间不一致 | 帧间物体形变、细节消失重现 | 逐帧检查 | 高 |
| 嘴唇同步 | 唇形与音频不匹配 | AV同步分析 | 高(换脸类) |
| 眨眼频率 | 不自然的眨眼节律(过多/过少) | 视频时序分析 | 中 |
| 元数据 | 缺失摄像头信息、时间戳异常 | 元数据工具 | 中 |
重要证据
强证据:
✓ 0.25x慢速播放可见形变/翘曲效应
✓ 面部特征漂移(眼/鼻/嘴在静态场景中微抖)
✓ 唇形与音频明显不同步
✓ 帧间光流分析发现非物理运动轨迹
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-chat2dev-ai-content-detection": {
"enabled": true,
"auto_update": true
}
}
}