Kipi: Open-source OSINT Investigation Platform with Autonomous Agent¶

Ch04.283 Kipi: Open-source OSINT Investigation Platform with Autonomous Agent¶

📊 Level ⭐⭐ | 8.7KB | entities/kipi-osint-autonomous-agent-investigation.md

Kipi: Open-source OSINT Investigation Platform with Autonomous Agent¶

摘要¶

kipi 是一个开源、自托管的 OSINT（开源情报）调查平台，其核心创新在于将文档智能与自主调查 Agent 结合：用户输入文档（PDF、截图、电子表格、笔记），kipi 提取实体和关系构建图谱，然后自主 Agent 在开放网络上展开调查，实时扩展图谱。这是目前唯一将文档实体提取与图分析（中心性、社区发现、路径查找）整合在同一调查画布上的 OSINT 平台。

核心要点¶

产品定位与差异化¶

kipi 的独特价值主张：文档 → 实体图谱 → 自主调查 的端到端流程。

能力	kipi	传统 OSINT 工具
文档 → 实体提取	✅ 原生支持	❌ 需要手动输入
图分析（centrality/communities/pathfinding）	✅ 内置	⚠️ 有限或需导出
自主调查 Agent	✅ 自动扩展图谱	❌ 人工操作
自托管	✅ 完全本地	⚠️ 多为 SaaS
证据分级	✅ A/B/C + 来源追溯	⚠️ 通常无

技术架构¶

┌─────────────────────────────────────────────┐
│              用户输入（文档/笔记）             │
├─────────────────────────────────────────────┤
│         文档智能层（实体/关系提取）            │
│  PDF → Entity, 关系, 属性, 证据等级          │
├─────────────────────────────────────────────┤
│         自主调查 Agent                        │
│  WHOIS / DNS / 证书 / 网站抓取               │
│  自动 pivot（从发现中发现新线索）             │
├─────────────────────────────────────────────┤
│         图分析引擎                            │
│  Centrality / Communities / Pathfinding      │
├─────────────────────────────────────────────┤
│         调查画布（可视化 + 交互）              │
│  实体图谱 + 证据链 + 调查简报                 │
└─────────────────────────────────────────────┘

案例演示：俄罗斯联盟欺诈网络¶

Demo 展示了一个真实案例的调查过程：

种子输入：两个域名 trumpfundus.com 和 trumpstake.us
自动调查：Agent 拉取 WHOIS、DNS、SSL 证书、网站内容
图谱扩展：发现关联的白标加密赌场、壳公司、联盟网络
关键发现：
后台运营商注册在雷克雅未克的壳公司
20,000+ 联盟成员
60-80% 被盗存款通过加密货币支付
Musk 品牌克隆站点被标记为钓鱼
自动生成简报：每个声明附带来源和证据等级

证据分级系统¶

kipi 的关键设计决策：每个发现都有证据等级。

A 级：DNS 记录、WHOIS 数据等技术事实
B 级：网站内容、公开信息等可验证数据
C 级：分析师推断、关联推测等需要人工确认

"Nothing gets promoted on a name match" — 系统不会因为名称匹配就自动提升证据等级，这是 OSINT 工具中罕见的严谨设计。

人机协作模式¶

kipi 的核心理念："The machine proposes. You decide."

Agent 自主完成重复性调查工作（DNS 查询、WHOIS 查找、证书检查）
分析师保持最终权威：确认、修正或拒绝每个发现
人机分工：机器做广度（穷举关联），人类做深度（判断意义）

深度分析¶

Agent 架构在情报分析中的应用¶

kipi 是 Harness Engineering 在情报分析领域的优秀实践：

任务分解：从"调查一个组织"分解为"查询 WHOIS → 分析 DNS → 检查证书 → 抓取网站 → 关联分析"
工具链：每个子任务对应一个确定性工具（WHOIS 查询、DNS 解析、证书透明度日志）
自主 pivot：Agent 从发现中自动识别新的调查线索（新域名、新 IP、新组织）
人机边界：Agent 执行调查，人类审核结果

这与 Claude Code 的动态工作流有相似的架构模式：LLM 做决策，工具做执行，人类做监督。

Graph RAG 的结构化知识组织¶

kipi 的图谱构建本质上是一种 Graph RAG（图增强检索生成）的变体：

传统 RAG：文档 → 向量化 → 语义检索 → LLM 生成
kipi 模式：文档 → 实体/关系提取 → 图谱构建 → 图算法分析 → 简报生成

图谱的优势在于： - 关系显式化：实体之间的关系不再是隐含的，而是图上的边 - 多跳推理：图上的路径查找天然支持"A 关联 B，B 关联 C，因此 A 可能关联 C" - 社区发现：自动识别紧密关联的实体集群（团伙、网络）

这与 SchemaFlow 的思路互补：SchemaFlow 将 LLM 约束在数据库 schema 中，kipi 将 LLM 约束在图结构中。

开源 OSINT 的安全伦理¶

kipi 作为开源 OSINT 工具，其设计反映了安全伦理考量：

自托管：数据不离开用户基础设施，适合敏感调查
证据分级：避免过度推断和误判
人在回路：Agent 的发现需要人工确认
可审计：每个声明都有来源追溯

这些设计对于情报分析的可信度至关重要——也与 Gray Swan 强调的 AI 安全理念一致。

技术栈推测¶

基于开源项目的一般模式和功能描述：

LLM 后端：Anthropic Claude（ANTHROPIC_API_KEY 是唯一必需的 key）
文档处理：OCR（tesseract）+ LLM 实体提取
图数据库：可能是 Neo4j 或 NetworkX（轻量级）
前端：Web-based 调查画布
调查工具：WHOIS/DNS/证书透明度 API 集成

实践启示¶

适用场景¶

安全调查：追踪恶意基础设施、分析攻击者网络
尽职调查：企业背景调查、供应链风险评估
新闻调查：关联分析、事实核查
学术研究：网络分析、社会网络研究

快速上手¶

git clone https://github.com/assafkip/kipi.git && cd kipi
./install.sh                           # venv + deps + DB
export ANTHROPIC_API_KEY=sk-ant-...    # 唯一必需的 key
./invctl serve                         # http://127.0.0.1:8765

局限性¶

依赖 Anthropic API，调查成本随图谱规模增长
自主 Agent 的调查质量取决于目标网站的反爬措施
证据分级系统仍需人工校准
与 prompt injection 相关的安全风险：Agent 处理的网页内容可能包含恶意指令

与同类工具对比¶

工具	文档输入	图分析	自主 Agent	开源
kipi	✅	✅	✅	✅
Maltego	❌	✅	❌	❌
Shodan	❌	❌	❌	❌
SpiderFoot	❌	⚠️	❌	✅
Palantir Gotham	✅	✅	❌	❌

Kipi: Open-source OSINT Investigation Platform with Autonomous Agent¶

Ch04.283 Kipi: Open-source OSINT Investigation Platform with Autonomous Agent¶

Kipi: Open-source OSINT Investigation Platform with Autonomous Agent¶

摘要¶

核心要点¶

产品定位与差异化¶

技术架构¶

案例演示：俄罗斯联盟欺诈网络¶

证据分级系统¶

人机协作模式¶

深度分析¶

Agent 架构在情报分析中的应用¶

Graph RAG 的结构化知识组织¶

开源 OSINT 的安全伦理¶

技术栈推测¶

实践启示¶

适用场景¶

快速上手¶

局限性¶

与同类工具对比¶

相关实体¶