Local-first data asset manager — scan, classify, organize, report
Project description
DataVault
English version: README_EN.md
AI Agent 的数据资产管理 Skill。
DataVault 给你的 AI 提供一套标准化的工作流——扫描、分类、隐私检测、安全注册数据资产。它不是替代 AI 的判断力,而是一套确定性 SOP,让每个 Agent 每次都遵循同样的规则。
为什么需要 DataVault?
你的 AI 已经能读文件、分类数据了。但没有 DataVault:
- 每次对话应用的标准不一样
- 隐私检查靠概率
- 没有审计记录
- 用户想不到让 AI 管理数据资产
DataVault 提供确定性规则(正则 PII 检测、扩展名分类)加上标准管线,AI Agent 自动遵循。
安装
pip install odv # 独立扫描器
pip install oasyce # 推荐:同时包含 Oasyce + DataVault
oas bootstrap # 自更新 + 钱包 + DataVault 就绪 + 托管自动更新
使用
datavault scan ~/Documents # 扫描目录,SHA-256 哈希
datavault classify # 自动检测文件类型
datavault privacy # 扫描 PII(身份证、信用卡、API 密钥)
datavault report # 查看报告
datavault report --format json # JSON 格式输出
datavault register ~/Documents --confirm --json # 只注册 safe 文件
作为 AI Skill 使用
当 Claude Code、Cursor 或任何 AI 编程助手使用时:
用户: "帮我管理 ~/Documents 里的数据资产"
AI(装了 DataVault skill):
1. datavault scan ~/Documents -> 扫描 342 个文件
2. datavault privacy -> 标记 12 个包含 PII 的文件
3. datavault report --format json -> 显示 330 个安全文件
4. "发现 330 个安全文件,12 个包含敏感信息(信用卡号、API 密钥)。
要注册安全的那些吗?"
5. datavault register ~/Documents --confirm --json
-> 只自动注册 `privacy_risk == safe` 的文件
没有 DataVault,AI 每次都会用不同的方式处理这个流程。
管线
扫描 (本地) -> 分类 (本地) -> 隐私检测 (本地) -> 报告 (本地)
|
用户确认
|
注册 (上链)
分割线以上全部在本地完成,免费。注册是一个需要明确确认的操作,发布到 Oasyce 网络。
上链的是什么?
只有 SHA-256 哈希和元数据(名称、标签、权利类型)。永远不上传原始文件内容。文件留在你的机器上。
风险等级
| 等级 | 含义 |
|---|---|
| safe | 未检测到 PII |
| low | 仅 IP 地址 |
| medium | 电子邮件地址 |
| high | 电话号码、身份证 |
| critical | 信用卡、API 密钥 |
铁律: AI-first 自动注册只允许 privacy_risk == safe 的文件上链。
标记为 low、medium、high、critical 的文件都会留在本地等待人工审查。
生态
oasyce-chain — L1 共识层(Go 应用链)
oasyce CLI — Python 薄客户端 + Dashboard
DataVault — AI Agent 数据管理 Skill(本仓库)
| 组件 | 定位 |
|---|---|
| oasyce-chain | L1 共识和结算 |
| oasyce | Python 客户端、CLI、Dashboard |
| DataVault (本仓库) | AI Agent 数据资产管理 Skill |
当前进度
- v0.2.1,47 个测试通过
- 确定性扫描 + SHA-256 哈希 + 文件分类
- 正则 PII 检测(邮箱、信用卡、API 密钥、身份证)
- SQLite 本地清单
- Oasyce 桥接注册
- AI Agent Skill 模式(CLAUDE.md 内置 SOP)
--confirm标志防止意外注册
许可证
MIT
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file odv-0.2.1.tar.gz.
File metadata
- Download URL: odv-0.2.1.tar.gz
- Upload date:
- Size: 19.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.9.6
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
a2cfa0f52bb526dc210415bb541b4a3cbf4425ef131685dcc3751ffe6955eb50
|
|
| MD5 |
b8e9b27a7611f01b2c0db7e3465fedb7
|
|
| BLAKE2b-256 |
b8bb17e18b8c9b02d89feb23207f2a3c4006617013af8b667edcfed20e913fa2
|
File details
Details for the file odv-0.2.1-py3-none-any.whl.
File metadata
- Download URL: odv-0.2.1-py3-none-any.whl
- Upload date:
- Size: 15.1 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.9.6
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
b4821dd586e01f80391f42ea75e2dfc402ba9819545c4e3d9ba9500997ef0c88
|
|
| MD5 |
3fd343ad812ef3daa7ad96849fbd0dea
|
|
| BLAKE2b-256 |
6d08d2298a7b187e725a37ee0674249102e0db79c62e7f2aa622c4c70d5ab7f5
|