Skip to main content

Local-first data asset manager — scan, classify, organize, report

Project description

DataVault

License: MIT

English version: README_EN.md

AI Agent 的数据资产管理 Skill。

DataVault 给你的 AI 提供一套标准化的工作流——扫描、分类、隐私检测、安全注册数据资产。它不是替代 AI 的判断力,而是一套确定性 SOP,让每个 Agent 每次都遵循同样的规则。

为什么需要 DataVault?

你的 AI 已经能读文件、分类数据了。但没有 DataVault:

  • 每次对话应用的标准不一样
  • 隐私检查靠概率
  • 没有审计记录
  • 用户想不到让 AI 管理数据资产

DataVault 提供确定性规则(正则 PII 检测、扩展名分类)加上标准管线,AI Agent 自动遵循。

安装

pip install odv              # 独立扫描器
pip install oasyce           # 推荐:同时包含 Oasyce + DataVault
oas bootstrap                # 自更新 + 钱包 + DataVault 就绪 + 托管自动更新

使用

datavault scan ~/Documents                  # 扫描目录,SHA-256 哈希
datavault classify                          # 自动检测文件类型
datavault privacy                           # 扫描 PII(身份证、信用卡、API 密钥)
datavault report                            # 查看报告
datavault report --format json              # JSON 格式输出
datavault register ~/Documents --confirm --json  # 只注册 safe 文件

作为 AI Skill 使用

当 Claude Code、Cursor 或任何 AI 编程助手使用时:

用户: "帮我管理 ~/Documents 里的数据资产"

AI(装了 DataVault skill):
  1. datavault scan ~/Documents     -> 扫描 342 个文件
  2. datavault privacy              -> 标记 12 个包含 PII 的文件
  3. datavault report --format json -> 显示 330 个安全文件
  4. "发现 330 个安全文件,12 个包含敏感信息(信用卡号、API 密钥)。
     要注册安全的那些吗?"
  5. datavault register ~/Documents --confirm --json
     -> 只自动注册 `privacy_risk == safe` 的文件

没有 DataVault,AI 每次都会用不同的方式处理这个流程。

管线

扫描 (本地) -> 分类 (本地) -> 隐私检测 (本地) -> 报告 (本地)
                                                      |
                                                  用户确认
                                                      |
                                                注册 (上链)

分割线以上全部在本地完成,免费。注册是一个需要明确确认的操作,发布到 Oasyce 网络。

上链的是什么?

只有 SHA-256 哈希元数据(名称、标签、权利类型)。永远不上传原始文件内容。文件留在你的机器上。

风险等级

等级 含义
safe 未检测到 PII
low 仅 IP 地址
medium 电子邮件地址
high 电话号码、身份证
critical 信用卡、API 密钥

铁律: AI-first 自动注册只允许 privacy_risk == safe 的文件上链。 标记为 lowmediumhighcritical 的文件都会留在本地等待人工审查。

生态

oasyce-chain  — L1 共识层(Go 应用链)
oasyce CLI    — Python 薄客户端 + Dashboard
DataVault     — AI Agent 数据管理 Skill(本仓库)
组件 定位
oasyce-chain L1 共识和结算
oasyce Python 客户端、CLI、Dashboard
DataVault (本仓库) AI Agent 数据资产管理 Skill

当前进度

  • v0.2.1,47 个测试通过
  • 确定性扫描 + SHA-256 哈希 + 文件分类
  • 正则 PII 检测(邮箱、信用卡、API 密钥、身份证)
  • SQLite 本地清单
  • Oasyce 桥接注册
  • AI Agent Skill 模式(CLAUDE.md 内置 SOP)
  • --confirm 标志防止意外注册

许可证

MIT

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

odv-0.2.1.tar.gz (19.9 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

odv-0.2.1-py3-none-any.whl (15.1 kB view details)

Uploaded Python 3

File details

Details for the file odv-0.2.1.tar.gz.

File metadata

  • Download URL: odv-0.2.1.tar.gz
  • Upload date:
  • Size: 19.9 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.9.6

File hashes

Hashes for odv-0.2.1.tar.gz
Algorithm Hash digest
SHA256 a2cfa0f52bb526dc210415bb541b4a3cbf4425ef131685dcc3751ffe6955eb50
MD5 b8e9b27a7611f01b2c0db7e3465fedb7
BLAKE2b-256 b8bb17e18b8c9b02d89feb23207f2a3c4006617013af8b667edcfed20e913fa2

See more details on using hashes here.

File details

Details for the file odv-0.2.1-py3-none-any.whl.

File metadata

  • Download URL: odv-0.2.1-py3-none-any.whl
  • Upload date:
  • Size: 15.1 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.9.6

File hashes

Hashes for odv-0.2.1-py3-none-any.whl
Algorithm Hash digest
SHA256 b4821dd586e01f80391f42ea75e2dfc402ba9819545c4e3d9ba9500997ef0c88
MD5 3fd343ad812ef3daa7ad96849fbd0dea
BLAKE2b-256 6d08d2298a7b187e725a37ee0674249102e0db79c62e7f2aa622c4c70d5ab7f5

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page