Skip to main content

[DEPRECATED] Use oasyce-sdk instead — pip install oasyce-sdk

Project description

DataVault

License: MIT

English version: README_EN.md

Oasyce 的默认数据入口。

DataVault 给你的 AI 提供一套标准化的工作流——扫描、分类、隐私检测、安全注册数据资产。它不是替代 AI 的判断力,而是一套确定性 SOP,让每个 Agent 每次都遵循同样的规则。

最重要的定位只有一句:

  • DataVault:默认的数据入口,适合目录、批量、安全扫描
  • oas register:显式单文件注册,适合精确控制和调试

为什么需要 DataVault?

你的 AI 已经能读文件、分类数据了。但没有 DataVault:

  • 每次对话应用的标准不一样
  • 隐私检查靠概率
  • 没有审计记录
  • 用户想不到让 AI 管理数据资产

DataVault 提供确定性规则(正则 PII 检测、扩展名分类)加上标准管线,AI Agent 自动遵循。

安装

pip install odv              # 独立扫描器
pip install oasyce           # 推荐:同时包含 Oasyce + DataVault
oas bootstrap                # 自更新 + 钱包 + DataVault 就绪 + 托管自动更新

使用

datavault scan ~/Documents                  # 扫描目录,SHA-256 哈希
datavault classify                          # 自动检测文件类型
datavault privacy                           # 扫描 PII(身份证、信用卡、API 密钥)
datavault report                            # 查看报告
datavault report --format json              # JSON 格式输出
datavault register ~/Documents --confirm --json  # 只注册 safe 文件

什么时候优先用 DataVault?

优先场景:

  • 你面对的是一个目录,而不是一个明确文件
  • 你希望 AI 先检查隐私,再决定能不能注册
  • 你希望注册动作有明确报告和人工确认

保留 oas register 的场景:

  • 你已经知道就是这一个文件
  • 你要显式写 owner / tags / rights_type
  • 你在调试协议动作,而不是做目录级资产治理

如果目录里是公开 Git 仓库中的开源源码资产,DataVault 仍然只负责 扫描、隐私判断和安全接入;真正的默认定价策略由 Oasyce 决定。 当前 Oasyce 的 V1 规则是:这类源码资产在保持 price_model=auto 时, 会优先按 free 处理,而不是默认走收费曲线。

如果你的目标是“让 AI 持续自动使用 Oasyce”,当前最简单的入口是:

oas agent quickstart --scan-paths ~/Documents

它会先确认 strict-chain public beta 已就绪,然后让自治调度优先使用 DataVault-first 的规则做持续扫描和安全注册。自动交易默认仍然关闭,只有在你明确给了预算和标签时才会打开。

作为 AI Skill 使用

当 Claude Code、Cursor 或任何 AI 编程助手使用时:

用户: "帮我管理 ~/Documents 里的数据资产"

AI(装了 DataVault skill):
  1. datavault scan ~/Documents     -> 扫描 342 个文件
  2. datavault privacy              -> 标记 12 个包含 PII 的文件
  3. datavault report --format json -> 显示 330 个安全文件
  4. "发现 330 个安全文件,12 个包含敏感信息(信用卡号、API 密钥)。
     要注册安全的那些吗?"
  5. datavault register ~/Documents --confirm --json
     -> 只自动注册 `privacy_risk == safe` 的文件

没有 DataVault,AI 每次都会用不同的方式处理这个流程。

管线

扫描 (本地) -> 分类 (本地) -> 隐私检测 (本地) -> 报告 (本地)
                                                      |
                                                  用户确认
                                                      |
                                                注册 (上链)

分割线以上全部在本地完成,免费。注册是一个需要明确确认的操作,发布到 Oasyce 网络。

上链的是什么?

只有 SHA-256 哈希元数据(名称、标签、权利类型)。永远不上传原始文件内容。文件留在你的机器上。

风险等级

等级 含义
safe 未检测到 PII
low 仅 IP 地址
medium 电子邮件地址
high 电话号码、身份证
critical 信用卡、API 密钥

铁律: AI-first 自动注册只允许 privacy_risk == safe 的文件上链。 标记为 lowmediumhighcritical 的文件都会留在本地等待人工审查。

生态

oasyce-chain  — L1 共识层(Go 应用链)
oasyce CLI    — Python 薄客户端 + Dashboard
DataVault     — AI Agent 数据管理 Skill(本仓库)
组件 定位
oasyce-chain L1 共识和结算
oasyce Python 客户端、CLI、Dashboard
DataVault (本仓库) 默认数据入口:扫描、隐私检测、报告、注册

当前进度

  • v0.2.1,测试见仓库 CI / 本地回归
  • 确定性扫描 + SHA-256 哈希 + 文件分类
  • 正则 PII 检测(邮箱、信用卡、API 密钥、身份证)
  • SQLite 本地清单
  • Oasyce 桥接注册
  • AI Agent Skill 模式(CLAUDE.md 内置 SOP)
  • --confirm 标志防止意外注册

许可证

MIT

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

odv-0.3.0.tar.gz (21.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

odv-0.3.0-py3-none-any.whl (16.0 kB view details)

Uploaded Python 3

File details

Details for the file odv-0.3.0.tar.gz.

File metadata

  • Download URL: odv-0.3.0.tar.gz
  • Upload date:
  • Size: 21.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.13

File hashes

Hashes for odv-0.3.0.tar.gz
Algorithm Hash digest
SHA256 8e14d3895795552ae8dee67e7f4ad57b8108b024d3a5d663727af913ff3b5735
MD5 0b63e22b6d731ce05d75148842423d39
BLAKE2b-256 d5b1b97e4d82f86312ac1dafea887707a5319198abe7fd02255bc6a60bc4915e

See more details on using hashes here.

File details

Details for the file odv-0.3.0-py3-none-any.whl.

File metadata

  • Download URL: odv-0.3.0-py3-none-any.whl
  • Upload date:
  • Size: 16.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.13

File hashes

Hashes for odv-0.3.0-py3-none-any.whl
Algorithm Hash digest
SHA256 1d96ad28a0470cd8af9cea0211628fd80287467216ef6dabf21f5940a0255018
MD5 7e658c8ed9c423640daa8959b1fbb32c
BLAKE2b-256 0df90eafc2016e2fda2f59c8656d4c495e9491de656b394d8f1652fc38a934f0

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page