[DEPRECATED] Use oasyce-sdk instead — pip install oasyce-sdk
Project description
DataVault
English version: README_EN.md
Oasyce 的默认数据入口。
DataVault 给你的 AI 提供一套标准化的工作流——扫描、分类、隐私检测、安全注册数据资产。它不是替代 AI 的判断力,而是一套确定性 SOP,让每个 Agent 每次都遵循同样的规则。
最重要的定位只有一句:
DataVault:默认的数据入口,适合目录、批量、安全扫描oas register:显式单文件注册,适合精确控制和调试
为什么需要 DataVault?
你的 AI 已经能读文件、分类数据了。但没有 DataVault:
- 每次对话应用的标准不一样
- 隐私检查靠概率
- 没有审计记录
- 用户想不到让 AI 管理数据资产
DataVault 提供确定性规则(正则 PII 检测、扩展名分类)加上标准管线,AI Agent 自动遵循。
安装
pip install odv # 独立扫描器
pip install oasyce # 推荐:同时包含 Oasyce + DataVault
oas bootstrap # 自更新 + 钱包 + DataVault 就绪 + 托管自动更新
使用
datavault scan ~/Documents # 扫描目录,SHA-256 哈希
datavault classify # 自动检测文件类型
datavault privacy # 扫描 PII(身份证、信用卡、API 密钥)
datavault report # 查看报告
datavault report --format json # JSON 格式输出
datavault register ~/Documents --confirm --json # 只注册 safe 文件
什么时候优先用 DataVault?
优先场景:
- 你面对的是一个目录,而不是一个明确文件
- 你希望 AI 先检查隐私,再决定能不能注册
- 你希望注册动作有明确报告和人工确认
保留 oas register 的场景:
- 你已经知道就是这一个文件
- 你要显式写
owner / tags / rights_type - 你在调试协议动作,而不是做目录级资产治理
如果目录里是公开 Git 仓库中的开源源码资产,DataVault 仍然只负责
扫描、隐私判断和安全接入;真正的默认定价策略由 Oasyce 决定。
当前 Oasyce 的 V1 规则是:这类源码资产在保持 price_model=auto 时,
会优先按 free 处理,而不是默认走收费曲线。
如果你的目标是“让 AI 持续自动使用 Oasyce”,当前最简单的入口是:
oas agent quickstart --scan-paths ~/Documents
它会先确认 strict-chain public beta 已就绪,然后让自治调度优先使用 DataVault-first 的规则做持续扫描和安全注册。自动交易默认仍然关闭,只有在你明确给了预算和标签时才会打开。
作为 AI Skill 使用
当 Claude Code、Cursor 或任何 AI 编程助手使用时:
用户: "帮我管理 ~/Documents 里的数据资产"
AI(装了 DataVault skill):
1. datavault scan ~/Documents -> 扫描 342 个文件
2. datavault privacy -> 标记 12 个包含 PII 的文件
3. datavault report --format json -> 显示 330 个安全文件
4. "发现 330 个安全文件,12 个包含敏感信息(信用卡号、API 密钥)。
要注册安全的那些吗?"
5. datavault register ~/Documents --confirm --json
-> 只自动注册 `privacy_risk == safe` 的文件
没有 DataVault,AI 每次都会用不同的方式处理这个流程。
管线
扫描 (本地) -> 分类 (本地) -> 隐私检测 (本地) -> 报告 (本地)
|
用户确认
|
注册 (上链)
分割线以上全部在本地完成,免费。注册是一个需要明确确认的操作,发布到 Oasyce 网络。
上链的是什么?
只有 SHA-256 哈希和元数据(名称、标签、权利类型)。永远不上传原始文件内容。文件留在你的机器上。
风险等级
| 等级 | 含义 |
|---|---|
| safe | 未检测到 PII |
| low | 仅 IP 地址 |
| medium | 电子邮件地址 |
| high | 电话号码、身份证 |
| critical | 信用卡、API 密钥 |
铁律: AI-first 自动注册只允许 privacy_risk == safe 的文件上链。
标记为 low、medium、high、critical 的文件都会留在本地等待人工审查。
生态
oasyce-chain — L1 共识层(Go 应用链)
oasyce CLI — Python 薄客户端 + Dashboard
DataVault — AI Agent 数据管理 Skill(本仓库)
| 组件 | 定位 |
|---|---|
| oasyce-chain | L1 共识和结算 |
| oasyce | Python 客户端、CLI、Dashboard |
| DataVault (本仓库) | 默认数据入口:扫描、隐私检测、报告、注册 |
当前进度
- v0.2.1,测试见仓库 CI / 本地回归
- 确定性扫描 + SHA-256 哈希 + 文件分类
- 正则 PII 检测(邮箱、信用卡、API 密钥、身份证)
- SQLite 本地清单
- Oasyce 桥接注册
- AI Agent Skill 模式(CLAUDE.md 内置 SOP)
--confirm标志防止意外注册
许可证
MIT
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file odv-0.3.0.tar.gz.
File metadata
- Download URL: odv-0.3.0.tar.gz
- Upload date:
- Size: 21.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
8e14d3895795552ae8dee67e7f4ad57b8108b024d3a5d663727af913ff3b5735
|
|
| MD5 |
0b63e22b6d731ce05d75148842423d39
|
|
| BLAKE2b-256 |
d5b1b97e4d82f86312ac1dafea887707a5319198abe7fd02255bc6a60bc4915e
|
File details
Details for the file odv-0.3.0-py3-none-any.whl.
File metadata
- Download URL: odv-0.3.0-py3-none-any.whl
- Upload date:
- Size: 16.0 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
1d96ad28a0470cd8af9cea0211628fd80287467216ef6dabf21f5940a0255018
|
|
| MD5 |
7e658c8ed9c423640daa8959b1fbb32c
|
|
| BLAKE2b-256 |
0df90eafc2016e2fda2f59c8656d4c495e9491de656b394d8f1652fc38a934f0
|