GrowingIO Importer是GrowingIO CDP平台元数据创建和数据导入工具
Project description
GrowingIO Importer
GrowingIO Importer是GrowingIO CDP平台元数据创建和数据导入工具。
入门
有关GrowingIO Importer请访问GrowingIO官方文档获取帮助。
环境依赖
| 4.4 | |
|---|---|
| Python | 3.8 |
安装
pip install gio-importer-v44
环境参数
import importers
print(importers.__path__)
根据路径信息,进入包目录,修改conf.cfg(导入工具配置信息)
需要修改有关FTP,API信息(找负责项目运维提供FTP,API-uri相关信息)
元数据导入
目前支持如下:
- 创建事件
- 创建事件属性
- 创建用户属性
- 绑定事件与事件属性
- 导出元数据
- 导入元数据
使用说明
创建事件
from importers import meta_importer
params = {
'm': 'create_event',
'key': '<事件名>',
'name': '<事件显示名>',
'desc': '<事件描述>'
}
meta_importer.do_meta(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必选参数,项目名。 |
| --key | 必选参数,事件名。仅允许大小写英文、数字、以及下划线,并且不能以数字开头,限长30字符 |
| --name | 可选参数,事件显示名。默认同事件名,限长30字符 |
| --desc | 可选参数,事件描述,默认为空。若描述中有空格则需要加双引号 |
创建事件属性
from importers import meta_importer
params = {
'm': 'create_event_variables',
'key': '<事件属性名>',
'type': '<事件属性数据类型>',
'name': '<事件属性显示名>',
'desc': '<事件属性描述>'
}
meta_importer.do_meta(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必选参数,项目名。 |
| --key | 必选参数,事件名。仅允许大小写英文、数字、以及下划线,并且不能以数字开头,限长30字符 |
| --type | 必选参数,事件属性数据类型。可选值:string/int/double |
| --name | 可选参数,事件显示名。默认同事件名,限长30字符 |
| --desc | 可选参数,事件描述,默认为空。若描述中有空格则需要加双引号 |
创建用户属性
from importers import meta_importer
params = {
'm': 'create_user_variables',
'key': '<用户属性名>',
'type': '<用户属性数据类型>',
'name': '<用户属性显示名>',
'desc': '<用户属性描述>'
}
meta_importer.do_meta(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必选参数,项目名。 |
| --key | 必选参数,标识符。仅允许大小写英文、数字、以及下划线,并且不能以数字开头,限长30字符 |
| --type | 必选参数,可选参数:string/int/date |
| --name | 可选参数,用户显示名。默认同标识符,限长30字符 |
| --desc | 可选参数,用户属性描述,默认为空。若描述中有空格则需要加双引号 |
绑定事件与事件属性
python3 meta_importer.py -m bind_event_variables \
-k <事件名> \
-a <绑定事件属性名> \
| 参数 | 参数说明 |
|---|---|
| -m | 必选参数,项目名。 |
| --key | 必选参数,事件名。若事件不存在则创建,否则更新事件 |
| --attr | 必选参数,绑定事件属性名。多个属性名使用英文逗号分隔(需加单引号或者在特殊符号前加上) |
导出元数据
from importers import meta_importer
params = {
'm': 'bind_event_variables',
'key': '<事件名>',
'attr': '<绑定事件属性名集合>'
}
meta_importer.do_meta(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必选参数,项目名。 |
| --file | 必选参数,导出文件名 |
导入元数据
from importers import meta_importer
params = {
'm': 'import_meta',
'file': '<文件名>'
}
meta_importer.do_meta(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必选参数,项目名。 |
| --file | 必选参数,导入文件名 |
数据导入
目前支持如下:
- 用户属性数据导入
- 用户行为数据导入
使用说明
用户属性数据导入
from importers import data_importer
params = {
'm': 'user_variables',
'path': '<文件路径>',
'datasource_id': '<数据源ID>',
'format': '[CSV|TSV|Json]',
'separator': ',',
'skip_header': 'True',
'attributes': 'userId,...'
}
data_importer.do_importer(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 用户属性数据导入-user_variables |
| -path | 必填参数. 需要导入的数据所在的路径 |
| -datasource_id | 必填参数. 数据源ID |
| -format | 可选参数. 导入数据格式,目前支持JSON,CSV,TSV三种格式.默认值:JSON |
| -qualifier | 可选参数. CSV,TSV格式文本限定符.默认值:" |
| -separator | 可选参数. CSV,TSV格式文本分割符.默认值:, |
| -skip_header | 可选参数. CSV,TSV格式设置则自动跳过首行,此参数不需要设置值. |
| -attributes | 可选参数. CSV,TSV格式导入文件的各列按顺序映射到属性名,逗号分隔.userId必须指定(需加单引号或者在特殊符号前加上) |
用户行为数据导入
from importers import data_importer
params = {
'm': 'events',
'path': '<文件路径>',
'datasource_id': '<数据源ID>',
'format': '[CSV|TSV|Json]',
'separator': ',',
'skip_header': 'True',
'attributes': 'userId,...,
'event_start': '<数据起始日期 YYYY-MM-DD>',
'event_end': '<数据结束日期 YYYY-MM-DD>'
}
data_importer.do_importer(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 用户行为数据导入-events |
| -path | 必填参数. 需要导入的数据所在的路径 |
| -datasource_id | 必填参数. 数据源ID |
| -event_start | 必选参数. 数据起始时间,导入用户行为数据时指定.格式:YYYY-MM-DD |
| -event_end | 必选参数. 数据结束时间,导入用户行为数据时指定.格式:YYYY-MM-DD |
| -format | 可选参数. 导入数据格式,目前支持JSON,CSV,TSV三种格式.默认值:JSON |
| -qualifier | 可选参数. CSV,TSV格式文本限定符.默认值:" |
| -separator | 可选参数. CSV,TSV格式文本分割符.默认值:, |
| -skip_header | 可选参数. CSV,TSV格式设置则自动跳过首行,此参数不需要设置值. |
| -attributes | 可选参数. CSV,TSV格式导入文件的各列按顺序映射到属性名,逗号分隔.userId,event,timestamp必须指定(需加单引号或者在特殊符号前加上) |
数据导入之MYSQL
目前支持如下:
- 用户属性数据导入
- 用户行为数据导入
使用说明
用户属性数据导入
from importers import format_importer
params = {
'm': 'user_variables',
'format': 'mysql',
'datasource_id': '<数据源ID>',
'host': '<数据库连接地址>',
'user': '<数据库连接用户>',
'password': '<数据库连接密码>',
'port': '<数据库连接端口号>',
'sql': '<查询语句>'
}
format_importer.do_importer(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 用户属性数据导入-user_variables |
| -datasource_id | 必填参数. 数据源ID |
| -format | 必选参数. 导入数据格式,目前支持mysql、hive数据源 |
| -host | 必选参数. mysql数据库ip |
| -user | 必选参数. 客户端用户名 |
| -password | 必选参数.客户端密码 |
| -port | 必选选参数. 客户端端口号 |
| -sql | 必选参数. sql语句 |
用户行为数据导入
from importers import format_importer
params = {
'm': 'events',
'format': 'mysql',
'datasource_id': '<数据源ID>',
'host': '<数据库连接地址>',
'user': '<数据库连接用户>',
'password': '<数据库连接密码>',
'port': '<数据库连接端口号>',
'sql': '<查询语句>',
'start_time': '<数据起始日期>',
'end_time': '<数据结束日期>'
}
format_importer.do_importer(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 用户属性数据导入-user_variables |
| -datasource_id | 必填参数. 数据源ID |
| -format | 必选参数. 导入数据格式,目前支持mysql、hive数据源 |
| -host | 必选参数. mysql数据库ip |
| -user | 必选参数. 客户端用户名 |
| -password | 必选参数.客户端密码 |
| -port | 必选选参数. 客户端端口号 |
| -sql | 必选参数. sql语句 |
| -start_time | 必选参数. 数据起始时间,导入用户行为数据时指定.格式:YYYY-MM-DD |
| -end_time | 必选参数. 数据结束时间,导入用户行为数据时指定.格式:YYYY-MM-DD |
数据导入之HIVE
目前支持如下:
- 用户属性数据导入
- 用户行为数据导入
使用说明
用户属性数据导入
from importers import format_importer
params = {
'm': 'user_variables',
'format': 'hive',
'datasource_id': '<数据源ID>',
'host': '<数据库连接地址>',
'user': '<数据库连接用户>',
'password': '<数据库连接密码>',
'port': '<数据库连接端口号>',
'sql': '<查询语句>'
}
format_importer.do_importer(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 用户属性数据导入-user_variables |
| -datasource_id | 必填参数. 数据源ID |
| -format | 必选参数. 导入数据格式,目前支持mysql、hive数据源 |
| -host | 必选参数. mysql数据库ip |
| -user | 必选参数. 客户端用户名 |
| -password | 必选参数.客户端密码 |
| -port | 必选选参数. 客户端端口号 |
| -sql | 必选参数. sql语句 |
用户行为数据导入
from importers import format_importer
params = {
'm': 'events',
'format': 'hive',
'datasource_id': '<数据源ID>',
'host': '<数据库连接地址>',
'user': '<数据库连接用户>',
'password': '<数据库连接密码>',
'port': '<数据库连接端口号>',
'sql': '<查询语句>',
'start_time': '<数据起始日期>',
'end_time': '<数据结束日期>'
}
format_importer.do_importer(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 用户属性数据导入-user_variables |
| -datasource_id | 必填参数. 数据源ID |
| -format | 必选参数. 导入数据格式,目前支持mysql、hive数据源 |
| -host | 必选参数. mysql数据库ip |
| -user | 必选参数. 客户端用户名 |
| -password | 必选参数.客户端密码 |
| -port | 必选选参数. 客户端端口号 |
| -sql | 必选参数. sql语句 |
| -start_time | 必选参数. 数据起始时间,导入用户行为数据时指定.格式:YYYY-MM-DD |
| -end_time | 必选参数. 数据结束时间,导入用户行为数据时指定.格式:YYYY-MM-DD |
用户删除
目前支持如下:
- 触发用户删除任务
- 批量添加待删除用户
使用说明
触发用户删除任务
from importers import clear_user
params = {
'm': 'clear_users',
'now': True
}
clear_user.do_user(params)
python3 clear_user.py -m clear_users -n True
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 触发用户删除任务-clear_users |
| -now | 必填参数. True - 立即执行离线任务,False - 天任务执行清理任务 |
批量添加待删除用户
from importers import clear_user
params = {
'm': 'clear_users',
'users': 'xxx,xxx,xxx'
}
clear_user.do_user(params)
| 参数 | 参数说明 |
|---|---|
| -m | 必填参数. 批量添加待删除用户-clear_users_meta |
| -users | 必填参数. 添加待删除用户,多个用户以逗号(,)分隔 |
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
gio_importer_v45-1.0.2.tar.gz
(42.7 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file gio_importer_v45-1.0.2.tar.gz.
File metadata
- Download URL: gio_importer_v45-1.0.2.tar.gz
- Upload date:
- Size: 42.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.0.0 CPython/3.9.12
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c38e87bdcc29bf201d3e80826d3063363278e63d8b6e515e4f4aa1c32f702b8f
|
|
| MD5 |
882fda5c6d88fb3606869610d8bc043b
|
|
| BLAKE2b-256 |
21fc85624a0c387eb56d3ded4d2cd254cf59c033e03f0f96e59e9791e3b8f59f
|
File details
Details for the file gio_importer_v45-1.0.2-py3-none-any.whl.
File metadata
- Download URL: gio_importer_v45-1.0.2-py3-none-any.whl
- Upload date:
- Size: 65.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.0.0 CPython/3.9.12
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
dc917d7505a05c0530c73aae603e3b836630077f65b802ff3657f805a36367ca
|
|
| MD5 |
93b80dba18377b950ab8fde61f6eb490
|
|
| BLAKE2b-256 |
ede25370f06a2915430b808d6f222f493bb9775b3ff08f471c89c36e08b0cc33
|