metadriven-адаптер для RESTAPI запросов
Project description
REST2JSON
Конфигурируемый адаптер, способный выполнять чтение данных с использованием внешнего REST-сервиса без написания клиента под каждый конкретный API на основании описания метаданных этого сервиса.
Особенности
- Гибкая конфигурация через OmegaConf
- Загрузка OpenAPI спецификаций из файлов (YAML/JSON) или по URL
- Пакетная обработка запросов с подготовкой payload(Возможно,придется отказаться в пользу явного построения запроса)
- Поддержка контекстного менеджера для безопасного управления ресурсами
- Генерация JSON Schema из OpenAPI спецификации
Установка
pip install git+https://github.com/Siinthd/Rest2JSON.git
pip install REST2JSON --index-url {mirror}
Быстрый старт
Простой запрос
from rest2json import REST2JSON
config_file = 'C:/Users/kdenis/Documents/Work/configs/config_WorldBank.yaml'
import yaml
with open(config_file) as stream:
try:
config = yaml.safe_load(stream)
except yaml.YAMLError as exc:
print(exc)
#Иницализация адаптера, в этот момент происходит чтение/конфигурации,скачивание спецификации и ее парсинг
adapter = REST2JSON(config)
# get_schema() возвращает схему данных в <class 'dict'> - формате
# по умолчанию (raw = False) вернет Spark dataframe ddl
# (raw = True) возвращает структуру ответа без обработки (не подходит,чтобы создать dataframe)
schema = adapter.get_schema(raw = False)
# get_data() возвращает данные ответов с сервера в формате [<class 'dict'>]
# по умолчанию (пустые скобки), payload берется из конфигурации
data = adapter.get_data()
# При наличии payload (get_data(payload)) у сервера запрашиваются конкретные в payload данные.
payload = [{"query": 123}, {"query": 456}, {"query": 789}]
results = adapter.get_response(payload)
Использование с контекстным менеджером
# возможность докачки данных вне конфигурации
with REST2JSON(config) as adapter:
# Работа с адаптером
response = adapter.get_data({})
print(response)
# Автоматическое закрытие соединений
Пакетная обработка
payload = [{"query": 123}, {"query": 456}, {"query": 789}] # API-сервис ожидает параметр c именем query
with REST2JSON(config) as adapter:
results = adapter.get_response(payload)
for result in results:
print(result)
#или
adapter = REST2JSON(config)
response = adapter.get_response(payload)
for result in response:
print(result)
Конфигурация
Структура конфигурации
# обязательный: параметры процесса
# (основные настройки)
proc:
# обязательный: конфиг источника
src:
# обязательный: наименование источника
name: "getEverything" #
# обязательный: тип подключения
# определяет, как мы читаем источник
conn_type: 'rest2json'
# обязательный: список параметров подключения
conn_params:
# опциональный: количество ретраев и таймаут
# если не указать -- 1 ретрай и какой-нибудь таймаут
retries: 3
timeout: 30
# обязательный: спецификация сервиса
# (хотя бы один из двух должен быть указан и заполнен)
# отсюда берём схемы реплаев,
# + url для запроса, если возможно
spec_url: 'https://dadata.ru/files/openapi/suggestions.yml'
spec_data:
# опциональный: адрес для запроса
base_url: "https://suggestions.dadata.ru/suggestions"
# опциональный: ep+method для случаев, когда сервис не использует operation_id
endpoint_url: "/api/4_1/rs/suggest/bank"
method: 'post'
# опциональный: перебор страниц на сервере
# игнорим, если параметра нет,
pagination:
# обязательный: включение
enabled: false
# обязательный: название параметра с номером страницы
page_param: 'page'
# обязательный: название параметра с размером страницы
pagesize_param: 'per_page'
# обязательный: запрашиваемый размер страницы
pagesize_val: 100
# обязательный: название параметра с общим числом записей
pagecnt_param: "total_results"
# обязательный: конфиг данных (схема, фильтры, etc)
data:
# TODO: использовать динамическую генерацию запросов по спеке,
# и как-то угадывать, куда какие параметры писать -- нецелесообразно
payload:
['SABRRUMM', 'VTBRRUMM',]
# опциональный: свой маппинг типов
json_mapping_override:
"null": "null"
# обязательный: данные для авторизации
# содержат только логины, токены, пароли
auth:
# источник (extract)
src:
header: # авторизация через хедер (как в dadata)
"Authorization": "Token "
"X-Secret": ""
#X-Secret: "64545645"
body: # авторизация через параметр в теле (как в random.org)
#- "API_KEY: 12434547985675"
env:
# опциональный: маппинг типов данных (при конвертация в StrucType-json)
json:
type_mapping:
int32: integer
int64: long
float: float
double: double
date: string
date-time: string
binary: binary
Class Reference
Класс REST2JSON
Основной класс для работы с API.
Методы
get_data(data=None)
Основной метод для выполнения запросов. Автоматически управляет контекстом.
Параметры:
-
data- Данные для запроса. Может быть:None- запрос без параметров,в таком случае данные для запроса берутся из конфигурации (раздел proc.src.data.payload)dict- одиночный запрос (может быть пустым - {})list[dict]- пакет запросов (может быть пустым - [])str/int- одиночное значение (будет преобразовано в параметр required)(может быть пустым - '')
Возвращает: JSON ответ от API или список ответов при пакетной обработке.
get_schema(raw = False)
Возвращает: схема структуры данных из OpenAPI спецификации при raw = False возвращает схему в Spark-формате.
Обработка payload
Для получения ответа от API сервиса необходимо передать в запрос параметры, которые он ожидает — обычно это идентификаторы, фильтры или данные для создания/обновления объектов. Они могут быть переданы как часть URL (например, /users/123), в строке запроса (?page=2) или в теле запроса (JSON с полями).
Такие параметры указаны в разделе "requestBody". Часто, это один required-параметр и можно передать в REST2JSON список значения без указания имени параметра - Сервис сам подставить имя параметра.
В противном случае, требуется указать все параметры явно:
data = {"query": 123,"status":["ACTIVE"],"type":["BANK","BANK_BRANCH","OTHER"]}
Пример requestBody в спецификации
requestBody:
content:
application/json:
schema:
required:
- query
type: object
properties:
count:
type: integer
format: int32
nullable: true
default: 10
locations:
type: array
nullable: true
items:
$ref: "#/components/schemas/LocationCode"
locations_boost:
type: array
nullable: true
items:
$ref: "#/components/schemas/LocationCode"
query:
type: string
status:
type: array
nullable: true
items:
type: string
enum:
- ACTIVE
- LIQUIDATING
- LIQUIDATED
- REORGANIZING
- BANKRUPT
type:
type: array
nullable: true
items:
type: string
enum:
- BANK
- NKO
- BANK_BRANCH
- NKO_BRANCH
- RKC
- CBR
- TREASURY
- OTHER
| Тип входных данных | Результат |
|---|---|
{},[],'' |
[dict] - одиночный запрос(сервер не ждет данных) |
dict |
[dict] - одиночный запрос |
list[dict] |
list[dict] - пакет запросов |
list (не словарей) |
Если required имеет n параметров: [{query: value_1}...{query: value_n}] |
| Одиночное значение | Если required имеет 1 параметр: [{query: value}] |
Примеры преобразования данных
# Одиночный словарь
data = {"query": 123}
# → [{"query": 123}]
# Список словарей
data = [{"query": 123}, {"query": 456}]
# → [{"query": 123}, {"query": 456}]
# Список значений (если required = ["id"])
data = [123, 456, 789]
# [{"query": 123}, {"query": 456}, {"query": 789}]
# Одиночное значение (если required = ["query"])
data = 123
# [{"query": 123}]
data = {"query": 123,"status":["ACTIVE"],"type":["BANK","BANK_BRANCH","OTHER"]}
#Явное указание дополнительных фильтров
TODO
- Проверка наличия ключей словаря в спецификации
- Формирование очереди загрузок
- Реализация пагинации
- Улучшенная валидация ответов
- Потокобезопасность
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file rest2json-0.1.4.tar.gz.
File metadata
- Download URL: rest2json-0.1.4.tar.gz
- Upload date:
- Size: 26.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
10eb50555522f5a3409bf32fda7efe32de3836ff733d7885dd4bbe13d3f5cedf
|
|
| MD5 |
94c13dd8aa1a1237fba67cc2fffaf0c5
|
|
| BLAKE2b-256 |
13312724078aab6b90df8d65d430a0baceb4d21c959a668db93a759a43577f28
|
File details
Details for the file rest2json-0.1.4-py3-none-any.whl.
File metadata
- Download URL: rest2json-0.1.4-py3-none-any.whl
- Upload date:
- Size: 23.9 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
e57227761b7e01a27325c4bf21133cc9a49ba4e7c4680b99339b5ffb4b86830d
|
|
| MD5 |
bd42cb54b9025ac5d561d040ff1992e9
|
|
| BLAKE2b-256 |
ce49d828f349d3516d171d3696b9dcb52bef2fd752e52428dc0dc0d035d09d8b
|