Arrow-mssql exporta tabela ou consulta para .parquet ou .csv, e também faz a leitura de .parquet ou .csv para tabela do sql server
Project description
Arrow-mssql
O que é o Arrow-mssql ?
É um projeto que recebe uma tabela ou consulta do SQL SERVER
e faz a exportação para um arquivo .parquet ou .csv,
utilizando a solução arrow que é uma tecnologia com
foco em análise e desempenho na memória.
Também é possível importar um arquivo .parquet para uma tabela do sql server ou arquivo .csv.
Instalação
pip install arrow-mssql
Conexão
Para se conectar ao sql server o driver padrão
é o pyodbc
é preciso fornecedor uma string de conexao
somente a string de conexão é permitida
DRIVER = (
'Driver={ODBC Driver 18 for Sql Server};'
'Server=seu_servidor;'
'Database=seu_banco_de_dados;'
'TrustServerCertificate=Yes;'
'Authentication=ActiveDirectoryIntegrated;'
)
Como usar ?
Tanto uma tabela ou consulta pode ser exportada
a exportacao é feita de forma incrimental por lotes de dados
# EXPORTANDO UMA TABELA -- para csv
to_csv(
DRIVER,
'NOME_TABELA',
schema='dbo',
database='seu_banco',
path='destino.csv'
)
# EXPORTANDO UMA CONSULTA -- para .parquet
to_parquet(
DRIVER,
'SELECT N1, N2 FROM NOME_TABELA WHERE N1 = 0',
schema='dbo',
database='seu_banco',
path='destino.parquet'
)
É possivel importar arquivos csv ou parquet, definir um limite de linhas e colunas no processo.
# IMPORTAR .parquet para tabela temporaria do ssms
# o retornor é um cursor referente a conexao com o banco de dados
with write_parquet(
DRIVER,
'##teste',
path='origem.parquet'
) as C:
...
# AGORA é possivel importar um numero limite de linhas
# e selecionar as colunas no arquivo parquet
with write_parquet(
DRIVER,
'##teste',
path='origem.parquet',
limit=100,
columns=['col1', 'col2']
) as C:
...
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file arrow_mssql-0.0.87.tar.gz
.
File metadata
- Download URL: arrow_mssql-0.0.87.tar.gz
- Upload date:
- Size: 8.0 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.8.3 CPython/3.11.7 Windows/10
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 1cb2931ba39ecc029ecab63fe7048f310db3db96a4339cf5095b4e1d6caf548b |
|
MD5 | 869b6afa458ec9d073f9c5902de10b64 |
|
BLAKE2b-256 | 57e1838853c22aab4f37ed2a08866b958536186a7e5485983eeeab1eea707de6 |
File details
Details for the file arrow_mssql-0.0.87-py3-none-any.whl
.
File metadata
- Download URL: arrow_mssql-0.0.87-py3-none-any.whl
- Upload date:
- Size: 10.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.8.3 CPython/3.11.7 Windows/10
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | b1ce17bfebcf2bbbda9fc709e5215f7e68b90030f83cd07d0a00da8a5553aec4 |
|
MD5 | 6807a6082104d47cce9b0b7071f74504 |
|
BLAKE2b-256 | 560e04b90b64c5351eb4c8d27611420757a814d09aaac216a2c1b54f98f5b4f6 |