Skip to main content

Arrow-mssql exporta tabela ou consulta para .parquet ou .csv, e também faz a leitura de .parquet ou .csv para tabela do sql server

Project description

Arrow-mssql

PyPI

O que é o Arrow-mssql ?

É um projeto que recebe uma tabela ou consulta do SQL SERVER e faz a exportação para um arquivo .parquet ou .csv, utilizando a solução arrow que é uma tecnologia com foco em análise e desempenho na memória.

Também é possível importar um arquivo .parquet para uma tabela do sql server ou arquivo .csv.

Instalação

pip install arrow-mssql

Conexão

Para se conectar ao sql server o driver padrão é o pyodbc é preciso fornecedor uma string de conexao

somente a string de conexão é permitida

DRIVER = (
    'Driver={ODBC Driver 18 for Sql Server};'
    'Server=seu_servidor;'
    'Database=seu_banco_de_dados;'
    'TrustServerCertificate=Yes;'
    'Authentication=ActiveDirectoryIntegrated;'
)

Como usar ?

Tanto uma tabela ou consulta pode ser exportada

a exportacao é feita de forma incrimental por lotes de dados

# EXPORTANDO UMA TABELA -- para csv
to_csv(
    DRIVER, 
    'NOME_TABELA',
    schema='dbo',
    database='seu_banco', 
    path='destino.csv'
)

# EXPORTANDO UMA CONSULTA -- para .parquet
to_parquet(
    DRIVER, 
    'SELECT N1, N2 FROM NOME_TABELA WHERE N1 = 0', 
    schema='dbo',
    database='seu_banco', 
    path='destino.parquet'
)

É possivel importar arquivos csv ou parquet, definir um limite de linhas e colunas no processo.

# IMPORTAR .parquet para tabela temporaria do ssms
# o retornor é um cursor referente a conexao com o banco de dados
with write_parquet(
    DRIVER, 
    '##teste', 
    path='origem.parquet'
) as C:

    ...

# AGORA é possivel importar um numero limite de linhas
# e selecionar as colunas no arquivo parquet
with write_parquet(
    DRIVER, 
    '##teste', 
    path='origem.parquet',
    limit=100,
    columns=['col1', 'col2']
) as C:

    ...

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

arrow_mssql-0.0.87.tar.gz (8.0 kB view details)

Uploaded Source

Built Distribution

arrow_mssql-0.0.87-py3-none-any.whl (10.2 kB view details)

Uploaded Python 3

File details

Details for the file arrow_mssql-0.0.87.tar.gz.

File metadata

  • Download URL: arrow_mssql-0.0.87.tar.gz
  • Upload date:
  • Size: 8.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.11.7 Windows/10

File hashes

Hashes for arrow_mssql-0.0.87.tar.gz
Algorithm Hash digest
SHA256 1cb2931ba39ecc029ecab63fe7048f310db3db96a4339cf5095b4e1d6caf548b
MD5 869b6afa458ec9d073f9c5902de10b64
BLAKE2b-256 57e1838853c22aab4f37ed2a08866b958536186a7e5485983eeeab1eea707de6

See more details on using hashes here.

File details

Details for the file arrow_mssql-0.0.87-py3-none-any.whl.

File metadata

  • Download URL: arrow_mssql-0.0.87-py3-none-any.whl
  • Upload date:
  • Size: 10.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.11.7 Windows/10

File hashes

Hashes for arrow_mssql-0.0.87-py3-none-any.whl
Algorithm Hash digest
SHA256 b1ce17bfebcf2bbbda9fc709e5215f7e68b90030f83cd07d0a00da8a5553aec4
MD5 6807a6082104d47cce9b0b7071f74504
BLAKE2b-256 560e04b90b64c5351eb4c8d27611420757a814d09aaac216a2c1b54f98f5b4f6

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page