Skip to main content

ssss

Project description

Upsert Pandas

Repo PyPI - Version
Read the Docs Publish Python to PyPI

A função Upsert é uma operação fundamental em bancos de dados e sistemas de gerenciamento de dados que combina as operações de Update (Atualizar) e Insert (Inserir) em uma única etapa atômica. O nome Upsert é, literalmente, uma junção dos dois verbos.



Objetivo da Função Upsert

O principal objetivo do upsert é garantir que os dados de uma fonte de origem sejam sincronizados de forma eficiente com uma tabela de destino, sem gerar erros de duplicidade nas chaves primárias.

Ela funciona verificando a existência de um registro com base em uma Chave de Negócio (ou Chave Primária):

  • SE o registro EXISTE na tabela de destino (match na chave): Atualiza (Update) as colunas do registro existente com os novos valores da fonte de origem.

  • SE o registro NÃO EXISTE na tabela de destino (não há match na chave): Insere (Insert) o novo registro na tabela de destino.



Cenários de Uso Comuns

O Upsert é amplamente utilizado em Engenharia de Dados, ETL/ELT e Data Warehousing:

  • Sincronização de Dados: É a base para manter tabelas de dimensão em Data Warehouses atualizadas, garantindo que novos clientes sejam inseridos e que os dados de clientes existentes (como endereço ou nome) sejam corrigidos.
  • Processamento de Streams: Em sistemas de processamento em tempo real (como Apache Kafka ou Flink), o Upsert é usado para garantir que o estado de uma entidade seja consistentemente atualizado, tratando eventos novos ou modificações.
  • Pandas/PySpark: Em ambientes como PySpark (com Delta Lake) ou Pandas, a lógica Upsert é implementada para fundir (merge) DataFrames de forma eficiente.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

upsert_pandas-0.0.1.tar.gz (4.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

upsert_pandas-0.0.1-py3-none-any.whl (4.6 kB view details)

Uploaded Python 3

File details

Details for the file upsert_pandas-0.0.1.tar.gz.

File metadata

  • Download URL: upsert_pandas-0.0.1.tar.gz
  • Upload date:
  • Size: 4.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.10.0 {"installer":{"name":"uv","version":"0.10.0","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}

File hashes

Hashes for upsert_pandas-0.0.1.tar.gz
Algorithm Hash digest
SHA256 1b6d0a63ba042d0ec82f7593007a1557b3d410a23418e092ad68a78be92d5dec
MD5 9edd4df2d8141a00ccc2004a1d0f1b5d
BLAKE2b-256 0e9bdb6ae83366732e522ec3fd95bd7d466f39ce1741dada7f13fbba909aac5b

See more details on using hashes here.

File details

Details for the file upsert_pandas-0.0.1-py3-none-any.whl.

File metadata

  • Download URL: upsert_pandas-0.0.1-py3-none-any.whl
  • Upload date:
  • Size: 4.6 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.10.0 {"installer":{"name":"uv","version":"0.10.0","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}

File hashes

Hashes for upsert_pandas-0.0.1-py3-none-any.whl
Algorithm Hash digest
SHA256 877e2430588536f4449dc672053baecec3026210b8659120bb6bf1739b23ae27
MD5 62e25de4e01e04caf41d6e1bf43a536c
BLAKE2b-256 4d4691f48a5931f02523600f5a0bb3777f5eec29738e4078cdf3eb44b324a25f

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page