Skip to main content

Upsert function in Pandas

Project description

Upsert Pandas

Repo PyPI - Version
Read the Docs Publish Python to PyPI

A função Upsert é uma operação fundamental em bancos de dados e sistemas de gerenciamento de dados que combina as operações de Update (Atualizar) e Insert (Inserir) em uma única etapa atômica. O nome Upsert é, literalmente, uma junção dos dois verbos.



Objetivo da Função Upsert

O principal objetivo do upsert é garantir que os dados de uma fonte de origem sejam sincronizados de forma eficiente com uma tabela de destino, sem gerar erros de duplicidade nas chaves primárias.

Ela funciona verificando a existência de um registro com base em uma Chave de Negócio (ou Chave Primária):

  • SE o registro EXISTE na tabela de destino (match na chave): Atualiza (Update) as colunas do registro existente com os novos valores da fonte de origem.

  • SE o registro NÃO EXISTE na tabela de destino (não há match na chave): Insere (Insert) o novo registro na tabela de destino.



Cenários de Uso Comuns

O Upsert é amplamente utilizado em Engenharia de Dados, ETL/ELT e Data Warehousing:

  • Sincronização de Dados: É a base para manter tabelas de dimensão em Data Warehouses atualizadas, garantindo que novos clientes sejam inseridos e que os dados de clientes existentes (como endereço ou nome) sejam corrigidos.
  • Processamento de Streams: Em sistemas de processamento em tempo real (como Apache Kafka ou Flink), o Upsert é usado para garantir que o estado de uma entidade seja consistentemente atualizado, tratando eventos novos ou modificações.
  • Pandas/PySpark: Em ambientes como PySpark (com Delta Lake) ou Pandas, a lógica Upsert é implementada para fundir (merge) DataFrames de forma eficiente.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

upsert_pandas-0.0.4.tar.gz (4.5 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

upsert_pandas-0.0.4-py3-none-any.whl (4.8 kB view details)

Uploaded Python 3

File details

Details for the file upsert_pandas-0.0.4.tar.gz.

File metadata

  • Download URL: upsert_pandas-0.0.4.tar.gz
  • Upload date:
  • Size: 4.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.10.2 {"installer":{"name":"uv","version":"0.10.2","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}

File hashes

Hashes for upsert_pandas-0.0.4.tar.gz
Algorithm Hash digest
SHA256 edfd91e4ee46c26660bb44c059ece9a5978617cd89a80a267bb514d83f7eafa4
MD5 0469f0b0cb977faace92f3ba35df4972
BLAKE2b-256 8cb3f5ce28e9ecbf8041a68890231e7a0a1d2a5dac8884f9d2b8ea9d12593e5c

See more details on using hashes here.

File details

Details for the file upsert_pandas-0.0.4-py3-none-any.whl.

File metadata

  • Download URL: upsert_pandas-0.0.4-py3-none-any.whl
  • Upload date:
  • Size: 4.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.10.2 {"installer":{"name":"uv","version":"0.10.2","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}

File hashes

Hashes for upsert_pandas-0.0.4-py3-none-any.whl
Algorithm Hash digest
SHA256 49f40396f602610abf47d2b4ee54b5ceeb18da7026ff532016c2fdde380d960e
MD5 b1ff1f90425e635eac5bc701788f49ec
BLAKE2b-256 f8880a31eea56176c25452cb616c23854aed1a8c6631921f3f49fc1910e5459f

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page