tpu-inference

No project description provided

These details have not been verified by PyPI

Project description

vLLM TPU

Latest News 🔥

Pytorch Conference Learn how Spotify uses vLLM with both GPUs and TPUs to drive down costs and improve user experience.
Check back soon for a recording of our session at Ray Summit, November 3-5 in San Francisco!
Check back soon for a recording of our session at JAX DevLab on November 18th in Sunnyvale!
[2025/10] vLLM TPU: A New Unified Backend Supporting PyTorch and JAX on TPU

Previous News 🔥

About

vLLM TPU is now powered by tpu-inference, an expressive and powerful new hardware plugin unifying JAX and PyTorch under a single lowering path within the vLLM project. The new backend now provides a framework for developers to:

Push the limits of TPU hardware performance in open source.
Provide more flexibility to JAX and PyTorch users by running PyTorch model definitions performantly on TPU without any additional code changes, while also extending native support to JAX.
Retain vLLM standardization: keep the same user experience, telemetry, and interface.

Recommended models and features

Although vLLM TPU’s new unified backend makes out-of-the-box high performance serving possible with any model supported in vLLM, the reality is that we're still in the process of implementing a few core components.

For this reason, we’ve provided a Recommended Models and Features page detailing the models and features that are validated through unit, integration, and performance testing.

Get started

Get started with vLLM on TPUs by following the quickstart guide.

Visit our documentation to learn more.

Compatible TPU Generations

Recommended: v5e, v6e
Experimental: v3, v4, v5p

Check out a few v6e recipes here!

Contribute

We're always looking for ways to partner with the community to accelerate vLLM TPU development. If you're interested in contributing to this effort, check out the Contributing guide and Issues to start. We recommend filtering Issues on the good first issue tag if it's your first time contributing.

Contact us

For technical questions and feature requests, open a GitHub Issue
For feature requests, please open one on Github here
For discussing with fellow users, use the TPU support topic in the vLLM Forum
For coordinating contributions and development, use the Developer Slack
For collaborations and partnerships, contact us at vllm-tpu@google.com

Project details

These details have not been verified by PyPI

Release history Release notifications | RSS feed

0.19.0

May 5, 2026

0.19.0.dev20260506 pre-release

May 6, 2026

0.18.0

Apr 20, 2026

0.18.0rc1 pre-release

Apr 13, 2026

0.18.0.dev20260505 pre-release

May 5, 2026

0.18.0.dev20260504 pre-release

May 4, 2026

0.18.0.dev20260503 pre-release

May 3, 2026

0.18.0.dev20260502 pre-release

May 2, 2026

0.18.0.dev20260501 pre-release

May 1, 2026

0.18.0.dev20260430 pre-release

Apr 30, 2026

0.18.0.dev20260429 pre-release

Apr 29, 2026

0.18.0.dev20260428 pre-release

Apr 28, 2026

0.18.0.dev20260427 pre-release

Apr 27, 2026

0.18.0.dev20260426 pre-release

Apr 26, 2026

0.18.0.dev20260425 pre-release

Apr 25, 2026

0.18.0.dev20260424 pre-release

Apr 24, 2026

0.18.0.dev20260423 pre-release

Apr 23, 2026

0.18.0.dev20260422 pre-release

Apr 22, 2026

0.18.0.dev20260421 pre-release

Apr 21, 2026

0.13.3

Dec 30, 2025

0.13.2.post6

Dec 30, 2025

0.13.2

Dec 30, 2025

0.13.2rc4.post6 pre-release

Dec 30, 2025

0.13.2rc4 pre-release

Dec 30, 2025

0.13.2rc3 pre-release

Dec 24, 2025

0.13.2rc2.post7 pre-release

Dec 24, 2025

0.13.2rc2 pre-release

Dec 24, 2025

0.13.2rc1.post7 pre-release

Dec 23, 2025

0.13.2rc1 pre-release

Dec 23, 2025

0.13.2a1 pre-release

Mar 5, 2026

0.13.2.dev20260420 pre-release

Apr 20, 2026

0.13.2.dev20260419 pre-release

Apr 19, 2026

0.13.2.dev20260418 pre-release

Apr 18, 2026

0.13.2.dev20260417 pre-release

Apr 17, 2026

0.13.2.dev20260416 pre-release

Apr 16, 2026

0.13.2.dev20260415 pre-release

Apr 15, 2026

0.13.2.dev20260414 pre-release

Apr 14, 2026

0.13.2.dev20260413 pre-release

Apr 13, 2026

0.13.2.dev20260412 pre-release

Apr 12, 2026

0.13.2.dev20260411 pre-release

Apr 11, 2026

0.13.2.dev20260410 pre-release

Apr 10, 2026

0.13.2.dev20260409 pre-release

Apr 9, 2026

0.13.2.dev20260408 pre-release

Apr 8, 2026

0.13.2.dev20260407 pre-release

Apr 7, 2026

0.13.2.dev20260406 pre-release

Apr 6, 2026

0.13.2.dev20260405 pre-release

Apr 5, 2026

0.13.2.dev20260404 pre-release

Apr 4, 2026

0.13.2.dev20260403 pre-release

Apr 3, 2026

0.13.2.dev20260402 pre-release

Apr 2, 2026

0.13.2.dev20260401 pre-release

Apr 1, 2026

0.13.2.dev20260331 pre-release

Mar 31, 2026

0.13.2.dev20260330 pre-release

Mar 30, 2026

0.13.2.dev20260329 pre-release

Mar 29, 2026

0.13.2.dev20260328 pre-release

Mar 28, 2026

0.13.2.dev20260327 pre-release

Mar 27, 2026

0.13.2.dev20260326 pre-release

Mar 26, 2026

0.13.2.dev20260325 pre-release

Mar 25, 2026

0.13.2.dev20260324 pre-release

Mar 24, 2026

0.13.2.dev20260323 pre-release

Mar 23, 2026

0.13.2.dev20260322 pre-release

Mar 22, 2026

0.13.2.dev20260321 pre-release

Mar 21, 2026

0.13.2.dev20260320 pre-release

Mar 20, 2026

0.13.2.dev20260319 pre-release

Mar 19, 2026

0.13.2.dev20260318 pre-release

Mar 18, 2026

0.13.2.dev20260317 pre-release

Mar 17, 2026

0.13.2.dev20260316 pre-release

Mar 16, 2026

0.13.2.dev20260315 pre-release

Mar 15, 2026

0.13.2.dev20260314 pre-release

Mar 14, 2026

0.13.2.dev20260313 pre-release

Mar 13, 2026

0.13.2.dev20260312 pre-release

Mar 12, 2026

0.13.2.dev20260311 pre-release

Mar 11, 2026

0.13.2.dev20260310 pre-release

Mar 10, 2026

0.13.2.dev20260309 pre-release

Mar 9, 2026

0.13.2.dev20260308 pre-release

Mar 8, 2026

0.13.2.dev20260307 pre-release

Mar 7, 2026

0.13.2.dev20260306 pre-release

Mar 6, 2026

0.13.2.dev20260305 pre-release

Mar 5, 2026

0.13.2.dev20260304 pre-release

Mar 4, 2026

0.13.2.dev20260303 pre-release

Mar 3, 2026

0.13.2.dev20260302 pre-release

Mar 2, 2026

0.13.2.dev20260301 pre-release

Mar 1, 2026

0.13.2.dev20260228 pre-release

Feb 28, 2026

0.13.2.dev20260227 pre-release

Feb 27, 2026

0.13.2.dev20260226 pre-release

Feb 26, 2026

0.13.2.dev20260225 pre-release

Feb 25, 2026

0.13.2.dev20260224 pre-release

Feb 24, 2026

0.13.2.dev20260223 pre-release

Feb 23, 2026

0.13.2.dev20260222 pre-release

Feb 22, 2026

0.13.2.dev20260221 pre-release

Feb 21, 2026

0.13.2.dev20260220 pre-release

Feb 20, 2026

0.13.2.dev20260219 pre-release

Feb 19, 2026

0.13.2.dev20260218 pre-release

Feb 18, 2026

0.13.2.dev20260217 pre-release

Feb 17, 2026

0.13.2.dev20260216 pre-release

Feb 16, 2026

0.13.2.dev20260215 pre-release

Feb 15, 2026

0.13.2.dev20260214 pre-release

Feb 14, 2026

0.13.2.dev20260213 pre-release

Feb 13, 2026

0.13.2.dev20260212 pre-release

Feb 12, 2026

0.13.2.dev20260128 pre-release

Jan 28, 2026

0.13.2.dev20260127 pre-release

Jan 27, 2026

0.13.2.dev20260126 pre-release

Jan 26, 2026

0.13.2.dev20260125 pre-release

Jan 25, 2026

0.13.2.dev20260124 pre-release

Jan 24, 2026

0.13.2.dev20260123 pre-release

Jan 23, 2026

0.13.2.dev20260122 pre-release

Jan 22, 2026

0.13.2.dev20260121 pre-release

Jan 21, 2026

0.13.2.dev20260120 pre-release

Jan 20, 2026

0.13.2.dev20260119 pre-release

Jan 19, 2026

0.13.2.dev20260118 pre-release

Jan 18, 2026

0.13.2.dev20260117 pre-release

Jan 17, 2026

0.13.2.dev20260116 pre-release

Jan 16, 2026

0.13.2.dev20260115 pre-release

Jan 15, 2026

0.13.2.dev20260114 pre-release

Jan 14, 2026

0.13.2.dev20260113 pre-release

Jan 13, 2026

0.13.2.dev20260112 pre-release

Jan 12, 2026

0.13.2.dev20260111 pre-release

Jan 11, 2026

0.13.2.dev20260110 pre-release

Jan 10, 2026

0.13.2.dev20260109 pre-release

Jan 9, 2026

0.13.2.dev20260108 pre-release

Jan 8, 2026

0.13.2.dev20260107 pre-release

Jan 7, 2026

0.13.2.dev20260106 pre-release

Jan 6, 2026

0.13.2.dev20260105 pre-release

Jan 5, 2026

0.13.2.dev20260104 pre-release

Jan 4, 2026

0.13.2.dev20260103 pre-release

Jan 3, 2026

0.13.2.dev20260102 pre-release

Jan 2, 2026

0.13.2.dev20260101 pre-release

Jan 1, 2026

0.13.2.dev20251231 pre-release

Dec 31, 2025

0.13.2.dev20251230 pre-release

Dec 30, 2025

0.13.0rc2.post7 pre-release

Dec 23, 2025

0.13.0rc2 pre-release

Dec 23, 2025

0.13.0rc1 pre-release

Dec 17, 2025

0.12.0

Dec 6, 2025

0.12.0rc2 pre-release

Dec 3, 2025

0.12.0rc1 pre-release

Dec 3, 2025

0.12.0.dev20251229 pre-release

Dec 29, 2025

0.12.0.dev20251228 pre-release

Dec 28, 2025

0.12.0.dev20251227 pre-release

Dec 27, 2025

0.12.0.dev20251226 pre-release

Dec 26, 2025

0.12.0.dev20251225 pre-release

Dec 25, 2025

0.12.0.dev20251224 pre-release

Dec 24, 2025

0.12.0.dev20251223 pre-release

Dec 23, 2025

0.12.0.dev20251222 pre-release

Dec 22, 2025

0.12.0.dev20251221 pre-release

Dec 21, 2025

0.12.0.dev20251220 pre-release

Dec 20, 2025

0.12.0.dev20251219 pre-release

Dec 19, 2025

0.12.0.dev20251218 pre-release

Dec 18, 2025

0.12.0.dev20251217 pre-release

Dec 17, 2025

0.12.0.dev20251216 pre-release

Dec 16, 2025

0.12.0.dev20251215 pre-release

Dec 15, 2025

0.12.0.dev20251214 pre-release

Dec 14, 2025

0.12.0.dev20251213 pre-release

Dec 13, 2025

0.12.0.dev20251212 pre-release

Dec 12, 2025

This version

0.12.0.dev20251211 pre-release

Dec 11, 2025

0.12.0.dev20251210 pre-release

Dec 10, 2025

0.12.0.dev20251209 pre-release

Dec 9, 2025

0.12.0.dev20251208 pre-release

Dec 8, 2025

0.12.0.dev20251207 pre-release

Dec 7, 2025

0.12.0.dev20251206 pre-release

Dec 6, 2025

0.11.2rc3 pre-release

Nov 27, 2025

0.11.2rc2 pre-release

Nov 13, 2025

0.11.2rc1 pre-release

Nov 12, 2025

0.11.1

Oct 16, 2025

0.11.1rc3 pre-release

Oct 15, 2025

0.11.1rc2 pre-release

Oct 15, 2025

0.11.1rc1 pre-release

Oct 15, 2025

0.11.1.dev202512030818 pre-release

Dec 3, 2025

0.11.1.dev202512020844 pre-release

Dec 2, 2025

0.11.1.dev202512010850 pre-release

Dec 1, 2025

0.11.1.dev202511300812 pre-release

Nov 30, 2025

0.11.1.dev202511290830 pre-release

Nov 29, 2025

0.11.1.dev202511280814 pre-release

Nov 28, 2025

0.11.1.dev202511270815 pre-release

Nov 27, 2025

0.11.1.dev202511260843 pre-release

Nov 26, 2025

0.11.1.dev202511250817 pre-release

Nov 25, 2025

0.11.1.dev202511240815 pre-release

Nov 24, 2025

0.11.1.dev202511230812 pre-release

Nov 23, 2025

0.11.1.dev202511220812 pre-release

Nov 22, 2025

0.11.1.dev202511210828 pre-release

Nov 21, 2025

0.11.1.dev202511200814 pre-release

Nov 20, 2025

0.11.1.dev202511190816 pre-release

Nov 19, 2025

0.11.1.dev202511180814 pre-release

Nov 18, 2025

0.11.1.dev202511170815 pre-release

Nov 17, 2025

0.11.1.dev202511160811 pre-release

Nov 16, 2025

0.11.1.dev202511150811 pre-release

Nov 15, 2025

0.11.1.dev202511140813 pre-release

Nov 14, 2025

0.11.1.dev202511130813 pre-release

Nov 13, 2025

0.11.1.dev202511120814 pre-release

Nov 12, 2025

0.11.1.dev20251205 pre-release

Dec 5, 2025

0.11.1.dev20251204 pre-release

Dec 4, 2025

0.0.2rc1.post7 pre-release

Dec 23, 2025

0.0.1rc1 pre-release

Dec 4, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

tpu_inference-0.12.0.dev20251211.tar.gz (367.9 kB view details)

Uploaded Dec 11, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

tpu_inference-0.12.0.dev20251211-py3-none-any.whl (437.8 kB view details)

Uploaded Dec 11, 2025 Python 3

File details

Details for the file tpu_inference-0.12.0.dev20251211.tar.gz.

File metadata

Download URL: tpu_inference-0.12.0.dev20251211.tar.gz
Upload date: Dec 11, 2025
Size: 367.9 kB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for tpu_inference-0.12.0.dev20251211.tar.gz
Algorithm	Hash digest
SHA256	`8a1deac76f099c7d179ff67401cdb1dc7e74577dcd383b30b3cd1d0a04767cb4`
MD5	`cb6d71e9c539a5acd92dabcf772e705d`
BLAKE2b-256	`be91c3a3517d7499e2fd2dcf10d1c393bbc94cf06b69b3ec02557e8cd15624ae`

See more details on using hashes here.

Provenance

The following attestation bundles were made for tpu_inference-0.12.0.dev20251211.tar.gz:

Publisher: release.yml on vllm-project/tpu-inference

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: tpu_inference-0.12.0.dev20251211.tar.gz
- Subject digest: 8a1deac76f099c7d179ff67401cdb1dc7e74577dcd383b30b3cd1d0a04767cb4
- Sigstore transparency entry: 759958386
- Sigstore integration time: Dec 11, 2025
Source repository:
- Permalink: vllm-project/tpu-inference@ca0914d0d986fb84f5178a4d1a7104c6a638af21
- Branch / Tag: refs/heads/main
- Owner: https://github.com/vllm-project
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: release.yml@ca0914d0d986fb84f5178a4d1a7104c6a638af21
- Trigger Event: schedule

File details

Details for the file tpu_inference-0.12.0.dev20251211-py3-none-any.whl.

File metadata

Download URL: tpu_inference-0.12.0.dev20251211-py3-none-any.whl
Upload date: Dec 11, 2025
Size: 437.8 kB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for tpu_inference-0.12.0.dev20251211-py3-none-any.whl
Algorithm	Hash digest
SHA256	`bc7300b02e25889426ae3ebe0ee9b6f551e80c745a3efa4fce7e3a41eeb6f9bf`
MD5	`e8c0946b6638b6cf95380810c0b0f35e`
BLAKE2b-256	`257a201e37135e4d6f5d1d1e42fc4a5f1b7501dd08e431e132ad31848d75b5f6`

See more details on using hashes here.

Provenance

The following attestation bundles were made for tpu_inference-0.12.0.dev20251211-py3-none-any.whl:

Publisher: release.yml on vllm-project/tpu-inference

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: tpu_inference-0.12.0.dev20251211-py3-none-any.whl
- Subject digest: bc7300b02e25889426ae3ebe0ee9b6f551e80c745a3efa4fce7e3a41eeb6f9bf
- Sigstore transparency entry: 759958392
- Sigstore integration time: Dec 11, 2025
Source repository:
- Permalink: vllm-project/tpu-inference@ca0914d0d986fb84f5178a4d1a7104c6a638af21
- Branch / Tag: refs/heads/main
- Owner: https://github.com/vllm-project
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: release.yml@ca0914d0d986fb84f5178a4d1a7104c6a638af21
- Trigger Event: schedule

tpu-inference 0.12.0.dev20251211

Navigation

Verified details

Maintainers

Unverified details

Meta

Classifiers

Project description

About

Recommended models and features

Get started

Contribute

Contact us

Project details

Verified details

Maintainers

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance