vLLM Semantic Router - Intelligent routing for Mixture-of-Models

These details have not been verified by PyPI

Project links

Project description

vLLM Semantic Router

Intelligent Router for Mixture-of-Models (MoM).

GitHub: https://github.com/vllm-project/semantic-router

Quick Start

Installation

# Install from PyPI
pip install vllm-sr

# Or install from source (development)
cd src/vllm-sr
pip install -e .

Usage

# Start the router (includes dashboard, simulator sidecar, and first-run setup)
HF_TOKEN=hf_xxx vllm-sr serve

# Start an isolated second local stack on offset host ports
VLLM_SR_STACK_NAME=lane-b VLLM_SR_PORT_OFFSET=200 HF_TOKEN=hf_xxx vllm-sr serve

# Open the dashboard
# http://localhost:8700
# second stack example: http://localhost:8900

# Optional: open the dashboard in your browser
vllm-sr dashboard

# View logs
vllm-sr logs router
vllm-sr logs envoy
vllm-sr logs dashboard
vllm-sr logs simulator

# Evaluate how signals fire for a prompt (requires: vllm-sr serve)
# Single prompt — readable summary (default)
vllm-sr eval --prompt "Explain inflation vs recession in plain English."
# decision: economics
# used signals: 3
#   - domain:economics
#   - keyword:inflation
#   - embedding:price_movement
# matched signals: 3
#   - domains:economics
#   - keywords:inflation
#   - embeddings:price_movement
# unmatched signals: 3
# signal confidences:
#   - domain:economics: 0.95
#   - keyword:inflation: 0.87
#   - embedding:price_movement: 0.82
# routing: economics

# Single prompt — full JSON payload
vllm-sr eval --prompt "Explain inflation vs recession in plain English." --json

# Multi-turn messages array (OpenAI chat format) — readable summary
vllm-sr eval --messages '[{"role":"system","content":"You are a careful tutor."},{"role":"user","content":"Explain inflation vs recession in plain English."}]'

# Multi-turn messages array — full JSON payload
vllm-sr eval --messages '[{"role":"system","content":"You are a careful tutor."},{"role":"user","content":"Explain inflation vs recession in plain English."}]' --json

# Override endpoint (e.g. remote stack or non-default port)
vllm-sr eval --prompt "hello" --endpoint http://localhost:8080

# Common errors:
#   Router not started:
#     ERROR - Router is not running at http://localhost:8080/api/v1/eval. Start the router with 'vllm-sr serve' and retry.
#   Wrong port (hitting a proxy instead of the router API):
#     ERROR - Router returned 403 from http://localhost:8080/api/v1/eval. This looks like a proxy or gateway —
#             check that --endpoint points directly to the router API port (default: 8080), not to Envoy or another proxy.
#   Invalid request body (400):
#     ERROR - Router returned 400 INVALID_INPUT: text cannot be empty
#   Service unavailable (503):
#     ERROR - Router returned 503 SERVICE_UNAVAILABLE: classifier not ready

# Check status
vllm-sr status

# Send a one-shot chat completion through Envoy (default model: MoM)
vllm-sr chat "hello"
vllm-sr chat --json "hello"
# Remote or port-forwarded stack
vllm-sr chat --base-url http://localhost:8080 "hello"

# Stop
vllm-sr stop

Kubernetes Deployment

The same CLI deploys to Kubernetes via Helm:

# Deploy to Kubernetes (uses your existing config.yaml)
HF_TOKEN=hf_xxx vllm-sr serve --target k8s --profile dev --config config.yaml

# Deploy to a specific namespace and context
HF_TOKEN=hf_xxx vllm-sr serve --target k8s --namespace production --context prod-cluster

# Check status / logs / stop
vllm-sr status --target k8s
vllm-sr logs router --target k8s -f
vllm-sr stop --target k8s

# Chat completion against a port-forwarded or ingress URL (requires --base-url)
vllm-sr chat --base-url http://localhost:8080 "hello"

Credential handling: Sensitive environment variables (HF_TOKEN, OPENAI_API_KEY, ANTHROPIC_API_KEY) are automatically stored in a Kubernetes Secret (vllm-sr-env-secrets) and mounted via envFrom. They never appear as plain-text values in Helm overrides or the Deployment spec. Non-sensitive variables (HF_ENDPOINT, HF_HOME, etc.) are passed as standard env entries.

The secret is created before helm upgrade --install and cleaned up by vllm-sr stop --target k8s.

If you start in an empty directory, vllm-sr serve bootstraps a minimal workspace and opens the dashboard in setup mode. Configure your first model there, then activate routing.

Local dashboard state is persisted under .vllm-sr/dashboard-data/ and bind-mounted into the container at /app/data. User accounts, evaluation history, and ML pipeline artifacts survive vllm-sr stop followed by a new vllm-sr serve as long as that workspace directory is kept.

The fleet simulator sidecar is started on the same runtime network by default. The dashboard backend proxies it at /api/fleet-sim/*, and the dashboard exposes its workflows under the Fleet Sim top-bar dropdown.

To run parallel local stacks from the same machine or multiple worktrees, set VLLM_SR_STACK_NAME and VLLM_SR_PORT_OFFSET before vllm-sr serve, vllm-sr status, vllm-sr dashboard, and vllm-sr stop. The stack name isolates container and network names, and the port offset shifts the published host ports while keeping internal container ports unchanged.

Advanced YAML-first setup

# Validate a hand-authored canonical config before serving
vllm-sr validate config.yaml

vllm-sr init was removed in v0.3. Author config.yaml directly using the canonical version/listeners/providers/routing/global layout, migrate an older file with vllm-sr config migrate --config old-config.yaml, or import supported OpenClaw model providers with vllm-sr config import --from openclaw. Router-wide defaults come from the router itself and can be overridden under global:.

Features

Router: Intelligent request routing based on intent classification
Envoy Proxy: High-performance proxy with ext_proc integration
Dashboard: Web UI for monitoring and testing (http://localhost:8700)
Metrics: Prometheus metrics endpoint (http://localhost:9190/metrics)

Endpoints

After running vllm-sr serve, the following endpoints are available:

Endpoint	Port	Description
Dashboard	8700	Web UI for monitoring and Playground
API	8888*	Chat completions API (configurable in config.yaml)
Metrics	9190	Prometheus metrics
gRPC	50051	Router gRPC (internal)
Jaeger UI	16686	Distributed tracing UI
Grafana (embedded)	8700	Dashboards at /embedded/grafana
Prometheus UI	9090	Metrics storage and querying

*Default port, configurable via listeners in config.yaml

Observability

vllm-sr serve automatically starts the observability stack:

Jaeger: Distributed tracing embedded at http://localhost:8700/embedded/jaeger (also available directly at http://localhost:16686)
Grafana: Pre-configured dashboards embedded at http://localhost:8700/embedded/grafana
Prometheus: Metrics collection at http://localhost:9090

Note: Grafana is optimized for embedded access through the dashboard. For the best experience, use http://localhost:8700/embedded/grafana where anonymous authentication is pre-configured.

Tracing is enabled by default. Traces are visible in Jaeger under the vllm-sr service name.

Configuration

Plugin Configuration

The CLI supports configuring plugins in your routing decisions. Plugins are per-decision behaviors that customize request handling (security, caching, customization, debugging).

Supported Plugin Types:

semantic-cache - Cache similar requests for performance
memory - Retrieve and store route-local conversation memory
system_prompt - Inject custom system prompts
header_mutation - Add/modify HTTP headers
hallucination - Detect hallucinations in responses
router_replay - Record routing decisions for debugging
rag - Inject retrieved knowledge into prompts
image_gen - Hand a matched route off to an image generation backend
fast_response - Return a route-local response immediately
request_params - Sanitize or cap request body parameters before forwarding
response_jailbreak - Screen model output before returning it
tools - Restrict or curate tool access per route

Plugin Examples:

Each example shows the plugin list inside a canonical routing.decisions[] entry.

semantic-cache - Cache similar requests:

routing:
  decisions:
    - name: "cached-route"
      plugins:
        - type: "semantic-cache"
          configuration:
            enabled: true
            similarity_threshold: 0.92  # 0.0-1.0, higher = more strict
            ttl_seconds: 3600  # Optional: cache TTL in seconds

fast_response - Return a route-local response:

routing:
  decisions:
    - name: "guarded-route"
      plugins:
        - type: "fast_response"
          configuration:
            message: "This request was blocked by the matched route policy."

system_prompt - Inject custom instructions:

routing:
  decisions:
    - name: "persona-route"
      plugins:
        - type: "system_prompt"
          configuration:
            enabled: true
            system_prompt: "You are a helpful assistant."
            mode: "replace"  # "replace" (default) or "insert" (prepend)

header_mutation - Modify HTTP headers:

routing:
  decisions:
    - name: "header-route"
      plugins:
        - type: "header_mutation"
          configuration:
            add:
              - name: "X-Custom-Header"
                value: "custom-value"
            update:
              - name: "User-Agent"
                value: "SemanticRouter/1.0"
            delete:
              - "X-Old-Header"

hallucination - Detect hallucinations:

routing:
  decisions:
    - name: "fact-check-route"
      plugins:
        - type: "hallucination"
          configuration:
            enabled: true
            use_nli: false  # Optional: use NLI for detailed analysis
            hallucination_action: "header"  # "header", "body", or "none"

router_replay - Record decisions for debugging:

routing:
  decisions:
    - name: "debug-route"
      plugins:
        - type: "router_replay"
          configuration:
            enabled: true
            max_records: 10000  # Optional: max records in memory (default: 10000)
            capture_request_body: true  # Optional: capture request payloads (default: true)
            capture_response_body: true  # Optional: capture response payloads (default: true)
            max_body_bytes: 4096  # Optional: max bytes to capture (default: 4096)

memory - Retrieve route-local memory:

routing:
  decisions:
    - name: "memory-route"
      plugins:
        - type: "memory"
          configuration:
            enabled: true
            retrieval_limit: 5
            similarity_threshold: 0.75
            auto_store: true

rag - Inject retrieved context:

routing:
  decisions:
    - name: "knowledge-route"
      plugins:
        - type: "rag"
          configuration:
            enabled: true
            backend: "milvus"
            top_k: 5
            similarity_threshold: 0.8

tools - Restrict available tools:

routing:
  decisions:
    - name: "tool-route"
      plugins:
        - type: "tools"
          configuration:
            enabled: true
            mode: "filtered"
            allow_tools: ["search_web"]
            block_tools: ["exec_cmd"]

image_gen - Route to an image backend:

routing:
  decisions:
    - name: "image-route"
      plugins:
        - type: "image_gen"
          configuration:
            enabled: true
            backend: "vllm_omni"
            backend_config:
              base_url: "http://image-router:8005"

request_params - Cap or strip request parameters:

routing:
  decisions:
    - name: "budget-route"
      plugins:
        - type: "request_params"
          configuration:
            blocked_params: ["logprobs", "top_logprobs"]
            max_tokens_limit: 512
            max_n: 1
            strip_unknown: true

response_jailbreak - Screen generated output:

routing:
  decisions:
    - name: "safety-route"
      plugins:
        - type: "response_jailbreak"
          configuration:
            enabled: true
            threshold: 0.8
            action: "header"

Router replay records are exposed through:

GET /v1/router_replay?limit=20&offset=0&search=req-123&decision=foo&model=bar&cache_status=cached - List recent records with pagination metadata. Default page size is 20; larger limit values are capped at 100.
GET /v1/router_replay/aggregate?search=req-123&decision=foo&model=bar&cache_status=cached - Return summary and chart aggregates for the filtered replay set.
GET /v1/router_replay/{id} - Fetch a single replay record.

If a replay page would exceed the ext-proc gRPC message budget, the router returns 413 Payload Too Large instead of failing the stream.

Validation Rules:

Plugin Type: Must be one of: semantic-cache, memory, system_prompt, header_mutation, hallucination, router_replay, rag, image_gen, fast_response, request_params, response_jailbreak, tools
enabled: Must be a boolean (required for most plugins)
similarity_threshold/min_confidence_threshold: Must be a float between 0.0 and 1.0
max_records/max_body_bytes: Must be a positive integer
ttl_seconds: Must be a non-negative integer
system_prompt: Must be a string (if provided)
mode: Must be "replace" or "insert" (if provided)
injection_mode: Must be tool_role or system_prompt (if provided)
on_failure: Must be skip, block, or warn (if provided)
action: Must be block, header, or none (if provided)

CLI Commands:

# Validate configuration (including plugins)
vllm-sr validate

# Migrate older configs to the canonical contract
vllm-sr config migrate --config old-config.yaml

# Import supported OpenClaw model providers into canonical config.yaml
vllm-sr config import --from openclaw --source openclaw.json --target config.yaml

File Descriptor Limits

The CLI automatically sets file descriptor limits to 65,536 for Envoy proxy. To customize:

export VLLM_SR_NOFILE_LIMIT=100000  # Optional (min: 8192)
vllm-sr serve

License

Apache 2.0

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.3.0.dev20260429215539 pre-release

Apr 29, 2026

0.3.0.dev20260429211422 pre-release

Apr 29, 2026

0.3.0.dev20260429204136 pre-release

Apr 29, 2026

0.3.0.dev20260429204108 pre-release

Apr 29, 2026

0.3.0.dev20260429132428 pre-release

Apr 29, 2026

0.3.0.dev20260429132343 pre-release

Apr 29, 2026

0.3.0.dev20260429132246 pre-release

Apr 29, 2026

0.3.0.dev20260429015500 pre-release

Apr 29, 2026

0.3.0.dev20260428225518 pre-release

Apr 28, 2026

0.3.0.dev20260428225403 pre-release

Apr 28, 2026

0.3.0.dev20260428171355 pre-release

Apr 28, 2026

0.3.0.dev20260428000810 pre-release

Apr 28, 2026

0.3.0.dev20260427234948 pre-release

Apr 27, 2026

0.3.0.dev20260427145552 pre-release

Apr 27, 2026

0.3.0.dev20260427141858 pre-release

Apr 27, 2026

0.3.0.dev20260427140843 pre-release

Apr 27, 2026

This version

0.3.0.dev20260427140612 pre-release

Apr 27, 2026

0.3.0.dev20260426031057 pre-release

Apr 26, 2026

0.3.0.dev20260425050555 pre-release

Apr 25, 2026

0.3.0.dev20260424071426 pre-release

Apr 24, 2026

0.3.0.dev20260423102309 pre-release

Apr 23, 2026

0.3.0.dev20260421130549 pre-release

Apr 21, 2026

0.3.0.dev20260421084323 pre-release

Apr 21, 2026

0.3.0.dev20260421083012 pre-release

Apr 21, 2026

0.3.0.dev20260421070244 pre-release

Apr 21, 2026

0.3.0.dev20260421015929 pre-release

Apr 21, 2026

0.3.0.dev20260420235522 pre-release

Apr 20, 2026

0.3.0.dev20260420142559 pre-release

Apr 20, 2026

0.3.0.dev20260419194403 pre-release

Apr 19, 2026

0.3.0.dev20260419194108 pre-release

Apr 19, 2026

0.3.0.dev20260419084737 pre-release

Apr 19, 2026

0.3.0.dev20260418170854 pre-release

Apr 18, 2026

0.3.0.dev20260418170743 pre-release

Apr 18, 2026

0.3.0.dev20260417071421 pre-release

Apr 17, 2026

0.3.0.dev20260416182425 pre-release

Apr 16, 2026

0.3.0.dev20260416182350 pre-release

Apr 16, 2026

0.3.0.dev20260416122720 pre-release

Apr 16, 2026

0.3.0.dev20260416122627 pre-release

Apr 16, 2026

0.3.0.dev20260415221203 pre-release

Apr 15, 2026

0.3.0.dev20260415192439 pre-release

Apr 15, 2026

0.3.0.dev20260415192236 pre-release

Apr 15, 2026

0.3.0.dev20260415113500 pre-release

Apr 15, 2026

0.3.0.dev20260415091701 pre-release

Apr 15, 2026

0.3.0.dev20260415091533 pre-release

Apr 15, 2026

0.3.0.dev20260415090023 pre-release

Apr 15, 2026

0.3.0.dev20260415085349 pre-release

Apr 15, 2026

0.3.0.dev20260414143616 pre-release

Apr 14, 2026

0.3.0.dev20260414134042 pre-release

Apr 14, 2026

0.3.0.dev20260414133604 pre-release

Apr 14, 2026

0.3.0.dev20260413224439 pre-release

Apr 13, 2026

0.3.0.dev20260413170144 pre-release

Apr 13, 2026

0.3.0.dev20260413151908 pre-release

Apr 13, 2026

0.3.0.dev20260413021123 pre-release

Apr 13, 2026

0.3.0.dev20260411202430 pre-release

Apr 11, 2026

0.3.0.dev20260410204730 pre-release

Apr 10, 2026

0.3.0.dev20260410204604 pre-release

Apr 10, 2026

0.3.0.dev20260410204456 pre-release

Apr 10, 2026

0.3.0.dev20260410203658 pre-release

Apr 10, 2026

0.3.0.dev20260410000329 pre-release

Apr 10, 2026

0.3.0.dev20260409142149 pre-release

Apr 9, 2026

0.3.0.dev20260409130707 pre-release

Apr 9, 2026

0.3.0.dev20260409092705 pre-release

Apr 9, 2026

0.3.0.dev20260409024708 pre-release

Apr 9, 2026

0.3.0.dev20260408065746 pre-release

Apr 8, 2026

0.3.0.dev20260407062514 pre-release

Apr 7, 2026

0.3.0.dev20260407040334 pre-release

Apr 7, 2026

0.3.0.dev20260407030129 pre-release

Apr 7, 2026

0.3.0.dev20260407022258 pre-release

Apr 7, 2026

0.3.0.dev20260407022205 pre-release

Apr 7, 2026

0.3.0.dev20260407022127 pre-release

Apr 7, 2026

0.3.0.dev20260404143343 pre-release

Apr 4, 2026

0.3.0.dev20260403115558 pre-release

Apr 3, 2026

0.3.0.dev20260403072530 pre-release

Apr 3, 2026

0.3.0.dev20260403060503 pre-release

Apr 3, 2026

0.3.0.dev20260403015321 pre-release

Apr 3, 2026

0.3.0.dev20260402144536 pre-release

Apr 2, 2026

0.3.0.dev20260402132624 pre-release

Apr 2, 2026

0.3.0.dev20260402124224 pre-release

Apr 2, 2026

0.3.0.dev20260402104715 pre-release

Apr 2, 2026

0.3.0.dev20260402101301 pre-release

Apr 2, 2026

0.3.0.dev20260402074606 pre-release

Apr 2, 2026

0.2.0

Mar 10, 2026

0.2.0.dev20260402062221 pre-release

Apr 2, 2026

0.2.0.dev20260402041946 pre-release

Apr 2, 2026

0.2.0.dev20260402025827 pre-release

Apr 2, 2026

0.2.0.dev20260402005148 pre-release

Apr 2, 2026

0.2.0.dev20260331233517 pre-release

Mar 31, 2026

0.2.0.dev20260331143842 pre-release

Mar 31, 2026

0.2.0.dev20260331092759 pre-release

Mar 31, 2026

0.2.0.dev20260331063438 pre-release

Mar 31, 2026

0.2.0.dev20260331031544 pre-release

Mar 31, 2026

0.2.0.dev20260330193832 pre-release

Mar 30, 2026

0.2.0.dev20260330154418 pre-release

Mar 30, 2026

0.2.0.dev20260330134026 pre-release

Mar 30, 2026

0.2.0.dev20260330124601 pre-release

Mar 30, 2026

0.2.0.dev20260329122129 pre-release

Mar 29, 2026

0.2.0.dev20260328202914 pre-release

Mar 28, 2026

0.2.0.dev20260328143744 pre-release

Mar 28, 2026

0.2.0.dev20260327181645 pre-release

Mar 27, 2026

0.2.0.dev20260327181445 pre-release

Mar 27, 2026

0.2.0.dev20260327141126 pre-release

Mar 27, 2026

0.2.0.dev20260327124737 pre-release

Mar 27, 2026

0.2.0.dev20260327103803 pre-release

Mar 27, 2026

0.2.0.dev20260327071714 pre-release

Mar 27, 2026

0.2.0.dev20260326162625 pre-release

Mar 26, 2026

0.2.0.dev20260326135925 pre-release

Mar 26, 2026

0.2.0.dev20260326133829 pre-release

Mar 26, 2026

0.2.0.dev20260326131033 pre-release

Mar 26, 2026

0.2.0.dev20260326122444 pre-release

Mar 26, 2026

0.2.0.dev20260326091204 pre-release

Mar 26, 2026

0.2.0.dev20260326042715 pre-release

Mar 26, 2026

0.2.0.dev20260326042639 pre-release

Mar 26, 2026

0.2.0.dev20260325154945 pre-release

Mar 25, 2026

0.2.0.dev20260325121655 pre-release

Mar 25, 2026

0.2.0.dev20260325114705 pre-release

Mar 25, 2026

0.2.0.dev20260325111247 pre-release

Mar 25, 2026

0.2.0.dev20260325093824 pre-release

Mar 25, 2026

0.2.0.dev20260324234312 pre-release

Mar 24, 2026

0.2.0.dev20260324230608 pre-release

Mar 24, 2026

0.2.0.dev20260324201423 pre-release

Mar 24, 2026

0.2.0.dev20260324160059 pre-release

Mar 24, 2026

0.2.0.dev20260324154112 pre-release

Mar 24, 2026

0.2.0.dev20260324131800 pre-release

Mar 24, 2026

0.2.0.dev20260324121524 pre-release

Mar 24, 2026

0.2.0.dev20260324104831 pre-release

Mar 24, 2026

0.2.0.dev20260324104606 pre-release

Mar 24, 2026

0.2.0.dev20260324104443 pre-release

Mar 24, 2026

0.2.0.dev20260324104250 pre-release

Mar 24, 2026

0.2.0.dev20260324041637 pre-release

Mar 24, 2026

0.2.0.dev20260324012011 pre-release

Mar 24, 2026

0.2.0.dev20260323195201 pre-release

Mar 23, 2026

0.2.0.dev20260323142923 pre-release

Mar 23, 2026

0.2.0.dev20260323130328 pre-release

Mar 23, 2026

0.2.0.dev20260323121203 pre-release

Mar 23, 2026

0.2.0.dev20260323032220 pre-release

Mar 23, 2026

0.2.0.dev20260322154443 pre-release

Mar 22, 2026

0.2.0.dev20260322104032 pre-release

Mar 22, 2026

0.2.0.dev20260322100055 pre-release

Mar 22, 2026

0.2.0.dev20260322073649 pre-release

Mar 22, 2026

0.2.0.dev20260321144617 pre-release

Mar 21, 2026

0.2.0.dev20260321093952 pre-release

Mar 21, 2026

0.2.0.dev20260320184256 pre-release

Mar 20, 2026

0.2.0.dev20260320182404 pre-release

Mar 20, 2026

0.2.0.dev20260320070718 pre-release

Mar 20, 2026

0.2.0.dev20260320015200 pre-release

Mar 20, 2026

0.2.0.dev20260319171243 pre-release

Mar 19, 2026

0.2.0.dev20260319162116 pre-release

Mar 19, 2026

0.2.0.dev20260319155333 pre-release

Mar 19, 2026

0.2.0.dev20260319144759 pre-release

Mar 19, 2026

0.2.0.dev20260319103910 pre-release

Mar 19, 2026

0.2.0.dev20260319051129 pre-release

Mar 19, 2026

0.2.0.dev20260319014805 pre-release

Mar 19, 2026

0.2.0.dev20260318115900 pre-release

Mar 18, 2026

0.2.0.dev20260318063308 pre-release

Mar 18, 2026

0.2.0.dev20260318053744 pre-release

Mar 18, 2026

0.2.0.dev20260318031852 pre-release

Mar 18, 2026

0.2.0.dev20260318023955 pre-release

Mar 18, 2026

0.2.0.dev20260317165720 pre-release

Mar 17, 2026

0.2.0.dev20260317122153 pre-release

Mar 17, 2026

0.2.0.dev20260317071045 pre-release

Mar 17, 2026

0.2.0.dev20260317070845 pre-release

Mar 17, 2026

0.2.0.dev20260316233708 pre-release

Mar 16, 2026

0.2.0.dev20260316013520 pre-release

Mar 16, 2026

0.2.0.dev20260315103102 pre-release

Mar 15, 2026

0.2.0.dev20260315102234 pre-release

Mar 15, 2026

0.2.0.dev20260315102119 pre-release

Mar 15, 2026

0.2.0.dev20260315101327 pre-release

Mar 15, 2026

0.2.0.dev20260314090907 pre-release

Mar 14, 2026

0.2.0.dev20260314090205 pre-release

Mar 14, 2026

0.2.0.dev20260314084956 pre-release

Mar 14, 2026

0.2.0.dev20260314081752 pre-release

Mar 14, 2026

0.2.0.dev20260313094400 pre-release

Mar 13, 2026

0.2.0.dev20260313080811 pre-release

Mar 13, 2026

0.2.0.dev20260313073216 pre-release

Mar 13, 2026

0.2.0.dev20260312215350 pre-release

Mar 12, 2026

0.2.0.dev20260312125755 pre-release

Mar 12, 2026

0.2.0.dev20260312114536 pre-release

Mar 12, 2026

0.2.0.dev20260312091640 pre-release

Mar 12, 2026

0.2.0.dev20260312082527 pre-release

Mar 12, 2026

0.2.0.dev20260311144957 pre-release

Mar 11, 2026

0.2.0.dev20260311122524 pre-release

Mar 11, 2026

0.2.0.dev20260310204151 pre-release

Mar 10, 2026

0.2.0.dev20260310090632 pre-release

Mar 10, 2026

0.2.0.dev20260310081823 pre-release

Mar 10, 2026

0.1.0b2.dev20260310064703 pre-release

Mar 10, 2026

0.1.0b2.dev20260310064543 pre-release

Mar 10, 2026

0.1.0b2.dev20260310042405 pre-release

Mar 10, 2026

0.1.0b2.dev20260309172345 pre-release

Mar 9, 2026

0.1.0b2.dev20260309154701 pre-release

Mar 9, 2026

0.1.0b2.dev20260309131105 pre-release

Mar 9, 2026

0.1.0b2.dev20260309125302 pre-release

Mar 9, 2026

0.1.0b2.dev20260309121157 pre-release

Mar 9, 2026

0.1.0b2.dev20260309112426 pre-release

Mar 9, 2026

0.1.0b2.dev20260309084602 pre-release

Mar 9, 2026

0.1.0b2.dev20260309084438 pre-release

Mar 9, 2026

0.1.0b2.dev20260309082615 pre-release

Mar 9, 2026

0.1.0b2.dev20260309062732 pre-release

Mar 9, 2026

0.1.0b2.dev20260309014756 pre-release

Mar 9, 2026

0.1.0b2.dev20260308234608 pre-release

Mar 8, 2026

0.1.0b2.dev20260308204604 pre-release

Mar 8, 2026

0.1.0b2.dev20260308170839 pre-release

Mar 8, 2026

0.1.0b2.dev20260308152332 pre-release

Mar 8, 2026

0.1.0b2.dev20260308101130 pre-release

Mar 8, 2026

0.1.0b2.dev20260308094056 pre-release

Mar 8, 2026

0.1.0b2.dev20260307104604 pre-release

Mar 7, 2026

0.1.0b2.dev20260307093148 pre-release

Mar 7, 2026

0.1.0b2.dev20260307014531 pre-release

Mar 7, 2026

0.1.0b2.dev20260306161021 pre-release

Mar 6, 2026

0.1.0b2.dev20260306134708 pre-release

Mar 6, 2026

0.1.0b2.dev20260306134459 pre-release

Mar 6, 2026

0.1.0b2.dev20260306125433 pre-release

Mar 6, 2026

0.1.0b2.dev20260306042716 pre-release

Mar 6, 2026

0.1.0b2.dev20260306020711 pre-release

Mar 6, 2026

0.1.0b2.dev20260305191112 pre-release

Mar 5, 2026

0.1.0b2.dev20260305173343 pre-release

Mar 5, 2026

0.1.0b2.dev20260305132701 pre-release

Mar 5, 2026

0.1.0b2.dev20260305094821 pre-release

Mar 5, 2026

0.1.0b2.dev20260305092903 pre-release

Mar 5, 2026

0.1.0b2.dev20260305025251 pre-release

Mar 5, 2026

0.1.0b2.dev20260304021754 pre-release

Mar 4, 2026

0.1.0b2.dev20260303140253 pre-release

Mar 3, 2026

0.1.0b2.dev20260303092654 pre-release

Mar 3, 2026

0.1.0b2.dev20260303043258 pre-release

Mar 3, 2026

0.1.0b2.dev20260303022414 pre-release

Mar 3, 2026

0.1.0b2.dev20260302114647 pre-release

Mar 2, 2026

0.1.0b2.dev20260302084840 pre-release

Mar 2, 2026

0.1.0b2.dev20260302061705 pre-release

Mar 2, 2026

0.1.0b2.dev20260302012227 pre-release

Mar 2, 2026

0.1.0b2.dev20260301103217 pre-release

Mar 1, 2026

0.1.0b2.dev20260301045413 pre-release

Mar 1, 2026

0.1.0b2.dev20260228211340 pre-release

Feb 28, 2026

0.1.0b2.dev20260228211156 pre-release

Feb 28, 2026

0.1.0b2.dev20260228211118 pre-release

Feb 28, 2026

0.1.0b2.dev20260228191355 pre-release

Feb 28, 2026

0.1.0b2.dev20260228125450 pre-release

Feb 28, 2026

0.1.0b2.dev20260228074005 pre-release

Feb 28, 2026

0.1.0b2.dev20260228072136 pre-release

Feb 28, 2026

0.1.0b2.dev20260227094730 pre-release

Feb 27, 2026

0.1.0b2.dev20260227082359 pre-release

Feb 27, 2026

0.1.0b2.dev20260227063632 pre-release

Feb 27, 2026

0.1.0b2.dev20260227044025 pre-release

Feb 27, 2026

0.1.0b2.dev20260227020952 pre-release

Feb 27, 2026

0.1.0b2.dev20260227020903 pre-release

Feb 27, 2026

0.1.0b2.dev20260226230130 pre-release

Feb 26, 2026

0.1.0b2.dev20260226125333 pre-release

Feb 26, 2026

0.1.0b2.dev20260226114147 pre-release

Feb 26, 2026

0.1.0b2.dev20260226113956 pre-release

Feb 26, 2026

0.1.0b2.dev20260226041741 pre-release

Feb 26, 2026

0.1.0b2.dev20260225182508 pre-release

Feb 25, 2026

0.1.0b2.dev20260225152245 pre-release

Feb 25, 2026

0.1.0b2.dev20260225093517 pre-release

Feb 25, 2026

0.1.0b2.dev20260224212414 pre-release

Feb 24, 2026

0.1.0b2.dev20260224202237 pre-release

Feb 24, 2026

0.1.0b2.dev20260224153530 pre-release

Feb 24, 2026

0.1.0b2.dev20260224135706 pre-release

Feb 24, 2026

0.1.0b2.dev20260224064459 pre-release

Feb 24, 2026

0.1.0b2.dev20260223185051 pre-release

Feb 23, 2026

0.1.0b2.dev20260223183033 pre-release

Feb 23, 2026

0.1.0b2.dev20260223182537 pre-release

Feb 23, 2026

0.1.0b2.dev20260223180439 pre-release

Feb 23, 2026

0.1.0b2.dev20260222012728 pre-release

Feb 22, 2026

0.1.0b2.dev20260221205027 pre-release

Feb 21, 2026

0.1.0b2.dev20260220150754 pre-release

Feb 20, 2026

0.1.0b2.dev20260220095936 pre-release

Feb 20, 2026

0.1.0b2.dev20260219054955 pre-release

Feb 19, 2026

0.1.0b2.dev20260219020330 pre-release

Feb 19, 2026

0.1.0b2.dev20260218205154 pre-release

Feb 18, 2026

0.1.0b2.dev20260218153829 pre-release

Feb 18, 2026

0.1.0b2.dev20260218152727 pre-release

Feb 18, 2026

0.1.0b2.dev20260218151547 pre-release

Feb 18, 2026

0.1.0b2.dev20260218130407 pre-release

Feb 18, 2026

0.1.0b2.dev20260218122101 pre-release

Feb 18, 2026

0.1.0b2.dev20260218010516 pre-release

Feb 18, 2026

0.1.0b2.dev20260217230545 pre-release

Feb 17, 2026

0.1.0b2.dev20260217205526 pre-release

Feb 17, 2026

0.1.0b2.dev20260217154622 pre-release

Feb 17, 2026

0.1.0b2.dev20260217094623 pre-release

Feb 17, 2026

0.1.0b2.dev20260217073247 pre-release

Feb 17, 2026

0.1.0b2.dev20260215094652 pre-release

Feb 15, 2026

0.1.0b2.dev20260215093727 pre-release

Feb 15, 2026

0.1.0b2.dev20260214152627 pre-release

Feb 14, 2026

0.1.0b2.dev20260213210122 pre-release

Feb 13, 2026

0.1.0b2.dev20260213131612 pre-release

Feb 13, 2026

0.1.0b2.dev20260212212309 pre-release

Feb 12, 2026

0.1.0b2.dev20260212185534 pre-release

Feb 12, 2026

0.1.0b2.dev20260212183725 pre-release

Feb 12, 2026

0.1.0b2.dev20260212143705 pre-release

Feb 12, 2026

0.1.0b2.dev20260212135935 pre-release

Feb 12, 2026

0.1.0b2.dev20260212024800 pre-release

Feb 12, 2026

0.1.0b2.dev20260211222925 pre-release

Feb 11, 2026

0.1.0b2.dev20260211222842 pre-release

Feb 11, 2026

0.1.0b2.dev20260210223055 pre-release

Feb 10, 2026

0.1.0b2.dev20260210184734 pre-release

Feb 10, 2026

0.1.0b2.dev20260210184105 pre-release

Feb 10, 2026

0.1.0b2.dev20260210090442 pre-release

Feb 10, 2026

0.1.0b2.dev20260210071344 pre-release

Feb 10, 2026

0.1.0b2.dev20260210071203 pre-release

Feb 10, 2026

0.1.0b2.dev20260210023909 pre-release

Feb 10, 2026

0.1.0b2.dev20260209092709 pre-release

Feb 9, 2026

0.1.0b2.dev20260209081851 pre-release

Feb 9, 2026

0.1.0b2.dev20260209071029 pre-release

Feb 9, 2026

0.1.0b2.dev20260209070604 pre-release

Feb 9, 2026

0.1.0b2.dev20260209032858 pre-release

Feb 9, 2026

0.1.0b2.dev20260209024110 pre-release

Feb 9, 2026

0.1.0b2.dev20260208034739 pre-release

Feb 8, 2026

0.1.0b2.dev20260207041954 pre-release

Feb 7, 2026

0.1.0b2.dev20260206185459 pre-release

Feb 6, 2026

0.1.0b2.dev20260206185355 pre-release

Feb 6, 2026

0.1.0b2.dev20260206185234 pre-release

Feb 6, 2026

0.1.0b2.dev20260206185100 pre-release

Feb 6, 2026

0.1.0b2.dev20260205061836 pre-release

Feb 5, 2026

0.1.0b2.dev20260205060500 pre-release

Feb 5, 2026

0.1.0b2.dev20260205025509 pre-release

Feb 5, 2026

0.1.0b2.dev20260205022454 pre-release

Feb 5, 2026

0.1.0b2.dev20260204173308 pre-release

Feb 4, 2026

0.1.0b2.dev20260204173140 pre-release

Feb 4, 2026

0.1.0b2.dev20260204170140 pre-release

Feb 4, 2026

0.1.0b2.dev20260204170028 pre-release

Feb 4, 2026

0.1.0b2.dev20260204165914 pre-release

Feb 4, 2026

0.1.0b2.dev20260204165802 pre-release

Feb 4, 2026

0.1.0b2.dev20260204165623 pre-release

Feb 4, 2026

0.1.0b2.dev20260204090051 pre-release

Feb 4, 2026

0.1.0b2.dev20260204071119 pre-release

Feb 4, 2026

0.1.0b2.dev20260204070724 pre-release

Feb 4, 2026

0.1.0b2.dev20260203201608 pre-release

Feb 3, 2026

0.1.0b2.dev20260203182852 pre-release

Feb 3, 2026

0.1.0b2.dev20260203141053 pre-release

Feb 3, 2026

0.1.0b2.dev20260203021759 pre-release

Feb 3, 2026

0.1.0b2.dev20260202230157 pre-release

Feb 2, 2026

0.1.0b2.dev20260202181733 pre-release

Feb 2, 2026

0.1.0b2.dev20260202094318 pre-release

Feb 2, 2026

0.1.0b2.dev20260202075204 pre-release

Feb 2, 2026

0.1.0b2.dev20260202073049 pre-release

Feb 2, 2026

0.1.0b2.dev20260202024106 pre-release

Feb 2, 2026

0.1.0b2.dev20260201161152 pre-release

Feb 1, 2026

0.1.0b2.dev20260129200211 pre-release

Jan 29, 2026

0.1.0b2.dev20260129090916 pre-release

Jan 29, 2026

0.1.0b2.dev20260129021916 pre-release

Jan 29, 2026

0.1.0b2.dev20260129021803 pre-release

Jan 29, 2026

0.1.0b2.dev20260128175848 pre-release

Jan 28, 2026

0.1.0b2.dev20260128175701 pre-release

Jan 28, 2026

0.1.0b2.dev20260128094358 pre-release

Jan 28, 2026

0.1.0b2.dev20260128023742 pre-release

Jan 28, 2026

0.1.0b2.dev20260127131328 pre-release

Jan 27, 2026

0.1.0b2.dev20260126191646 pre-release

Jan 26, 2026

0.1.0b2.dev20260126191023 pre-release

Jan 26, 2026

0.1.0b2.dev20260126190945 pre-release

Jan 26, 2026

0.1.0b2.dev20260126032706 pre-release

Jan 26, 2026

0.1.0b2.dev20260126032124 pre-release

Jan 26, 2026

0.1.0b2.dev20260126030653 pre-release

Jan 26, 2026

0.1.0b2.dev20260126020902 pre-release

Jan 26, 2026

0.1.0b2.dev20260125165247 pre-release

Jan 25, 2026

0.1.0b2.dev20260125144457 pre-release

Jan 25, 2026

0.1.0b2.dev20260125142237 pre-release

Jan 25, 2026

0.1.0b2.dev20260125124820 pre-release

Jan 25, 2026

0.1.0b2.dev20260125061006 pre-release

Jan 25, 2026

0.1.0b2.dev20260124154617 pre-release

Jan 24, 2026

0.1.0b2.dev20260124154534 pre-release

Jan 24, 2026

0.1.0b2.dev20260124121900 pre-release

Jan 24, 2026

0.1.0b2.dev20260124113031 pre-release

Jan 24, 2026

0.1.0b2.dev20260124093645 pre-release

Jan 24, 2026

0.1.0b2.dev20260123142310 pre-release

Jan 23, 2026

0.1.0b2.dev20260123140931 pre-release

Jan 23, 2026

0.1.0b2.dev20260123140747 pre-release

Jan 23, 2026

0.1.0b2.dev20260123060712 pre-release

Jan 23, 2026

0.1.0b2.dev20260123002328 pre-release

Jan 23, 2026

0.1.0b2.dev20260123002150 pre-release

Jan 23, 2026

0.1.0b2.dev20260123002123 pre-release

Jan 23, 2026

0.1.0b2.dev20260123001526 pre-release

Jan 23, 2026

0.1.0b2.dev20260122164338 pre-release

Jan 22, 2026

0.1.0b2.dev20260122125803 pre-release

Jan 22, 2026

0.1.0b2.dev20260122052040 pre-release

Jan 22, 2026

0.1.0b2.dev20260121184506 pre-release

Jan 21, 2026

0.1.0b2.dev20260121184332 pre-release

Jan 21, 2026

0.1.0b2.dev20260121184308 pre-release

Jan 21, 2026

0.1.0b2.dev20260121170930 pre-release

Jan 21, 2026

0.1.0b2.dev20260121145717 pre-release

Jan 21, 2026

0.1.0b2.dev20260121140211 pre-release

Jan 21, 2026

0.1.0b2.dev20260121122356 pre-release

Jan 21, 2026

0.1.0b2.dev20260121122330 pre-release

Jan 21, 2026

0.1.0b2.dev20260121083420 pre-release

Jan 21, 2026

0.1.0b2.dev20260121053647 pre-release

Jan 21, 2026

0.1.0b2.dev20260120153404 pre-release

Jan 20, 2026

0.1.0b2.dev20260120152429 pre-release

Jan 20, 2026

0.1.0b2.dev20260120145929 pre-release

Jan 20, 2026

0.1.0b2.dev20260120144144 pre-release

Jan 20, 2026

0.1.0b2.dev20260120134034 pre-release

Jan 20, 2026

0.1.0b2.dev20260120121510 pre-release

Jan 20, 2026

0.1.0b2.dev20260120120856 pre-release

Jan 20, 2026

0.1.0b2.dev20260120114632 pre-release

Jan 20, 2026

0.1.0b2.dev20260120112307 pre-release

Jan 20, 2026

0.1.0b2.dev20260120110515 pre-release

Jan 20, 2026

0.1.0b2.dev20260120062721 pre-release

Jan 20, 2026

0.1.0b2.dev20260120053448 pre-release

Jan 20, 2026

0.1.0b2.dev20260120034158 pre-release

Jan 20, 2026

0.1.0b2.dev20260119204301 pre-release

Jan 19, 2026

0.1.0b2.dev20260119173708 pre-release

Jan 19, 2026

0.1.0b2.dev20260119173633 pre-release

Jan 19, 2026

0.1.0b2.dev20260119145221 pre-release

Jan 19, 2026

0.1.0b2.dev20260119135326 pre-release

Jan 19, 2026

0.1.0b2.dev20260119113253 pre-release

Jan 19, 2026

0.1.0b2.dev20260119084506 pre-release

Jan 19, 2026

0.1.0b2.dev20260119031535 pre-release

Jan 19, 2026

0.1.0b2.dev20260119031436 pre-release

Jan 19, 2026

0.1.0b2.dev20260119031309 pre-release

Jan 19, 2026

0.1.0b2.dev20260117150716 pre-release

Jan 17, 2026

0.1.0b2.dev20260116043205 pre-release

Jan 16, 2026

0.1.0b2.dev20260115161815 pre-release

Jan 15, 2026

0.1.0b2.dev20260115161657 pre-release

Jan 15, 2026

0.1.0b2.dev20260115161629 pre-release

Jan 15, 2026

0.1.0b2.dev20260115155105 pre-release

Jan 15, 2026

0.1.0b2.dev20260115081807 pre-release

Jan 15, 2026

0.1.0b2.dev20260115081117 pre-release

Jan 15, 2026

0.1.0b1 pre-release

Jan 8, 2026

0.1.0a1 pre-release

Jan 5, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

vllm_sr-0.3.0.dev20260427140612.tar.gz (144.3 kB view details)

Uploaded Apr 27, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

vllm_sr-0.3.0.dev20260427140612-py3-none-any.whl (121.1 kB view details)

Uploaded Apr 27, 2026 Python 3

File details

Details for the file vllm_sr-0.3.0.dev20260427140612.tar.gz.

File metadata

Download URL: vllm_sr-0.3.0.dev20260427140612.tar.gz
Upload date: Apr 27, 2026
Size: 144.3 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for vllm_sr-0.3.0.dev20260427140612.tar.gz
Algorithm	Hash digest
SHA256	`2a40255b2bde939b74414f4533e5c58ca3270ac3f392fd2570401a8bbd82ae0c`
MD5	`e80d45231b04a73354f8aa278606c85a`
BLAKE2b-256	`0477492d309ef36fceb07b4455581c3ca39a3db0766f820ad84d3014f2510653`

See more details on using hashes here.

File details

Details for the file vllm_sr-0.3.0.dev20260427140612-py3-none-any.whl.

File metadata

Download URL: vllm_sr-0.3.0.dev20260427140612-py3-none-any.whl
Upload date: Apr 27, 2026
Size: 121.1 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for vllm_sr-0.3.0.dev20260427140612-py3-none-any.whl
Algorithm	Hash digest
SHA256	`e8cfba61253acb95f54e657e7dfe1f6f7e96a4220805d804db2f16180e7048eb`
MD5	`59ea1ce0a47360a6b13573e57ffce85c`
BLAKE2b-256	`83c811ef5f0827d3cdb53bede0e8fbd4d81d8c76cdd6933b3dc41522268c9c1f`

See more details on using hashes here.

vllm-sr 0.3.0.dev20260427140612

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

vLLM Semantic Router

Quick Start

Installation

Usage

Kubernetes Deployment

Advanced YAML-first setup

Features

Endpoints

Observability

Configuration

Plugin Configuration

File Descriptor Limits

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes