Profile of lightseek

tokenspeed-scheduler

Last released Jul 22, 2026

TokenSpeed C++ scheduler with Python bindings

tokenspeed-kernel-amd

Last released Jul 22, 2026

TokenSpeed AMD-specific high-performance kernels.

tokenspeed-mla

Last released Jul 21, 2026

Speed-of-light TokenSpeed MLA kernels for Blackwell SM100 and SM103.

tokenspeed-triton

Last released Jul 21, 2026

A language and compiler for custom Deep Learning operations (vendor release for TokenSpeed)

tokenspeed-proton

Last released Jul 21, 2026

A profiler for Triton (vendor release for TokenSpeed)

tokenspeed-smg

Last released Jul 20, 2026

High-performance Rust-based inference gateway for large-scale LLM deployments

tokenspeed-smg-grpc-proto

Last released Jul 20, 2026

SMG gRPC proto definitions for vLLM, TRT-LLM, MLX, TokenSpeed, and SGLang

tokenspeed-smg-grpc-servicer

Last released Jul 20, 2026

SMG gRPC servicer implementations for LLM inference engines (vLLM, MLX, TokenSpeed, SGLang)

smg

Last released Jul 18, 2026

High-performance Rust-based inference gateway for large-scale LLM deployments

tokenspeed-deepgemm

Last released Jul 12, 2026

None

tokenspeed-fa4

Last released Jul 11, 2026

Flash Attention CUTE (CUDA Template Engine) implementation

tokenspeed-trtllm-kernel

Last released Jul 7, 2026

Standalone TensorRT-LLM CUDA kernels as PyTorch custom ops

tokenspeed-spdlog

Last released Jul 1, 2026

TokenSpeed packaging for spdlog headers and CMake metadata.

tokenspeed-flashmla

Last released Jun 15, 2026

None

tokenspeed-mooncake

Last released May 29, 2026

Python binding of a Mooncake library using pybind11

tokenspeed-trie

Last released May 23, 2026

A small harness for evaluating OpenAI-compatible inference endpoints with synthetic agentic workloads.

tokenspeed-iris

Last released May 10, 2026

Triton-based framework for Remote Memory Access (RMA) operations with SHMEM-like APIs for multi-GPU programming.

tokenspeed-tritonblas

Last released May 10, 2026

A Lightweight Triton-based BLAS Library

tokenspeed-triton-kernels

Last released May 10, 2026

None

tokenspeed-deepep

Last released May 4, 2026

None

tokenspeed-fa3

Last released Apr 8, 2026

FlashAttention-3

tokenspeed-fast-hadamard-transform

Last released Mar 29, 2026

Fast Hadamard Transform in CUDA, with a PyTorch interface

tokenspeed-kernel

Last released Mar 8, 2026

Name reserved for the tokenspeed-kernel project.

tokenspeed

Last released Mar 2, 2026

Name reserved for the tokenspeed project.

LightSeek Foundation

24 projects

tokenspeed-scheduler

tokenspeed-kernel-amd

tokenspeed-mla

tokenspeed-triton

tokenspeed-proton

tokenspeed-smg

tokenspeed-smg-grpc-proto

tokenspeed-smg-grpc-servicer

smg

tokenspeed-deepgemm

tokenspeed-fa4

tokenspeed-trtllm-kernel

tokenspeed-spdlog

tokenspeed-flashmla

tokenspeed-mooncake

tokenspeed-trie

tokenspeed-iris

tokenspeed-tritonblas

tokenspeed-triton-kernels

tokenspeed-deepep

tokenspeed-fa3

tokenspeed-fast-hadamard-transform

tokenspeed-kernel

tokenspeed