A lightweight library for operations on blocksparse matrices in PyTorch.

Project description

blksprs

Overview

A lightweight library for operations on blocksparse matrices in PyTorch.

Currently supported operations (includes gradient calculation):

Sparse matrix multiplication (supports any combination of sparse and dense matrices due to support for sparse = sparse @ sparse matmul)
Softmax
Transposition
Conversion from and to sparse form

As with this library sparse matrices are represented using a tuple of (matrix, sparsity_layout, sparsity_block_size), any element-wise operations can be applied in regular torch-like fashion. These include, e.g.,

Element-wise addition and subtraction
Element-wise multiplication and division
Element-wise exponentiation
...

Installation

We recommend installing blksprs from PyPI using pip:

pip install blksprs

Changelog

See CHANGELOG.md for a detailed changelog.

Usage

import torch

from blksprs.layouting.sparsity_layout import create_sparsity_layout
from blksprs.ops.conversion import to_sparse, to_dense
from blksprs.ops.matmul_sss import matmul_sss
from blksprs.ops.row_wise_sum import row_wise_sum
from blksprs.ops.softmax import softmax
from blksprs.ops.transpose import transpose
from blksprs.utils.tools import do_shape_blocksparse, undo_shape_blocksparse


def test_readme():
    # Set up parameters
    b, h, m, n, k = 2, 4, 64, 64, 16

    # Percentage of blocks that will be sparse in the output for demonstration purposes
    sparsity_percentage = 25

    # Must be a power of two, greater than or equal to 16 for matmul, and divide m, n, and k
    sparsity_block_size = 16

    # Must be a power of two and smaller than or equal to sparsity_block_size
    # If it is set to ``none`` a value will be chosen automatically
    triton_block_size = None


    # Initialise random (dense) tensors
    x = torch.randn(size=(b, h, m, k), device="cuda")
    y = torch.randn(size=(b, h, n, k), device="cuda").transpose(-1, -2).contiguous()

    # Convert tensors to three-dimensional (dense) tensors since Triton can only handle tensors of exactly three dimensions
    x_dense, x_shape_original = do_shape_blocksparse(x)
    y_dense, y_shape_original = do_shape_blocksparse(y)

    # Create sparsity layouts from existing tensors
    sparsity_layout_x = create_sparsity_layout(x_dense, sparsity_block_size, triton_block_size=triton_block_size)
    sparsity_layout_y = create_sparsity_layout(y_dense, sparsity_block_size, triton_block_size=triton_block_size)

    # Create random sparsity layout for output tensor
    sparsity_layout_o = _get_random_sparsity_layout(b * h, m, n, sparsity_block_size, sparsity_percentage)

    # Convert tensors to sparse tensors for matrix multiplication
    x_sparse = to_sparse(x_dense, sparsity_layout_x, sparsity_block_size, triton_block_size=triton_block_size)
    y_sparse = to_sparse(y_dense, sparsity_layout_y, sparsity_block_size, triton_block_size=triton_block_size)

    # Perform matrix multiplication
    o_sparse = matmul_sss(x_sparse, y_sparse, sparsity_layout_x, sparsity_layout_y, sparsity_layout_o,
                          sparsity_block_size, triton_block_size=triton_block_size)
    o_dense = to_dense(o_sparse, sparsity_layout_o, sparsity_block_size, triton_block_size=triton_block_size)

    # Sanity check
    o_torch = torch.matmul(x_dense, y_dense)

    # Perform round trip to set sparse blocks to 0
    o_torch_round_trip = to_dense(
        to_sparse(o_torch, sparsity_layout_o, sparsity_block_size, triton_block_size=triton_block_size),
        sparsity_layout_o, sparsity_block_size, fill_value=0, triton_block_size=triton_block_size)

    # Assert that the output is correct
    assert torch.allclose(o_dense, o_torch_round_trip, atol=2e-2)  # Note that small numerical differences are expected

    # Assert that the output has the correct sparsity layout
    actual_sparsity_layout_o = create_sparsity_layout(o_dense, sparsity_block_size, triton_block_size=triton_block_size)
    assert torch.allclose(actual_sparsity_layout_o, sparsity_layout_o)

    # Convert output tensor back to original shape
    o = undo_shape_blocksparse(o_dense, x_shape_original)

    # Other available functions
    transpose(o_sparse, sparsity_layout_o, sparsity_block_size, triton_block_size=triton_block_size)
    softmax(o_sparse, sparsity_layout_o, sparsity_block_size, triton_block_size=triton_block_size)
    row_wise_sum(o_sparse, sparsity_layout_o, sparsity_block_size, triton_block_size=triton_block_size)


def _get_random_sparsity_layout(b, m, n, sparsity_block_size, sparsity_percentage):
    """Helper function, creates a random sparsity layout for a given shape with a given percentage of blocks marked as sparse.

    """
    m_s = m // sparsity_block_size
    n_s = n // sparsity_block_size

    sparsity_layout = torch.ones(size=(b, m_s, n_s), device="cuda", dtype=torch.int)

    num_zero_elements = int(m_s * n_s * (sparsity_percentage / 100))
    for b_i in range(b):
        indices = torch.randperm(m_s * n_s)[:num_zero_elements]
        sparsity_layout[b_i, indices // n_s, indices % n_s] = 0

    return sparsity_layout

Project details

Release history Release notifications | RSS feed

1.4

Oct 2, 2024

1.3

Sep 26, 2024

1.2.1

Sep 25, 2024

1.2

Sep 20, 2024

1.1

Sep 19, 2024

This version

1.0

Sep 13, 2024

0.2b4 pre-release

Aug 29, 2024

0.2b3 pre-release

Aug 23, 2024

0.2b2 pre-release

Aug 21, 2024

0.2b1 pre-release

Aug 21, 2024

0.1

Aug 21, 2024

0.1b1 pre-release

Aug 21, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

blksprs-1.0.tar.gz (12.6 kB view hashes)

Uploaded Sep 13, 2024 Source

Built Distribution

blksprs-1.0-py3-none-any.whl (17.4 kB view hashes)

Uploaded Sep 13, 2024 Python 3

Hashes for blksprs-1.0.tar.gz

Hashes for blksprs-1.0.tar.gz
Algorithm	Hash digest
SHA256	`080e80e207b54dc61cd812670853da7821c121d8549602783df0a2ab2cbe93f0`
MD5	`465da14477d1f4a744c4ed911809c3ef`
BLAKE2b-256	`b120f8907198f848caec4aedd46513d73532e32a43f49fe0c20eb7aee38832d9`

Hashes for blksprs-1.0-py3-none-any.whl

Hashes for blksprs-1.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`2d0a15c036fcc34a3941cf8f070bbaade9be0d9e0bc0625830b284fa97a613b6`
MD5	`746db9fa5157859595b12f02b619d7ab`
BLAKE2b-256	`50a0c5735421023ce8cde81a2619bebcc62e2cb6fd2ed99e97712d36f438a9ce`