Python binding for llama.cpp using cffi

These details have not been verified by PyPI

Project links

Project description

llama-cpp-cffi

Python binding for llama.cpp using cffi and ctypes. Supports CPU and CUDA 12.5 execution.

Install

pip install llama-cpp-cffi

Example

from llama.llama_cli_cffi_cpu import llama_generate, Model, Options
# from llama.llama_cli_cffi_cuda_12_5 import llama_generate, Model, Options
# from llama.llama_cli_ctypes_cuda import llama_generate, Model, Options
# from llama.llama_cli_ctypes_cuda_12_5 import llama_generate, Model, Options

from llama.formatter import get_config

model = Model(
    'TinyLlama/TinyLlama-1.1B-Chat-v1.0',
    'TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUF',
    'tinyllama-1.1b-chat-v1.0.Q4_K_M.gguf',
)

config = get_config(model.creator_hf_repo)

messages = [
    {'role': 'system', 'content': 'You are a helpful assistant.'},
    {'role': 'user', 'content': 'Evaluate 1 + 2 in Python.'},
]

options = Options(
    ctx_size=config.max_position_embeddings,
    predict=-2,
    model=model,
    prompt=messages,
)

for chunk in llama_generate(options):
    print(chunk, flush=True, end='')

# newline
print()

Demos

#
# run demos
#
python -B examples/demo_cffi_cpu.py
python -B examples/demo_cffi_cuda_12_5.py

python -B examples/demo_ctypes_cpu.py
python -B examples/demo_ctypes_cuda_12_5.py

# python -m http.server -d examples/demo_pyonide -b "0.0.0.0" 5000

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.1.21

Sep 17, 2024

0.1.20

Sep 14, 2024

0.1.19

Sep 13, 2024

0.1.18

Sep 9, 2024

0.1.17

Sep 4, 2024

0.1.16

Sep 2, 2024

0.1.15

Aug 20, 2024

0.1.14

Aug 17, 2024

0.1.13

Aug 16, 2024

0.1.12

Aug 16, 2024

0.1.11

Aug 13, 2024

0.1.10

Aug 13, 2024

0.1.9

Aug 13, 2024

0.1.8

Aug 13, 2024

0.1.7

Aug 13, 2024

0.1.6

Aug 13, 2024

0.1.5

Jul 24, 2024

0.1.4

Jul 23, 2024

0.1.3

Jul 22, 2024

0.1.2

Jul 19, 2024

This version

0.1.1

Jul 19, 2024

0.1.0

Jul 18, 2024

0.0.4

Jul 18, 2024

0.0.3

Jul 14, 2024

0.0.2

Jul 9, 2024

0.0.1

Jul 5, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distributions

llama_cpp_cffi-0.1.1-cp312-cp312-musllinux_1_2_x86_64.whl (2.6 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.12 musllinux: musl 1.2+ x86-64

llama_cpp_cffi-0.1.1-cp312-cp312-musllinux_1_2_aarch64.whl (2.3 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.12 musllinux: musl 1.2+ ARM64

llama_cpp_cffi-0.1.1-cp312-cp312-manylinux_2_17_x86_64.whl (34.5 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.12 manylinux: glibc 2.17+ x86-64

llama_cpp_cffi-0.1.1-cp312-cp312-manylinux_2_17_aarch64.whl (2.5 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.12 manylinux: glibc 2.17+ ARM64

llama_cpp_cffi-0.1.1-cp311-cp311-musllinux_1_2_x86_64.whl (2.6 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.11 musllinux: musl 1.2+ x86-64

llama_cpp_cffi-0.1.1-cp311-cp311-musllinux_1_2_aarch64.whl (2.3 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.11 musllinux: musl 1.2+ ARM64

llama_cpp_cffi-0.1.1-cp311-cp311-manylinux_2_17_x86_64.whl (34.5 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.11 manylinux: glibc 2.17+ x86-64

llama_cpp_cffi-0.1.1-cp311-cp311-manylinux_2_17_aarch64.whl (2.5 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.11 manylinux: glibc 2.17+ ARM64

llama_cpp_cffi-0.1.1-cp310-cp310-musllinux_1_2_x86_64.whl (1.3 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.10 musllinux: musl 1.2+ x86-64

llama_cpp_cffi-0.1.1-cp310-cp310-musllinux_1_2_aarch64.whl (2.3 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.10 musllinux: musl 1.2+ ARM64

llama_cpp_cffi-0.1.1-cp310-cp310-manylinux_2_17_x86_64.whl (34.5 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.10 manylinux: glibc 2.17+ x86-64

llama_cpp_cffi-0.1.1-cp310-cp310-manylinux_2_17_aarch64.whl (2.5 MB view hashes)

Uploaded Jul 19, 2024 CPython 3.10 manylinux: glibc 2.17+ ARM64

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-musllinux_1_2_x86_64.whl

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-musllinux_1_2_x86_64.whl
Algorithm	Hash digest
SHA256	`5a3fd018756762542751b7de4c79ed7d7c3fa7fe10ac11afbff1dc70bc602f52`
MD5	`96ab97de31f230fbce3c2d5b7d1579b2`
BLAKE2b-256	`f60310713f7f8e496c015101a59124e3aec98c0141b2a1d04a6f1eccf44bef9a`

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-musllinux_1_2_aarch64.whl

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-musllinux_1_2_aarch64.whl
Algorithm	Hash digest
SHA256	`560114c773f8e066a319e98a6b790760b9830b6d0a86e980ce7fbe31afb64f95`
MD5	`4d76308fd9d435936699868f13cea835`
BLAKE2b-256	`ede298be007ed53613dff039d6f74c71ff437f8f186781fb3fb6b7d0836e6a99`

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-manylinux_2_17_x86_64.whl

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-manylinux_2_17_x86_64.whl
Algorithm	Hash digest
SHA256	`ea3c41bcc4420b11b6d2b37c3a7aaa77fce5e70c0926f3b5a77ffff5f9a8f3a4`
MD5	`01176b1ab9eb0ef9395431d2d55d9bc8`
BLAKE2b-256	`63435494ea6404cb0cdc6779a2104e81805470e7137ca299577610db04f0f69e`

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-manylinux_2_17_aarch64.whl

Hashes for llama_cpp_cffi-0.1.1-cp312-cp312-manylinux_2_17_aarch64.whl
Algorithm	Hash digest
SHA256	`ee66725073c61025e6e25fe44263396e0e41eae4c92d14703ca8f42964a62b91`
MD5	`1f3626bb01427ff70dec0f01a964019f`
BLAKE2b-256	`0f4a0ca13024986b6dce11444b4c1ada6ad44510080252f124381dee1dec1f46`

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-musllinux_1_2_x86_64.whl

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-musllinux_1_2_x86_64.whl
Algorithm	Hash digest
SHA256	`6e7cf26cd5b736e9c23427cc0e68742add1f667a0c6fc76ab982675a8e1c2d7e`
MD5	`cb5efd4e842a5a636411843e6b57a106`
BLAKE2b-256	`66655b097955b892448c5293273262babca132ef4f1facec58bd60d546cdda58`

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-musllinux_1_2_aarch64.whl

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-musllinux_1_2_aarch64.whl
Algorithm	Hash digest
SHA256	`cc2145dcf5013a78be8745ea54279bb4ae787adf33817370a5e8c8a6554dfd9c`
MD5	`390211062f5101f7f7e23b48ad6d2362`
BLAKE2b-256	`809bfbbfa1ed4c3683909b28eec46171f83de852a408a8b87db3497b4c44d6db`

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-manylinux_2_17_x86_64.whl

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-manylinux_2_17_x86_64.whl
Algorithm	Hash digest
SHA256	`4ae1e2517a237b8b63e598fed5101336f69eda31d0f187e6c8122b1d7ff5318b`
MD5	`6f8b4ef47d7bdde23dbe2e720ded98ab`
BLAKE2b-256	`0fa9385c5d3532a0fbed8a543e9f23c198b1f94c71ba6998aa036544d42bd729`

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-manylinux_2_17_aarch64.whl

Hashes for llama_cpp_cffi-0.1.1-cp311-cp311-manylinux_2_17_aarch64.whl
Algorithm	Hash digest
SHA256	`af836ec163f107af156a211d6dc508796de22ed500726d79031a12fd4b5f6ec1`
MD5	`85f2466706ba70d0f06a2d4f6588daaa`
BLAKE2b-256	`52ec46b3fe3b3d4df6cf93d52298dc3d380adac41849df53549b40c71e10e1c2`

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-musllinux_1_2_x86_64.whl

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-musllinux_1_2_x86_64.whl
Algorithm	Hash digest
SHA256	`4cb8694cab9953dbadd284526f7a2b74a5bc0c453a90f24752b1c254e398b440`
MD5	`12d25a08f22756a02b05ef9142313740`
BLAKE2b-256	`1a8ae61267cd17bf665d5a5c8b748eeb13d6ffc076d1bfbbbea67a0468059214`

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-musllinux_1_2_aarch64.whl

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-musllinux_1_2_aarch64.whl
Algorithm	Hash digest
SHA256	`4e3b228b304b9c3764561923974c8c6832928bed15707e4b58671052f1d25502`
MD5	`e7e2c12162b24cfd0464b5d88d0d4b2d`
BLAKE2b-256	`b928214e88bfd6c19556c2b5ec7e91cbd2b5dcc263625fcc35239587454bc65d`

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-manylinux_2_17_x86_64.whl

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-manylinux_2_17_x86_64.whl
Algorithm	Hash digest
SHA256	`575f89f804e23e9977049f42f6b19d0f735ade1f5f0b366b2895cfb90d999f2d`
MD5	`ba1ac616655a258f94fe4ae28bc98828`
BLAKE2b-256	`ccb6b3dc156edd1d52d8b38f2aebfebacad81acba5001fa6db2cc419dfc16516`

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-manylinux_2_17_aarch64.whl

Hashes for llama_cpp_cffi-0.1.1-cp310-cp310-manylinux_2_17_aarch64.whl
Algorithm	Hash digest
SHA256	`b2501a00d2eff69b870a5f6c5cf8aee96d2de9303d0743b5ed9e3a20f27cb17d`
MD5	`9b7efe73e753590f1045f9612821bf41`
BLAKE2b-256	`80dafa8316c6d290ef80f6203df81722b18b6bdb1d11021ded8fe880c55f7b79`