ARCA — Adaptive Resonant Cortical Architecture
Project description
ARCA: Advanced Recurrent Cognitive Architecture
ARCA est une architecture hybride de modèle de langage haute performance (wgpu / Rust) qui combine :
- Un Réservoir Dynamique (LSM) de 4096 unités pour la dynamique temporelle locale.
- Une Mémoire Hebbienne Plastique (Bio-Inspired) avec des couches gérées par contrôle homéostatique.
- Un mécanisme d'Attention Hybride avec KV-Cache pour la récupération à long terme (In-Context Learning).
- Un Pipeline GPU "Zero-Sync" Extrême conçu pour une exécution 100% VRAM-first (WGSL), avec compression FP16 et exécution par lots (Batching).
🚀 Fonctionnalités Clés (v2.6.0)
ARCA est spécifiquement optimisé pour éliminer le goulot d'étranglement des architectures hybrides : les transferts sur le bus PCIe et la bande passante mémoire.
⚡ Inférence "GPU-First" & "Batched"
Lors de l'inférence, zéro synchronisation CPU-GPU n'a lieu pour le calcul du graphe de l'encodeur jusqu'à l'échantillonnage.
- Pipeline VRAM Intégral :
Encodeur -> Attention KV-Cache -> Reservoir -> Projections -> Agrégation -> Logits -> Top-K Sampling. - Exécution Matrice-Matrice (Batching GEMM) : Le GPU gère
Bséquences d'inférence en parallèle massif. - Zéro Readback : Les états internes (
s_t, KV-Cache, mémoire hebbienne) ne quittent jamais la VRAM. - Précision Mixte FP16 : Toutes les matrices statiques (Reservoir, Embeddings, Attention) sont stockées compressées en
f16et dézippées (unpack2x16float) à la volée par les shaders WGSL, doublant virtuellement la Memory Bandwidth.
🎲 Échantillonnage Top-P VRAM (Nucleus Sampling)
La sélection probabiliste est assistée par le GPU :
Un shader de réduction multi-passes trouve les K meilleurs tokens ou applique un filtrage Top-P (Nucleus) et masque les logits. Le CPU ne lit que les tokens finaux (une poignée d'octets) pour appliquer la Température et un Tirage Pondéré (Softmax) afin de garantir un texte fluide et cohérent.
🏋️♂️ Entraînement Full-GPU (AdamW & WGSL)
L'entraînement de la tête de prédiction d'ARCA (plus de 55M de paramètres) est calculé à 100% sur la carte vidéo sans blocage CPU.
- Backpropagation in-place : L'optimiseur AdamW est implémenté en pur WGSL.
- Zero-Transfert : Le calcul des gradients (
grad_logits,grad_y_hidden) et les mises à jour de mémoire se font intégralement sur le GPU.
⚡ Tokenizer Multi-threadé (Rayon)
L'apprentissage du vocabulaire via BPE a été optimisé par du calcul distribué (Map-Reduce) sur tous les cœurs du CPU, réduisant drastiquement le temps de scan des gros corpus de texte.
🛠️ Architecture Hybride
1. ArcaSystem (Orchestrateur Principal)
L'objet central qui gère le graphe global, le dictionnaire BPE, et les flux de tokens.
// Exemple d'inférence batch extrême
let token_ids = system.forward_step_extreme_inference(&bytes_batch, &t_batch, &bpe_batch, 0.8);
2. GpuInferenceContext (Vulkan/Metal/DX12)
Moteur wgpu contenant tous les compute pipelines compilés et les buffers persistants FP16 :
encoder.wgsl: Hachage des n-grams, lookup BPE et convolution causale.attention.wgsl: Mécanisme d'attention hybride avec gestion dynamique du KV-Cache.reservoir_update.wgsl: Calculetanh(R * s_{t-1} + W_in * x)en matrice-matrice (batch).projections.wgsl: Projections locales pour la mise à jour plastique.hebbian_plasticity.wgsl: Règle de Hebb (outer-product) avec clamp homéostatique.aggregate.wgsl: Combinaison holographique des mémoires.logit_compute.wgsl: Produit scalaire massif sur la table d'embedding.top_k_sampling.wgsl: Réduction K-passes pour l'échantillonnage inférence.
3. Contrôleur Métabolique (CPU)
Gère le "climat" (macro-variables) qui module la plasticité selon l'erreur de prédiction : $\beta$ (tension), $\lambda$ (oubli), $\sigma$ (homéostasie).
4. API Python via PyO3 / Maturin
ARCA est intégralement compilable et utilisable depuis Python.
import arca
model = arca.ArcaModel("modele.sovereign", "tokenizer.json")
model.train(corpus, "modele.sovereign", 64)
print(model.generate("Texte", max_tokens=50, temperature=0.7, top_p=0.9))
📦 Installation & Compilation
ARCA nécessite Rust (Edition 2021) et un GPU compatible avec les backends wgpu.
# Cloner le projet
git clone https://github.com/corbac10099/ARCA.git
cd ARCA
# Compiler avec support GPU natif (Recommandé)
cargo build --release --features gpu
# Lancer les tests unitaires
cargo test --release --features gpu
ARCA est conçu pour la recherche en apprentissage hebbien et le calcul hybride (Liquid State Machine + Deep Learning) aux limites du matériel moderne.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file arca_core-0.3.2-cp311-cp311-win_amd64.whl.
File metadata
- Download URL: arca_core-0.3.2-cp311-cp311-win_amd64.whl
- Upload date:
- Size: 2.8 MB
- Tags: CPython 3.11, Windows x86-64
- Uploaded using Trusted Publishing? No
- Uploaded via: maturin/1.13.3
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
d613db1ae236f02dd0a63ebd4c047b04d21555ca1ff9d288deb73b5f46811f4c
|
|
| MD5 |
4eac2261e9c78be13d50ac3ac1149aea
|
|
| BLAKE2b-256 |
300f498c8f0f0f4070262bb0a3799d12607276e56e1f27f24c0eeb443b30175b
|