A language model for code and conversation.
Project description
🚀 Mimo Language Model
Mimo est un modèle de langage AI pour exceller à la fois en génération de code et en conversations naturelles.
Il est issu d'un mélange de datasets puissants.
✨ Points forts de Mimo
- 🔧 Optimisé pour le code : génération fiable de scripts Python, JS, etc.
- 💬 Excellente conversation : réponses naturelles et contextualisées.
- ⚡ Compatibilité multiplateforme : fonctionne sur Mac, PC et VSCode.
- 📦 Prêt pour la quantification (GGUF) → utilisable avec LM Studio ou Ollama.
📦 Installation
Clonez le dépôt et installez les dépendances :
git clone https://github.com/votre-utilisateur/mimo-llm.git
cd mimo-llm
pip install -r requirements.txt
⚠️ Assurez-vous d’avoir git-lfs installé pour gérer les poids du modèle.
🔑 Configuration
Avant toute utilisation, configurez votre Hugging Face Token :
export HF_TOKEN="votre_token_hugging_face"
🏋️ Fine-tuning
Lancez le fine-tuning avec :
python fine_tune_mimo.py
IMPORTANT : Remplacez example.jsonl par votre propre fichier de dataset avant d'exécuter ce script. Le fichier example.jsonl contient quelques exemples fictifs à des fins de démonstration.
- Utilise vos données perso (
example.jsonl) - Combine un sous-ensemble du dataset public
mosaicml/instruct-v3 - Sauvegarde les poids et tokenizer dans
./Mimo
⚠️ Note de sécurité : ne publiez jamais vos données privées ou sensibles dans le dépôt public.
🧑💻 Exemples d’utilisation
Génération de code
prompt = "Écris une fonction Python pour trier une liste."
inputs = mimo_tokenizer(prompt, return_tensors="pt")
outputs = mimo_model.generate(**inputs, max_new_tokens=100)
print(mimo_tokenizer.decode(outputs[0], skip_special_tokens=True))
Conversation
prompt = "Quelle est la meilleure façon d'apprendre une nouvelle langue ?"
inputs = mimo_tokenizer(prompt, return_tensors="pt")
outputs = mimo_model.generate(**inputs, max_new_tokens=150)
print(mimo_tokenizer.decode(outputs[0], skip_special_tokens=True))
📊 Performances comparatives
| Modèle | Code (Python) | Conversation | Mémoire requise |
|---|---|---|---|
| GPT-Neo 1.3B | ⭐⭐ | ⭐⭐ | ~12 Go |
| DeepSeek-Qwen-1.5B (base) | ⭐⭐⭐ | ⭐⭐⭐ | ~10 Go |
| Mimo-1.5B (fine-tuned) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ~8 Go (quantisé) |
➡️ Mimo surpasse la version de base sur les benchmarks internes (code + QA).
📂 Structure du dépôt
Mimo/
├── README.md
├── assets/mimo.png
├── assets/mimo_conv_code.png
├── example.jsonl # Jeu de données fictif
├── fine_tune_mimo.py
├── requirements.txt
├── .gitignore
└── LICENSE
🛠️ Intégration dans VSCode
- Clonez le dépôt :
git clone https://github.com/votre-utilisateur/mimo-llm.git cd mimo-llm
- Installez les dépendances :
pip install -r requirements.txt
- Exécutez soit :
fine_tune_mimo.py→ pour l’entraînement- un script d’inférence personnalisé
⚡ Vous pouvez aussi utiliser Mimo dans LM Studio en important la version quantisée GGUF ou autre format.
📜 Licence
Ce projet est sous licence Apache 2.0.
Voir le fichier LICENSE pour les détails.
⚠️ Note importante : le fichier example.jsonl est fourni uniquement comme exemple.
N’incluez jamais vos données sensibles ou privées dans le dépôt public.
📧 Auteur
- Nom : ABDESSEMED Mohamed
- Entreprise : Eurocybersecurite
- Contact : mohamed.abdessemed@eurocybersecurite.fr
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file mimo_llm-0.1.2.tar.gz.
File metadata
- Download URL: mimo_llm-0.1.2.tar.gz
- Upload date:
- Size: 7.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.9.6
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c278bda434c919cf66373f9436fa4085d67ec50169e8cf08810c418c702fc234
|
|
| MD5 |
7dbbd6c614cae36c59307f58423db761
|
|
| BLAKE2b-256 |
617744373adbf149a4c608165d68bca14ad3e2e29414b21f7b43cf9fd02c0a65
|
File details
Details for the file mimo_llm-0.1.2-py3-none-any.whl.
File metadata
- Download URL: mimo_llm-0.1.2-py3-none-any.whl
- Upload date:
- Size: 7.4 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.9.6
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
212308fbed759db90330cfbcc6b29b61ccc61dbc23fc8118550defb60985a87e
|
|
| MD5 |
c1445a0197947727bac3d62e51b75d6a
|
|
| BLAKE2b-256 |
1626ad575b08b967d3ceb2f3ce45b2281584be9918c1bd1104f83fb281bbb802
|