Technique Updated 2026-04

Quantization

Definition

La quantization réduit la précision des nombres dans un modèle IA pour le rendre plus petit et plus rapide, avec une perte de qualité minimale.

Tools that use quantization

DeepSeek

The open source Chinese model rivaling GPT-4

4.7/5

Stable Diffusion

The open source reference for AI image generation

4.4/5

OpenClaw

The open source AI agent that turns your LLMs into autonomous workers

4.5/5

Replit

Cloud IDE with built-in AI for coding from anywhere

4.5/5

Frequently Asked Questions

Quantization en 4-bit, 8-bit, qu'est-ce que ca change ?

Le modèle original utilise des nombres en 16 ou 32-bit. La quantization 8-bit divise la taille par 2, le 4-bit par 4. Un LLM de 70B en 4-bit tient dans 32GB de RAM.

La qualité baisse-t-elle beaucoup ?

En 8-bit, presque imperceptible. En 4-bit, légère baisse sur les tâches complexes mais acceptable pour la plupart des usages. En 2-bit, perte notable.

See also in the glossary

Tools that use quantization

Frequently Asked Questions