Technique Mis à jour 2026-04
Embedding
Definition
Un embedding est une représentation numérique (vecteur) d'un texte ou d'une donnée, capturant son sens sémantique.
Voir aussi dans le glossaire
B
Base de données vectorielle
Une base de données vectorielle stocke des embeddings pour la recherche sémantique et le RAG à grande échelle.
R
RAG (Retrieval-Augmented Generation)
Le RAG est une technique qui connecte un LLM à des sources de données externes pour générer des réponses plus précises et à jour.
L
LLM (Large Language Model)
Un LLM est un modèle d'IA entraîné sur des milliards de textes, capable de comprendre et générer du langage humain.
N
NLP (Traitement du Langage Naturel)
Le NLP est le domaine de l'IA qui permet aux machines de comprendre, interpréter et générer du langage humain.
Outils qui utilisent embedding
Questions fréquentes
A quoi servent les embeddings ?
Ils mesurent la similarité sémantique entre textes. Deux phrases avec le même sens auront des vecteurs proches. C'est la base du RAG.
Embedding et token, c'est pareil ?
Non. Un token est un morceau de texte brut. Un embedding est sa traduction en vecteur numérique dans un espace mathématique.