Organic traffic hack the seo logo e1706007562232 1

Accueil / Glossaire SEO GEO / Vecteur (base vectorielle)

GEO & IA

Vecteur (base vectorielle)

Definition SEO et GEO

La représentation numérique d'un texte (voir Embedding), stockée dans une base vectorielle pour retrouver les contenus les plus proches d'une requête. Base de la recherche sémantique et du RAG.

Comment fonctionne Vecteur

Un modèle d'embedding transforme un texte en vecteur, une suite de plusieurs centaines de nombres qui encode son sens dans un espace mathématique. On stocke ces vecteurs dans une base vectorielle, optimisée pour retrouver rapidement les plus proches d'un vecteur de requête. Deux textes au sens voisin ont des vecteurs proches ; deux textes sans rapport sont éloignés. La recherche consiste à mesurer ces distances (similarité cosinus le plus souvent) et à remonter les contenus pertinents, base technique de la recherche sémantique et du RAG.

Sens proche = procheSens eloigne
Dans l espace vectoriel, deux sens proches sont geometriquement proches.

Exemple concret

Exemple

Un assistant IA doit répondre à partir d'une documentation de 500 pages. On découpe le texte en morceaux (chunking), on convertit chaque morceau en vecteur et on stocke le tout dans une base vectorielle. À la question de l'utilisateur, la question devient elle aussi un vecteur ; la base renvoie les 5 passages les plus proches, qui sont injectés dans le modèle pour rédiger la réponse. Sans base vectorielle, l'IA devrait relire les 500 pages à chaque requête. Avec elle, la recherche se fait en millisecondes et cible uniquement les extraits réellement pertinents.

En chiffres

Trois repères chiffres pour comprendre les vecteurs et leur stockage.

384-1536
dimensions par vecteur (typique)
cosinus
mesure de similarité courante
top-k
nombre de résultats remontes

Reperes illustratifs, a titre pedagogique. Les resultats reels varient selon la concurrence et la qualite editoriale.

Erreurs frequentes a eviter
  • Confondre vecteur (représentation) et base de données classique
  • Mélanger des vecteurs issus de modèles d'embedding différents
  • Négliger le chunking, qui conditionne la qualité de la recherche
  • Croire qu'une base vectorielle comprend, alors qu'elle mesure des distances

Vecteur avec Hack The SEO

Hack The SEO calcule un GEO Score par page et liste ce qui manque pour être cité par ChatGPT, Perplexity et les autres IA. Decouvrir le plugin SEO WordPress Hack The SEO.

Terme precedent
User-Agent
Terme suivant
Vitesse de chargement

Questions frequentes

Quelle différence entre un vecteur et un embedding ?
Un embedding est le procédé qui transforme un texte en représentation numérique ; le vecteur est cette représentation elle-même, la liste de nombres produite. En pratique, les deux termes sont souvent employés de façon interchangeable. On dira que l'on génère des embeddings et qu'on stocke des vecteurs dans une base dédiée.
À quoi sert une base vectorielle dans le RAG ?
Dans le RAG (Retrieval-Augmented Génération), la base vectorielle stocke les documents transformes en vecteurs et retrouve, pour chaque question, les passages les plus proches par le sens. Ces extraits sont ensuite fournis au modèle de langage pour qu'il rédige une réponse ancrée dans vos données, plutôt que de répondre de mémoire, ce qui réduit les erreurs.
Comment mesure-t-on la proximité entre deux vecteurs ?
Le plus souvent par la similarité cosinus, qui compare l'orientation de deux vecteurs indépendamment de leur longueur : plus l'angle est petit, plus les sens sont proches. D'autres mesures existent (distance euclidienne, produit scalaire). Le choix dépend du modèle d'embedding et de la base vectorielle, mais le cosinus reste la référence pour la recherche sémantique.

On en parle ?

Hack The SEO applique tout ca a votre site WordPress, pilote en langage naturel. Reservez 20 minutes, on regarde votre cas ensemble.

Reserver 20 minutes