RAG

Le RAG (Retrieval-Augmented Generation) est l’une des techniques les plus répandues pour ancrer un modèle de langage dans des données réelles plutôt que dans ses seuls souvenirs d’entraînement. L’idée tient en deux temps : aller chercher la bonne information, puis laisser le modèle la formuler. En pratique, tout se joue dans ce premier mouvement.

Un RAG mal réglé ne corrige pas les hallucinations, il les habille de sources. La qualité des embeddings, le découpage des documents, la pertinence de la recherche pèsent autant que le modèle lui-même : on ne branche pas une rustine, on conçoit une architecture, des plus simples aux pipelines agentiques. Fiabiliser une IA tient peut-être d’abord à ce qu’on lui donne à lire. Sur quoi compter pour une réponse juste, le modèle ou ce qu’on a su lui retrouver ?