🏷️ Priorité : BASSE | Type : Enhancement / Research
Contexte
Le fork utilise facebook/contriever comme modèle d'embedding par défaut (hérité de LEANN upstream). Contriever est entraîné sur Wikipedia/CC-News — pas optimisé pour du contenu conversationnel ni pour du code.
Pour des sessions Claude Code (mélange conversation + code + tool usage), un modèle code-aware serait significativement meilleur.
Modèles à évaluer
| Modèle |
Dims |
Forces |
Source |
BAAI/bge-m3 |
1024 |
Multilingue + code, bien benchmarké |
HuggingFace |
jinaai/jina-embeddings-v3 |
1024 |
Code + conversation, très bon pour mixed content |
HuggingFace |
nomic-embed-text-v2 |
768 |
Léger, rapide, bon rapport qualité/vitesse |
HuggingFace |
Salesforce/SFR-Embedding-2_R |
4096 |
SOTA code, mais lourd |
HuggingFace |
Benchmark proposé
- Créer un jeu de test de 50 requêtes sur des sessions Claude Code réelles
- Indexer avec chaque modèle
- Mesurer : recall@5, recall@10, latence, RAM
- Comparer à Contriever comme baseline
Impact attendu
Amélioration de la pertinence des résultats de recherche sur les sessions Claude Code, surtout pour :
- Requêtes mixtes code + texte
- Recherche de patterns de code spécifiques
- Recherche dans du contenu multilingue
Notes
🏷️ Priorité : BASSE | Type : Enhancement / Research
Contexte
Le fork utilise
facebook/contrievercomme modèle d'embedding par défaut (hérité de LEANN upstream). Contriever est entraîné sur Wikipedia/CC-News — pas optimisé pour du contenu conversationnel ni pour du code.Pour des sessions Claude Code (mélange conversation + code + tool usage), un modèle code-aware serait significativement meilleur.
Modèles à évaluer
BAAI/bge-m3jinaai/jina-embeddings-v3nomic-embed-text-v2Salesforce/SFR-Embedding-2_RBenchmark proposé
Impact attendu
Amélioration de la pertinence des résultats de recherche sur les sessions Claude Code, surtout pour :
Notes
--embedding-model, donc pas de changement breakingclaude_code_rag.pyligne 49