1.4 KiB
1.4 KiB
Daneel - RAG / Memory Backend
Aktuální stav (únor 2026)
Aktivní backend: Builtin + OpenAI embeddings
- Model:
text-embedding-3-small(1536 dimenzí) - Vyhledávání: hybridní BM25 + vektorové
- Indexováno: denní logy, MEMORY.md, workspace soubory
- Pravidlo:
memory_searchvždy anglicky (lepší recall — soubory jsou česky, ale model funguje lépe s angličtinou)
Příklady správného použití:
memory_search("martin email himalaya credentials")
memory_search("web publish rules violation")
Špatně:
memory_search("email přihlašovací údaje") ; horší výsledky
Historie
QMD backend (leden–únor 2026) — odstraněn
Zkoušen jako alternativa k builtin backendu. Problémy:
- CUDA závislosti způsobovaly build problémy na serveru
- BM25 výsledky horší než builtin hybrid
- Složitá konfigurace bez jasného přínosu
Odstraněn, vráceno na builtin + OpenAI embeddings.
Kdy přehodnotit RAG
Workspace soubory jsou malé (~5–8K tokenů = ~3–4 % kontextového okna). RAG pro hot storage nedává smysl — úspora příliš malá vs. riziko vynechání pravidel.
memory_search (cold storage) = fakticky RAG pro 30+ denních logů.
Přehodnotit pokud overhead > 15 % (~30K tokenů). Při aktivním pruning v dohledné době nenastane.