:PROPERTIES: :ID: dac32a5d-f8f9-4973-8135-771da4afe7c9 :END: #+title: Daneel - RAG / Memory Backend #+filetags: :daneel:memory:rag: * Aktuální stav (únor 2026) Aktivní backend: *Builtin + OpenAI embeddings* - Model: =text-embedding-3-small= (1536 dimenzí) - Vyhledávání: hybridní BM25 + vektorové - Indexováno: denní logy, MEMORY.md, workspace soubory - Pravidlo: =memory_search= vždy *anglicky* (lepší recall — soubory jsou česky, ale model funguje lépe s angličtinou) Příklady správného použití: #+begin_example memory_search("martin email himalaya credentials") memory_search("web publish rules violation") #+end_example Špatně: #+begin_example memory_search("email přihlašovací údaje") ; horší výsledky #+end_example * Historie ** QMD backend (leden–únor 2026) — odstraněn Zkoušen jako alternativa k builtin backendu. Problémy: - CUDA závislosti způsobovaly build problémy na serveru - BM25 výsledky horší než builtin hybrid - Složitá konfigurace bez jasného přínosu Odstraněn, vráceno na builtin + OpenAI embeddings. ** Kdy přehodnotit RAG Workspace soubory jsou malé (~5–8K tokenů = ~3–4 % kontextového okna). RAG pro hot storage nedává smysl — úspora příliš malá vs. riziko vynechání pravidel. =memory_search= (cold storage) = fakticky RAG pro 30+ denních logů. Přehodnotit pokud overhead > 15 % (~30K tokenů). Při aktivním pruning v dohledné době nenastane.