Files
emacs-org/roam/20260217205442-daneel_rag.org

1.4 KiB
Raw Blame History

Daneel - RAG / Memory Backend

Aktuální stav (únor 2026)

Aktivní backend: Builtin + OpenAI embeddings

  • Model: text-embedding-3-small (1536 dimenzí)
  • Vyhledávání: hybridní BM25 + vektorové
  • Indexováno: denní logy, MEMORY.md, workspace soubory
  • Pravidlo: memory_search vždy anglicky (lepší recall — soubory jsou česky, ale model funguje lépe s angličtinou)

Příklady správného použití:

memory_search("martin email himalaya credentials")
memory_search("web publish rules violation")

Špatně:

memory_search("email přihlašovací údaje")   ; horší výsledky

Historie

QMD backend (ledenúnor 2026) — odstraněn

Zkoušen jako alternativa k builtin backendu. Problémy:

  • CUDA závislosti způsobovaly build problémy na serveru
  • BM25 výsledky horší než builtin hybrid
  • Složitá konfigurace bez jasného přínosu

Odstraněn, vráceno na builtin + OpenAI embeddings.

Kdy přehodnotit RAG

Workspace soubory jsou malé (~58K tokenů = ~34 % kontextového okna). RAG pro hot storage nedává smysl — úspora příliš malá vs. riziko vynechání pravidel.

memory_search (cold storage) = fakticky RAG pro 30+ denních logů. Přehodnotit pokud overhead > 15 % (~30K tokenů). Při aktivním pruning v dohledné době nenastane.