Files
emacs-org/roam/20260217205442-daneel_rag.org

46 lines
1.4 KiB
Org Mode
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
:PROPERTIES:
:ID: dac32a5d-f8f9-4973-8135-771da4afe7c9
:END:
#+title: Daneel - RAG / Memory Backend
#+filetags: :daneel:memory:rag:
* Aktuální stav (únor 2026)
Aktivní backend: *Builtin + OpenAI embeddings*
- Model: =text-embedding-3-small= (1536 dimenzí)
- Vyhledávání: hybridní BM25 + vektorové
- Indexováno: denní logy, MEMORY.md, workspace soubory
- Pravidlo: =memory_search= vždy *anglicky* (lepší recall — soubory jsou česky, ale model funguje lépe s angličtinou)
Příklady správného použití:
#+begin_example
memory_search("martin email himalaya credentials")
memory_search("web publish rules violation")
#+end_example
Špatně:
#+begin_example
memory_search("email přihlašovací údaje") ; horší výsledky
#+end_example
* Historie
** QMD backend (ledenúnor 2026) — odstraněn
Zkoušen jako alternativa k builtin backendu. Problémy:
- CUDA závislosti způsobovaly build problémy na serveru
- BM25 výsledky horší než builtin hybrid
- Složitá konfigurace bez jasného přínosu
Odstraněn, vráceno na builtin + OpenAI embeddings.
** Kdy přehodnotit RAG
Workspace soubory jsou malé (~58K tokenů = ~34 % kontextového okna).
RAG pro hot storage nedává smysl — úspora příliš malá vs. riziko vynechání pravidel.
=memory_search= (cold storage) = fakticky RAG pro 30+ denních logů.
Přehodnotit pokud overhead > 15 % (~30K tokenů). Při aktivním pruning v dohledné době nenastane.