46 lines
1.4 KiB
Org Mode
46 lines
1.4 KiB
Org Mode
:PROPERTIES:
|
||
:ID: dac32a5d-f8f9-4973-8135-771da4afe7c9
|
||
:END:
|
||
#+title: Daneel - RAG / Memory Backend
|
||
#+filetags: :daneel:memory:rag:
|
||
|
||
|
||
* Aktuální stav (únor 2026)
|
||
|
||
Aktivní backend: *Builtin + OpenAI embeddings*
|
||
- Model: =text-embedding-3-small= (1536 dimenzí)
|
||
- Vyhledávání: hybridní BM25 + vektorové
|
||
- Indexováno: denní logy, MEMORY.md, workspace soubory
|
||
- Pravidlo: =memory_search= vždy *anglicky* (lepší recall — soubory jsou česky, ale model funguje lépe s angličtinou)
|
||
|
||
Příklady správného použití:
|
||
#+begin_example
|
||
memory_search("martin email himalaya credentials")
|
||
memory_search("web publish rules violation")
|
||
#+end_example
|
||
|
||
Špatně:
|
||
#+begin_example
|
||
memory_search("email přihlašovací údaje") ; horší výsledky
|
||
#+end_example
|
||
|
||
|
||
* Historie
|
||
|
||
** QMD backend (leden–únor 2026) — odstraněn
|
||
|
||
Zkoušen jako alternativa k builtin backendu. Problémy:
|
||
- CUDA závislosti způsobovaly build problémy na serveru
|
||
- BM25 výsledky horší než builtin hybrid
|
||
- Složitá konfigurace bez jasného přínosu
|
||
|
||
Odstraněn, vráceno na builtin + OpenAI embeddings.
|
||
|
||
** Kdy přehodnotit RAG
|
||
|
||
Workspace soubory jsou malé (~5–8K tokenů = ~3–4 % kontextového okna).
|
||
RAG pro hot storage nedává smysl — úspora příliš malá vs. riziko vynechání pravidel.
|
||
|
||
=memory_search= (cold storage) = fakticky RAG pro 30+ denních logů.
|
||
Přehodnotit pokud overhead > 15 % (~30K tokenů). Při aktivním pruning v dohledné době nenastane.
|