This commit is contained in:
Martin Sukany
2026-02-17 22:06:04 +01:00
parent c82c325ed4
commit 2e8521a067
5 changed files with 76 additions and 5 deletions

View File

@@ -0,0 +1,37 @@
:PROPERTIES:
:ID: dac32a5d-f8f9-4973-8135-771da4afe7c9
:END:
#+title: Daneel - RAG
* QMD Memory Backend
** Problém
=memory_search= vracel prázdné výsledky i když QMD index byl správně naplněn.
Root cause: =qmd query= (defaultní mód) posílá cmake/node-llama-cpp
build output na *stdout* místo stderr. Bridge parsuje stdout jako JSON —
první =[= narazí na =[node-llama-cpp]=, JSON.parse selže → výsledek =[]=.
** Řešení
Přepnout =searchMode= z =query= na =search= v openclaw.json.
Mód =search= = BM25+vector bez LLM query expansion.
Žádné cmake, žádné extra modely, rychlejší.
#+begin_src json
{ "memory": { "backend": "qmd", "qmd": { "searchMode": "search" } } }
#+end_src
** Aktuální stav
- 34 souborů indexováno, 92 vektorů
- Embedding model: embeddinggemma-300M (314 MB, lokální, CPU)
- =memory_search= funguje, score 0.80.9
- Pravidlo: dotazy vždy anglicky (lepší recall)
- Bug nenahlášen upstream
** RAG analýza
Workspace soubory celkem: ~5 200 tokenů = *2,6 % context okna* (200K).
RAG teď nedává smysl — úspora příliš malá, riziko vynechání pravidel.
=memory_search= (QMD) = fakticky RAG pro cold storage (30+ daily logů).
Přehodnotit až overhead > 15 % (~30K tokenů).
Při aktivním pruning to v dohledné době nenastane.