updated

2026-02-17 22:06:04 +01:00
parent c82c325ed4
commit 2e8521a067
5 changed files with 76 additions and 5 deletions
--- a/roam/20260217205442-daneel_rag.org
+++ b/roam/20260217205442-daneel_rag.org
@@ -0,0 +1,37 @@
+:PROPERTIES:
+:ID:       dac32a5d-f8f9-4973-8135-771da4afe7c9
+:END:
+#+title: Daneel - RAG
+
+* QMD Memory Backend
+
+** Problém
+=memory_search= vracel prázdné výsledky i když QMD index byl správně naplněn.
+
+Root cause: =qmd query= (defaultní mód) posílá cmake/node-llama-cpp
+build output na *stdout* místo stderr. Bridge parsuje stdout jako JSON —
+první =[= narazí na =[node-llama-cpp]=, JSON.parse selže → výsledek =[]=.
+
+** Řešení
+Přepnout =searchMode= z =query= na =search= v openclaw.json.
+Mód =search= = BM25+vector bez LLM query expansion.
+Žádné cmake, žádné extra modely, rychlejší.
+
+#+begin_src json
+{ "memory": { "backend": "qmd", "qmd": { "searchMode": "search" } } }
+#+end_src
+
+** Aktuální stav
+- 34 souborů indexováno, 92 vektorů
+- Embedding model: embeddinggemma-300M (314 MB, lokální, CPU)
+- =memory_search= funguje, score 0.8–0.9
+- Pravidlo: dotazy vždy anglicky (lepší recall)
+- Bug nenahlášen upstream
+
+** RAG analýza
+Workspace soubory celkem: ~5 200 tokenů = *2,6 % context okna* (200K).
+RAG teď nedává smysl — úspora příliš malá, riziko vynechání pravidel.
+=memory_search= (QMD) = fakticky RAG pro cold storage (30+ daily logů).
+
+Přehodnotit až overhead > 15 % (~30K tokenů).
+Při aktivním pruning to v dohledné době nenastane.