为什么选择 Memorix
相比自建向量库 + 自写 Parser,或只用「文本切片 + 单向量」的轻量方案,Memorix 把复杂文档与生产检索一次做到位。
吸收 RAG-Anything 管线思路:版面级 Content List、图/表/公式分通道、上下文感知增强,论文财报也能检索
生产级混合检索:向量 + 全文 + RRF 融合,Query 扩写 + 相似度过滤 + 可选交叉编码器 Rerank
全链路可观测:Playground 展示改写变体、图谱命中、RAG Triad 评分,便于调优与对外承诺质量
三步接入:配置模型 → 上传文档 → 调 /v1/retrieve 或 /v1/chat,无代码扩展 Parser 也能跑通 MVP
核心能力一览
从文档摄入到带引用问答,覆盖托管 RAG 的完整能力栈。
技术要点
索引与在线检索分离:重计算在 Worker,API 无状态;租户数据与模型配置隔离,适合 SaaS 嵌入。
索引与检索管线
- 解析:默认 PDF/MD/DOCX + 可选 MinerU Content List;扫描页 OCR;图/表/公式多模态增强
- 切分:语义断点 + 规则兜底;表/公式块尽量整段保留,避免打碎表格
- 索引:租户自选 Embedding 模型写入 pgvector;可选 LLM 抽取知识图谱实体关系
- 在线:Query 扩写(独立对话模型)→ 多路召回 → 图谱加分 → 复杂问句 Rerank → 上下文打包与引用
- 对话:检索结果 + 租户 Chat 模型生成;启发式 + LLM 保守评分(Context Recall / Faithfulness)
可观测与诊断
每次检索与对话返回 meta:策略路由、扩写变体、向量/关键词命中数、Rerank 来源、多模态与图谱字段。检索日志与 API 日志可在控制台审计,方便排查「召回不准」类问题。
Query 扩写 + 相似度门槛
混合 RRF 召回
租户 Rerank 配置
严格 RAG 评测
检索/API 日志
BYOK:模型完全由你掌控
Bring Your Own Key 不是「只能填一个 OpenAI Key」。Memorix 把 Embedding、对话、OCR、Rerank、VLM 多模态、图谱抽取拆成独立配置轨,各自对接你信任的厂商与区域节点。
平台按存储、索引与检索计费;模型 Token 始终向你选的供应商付费,无隐藏加价、无强制捆绑。
Embedding:自选模型与 API(OpenAI、通义、SiliconFlow 等 OpenAI 兼容端点),决定向量空间与索引质量
对话 Chat:可配置多个 LLM Provider(OpenAI / Anthropic / 兼容 API),Playground 与 /v1/chat 使用你的 Key
OCR / VLM:扫描页与图片块可用 Qwen-VL-OCR 或视觉对话模型;多模态查询附图也走你的 VLM
Rerank:租户级交叉编码器(如 bge-reranker),复杂问句才触发,失败自动回退启发式
Query 扩写:使用 Embedding 配置中的「扩写模型」或回退到 Chat 模型,与 Embedding 模型可分离
随时切换:更换 Key 或模型名后重新索引即可迁移,不被单一云厂商锁死
工作原理
四步完成从文档到可引用问答,全程可在控制台验证。
上传
通过控制台或 API 上传 PDF、Markdown、DOCX 等;支持直传 Storage,单文档版本管理与重新索引。
索引
异步任务:解析 → 多模态增强 → 智能切分 → 向量化 → 可选图谱抽取;进度与失败原因可追踪。
检索
POST /v1/retrieve:扩写、混合召回、Rerank、引用定位;支持按知识库、文档过滤与附图多模态查询。
对话
POST /v1/chat:先检索再生成,返回答案、引用切片、评测分与完整诊断 meta。
为产品与应用而设计
白板、知识库 SaaS、企业内训、客服助手——只需前端 + Memorix API 即可具备工业级 RAG。批量文档、多租户、带页码引用,无需自建 Python 切片与向量运维。