产品 · 多模态托管 RAG

云端 RAG 基础设施为开发者而生

Memorix 是面向第三方应用与企业平台的工业级托管 RAG 服务：上传即索引、API 即召回。我们已融合 RAG-Anything 在多模态文档理解上的核心能力，并叠加混合检索、Query 扩写、租户级 Rerank、知识图谱与严格 RAG 评测——你专注业务，我们负责检索层。

不绑定单一模型厂商 · 不强制使用我们的 LLM · 检索与生成费用边界清晰

免费开始阅读文档

为什么选择 Memorix

相比自建向量库 + 自写 Parser，或只用「文本切片 + 单向量」的轻量方案，Memorix 把复杂文档与生产检索一次做到位。

吸收 RAG-Anything 管线思路：版面级 Content List、图/表/公式分通道、上下文感知增强，论文财报也能检索

生产级混合检索：向量 + 全文 + RRF 融合，Query 扩写 + 相似度过滤 + 可选交叉编码器 Rerank

全链路可观测：Playground 展示改写变体、图谱命中、RAG Triad 评分，便于调优与对外承诺质量

三步接入：配置模型 → 上传文档 → 调 /v1/retrieve 或 /v1/chat，无代码扩展 Parser 也能跑通 MVP

核心能力一览

从文档摄入到带引用问答，覆盖托管 RAG 的完整能力栈。

多格式摄入

PDF、Markdown、TXT、DOCX；可选 MinerU 风格 JSON 保留版面；页级去噪与跨页拼接适配中文 PDF。

多模态文档理解

图片/表格/公式独立通道；上下文感知 VLM 增强；附图提问；融合 RAG-Anything 管线设计。

多语言 RAG

中英混排与 jieba 分词 overlap；语义切分可关；向量 + 全文双路召回。

混合检索

pgvector 相似度 + Postgres FTS + RRF 融合；多 query 变体并行召回后合并。

智能重排

复杂问句触发租户配置的 Rerank API；启发式特征兜底；SiliconFlow / Jina / Cohere 等兼容。

知识图谱增强

索引时 LLM 抽取实体与关系；检索时实体命中为相关 chunk 加分，meta 可诊断。

可溯源引用

命中返回文档名、版本、页码、标题路径、chunk 序号；便于 UI 跳转与高亮。

知识库与多租户

项目 → 知识库 → 文档；API Key 与 JWT 租户隔离；评测集与检索日志按库审计。

企业级安全

私有 Storage、签名 URL、API Key 权限、检索/API 日志；支持私有化演进路线。

技术要点

索引与在线检索分离：重计算在 Worker，API 无状态；租户数据与模型配置隔离，适合 SaaS 嵌入。

索引与检索管线

解析：默认 PDF/MD/DOCX + 可选 MinerU Content List；扫描页 OCR；图/表/公式多模态增强
切分：语义断点 + 规则兜底；表/公式块尽量整段保留，避免打碎表格
索引：租户自选 Embedding 模型写入 pgvector；可选 LLM 抽取知识图谱实体关系
在线：Query 扩写（独立对话模型）→ 多路召回 → 图谱加分 → 复杂问句 Rerank → 上下文打包与引用
对话：检索结果 + 租户 Chat 模型生成；启发式 + LLM 保守评分（Context Recall / Faithfulness）

可观测与诊断

每次检索与对话返回 meta：策略路由、扩写变体、向量/关键词命中数、Rerank 来源、多模态与图谱字段。检索日志与 API 日志可在控制台审计，方便排查「召回不准」类问题。

Query 扩写 + 相似度门槛

混合 RRF 召回

租户 Rerank 配置

严格 RAG 评测

检索/API 日志

BYOK：模型完全由你掌控

Bring Your Own Key 不是「只能填一个 OpenAI Key」。Memorix 把 Embedding、对话、OCR、Rerank、VLM 多模态、图谱抽取拆成独立配置轨，各自对接你信任的厂商与区域节点。

平台按存储、索引与检索计费；模型 Token 始终向你选的供应商付费，无隐藏加价、无强制捆绑。

Embedding：自选模型与 API（OpenAI、通义、SiliconFlow 等 OpenAI 兼容端点），决定向量空间与索引质量

对话 Chat：可配置多个 LLM Provider（OpenAI / Anthropic / 兼容 API），Playground 与 /v1/chat 使用你的 Key

OCR / VLM：扫描页与图片块可用 Qwen-VL-OCR 或视觉对话模型；多模态查询附图也走你的 VLM

Rerank：租户级交叉编码器（如 bge-reranker），复杂问句才触发，失败自动回退启发式

Query 扩写：使用 Embedding 配置中的「扩写模型」或回退到 Chat 模型，与 Embedding 模型可分离

随时切换：更换 Key 或模型名后重新索引即可迁移，不被单一云厂商锁死

工作原理

四步完成从文档到可引用问答，全程可在控制台验证。

上传

通过控制台或 API 上传 PDF、Markdown、DOCX 等；支持直传 Storage，单文档版本管理与重新索引。

索引

异步任务：解析 → 多模态增强 → 智能切分 → 向量化 → 可选图谱抽取；进度与失败原因可追踪。

检索

POST /v1/retrieve：扩写、混合召回、Rerank、引用定位；支持按知识库、文档过滤与附图多模态查询。

对话

POST /v1/chat：先检索再生成，返回答案、引用切片、评测分与完整诊断 meta。

为产品与应用而设计

白板、知识库 SaaS、企业内训、客服助手——只需前端 + Memorix API 即可具备工业级 RAG。批量文档、多租户、带页码引用，无需自建 Python 切片与向量运维。

免费开始查看开发者指南