M
Memorix
登录开始项目

产品 · 多模态托管 RAG

云端 RAG 基础设施为开发者而生

Memorix 是面向第三方应用与企业平台的工业级托管 RAG 服务:上传即索引、API 即召回。我们已融合 RAG-Anything 在多模态文档理解上的核心能力,并叠加混合检索、Query 扩写、租户级 Rerank、知识图谱与严格 RAG 评测——你专注业务,我们负责检索层。

不绑定单一模型厂商 · 不强制使用我们的 LLM · 检索与生成费用边界清晰

为什么选择 Memorix

相比自建向量库 + 自写 Parser,或只用「文本切片 + 单向量」的轻量方案,Memorix 把复杂文档与生产检索一次做到位。

吸收 RAG-Anything 管线思路:版面级 Content List、图/表/公式分通道、上下文感知增强,论文财报也能检索

生产级混合检索:向量 + 全文 + RRF 融合,Query 扩写 + 相似度过滤 + 可选交叉编码器 Rerank

全链路可观测:Playground 展示改写变体、图谱命中、RAG Triad 评分,便于调优与对外承诺质量

三步接入:配置模型 → 上传文档 → 调 /v1/retrieve 或 /v1/chat,无代码扩展 Parser 也能跑通 MVP

核心能力一览

从文档摄入到带引用问答,覆盖托管 RAG 的完整能力栈。

多格式摄入
PDF、Markdown、TXT、DOCX;可选 MinerU 风格 JSON 保留版面;页级去噪与跨页拼接适配中文 PDF。
多模态文档理解
图片/表格/公式独立通道;上下文感知 VLM 增强;附图提问;融合 RAG-Anything 管线设计。
多语言 RAG
中英混排与 jieba 分词 overlap;语义切分可关;向量 + 全文双路召回。
混合检索
pgvector 相似度 + Postgres FTS + RRF 融合;多 query 变体并行召回后合并。
智能重排
复杂问句触发租户配置的 Rerank API;启发式特征兜底;SiliconFlow / Jina / Cohere 等兼容。
知识图谱增强
索引时 LLM 抽取实体与关系;检索时实体命中为相关 chunk 加分,meta 可诊断。
可溯源引用
命中返回文档名、版本、页码、标题路径、chunk 序号;便于 UI 跳转与高亮。
知识库与多租户
项目 → 知识库 → 文档;API Key 与 JWT 租户隔离;评测集与检索日志按库审计。
企业级安全
私有 Storage、签名 URL、API Key 权限、检索/API 日志;支持私有化演进路线。

技术要点

索引与在线检索分离:重计算在 Worker,API 无状态;租户数据与模型配置隔离,适合 SaaS 嵌入。

索引与检索管线

  • 解析:默认 PDF/MD/DOCX + 可选 MinerU Content List;扫描页 OCR;图/表/公式多模态增强
  • 切分:语义断点 + 规则兜底;表/公式块尽量整段保留,避免打碎表格
  • 索引:租户自选 Embedding 模型写入 pgvector;可选 LLM 抽取知识图谱实体关系
  • 在线:Query 扩写(独立对话模型)→ 多路召回 → 图谱加分 → 复杂问句 Rerank → 上下文打包与引用
  • 对话:检索结果 + 租户 Chat 模型生成;启发式 + LLM 保守评分(Context Recall / Faithfulness)

可观测与诊断

每次检索与对话返回 meta:策略路由、扩写变体、向量/关键词命中数、Rerank 来源、多模态与图谱字段。检索日志与 API 日志可在控制台审计,方便排查「召回不准」类问题。

Query 扩写 + 相似度门槛

混合 RRF 召回

租户 Rerank 配置

严格 RAG 评测

检索/API 日志

BYOK:模型完全由你掌控

Bring Your Own Key 不是「只能填一个 OpenAI Key」。Memorix 把 Embedding、对话、OCR、Rerank、VLM 多模态、图谱抽取拆成独立配置轨,各自对接你信任的厂商与区域节点。

平台按存储、索引与检索计费;模型 Token 始终向你选的供应商付费,无隐藏加价、无强制捆绑。

Embedding:自选模型与 API(OpenAI、通义、SiliconFlow 等 OpenAI 兼容端点),决定向量空间与索引质量

对话 Chat:可配置多个 LLM Provider(OpenAI / Anthropic / 兼容 API),Playground 与 /v1/chat 使用你的 Key

OCR / VLM:扫描页与图片块可用 Qwen-VL-OCR 或视觉对话模型;多模态查询附图也走你的 VLM

Rerank:租户级交叉编码器(如 bge-reranker),复杂问句才触发,失败自动回退启发式

Query 扩写:使用 Embedding 配置中的「扩写模型」或回退到 Chat 模型,与 Embedding 模型可分离

随时切换:更换 Key 或模型名后重新索引即可迁移,不被单一云厂商锁死

工作原理

四步完成从文档到可引用问答,全程可在控制台验证。

01

上传

通过控制台或 API 上传 PDF、Markdown、DOCX 等;支持直传 Storage,单文档版本管理与重新索引。

02

索引

异步任务:解析 → 多模态增强 → 智能切分 → 向量化 → 可选图谱抽取;进度与失败原因可追踪。

03

检索

POST /v1/retrieve:扩写、混合召回、Rerank、引用定位;支持按知识库、文档过滤与附图多模态查询。

04

对话

POST /v1/chat:先检索再生成,返回答案、引用切片、评测分与完整诊断 meta。

为产品与应用而设计

白板、知识库 SaaS、企业内训、客服助手——只需前端 + Memorix API 即可具备工业级 RAG。批量文档、多租户、带页码引用,无需自建 Python 切片与向量运维。