核心理念是「知识编译」:不是每次提问都从原始文档重新检索,而是让 LLM 把零散资料沉淀为持续增值的结构化知识库。
Stop re-deriving, start compiling.
核心理念
传统 RAG 每次提问都从原始文档临时翻找、拼凑答案,没有积累。NoteAI 在原始资料和最终答案之间插入一个「编译层」——由 AI 主动维护的结构化 Markdown 知识库。知识编译一次,持续增值。
功能全景
- 采集 — 网页文章下载(微信公众号/知乎优化)、PDF/DOCX/PPTX 多格式转换、AI 辅助排版
- 整理 — 多级主题树、jieba 自动标签、笔记整合、AI 主题分析
- 链接 — 双向链接发现(本地粗筛 + AI 精判)、关系图可视化、WIKI.md 自动索引
- 编辑 — Tiptap + CodeMirror 6 双引擎、实时预览、AI 改写、主题综述
- AI 助手 — RAG 问答、HyDE 查询优化、Flashrank 重排序、父子文档检索、长短记忆
RAG 检索流水线
用户提问 → HyDE 假设性答案生成
→ Milvus Lite 混合检索 (dense + sparse, bge-small-zh-v1.5)
→ 主题/标签过滤
→ FlagReranker 重排序 (bge-reranker-v2-m3)
→ MMR 去重
→ LLM 生成回答(流式输出)
三层知识架构
| 层 | 目录 | 说明 |
|---|---|---|
| Raw | Notes/ | 原始 Markdown(不可变,来源真相) |
| Wiki | Organized/ | AI 编译的结构化知识(LLM 拥有,持续更新) |
| Archive | Raw/ | 原始文件归档(PDF/DOCX/PPTX) |
