MinerU:PDF 转结构化 AI 可用数据(OCR + 版式解析)
Summary
开源 PDF 解析工具(⭐5.8万),将 PDF 转换为结构化 AI 可用数据。结合 OCR 和版式解析(Layout Parsing),输出保留原始文档结构的 Markdown/JSON。适合 KB 知识摄入管道。
Key Concepts
- PDF Parsing — PDF 内容提取与结构化
- Document Intelligence — 文档智能处理,理解页面版式
- OCR — 光学字符识别,图片/扫描 PDF 文字提取
- Layout Analysis — 版式解析,识别标题/段落/图表/表格
Use Cases
- 知识库文档摄入(RAG pipeline)
- 学术论文批量处理
- 企业文档数字化
Related Topics
- dots.ocr (dots.mocr) - 多语言文档版式解析 VLM
- CommonForms - PDF 自动转可填写表单(ML表单字段检测)
- RAG 检索质量评估:Precision@K、Recall@K 与 F1@K