跳到主要内容

MinerU:PDF 转结构化 AI 可用数据(OCR + 版式解析)

Summary

开源 PDF 解析工具(⭐5.8万),将 PDF 转换为结构化 AI 可用数据。结合 OCR 和版式解析(Layout Parsing),输出保留原始文档结构的 Markdown/JSON。适合 KB 知识摄入管道。

Key Concepts

  • PDF Parsing — PDF 内容提取与结构化
  • Document Intelligence — 文档智能处理,理解页面版式
  • OCR — 光学字符识别,图片/扫描 PDF 文字提取
  • Layout Analysis — 版式解析,识别标题/段落/图表/表格

Use Cases

  • 知识库文档摄入(RAG pipeline)
  • 学术论文批量处理
  • 企业文档数字化
  • dots.ocr (dots.mocr) - 多语言文档版式解析 VLM
  • CommonForms - PDF 自动转可填写表单(ML表单字段检测)
  • RAG 检索质量评估:Precision@K、Recall@K 与 F1@K