MinerU — это высокоточный движок для парсинга документов, предназначенный для рабочих процессов LLM, RAG и Agent. Он конвертирует PDF, DOCX, PPTX, XLSX, изображения и веб-страницы в структурированный Markdown или JSON.
Движок использует гибрид VLM и OCR, поддерживает 109 языков, включая сканированные документы и рукописный текст. Встроенный MCP Server и интеграция с LangChain, Dify, FastGPT упрощают разработку. Доступны бэкенды: pipeline (CPU/GPU), vlm-engine (высокая точность) и hybrid-engine (баланс).
