Queen

MinerU — точный парсинг документов для LLM и RAG

MinerU — это высокоточный движок для парсинга документов, предназначенный для рабочих процессов LLM, RAG и Agent. Он конвертирует PDF, DOCX, PPTX, XLSX, изображения и веб-страницы в структурированный Markdown или JSON.

Движок использует гибрид VLM и OCR, поддерживает 109 языков, включая сканированные документы и рукописный текст. Встроенный MCP Server и интеграция с LangChain, Dify, FastGPT упрощают разработку. Доступны бэкенды: pipeline (CPU/GPU), vlm-engine (высокая точность) и hybrid-engine (баланс).

Последние релизы (3.4 и 3.5) улучшили OCR‑модель и гибридный парсинг, добавили автоматический выбор источника моделей и поддержку отечественных AI‑чипов (Ascend, Cambricon и др.). Доступны без установки веб‑версия, десктопный клиент и API.

GitHub ★ 69,057

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик