Config is the same across clients — only the file and path differ.
{
"mcpServers": {
"mineru": {
"env": {
"PYTHONPATH": "/path/to/mineru-mcp-server/src"
},
"args": [
"/path/to/mineru-mcp-server/src/mineru_mcp_server.py"
],
"command": "/path/to/mineru-mcp-server/.venv/bin/python3"
}
}
}Are you the author?
Add this badge to your README to show your security score and help users find safe servers.
精准 API + Agent 轻量 API · 全参数透传 · 智能错误重试 · 自动拆分合并 · Token 自动续期
Run this in your terminal to verify the server starts. Then let us know if it worked — your result helps other developers.
uvx 'niquests' 2>&1 | head -1 && echo "✓ Server started successfully"
After testing, let us know if it worked:
Five weighted categories — click any category to see the underlying evidence.
No known CVEs.
Checked niquests against OSV.dev.
Click any tool to inspect its schema.
Be the first to review
Have you used this server?
Share your experience — it helps other developers decide.
Sign in to write a review.
Others in productivity
Persistent memory using a knowledge graph
Dynamic problem-solving through sequential thought chains
mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches while being all local
Official Miro MCP server - Supports context to code and creating diagrams, docs, and data tables.
MCP Security Weekly
Get CVE alerts and security updates for Mineru Mcp Server and similar servers.
Start a conversation
Ask a question, share a tip, or report an issue.
Sign in to join the discussion.
完整的 MinerU 文档处理解决方案 — v4.0.0 全面升级版
精准 API + Agent 轻量 API · 全参数透传 · 智能错误重试 · 自动拆分合并 · Token 自动续期
/api/v4/)+ Agent 轻量 API(/api/v1/agent/)双线process_document / process_directory / process_document_lite /
query_task_status / renew_tokens / get_token_status详见 docs/CHANGELOG.md 和 docs/API_V4_REFERENCE.md。
5 层 / 10 模块 / 6 个 MCP 工具 / 双 API 客户端 — 一图看懂:
| 层 | 模块 | 职责 |
|---|---|---|
| ① MCP 接入层 | mineru_mcp_server.py | 6 个 MCP 工具的 schema + 调度 |
| ② 协调编排层 | auto_split.py / mineru_batch_async.py / mineru_async.py / progress.py | 拆分→处理→合并的本地协调(无网) |
| ③ API 客户端层 | MinerUAsyncClient / AgentAPIClient | 调 MinerU 服务端的两套 API |
| ④ 基础设施 | api_errors.py / token_manager.py / path_fixer.py / split_large_file.py | 错误处理、Token 管理、路径修复、PDF 物理拆分 |
| ⑤ 外部依赖 | MinerU 服务端 / batch_login.py / all_tokens.json | 6 个账号配额 6000 页/天 |
输入 → 验证 → 拆分判断 → 提交 → 错误处理 → 轮询 → 下载 → 合并 → Markdown 输出:
关键能力:
MinerU-HTML 模型,Office 自动切 pipelineimages/x.jpg → {stem}_images/x.jpg,593 张图片缺失 0服务端硬限制 200 页 / 200 MB。超规格文件全自动拆分→并发处理→智能合并,对调用方完全透明:
真实案例:某 496 页 PDF → 自动拆 3 片(166+166+164)→ 3 片同时处理 → 合并为单 .md ~210 K 字符。总耗时 ~3 分钟(vs 串行单线程预估 ~9 分钟)。
6 个 MCP 工具 · 决策树:
| # | 工具 | 用途 | 关键参数 |
|---|---|---|---|
| 1 | process_document | 精准 API 单文件处理 | 11 参数(含 language / is_ocr / page_ranges / extra_formats / data_id 等) |
| 2 | process_directory | 精准 API 批量并行 | 10 参数 + max_workers |
| 3 | process_document_lite | Agent 轻量 API(≤10MB / 20 页 / 免 Token) | 6 参数 |
| 4 | query_task_status | 异步查询任务进度 | task_id, lite |
| 5 | get_token_status | Token 状态报告 | — |
| 6 | renew_tokens | 触发 Token 自动续期 | force, headless |
完整参数参考:docs/API_V4_REFERENCE.md
| 文件 | 页数 | 处理方式 | MD 字符 | 图片 | 缺失 |
|---|---|---|---|---|---|
| PDF-A | 91 | 直接处理 | 48,117 | 23 | 0 |
| PDF-B | 143 | 直接处理 | 82,443 | 1 | 0 |
| PDF-C | 190 | 直接处理 | 243,271 | 519 | 0 |
| PDF-D | 309 | 自动拆 2 片 | 247,435 | 30 | 0 |
| PDF-E | 496 | 自动拆 3 片 | 209,471 | 0 | 0 |
| 合计 | 1,229 | — | 830,737 | 573 | 0 |
总耗时(含 OCR 全部 5 个文件):约 10 分钟。
| 场景 | 串行处理 | v4 并发处理 | 提升 |
|---|---|---|---|
| 单文件 | 23 秒 | 23 秒 | — |
| 3 文件 | 149 秒 | 88 秒 | 1.7× |
| 10 文件 | 300 秒 | 30 秒 | 10× |
| 异体字(无 OCR) | 异体字(有 OCR) | OCR 收益 | |
|---|---|---|---|