当前位置:

MinerU v2.6.8

收藏
举报
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
  • 作者:
    暂无
  • 演示网站:
    暂无
  • 当前版本:
    v2.6.8
  • 日期:
    2025-12-25
  • 相关链接:
    暂无
  • 所属分类:
    开发工具 Python
  • 软件评级:
  • 下载人气:
    147
免费下载
求购此源码
源码详情
免费下载
联系客服/入群
源码属性
授权 开源
大小 15.25MB
语言 Python
功能介绍
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。

主要功能:
1、删除页眉、页脚、脚注、页码等元素,确保语义连贯
2、输出符合人类阅读顺序的文本,适用于单栏、多栏及复杂排版
3、保留原文档的结构,包括标题、段落、列表等
4、提取图像、图片描述、表格、表格标题及脚注
5、自动识别并转换文档中的公式为LaTeX格式
6、自动识别并转换文档中的表格为HTML格式
7、自动检测扫描版PDF和乱码PDF,并启用OCR功能
8、OCR支持84种语言的检测与识别
9、支持多种输出格式,如多模态与NLP的Markdown、按阅读顺序排序的10、JSON、含有丰富信息的中间格式等
11、支持多种可视化结果,包括layout可视化、span可视化等,便于高效确认输出效果与质检
12、支持纯CPU环境运行,并支持 GPU(CUDA)/NPU(CANN)/MPS 加速
13、兼容Windows、Linux和Mac平台
付费服务
模板/插件

联系客服

手机版

扫一扫进入手机版

返回顶部