MinerU–开源的最佳 PDF Text、Image、Table、LaTex 公式的提取工具。来自上海人工智能实验室。近期star 数爆涨。 今天仔细研究了一番,项目用到了 OCR、layout、Table 提取、LaTex 提取这些模型。AGPL-3.0 协议 https://ihey.cc/hacker/opendatalab-mineru-product-study/