使用下面的搜索规则,更精确:
例如: site:news.163.com author:老司机 saved:搜索自己收藏的内容
site:news.163.com author:老司机 saved:搜索自己收藏的内容
默认搜索标题...
除了微软开源的markitdown,下面是我之前收藏各种PDF提取文字工具 tika Apache Tika 工具包可从一千多种不同文件类型(例如 PPT、XLS 和 PDF)中检测并提取元数据和文本 https://t.co/426x7gPiaE pdf2htmlEX 将 PDF 转换为 HTML 而不会丢失文本或格式。 https://t.co/azzxBuuAgg MinerU 一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。 https://t.co/v2XHHyb26i OCRmyPDF 为扫描的 PDF 文件添加 OCR 文本层,以便搜索 https://t.co/QYHBoy2r30 marker 快速高精度地将 PDF 转换为 Markdown + JSON https://t.co/4J8s514ahf zerox 使用视觉模型将 PDF 转换为 Markdown https://t.co/LSu7PVv5RG
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?