⚙️ PDF Craft - 一个用于将 PDF 转换为 Markdown 或 EPUB 的工具
它基于 DeepSeek OCR 进行文档识别,支持复杂内容识别,能自动识别文档结构,过滤干扰信息,妥善处理脚注、公式、表格等元素
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
📖 BabelDOC - 一款开源的 PDF 翻译工具
🌐 在线使用 (每月1000 页免费)
BabelDOC 专注翻译科学论文,对数学公式、数据表格等复杂排版可以做到精确处理
☀️ 该项目由 funstory.ai 开发,该公司主要提供网文出海服务,所以在翻译长篇文档方面有一定的优势
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
⭐ OlmOCR - 从 PDF 中提取文字的开源 AI 工具
🐙 开源页面
OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。
完全开源,可以在本地 Nvidia GPU(4090以上) 上运行
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN