⚙️ PDF Craft - 一个用于将 PDF 转换为 Markdown 或 EPUB 的工具
它基于 DeepSeek OCR 进行文档识别,支持复杂内容识别,能自动识别文档结构,过滤干扰信息,妥善处理脚注、公式、表格等元素
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
⭐ Zerox - 一款开源的 AI OCR 工具
Zerox可以将 PDF、DOCX、图片等格式的文档转换为 Markdown
它基于 AI 视觉模型(如 GPT-4o-mini 等)实现 OCR 并直接生成结构化内容
📑相关阅读
Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
⭐ Mistral OCR PDF 处理工具
该项目基于 Mistral AI 的 OCR (光学字符识别) 功能实现从 PDF 文档中提取文本内容和图像,并将结果保存为 Markdown 格式
📑相关阅读
Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元
📮投稿 📢频道 💬群聊 🔎索引
GitHub
GitHub - nicekate/mistral-ocr
Contribute to nicekate/mistral-ocr development by creating an account on GitHub.
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
⭐ Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元
免费试用: chat.mistral.ai/chat
API: console.mistral.ai/home
与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。
表格+数字、数学公式、不规则PDF、带水印文本通通不在话下!
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
⭐ OlmOCR - 从 PDF 中提取文字的开源 AI 工具
🐙 开源页面
OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。
完全开源,可以在本地 Nvidia GPU(4090以上) 上运行
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
来自频道: @AI_News_CN