#PDF #工具 #OCR #deepseek

⚙️ PDF Craft - 一个用于将 PDF 转换为 Markdown 或 EPUB 的工具

它基于 DeepSeek OCR 进行文档识别,支持复杂内容识别,能自动识别文档结构,过滤干扰信息,妥善处理脚注、公式、表格等元素

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
#OCR #开源 #AI

Zerox - 一款开源的 AI OCR 工具

Zerox可以将 PDF、DOCX、图片等格式的文档转换为 Markdown

它基于 AI 视觉模型(如 GPT-4o-mini 等)实现 OCR 并直接生成结构化内容

📑相关阅读

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

📮
投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
#AI #OCR

Mistral OCR PDF 处理工具

该项目基于 Mistral AI 的 OCR (光学字符识别) 功能实现从 PDF 文档中提取文本内容和图像,并将结果保存为 Markdown 格式

📑相关阅读

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

📮投稿 📢频道 💬群聊 🔎索引
GitHub
GitHub - nicekate/mistral-ocr

Contribute to nicekate/mistral-ocr development by creating an account on GitHub.


via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
#AI #OCR

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

免费试用: chat.mistral.ai/chat
API: console.mistral.ai/home

与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。

表格+数字、数学公式、不规则PDF、带水印文本通通不在话下!

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel
来自频道: @AI_News_CN
#开源 #OCR #PDF #AI #PDF

OlmOCR - 从 PDF 中提取文字的开源 AI 工具

🐙 开源页面

OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。

完全开源,可以在本地 Nvidia GPU(4090以上) 上运行

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel
来自频道: @AI_News_CN