%23OCR | Multi-Channel Broadcast

#PDF #工具 #OCR #deepseek

⚙️ PDF Craft - 一个用于将 PDF 转换为 Markdown 或 EPUB 的工具

它基于 DeepSeek OCR 进行文档识别，支持复杂内容识别，能自动识别文档结构，过滤干扰信息，妥善处理脚注、公式、表格等元素

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

来自频道: @AI_News_CN

#OCR #开源 #AI

⭐ Zerox - 一款开源的 AI OCR 工具

Zerox可以将 PDF、DOCX、图片等格式的文档转换为 Markdown

它基于 AI 视觉模型（如 GPT-4o-mini 等）实现 OCR 并直接生成结构化内容

📑相关阅读

Mistral AI 发布全球最强 OCR：每解析1000 页费用为1 美元

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

来自频道: @AI_News_CN

#AI #OCR

⭐ Mistral OCR PDF 处理工具

该项目基于 Mistral AI 的 OCR (光学字符识别) 功能实现从 PDF 文档中提取文本内容和图像，并将结果保存为 Markdown 格式

📑相关阅读

Mistral AI 发布全球最强 OCR：每解析1000 页费用为1 美元

📮投稿 📢频道 💬群聊 🔎索引

GitHub
GitHub - nicekate/mistral-ocr

Contribute to nicekate/mistral-ocr development by creating an account on GitHub.

via 极客分享 - Telegram Channel

来自频道: @AI_News_CN

#AI #OCR

⭐ Mistral AI 发布全球最强 OCR：每解析1000 页费用为1 美元

免费试用： chat.mistral.ai/chat
API： console.mistral.ai/home

与传统的 OCR API 不同，Mistral OCR 是一款多模态 API，它不仅可以识别文本中是否嵌入了插图或照片，还会为这些图形元素创建边界框，并将它们包含在输出中。

表格+数字、数学公式、不规则PDF、带水印文本通通不在话下！

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

来自频道: @AI_News_CN

#开源 #OCR #PDF #AI #PDF

⭐ OlmOCR - 从 PDF 中提取文字的开源 AI 工具

🐙 开源页面

OlmOCR 基于 Qwen2-VL-7B-Instruct 模型，用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。

完全开源，可以在本地 Nvidia GPU（4090以上）上运行

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

来自频道: @AI_News_CN