丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給鄭佳美
發(fā)送

0

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

本文作者: 鄭佳美   2025-03-14 16:25
導語:繼開源首個 MoE 模型后,他們又發(fā)布了千頁只需 7 塊錢的文件掃描 API。

就在剛剛,那個曾經(jīng)開源了首個 MoE 模型的歐洲初創(chuàng)公司 Mistral AI 在沉寂一段時間之后又出新活。

Mistral 團隊發(fā)布了一個號稱“全世界最好的 OCR”的產(chǎn)品 —— Mistral OCR,旨在將一些 AI 難以直接識別的粗糙且復雜的文件進行整理,便于 AI 操作識別。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

帖子一經(jīng)發(fā)出,評論區(qū)瞬間充滿了各種夸夸言論,但在一眾贊美聲中,也不乏一些真正用過產(chǎn)品的網(wǎng)友的理智發(fā)言。

就比如有網(wǎng)友對 Mistral OCR 的產(chǎn)品能力表示認同,但卻有點接受不了它的產(chǎn)品定價,覺得有點太貴,并且期待中國 AI 公司早點發(fā)布一個類似的開源版本,把價格打下來。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

同時也有網(wǎng)友親自上手,上傳掃描了手寫板的內(nèi)容,但最后識別出的文字結果正確率并不是很高。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

除此之外,還有被 Mistral 所宣傳的“可以識別超多種語言”噱頭吸引過來的網(wǎng)友,但使用后卻失望的發(fā)現(xiàn)它無法識別自己所用語言。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

盡管 Mistral OCR 目前還存在著一定的局限性,但它的出現(xiàn)確實是一次從字符識別到場景智能的跨越。

從圖文到結構化數(shù)據(jù)的一大步

與傳統(tǒng)的 OCR API 不同,Mistral OCR 是一款多模態(tài) API,它不僅可以識別文本中是否嵌入了插圖或照片,還會為這些圖形元素創(chuàng)建邊界框,并將它們包含在輸出中。

從 Mistral AI 團隊放出的 Demo 視頻可以看出,Mistral OCR 能夠將圖文混排的 PDF 文件轉換成結構清晰的 Markdown 格式文件。

例如表格+數(shù)字的 PDF 組合。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

PDF 圖片中數(shù)學公式的轉換。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

PDF 宣傳圖片中的印地語。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

拍得并不方正的論文照片。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

甚至帶有水印的文字也可以輕松識別。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

從字符識別到場景智能的一大步

除了直觀的 Demo 外,Mistral AI 團隊還列舉了 6 點 Mistral OCR 的絕對優(yōu)勢:

卓越的復雜文檔解析能力:Mistral OCR 在理解復雜文檔結構方面表現(xiàn)出色,能夠精準解析交錯的圖像、數(shù)學公式、表格以及 LaTeX 等高級排版格式。這使其在處理包含圖表、圖形、公式和插圖的科學論文等富文本文檔時更具優(yōu)勢。

原生支持多語言與多模態(tài):Mistral OCR 自帶多語言和多模態(tài)處理能力,能夠靈活應對不同語言以及多種類型的內(nèi)容,無需額外適配。

行業(yè)領先的基準測試表現(xiàn):在多項行業(yè)基準測試中,Mistral OCR 均取得優(yōu)異成績,充分展示了其強勁的性能和高準確度。

同類產(chǎn)品中處理速度最快:Mistral OCR 采用輕量化架構,處理速度遠超同類產(chǎn)品,單節(jié)點每分鐘可解析高達 2000 頁文檔。無論在高負載環(huán)境還是大規(guī)模數(shù)據(jù)處理中,它都能保持高效運行,確保穩(wěn)定性能。

創(chuàng)新性的“文檔即提示”結構化輸出:Mistral OCR 率先引入“文檔即提示”概念,使用戶能夠直接使用文檔作為指令,以獲取更加精準和定制化的結果。它還能輸出 JSON 等結構化格式,便于與后續(xù)任務或自動化流程銜接,實現(xiàn)更智能的內(nèi)容提取。

可選的自托管部署方案:針對數(shù)據(jù)隱私要求嚴格的企業(yè)或機構,Mistral OCR 提供自托管部署選項,確保敏感信息始終存儲在本地基礎設施內(nèi),滿足合規(guī)性與安全性需求。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

團隊還將 Mistral OCR 將 Google Document AI、Azure OCR、Gemini 系列模型以及 GPT-4o 的產(chǎn)品性能進行對比。

最終的結果表明,Mistral OCR 在總體準確率、數(shù)學公式識別等方面表現(xiàn)優(yōu)異,特別是在 2503 版本中,各項指標均大幅提升,達到了新的高度。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

在多語言處理方面,得出的數(shù)據(jù)更是遠遠優(yōu)于 Google Document AI 和 Azure OCR。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

歐洲也有自己的“DeepSeek”

Mistral AI 是一家位于法國的初創(chuàng)公司,憑借其 AI 助手 Le Chat 和多個基礎模型,已被官方視為法國最具前途的科技公司之一,并被認為是唯一有潛力與 OpenAI 競爭的歐洲企業(yè)。

Mistral AI 的三位創(chuàng)始人都擁有在全球頂級科技公司中積累的豐富 AI 研究經(jīng)驗。首席執(zhí)行官 Arthur Mensch 曾在谷歌 DeepMind 部門工作,首席技術官 Timothée Lacroix 和首席科學家 Guillaume Lample 則曾是 Meta 的核心成員。憑借著強大的技術背景,Mistral AI 的創(chuàng)始團隊帶領公司迅速發(fā)展。

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

值得一提的是,雷峰網(wǎng)(公眾號:雷峰網(wǎng))得知自 2023 年成立以來,Mistral AI 在籌集資金方面取得了顯著成績,目標是將前沿 AI 技術普及給每個人,雖然這一目標并未直接挑戰(zhàn) OpenAI,但它強調了公司對于 AI 開放性的堅定支持。

作為 ChatGPT 的替代品,Mistral AI 推出了聊天助手 Le Chat,并在 iOS 和 Android 上成功上線。在發(fā)布后僅兩周,Le Chat 的下載量便突破了 100 萬次,并一度在 iOS App Store 中登頂法國免費下載榜單。

除此之外,截至 2025 年 2 月,Mistral AI 已籌集了約 10 億歐元(約 10.4 億美元)的資金,其中包括幾輪股權融資和部分債務融資。尤其值得注意的是,在 2023 年 6 月公司發(fā)布首批模型之前,Mistral AI 就成功完成了創(chuàng)紀錄的 1.12 億美元種子輪融資,成為歐洲歷史上最大的一輪種子融資,當時公司估值達 2.6 億美元。

參考鏈接:

https://mistral.ai/fr/news/mistral-ocr

https://x.com/MistralAI/status/1897694143180112096

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

歐洲“DeepSeek”發(fā)布了全世界最好的 OCR,網(wǎng)友:蹲蹲中國的免費開源版

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說