丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給Nemo
發(fā)送

0

超越GPT-4o及Qwen2.5-VL,百度超輕量模型PP-OCRv5 Blog持續(xù)登頂Hugging Face熱度第一

本文作者: Nemo   2025-09-19 17:55
導語:最新信息顯示,飛槳團隊發(fā)布的技術Blog已連續(xù)一周登頂Hugging Face博客熱度榜首,受到開發(fā)者社區(qū)的廣泛關注。

近日,百度在海外官方賬號介紹了最新輕量級文字識別模型 PP-OCRv5。該模型僅0.07B參數(shù),以千分之一參數(shù)量實現(xiàn)與700億參數(shù)大模型相媲美的OCR精度。在多項 OCR 場景測試中,PP-OCRv5 的表現(xiàn)超越GPT-4o、Qwen2.5-VL-72B等通用視覺大模型。最新信息顯示,飛槳團隊發(fā)布的技術Blog已連續(xù)一周登頂Hugging Face博客熱度榜首,受到開發(fā)者社區(qū)的廣泛關注。

超越GPT-4o及Qwen2.5-VL,百度超輕量模型PP-OCRv5 Blog持續(xù)登頂Hugging Face熱度第一

?

據(jù)了解,2025年5月,飛槳團隊推出PaddleOCR 3.0版本,文字識別方案PP-OCRv5與通用文檔解析方案PP-StructureV3,以及原生支持文心大模型4.5的智能文檔理解方案PP-ChatOCRv4共同構成其三大特色能力。自2020年開源以來,PaddleOCR累計下載量突破900萬,被超過5.9k開源項目直接或間接使用,是GitHub 社區(qū)中唯一一個 Star數(shù)超過50k的中國OCR項目。

超越GPT-4o及Qwen2.5-VL,百度超輕量模型PP-OCRv5 Blog持續(xù)登頂Hugging Face熱度第一

9月18日晚,Paddle OCR項目登上了GitHub全球總榜 trending榜, 位于python榜第5,總榜第13。

超越GPT-4o及Qwen2.5-VL,百度超輕量模型PP-OCRv5 Blog持續(xù)登頂Hugging Face熱度第一

Blog指出,在OCR場景中,通用視覺大模型(VLM)在精確文本定位和邊框精度上仍面臨挑戰(zhàn),同時容易帶來高計算開銷和“幻覺”輸出。相較于VLM,PP-OCRv5采用了模塊化雙階段檢測與識別方案,能夠實現(xiàn)輕量高效推理與更精準的文本邊界框輸出。

Benchmark數(shù)據(jù)顯示,PP-OCRv5在 Printed Chinese、Printed English、Handwritten English 等核心任務上與百億級大模型 Qwen2.5-VL-72B 精度持平甚至更優(yōu);在Handwritten Chinese、Chinese Pinyin等復雜場景中,仍穩(wěn)居前列,表現(xiàn)出強泛化能力。

?

超越GPT-4o及Qwen2.5-VL,百度超輕量模型PP-OCRv5 Blog持續(xù)登頂Hugging Face熱度第一

?作為百度飛槳團隊推出的全場景文字識別模型,PP-OCRv5是業(yè)界首個單模型支持5 種文字類型的超輕量級(<100M)開源模型,且支持復雜手寫體識別,可廣泛應用于教育行業(yè)的試卷作業(yè)批改、醫(yī)療行業(yè)的病歷數(shù)字化、法律行業(yè)的合同筆錄數(shù)字化等多場景業(yè)務需求。

?


雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說