百度AI團(tuán)隊今日正式推出PaddleOCR 3.1版本,以突破性的多語言組合識別(Multilingual Composition Perception, MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場景提供前所未有的智能化解決方案。
技術(shù)制高點:MCP重塑OCR能力邊界
顛覆性混合識別:MCP技術(shù)突破單一語言識別局限,無需預(yù)先指定語種,即可對文檔中自由穿插的中文、英文、日文、韓文、法文、德文、阿拉伯文等數(shù)十種語言文本進(jìn)行同步、高精度識別,尤其擅長處理專業(yè)術(shù)語、專有名詞混排場景。
上下文語義貫通:基于百度文心大模型強大的語義理解能力,系統(tǒng)可智能關(guān)聯(lián)混合文本上下文,顯著提升如“中英技術(shù)文檔”、“多語合同條款”、“國際化財報”等復(fù)雜材料的識別準(zhǔn)確率與邏輯連貫性。
工業(yè)級魯棒性:針對模糊掃描件、低光照拍攝、復(fù)雜表格等極端場景優(yōu)化模型架構(gòu),識別精度在制造業(yè)圖紙、物流單據(jù)、醫(yī)療檔案等專業(yè)領(lǐng)域提升超15%。
全景應(yīng)用賦能:驅(qū)動產(chǎn)業(yè)智能化升級
跨境貿(mào)易與金融:自動解析多語種報關(guān)單、信用證、合同,縮短處理周期70%,規(guī)避人工誤讀風(fēng)險。
學(xué)術(shù)研究與國際出版:高效處理混合引用文獻(xiàn)、多語論文資料,助力知識高效流轉(zhuǎn)。
智能辦公與檔案數(shù)字化:一鍵轉(zhuǎn)換國際化會議紀(jì)要、混排企業(yè)檔案,實現(xiàn)全球信息無縫管理。
多語言產(chǎn)品與客服:實時識別用戶上傳的多語種圖片反饋,提升全球客戶服務(wù)體驗。
開發(fā)者生態(tài):極致效率與開放共創(chuàng)
輕量化部署:提供從服務(wù)器到邊緣設(shè)備的全棧優(yōu)化模型,推理速度提升50%,內(nèi)存占用降低30%。
零代碼落地:升級OCR辦公平臺,企業(yè)用戶無需開發(fā)即可通過可視化界面配置多語言混合識別流程。
模型工廠開源:在GitHub開放MCP訓(xùn)練架構(gòu)及多語言數(shù)據(jù)集,支持開發(fā)者定制專屬混合識別模型。
“PaddleOCR 3.1的MCP能力是全球化智能文檔處理的里程碑。”百度AI技術(shù)負(fù)責(zé)人王海峰表示,“它不僅是技術(shù)的突破,更是對全球商業(yè)、文化交流底層需求的回應(yīng)。我們致力于讓機器真正‘讀懂’人類多元化的表達(dá)方式。”
即刻體驗未來:
開發(fā)者可通過PaddleOCR GitHub倉庫獲取3.1版本完整代碼、預(yù)訓(xùn)練模型及詳細(xì)教程。企業(yè)用戶可登陸百度智能云官網(wǎng)申請MCP能力商用授權(quán)。
關(guān)于PaddleOCR:
作為百度飛槳生態(tài)的核心組件,PaddleOCR已服務(wù)全球超10萬企業(yè)和開發(fā)者,涵蓋金融、制造、醫(yī)療、教育等80余個行業(yè),日均調(diào)用量超百億次,持續(xù)領(lǐng)跑開源OCR技術(shù)發(fā)展。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例
高考一結(jié)束,忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績才勉強過一本線,今年集體晉升985。據(jù)悉,豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎,中小AI創(chuàng)企的處境卻日益尷尬
當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍(lán)色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{(lán)色超鏈接,點擊即可瀏覽由
蘋果還沒從WWDC25的“群嘲”中走出,又迎來了一次新的痛擊。據(jù)路透社報道,21日,蘋果公司遭到股東集體起訴,被指在信息披露中低估了將先進(jìn)生成式AI整合進(jìn)語音助手Siri所需的時間,導(dǎo)致iPhone銷量受影響、股價下滑,構(gòu)成證券欺詐。在這份訴訟中,庫克、首席財務(wù)官凱文·帕雷克及前首席財務(wù)官盧卡·馬埃
ERGO與ECODYNAMICS聯(lián)合報告解析LLM的“內(nèi)容審美”結(jié)構(gòu)清晰、問答模塊化的內(nèi)容,正成為AI驅(qū)動搜索時代的“新通行證”。近期,ERGO創(chuàng)新實驗室與ECODYNAMICS聯(lián)合發(fā)布的開創(chuàng)性研究報告在保險科技領(lǐng)域引發(fā)關(guān)注。這項覆蓋33,000個AI搜索結(jié)果和600個網(wǎng)站的研究發(fā)現(xiàn):大型語言模型(
文/道哥美國設(shè)計軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價定每股33美元,開盤報價85美元,較發(fā)行價翻倍。首日收報115.50美元,較發(fā)行價大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線資金獲利了結(jié),
8月16日,盧松松非常榮幸的成為了一名《2025世界人形機器人運動會》的觀眾。這是一場超酷的機器人運動會,也是人類給機器人辦的第一屆奧運會,來自16個國家的280支隊伍會參加500多個比賽項目??戳艘惶斓谋荣悾砩暇突貋韺懳恼?,編輯短視頻。先說感悟:(1)這是人類首次給機器人辦的第一屆運動會,史無前
文/一燈來源/節(jié)點財經(jīng)在當(dāng)前無人敢缺席的AI軍備競賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場勾勒著未來的宏偉藍(lán)圖。在各家動輒千億級投入的背景下,市場迫切需要一份關(guān)于AI回報價值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財報。盡管資本開支同比劇增119%,達(dá)
文/二風(fēng)來源/節(jié)點財經(jīng)2025年的硅谷,一場沒有硝煙的戰(zhàn)爭正以前所未有的烈度上演。這場戰(zhàn)爭的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來人工智能基礎(chǔ)模型的頂尖大腦。在這場激烈的人才爭奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的
Manus撕開一道真相
文/八真來源/節(jié)點財經(jīng)具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機器人及相關(guān)主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內(nèi)IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內(nèi)團(tuán)隊也將大幅裁撤——原有120人規(guī)模團(tuán)隊除40余