近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應用科技公司)、AFRL(美國空軍研究實驗室)以及KIT(德國卡爾斯魯厄理工學院)等國際國內(nèi)多個強勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領域的技術硬實力!
表1 IWSLT大賽Baseline Model賽道最終結果
--取自IWSLT官方公布結:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
這是搜狗繼WMT 2017機器翻譯頂級評測大賽奪冠之后,所摘得的又一翻譯領域的技術桂冠。短期內(nèi)連續(xù)登頂世界第一的位置,充分證明了搜狗在翻譯行業(yè)特別是口語翻譯領域已位居領先地位。
IWSLT是什么比賽?
IWSLT是國際最具影響力的口語機器翻譯評測比賽,從2004年開始已經(jīng)舉辦了15屆。每屆比賽都吸引了世界各地機器翻譯領域的知名企業(yè)和研究機構參與,本屆比賽吸引了訊飛、阿里巴巴等國內(nèi)公司,愛爾蘭ADAPT中心,美國約翰霍普金斯大學,德國卡爾斯魯厄理工學院,芬蘭赫爾辛基大學,英國愛丁堡大學,美國AppTek公司等多家國際知名大學、研究機構和公司參加。
表2 IWSLT2018大賽參賽情況
--取自IWSLT官方公布結果:
:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
本屆IWSLT 2018的口語機器翻譯任務主要評測基于指定數(shù)據(jù)集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個賽道,其中Baseline Model賽道主要評測語音翻譯的流水線方案,輸入語音先通過語音識別系統(tǒng)得到語音識別結果,之后將結果送入機器翻譯系統(tǒng)獲得譯文,這也是業(yè)內(nèi)最主流、效果最好的語音翻譯解決方案,市場上商用機器同傳、翻譯機等語音翻譯類產(chǎn)品幾乎都采用了類似的方法;End-to-End則是本次評測新增設的賽道,主要鼓勵參賽方探索基于神經(jīng)網(wǎng)絡的端到端語音翻譯解決方案,希望能夠輸入語音,基于深度神經(jīng)網(wǎng)絡模型直接輸出譯文,這種方法目前仍處于早期研究階段,受制于語音-文本平行語料難以大規(guī)模采集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評測中,在訓練集、測試集相同的情況下,Baseline Model賽道最好的系統(tǒng)取得了28.09的BLEU(機器翻譯質(zhì)量評價指標,值越大代表翻譯質(zhì)量越好),而End-to-End賽道最好的系統(tǒng)僅取得了19.4的BLEU,較Baseline Model賽道相差8.69個BLEU,差距非常明顯,也證明了Baseline Model賽道評測的算法仍是目前最可行和實用的解決方案。
搜狗本次參加的是Baseline Model賽道的評測,并取得了第一名的好成績。評測任務面向TED演講和大會學術報告場景,測試集包括來自英國、歐洲、印度等各個國家的英語演講者,存在噪聲、口音、自由表達等復雜語音現(xiàn)象,同時語言中存在大量領域?qū)S忻~和口語化的表達(如:大量語氣詞、錯誤語法表達等),具有極強的實戰(zhàn)意義和挑戰(zhàn)性。最終,搜狗提交的系統(tǒng)BLEU值達到28.09,領先排名第二的科大訊飛1.6個BLEU,證明了搜狗在口語機器翻譯領域強大的實力。
AI賽道中持續(xù)發(fā)力,搜狗領跑語音翻譯行業(yè)
搜狗的AI戰(zhàn)略藍圖之中,語言是最核心的重頭戲。一直以來,搜狗都堅持著“自然交互+知識計算”的人工智能核心方向,并持續(xù)深耕技術,推動技術向產(chǎn)品的快速轉化,2016年,搜狗發(fā)布了自有人機交互解決方案-知音引擎。擁有充足真實語料數(shù)據(jù)優(yōu)勢的搜狗,將語音識別與機器翻譯技術相結合,并在2016年推出了全球首款商用AI同傳系統(tǒng)-搜狗同傳,引領了語音翻譯技術的普及與應用。通過數(shù)百場的國際會議“實戰(zhàn)”,搜狗同傳獲得了無數(shù)媒體和觀眾的好評,成為當下炙手可熱的“AI字幕君”。
與此同時,搜狗也推出了一系列的智能硬件,將語音翻譯技術應用到了更廣闊的場景之中,幫助用戶打破了跨國交流時的語言困境。2018年3月,搜狗推出了搜狗旅行翻譯寶,具備離線翻譯功能與拍照翻譯功能,讓馬化騰都為之心動,在朋友圈里大打廣告。作為首款智能翻譯硬件,它支持42種語言對話翻譯,解決了旅游場景中用戶聽不懂、看不懂、不會說等真實痛點。該項產(chǎn)品在京東平臺首發(fā)當日即告售罄,首日銷售額破千萬。與此同時,搜狗還推出了錄音翻譯筆,提供錄音轉寫、對話翻譯、同聲傳譯等功能,把AI同傳落地到了消費級產(chǎn)品之中,開拓了語音翻譯的新航道。
眾所周知,人工智能是未來科技的風向標。通過這次在IWSLT比賽中的優(yōu)秀成績,可以看到以搜狗為代表的國產(chǎn)科技巨頭企業(yè),已表現(xiàn)出了引領行業(yè)的技術硬實力。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運營商、科研院所等優(yōu)秀團隊
這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務,建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定
美團曾經(jīng)的二號人物王慧文對標OpenAI的創(chuàng)業(yè)項目光年之外,以20億賣給美團,再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時,外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
我覺得我們AI的目標是:從芯片設計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓練和推理分開,訓練就
文/道哥在深陷“后門”風波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關鍵供應商——包括負責封裝的安靠科技、供應高帶寬內(nèi)存的三星電子、以及承擔后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風來源/節(jié)點財經(jīng)一場關于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領域取
技術的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術的PolarDB數(shù)據(jù)庫專用服務器。在原有RDMA網(wǎng)絡的基礎上,Polar
2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS
9月24日,杭州云棲大會技術主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應效率。在過去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國際版、科學智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達。自2022年11月初成立至今,魔搭社區(qū)已成長為中國最大AI開源社區(qū),其模型數(shù)量已突破10萬,服務了全球20
9月24日,2025云棲大會現(xiàn)場,阿里云CTO周靖人接連發(fā)布了七款大模型技術產(chǎn)品。七款技術產(chǎn)品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實現(xiàn)突破。在大語言模型中,阿里通義旗艦模型Qwen3-Max全新亮相,性能超過G
9月24日,阿里云在云棲大會上宣布新一輪全球基礎設施擴建計劃:將在巴西、法國和荷蘭首次設立云計算地域節(jié)點(region),并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數(shù)據(jù)中心,以便更好服務全球客戶日益增長的AI和云計算需求。目前,阿里云在全球29個地區(qū)運營91個可用區(qū),是中國最大、亞太第一的云服務商