5月14日OpenAI搶跑發(fā)布GPT-4o,通過(guò)實(shí)時(shí)的語(yǔ)音、視頻和文本交互刷屏社交網(wǎng)絡(luò)。
但僅僅24小時(shí)后,谷歌毫不示弱,在一年一度的Google I/O 開(kāi)發(fā)者大會(huì)上,展示了由升級(jí)后Gemini模型驅(qū)動(dòng)的AI助手項(xiàng)目Project Astra、對(duì)標(biāo)Sora的文生視頻模型Veo,以及在硬件方面發(fā)布的第六代Tensor處理器單元(TPU)Trillium芯片,并推出了徹底AI改造后的搜索。
谷歌首席執(zhí)行官桑達(dá)爾?皮查伊表示,谷歌所有的工作都圍繞生成式AI模型Gemini來(lái)做。
由此,多模態(tài)大模型 成為巨頭選定的未來(lái)方向,這讓人不由的發(fā)出疑問(wèn),中國(guó)大模型誰(shuí)能扛起多模態(tài)的大旗?
多模態(tài)遙遙領(lǐng)先的中國(guó)大模型
谷歌發(fā)布會(huì)固然精彩,但總體上也談不上絕對(duì)領(lǐng)先,比如我們看到一個(gè)挺有意思的演示,就是給出一個(gè)三天的膳食計(jì)劃,最后得出的結(jié)果是圖文并茂的。這一點(diǎn)確實(shí)帶來(lái)了很大的體驗(yàn)提升,而目前國(guó)內(nèi)的大部分大模型的對(duì)話方式還是簡(jiǎn)單的停留在文字交互上,多模態(tài)的混合內(nèi)容幾乎沒(méi)有。
不過(guò)比起國(guó)內(nèi)的多模態(tài)AI搜索領(lǐng)軍產(chǎn)品天工大模型(www.tiangong.cn)來(lái)說(shuō),谷歌這個(gè)多模態(tài)的搜索結(jié)果就有點(diǎn)花拳繡腿了,比如我提的一個(gè)問(wèn)題是“特斯拉與小米的參數(shù)對(duì)比”,這里給出的答案應(yīng)該是所有大模型里唯一能夠用表格對(duì)比并配圖的了,在實(shí)用性和可用性上來(lái)說(shuō),真的是遙遙領(lǐng)先,根本不需要二次處理數(shù)據(jù)就可以直接輸出內(nèi)容了。
從這個(gè)角度來(lái)看的話,我覺(jué)得谷歌還是處于一個(gè)炫技的demo階段,而天工大模型在多模態(tài)這塊確實(shí)已經(jīng)進(jìn)入了一個(gè)實(shí)用階段。
從這里我們可以看出,早在4月17日發(fā)布的“天工3.0”在多模態(tài)領(lǐng)域的領(lǐng)先并不僅僅是在國(guó)內(nèi)范圍,而是全球范圍。“天工3.0”是采用4千億級(jí)參數(shù)MoE混合專家模型,也是全球模型參數(shù)最大、性能最強(qiáng)的MoE模型之一。
最為重要的一點(diǎn)則是,“天工3.0”也是全球首個(gè)多模態(tài)“超級(jí)模型”(Super Model),其最早集成了AI搜索、AI PPT、AI視頻轉(zhuǎn)繪、AI寫作、AI長(zhǎng)文本閱讀、AI對(duì)話、AI語(yǔ)音合成、AI圖片生成、AI漫畫創(chuàng)作、AI圖片識(shí)別、AI音樂(lè)生成、AI代碼寫作、AI表格生成等多項(xiàng)能力。
這一路徑選擇,在一個(gè)月之后的今天,兩大巨頭的模型更新后,也被確認(rèn)為全球大模型未來(lái)的發(fā)展方向。
之所以天工能夠?qū)崿F(xiàn)這樣的領(lǐng)先,是因?yàn)樵缭谌ツ?月就發(fā)布了多模態(tài)大模型Skywork-MM然后一步一步迭代而來(lái),這種對(duì)未來(lái)發(fā)展方向的遠(yuǎn)見(jiàn)和正確判斷,無(wú)疑是在AI這種創(chuàng)新領(lǐng)域?qū)崿F(xiàn)領(lǐng)先的關(guān)鍵。
反觀谷歌反而在摸索方向方面耗費(fèi)了太多的時(shí)間,現(xiàn)在才開(kāi)始逐漸步入正軌。
多模態(tài)AI打破個(gè)人創(chuàng)作局限
如果說(shuō)AI搜索是剛需的入口,那么多模態(tài)顯然就是應(yīng)用的未來(lái)。我曾向很多公務(wù)員朋友推薦使用天工AI,其中很多多模態(tài)功能在工作中都有很好的表現(xiàn)。比如說(shuō)AI ppt功能可以一鍵生成大綱和PPT,大幅降低工作的繁瑣程度,只要簡(jiǎn)單修改就可以直接應(yīng)用。
而AI視頻轉(zhuǎn)繪畫的功能則是我意想不到的一個(gè)受歡迎的功能,因?yàn)榇蠹叶家龆桃曨l,但又不方便露臉,一鍵轉(zhuǎn)成漫畫風(fēng)格就完全沒(méi)有問(wèn)題了。
對(duì)于文案工作者來(lái)說(shuō),閱讀分析大量的材料和進(jìn)行范式文體的寫作是日常工作中最耗費(fèi)精力的部分,而AI能夠帶來(lái)的最大價(jià)值就在這里了。
天工的AI文檔解析支持無(wú)字?jǐn)?shù)限制的文檔閱讀,除了PDF和TXT、EXCEL等文檔形式外也支持網(wǎng)絡(luò)鏈接,文檔上傳后,能一鍵生成AI摘要和要點(diǎn)提煉,還貼心標(biāo)注提煉內(nèi)容的總計(jì)字?jǐn)?shù)及閱讀時(shí)間,方便參考。
而且AI閱讀的所有問(wèn)答歷史、閱讀列表都將成為你的個(gè)人知識(shí)庫(kù),避免重復(fù)學(xué)習(xí),也能隨時(shí)找到過(guò)去的工作成果。
然后再配合AI寫作、AI PPT,可以快速生成大綱、框架、文本或者PPT,大幅提升文字工作的效率。這就是AI輔助未來(lái)辦公的一個(gè)真實(shí)可用的場(chǎng)景。
值得一提到是,天工AI解析EXCEL這種復(fù)雜數(shù)據(jù)場(chǎng)景也是游刃有余,絕對(duì)是未來(lái)的硬核生產(chǎn)力工具。
文字工作是一切的基礎(chǔ),AI圖片、AI音樂(lè)、AI漫畫、AI代碼、AI數(shù)據(jù)分析等一系列AI多模態(tài)能力的誕生,則實(shí)現(xiàn)了全場(chǎng)景的生產(chǎn)效率提升,無(wú)論是我們想配一個(gè)無(wú)版權(quán)的插圖,還是想配一個(gè)合適的音樂(lè),漫畫,現(xiàn)在都可以通過(guò)AI來(lái)生成完全具有知識(shí)產(chǎn)權(quán)的內(nèi)容,這一點(diǎn)不僅僅會(huì)為職場(chǎng)人士帶來(lái)效率提升的價(jià)值,也會(huì)為大量的內(nèi)容創(chuàng)業(yè)者打開(kāi)創(chuàng)作的桎梏,生成更多的優(yōu)質(zhì)內(nèi)容。
從這一點(diǎn)來(lái)說(shuō),多模態(tài)的未來(lái)相關(guān)于每一個(gè)生產(chǎn)內(nèi)容的人,也勢(shì)必會(huì)為創(chuàng)造力插上最強(qiáng)的輔助翅膀。
除此之外,天工垂直領(lǐng)域的智能體對(duì)話的工具性也非常有實(shí)用價(jià)值,比如旅游在出行前問(wèn)一問(wèn),就可以作出很好的推薦和路線規(guī)劃。
星座運(yùn)勢(shì)也可以隨時(shí)給出關(guān)于星座的運(yùn)勢(shì)走向和生活指南,也可以給枯燥的生活帶來(lái)幾分樂(lè)趣和期待。
這里尤其需要說(shuō)明的是,能夠提供即時(shí)的信息內(nèi)容,且視覺(jué)感不輸傳統(tǒng)搜索引擎的體驗(yàn),也是天工大模型的獨(dú)家能力,如果是其他大模型,大部分都只能呈現(xiàn)文字效果,甚至還在分析過(guò)去的信息,是沒(méi)有辦法提供星座運(yùn)程這樣的即時(shí)的信息分析反饋的。
還有很多年輕的朋友會(huì)在二次元漫畫中樂(lè)此不疲的完成自己的作品創(chuàng)作。而隨著多模態(tài)能力的發(fā)展,我相信還會(huì)有更多垂直領(lǐng)域的垂直模型被開(kāi)發(fā)出來(lái),這些對(duì)于人們的工作生活都會(huì)帶來(lái)顛覆性的改變。
而最完美的場(chǎng)景自然是和語(yǔ)音助手的結(jié)合,讓每個(gè)人都能擁有一個(gè)類似鋼鐵俠的賈維斯那樣的AI助手,這樣大量的工作和娛樂(lè)需求只要一句話就會(huì)被AI滿足,這種完美的生活體驗(yàn)我相信距離我們已經(jīng)不遠(yuǎn)了。
AI搜索的開(kāi)創(chuàng)者
值得一提的是,除了在多模態(tài)方面的領(lǐng)先,天工也是中國(guó)AI搜索的開(kāi)創(chuàng)者,2023年8月就率先推出基于自研大語(yǔ)言模型的AI搜索產(chǎn)品——天工AI搜索,這也啟發(fā)了國(guó)內(nèi)的搜索巨頭,百度和360也相繼入局。
目前來(lái)看,搜索融入AI可以說(shuō)是一個(gè)神來(lái)之筆,從全球范圍來(lái)看,谷歌最終也很有可能憑借搜索的優(yōu)勢(shì)來(lái)反超OpenAI。
因?yàn)樗阉骱虯I的結(jié)合是最為自然的,也是實(shí)用性提升最強(qiáng)的,它大大降低了搜索工具的使用門檻,同時(shí)篩掉了很多往往需要專業(yè)人士才能分辨的垃圾信息,而最終產(chǎn)生的搜索結(jié)果,就好像上面的對(duì)比表格一樣,直接利用率非常高,不再需要人們進(jìn)行更復(fù)雜的二次數(shù)據(jù)整理和編輯。
在這里需要強(qiáng)調(diào)的是,天工大模型和其他AI搜索的領(lǐng)先之處還有一點(diǎn)是支持簡(jiǎn)潔、增強(qiáng)、研究3個(gè)模式,其中的簡(jiǎn)潔模式的結(jié)果和其他大模型類似,而增強(qiáng)和研究?jī)蓚€(gè)模式則能輸出更為豐富和復(fù)雜的結(jié)果來(lái)供更加專業(yè)的需求使用。
比如關(guān)于普通人有必要理財(cái)么這個(gè)問(wèn)題,簡(jiǎn)潔模式就回復(fù)了基本的理財(cái)?shù)哪康摹⒑锰?、風(fēng)險(xiǎn),而增強(qiáng)版搜索則更為細(xì)節(jié)的闡述了理財(cái)?shù)哪康摹⒗碡?cái)?shù)牟呗陨踔吝€有理財(cái)?shù)漠a(chǎn)品推薦。
而在研究模式下,我們就可以看到指定理財(cái)計(jì)劃的推薦,以及10種理財(cái)工具的介紹,真的對(duì)這個(gè)領(lǐng)域有興趣的用戶就可以針對(duì)這10種產(chǎn)品進(jìn)一步的進(jìn)行研究和采納了。這三個(gè)答案可以說(shuō)是比較充分的體現(xiàn)出了天工AI搜索三種模式結(jié)果的不同。
對(duì)我本人的使用場(chǎng)景來(lái)說(shuō),大大解決了搜索中專業(yè)度不足的問(wèn)題。之前我使用的大模型提供的素材很難在專業(yè)的稿件中用到,但天工AI搜索的增強(qiáng)尤其是研究模式下的結(jié)果,可用度就非常高了。
當(dāng)然天工在AI搜索方面的領(lǐng)先也不是憑空而來(lái),很多人只知道天工的研發(fā)者昆侖萬(wàn)維是國(guó)內(nèi)市值數(shù)百億的上市公司,但不知道的是,它之前曾收購(gòu)并成功運(yùn)營(yíng)海外主流瀏覽器Opera,所以在搜索方面不僅有很強(qiáng)的技術(shù)積累,同時(shí)也奠定了如今自研搜索引擎的能力,這種積累最終在AI領(lǐng)域?qū)崿F(xiàn)了爆發(fā),不能不說(shuō)昆侖萬(wàn)維在戰(zhàn)略和遠(yuǎn)見(jiàn)方面的優(yōu)勢(shì)。
要知道,在國(guó)內(nèi)同時(shí)具有大模型和搜索能力的公司屈指可數(shù),而從目前的發(fā)展趨勢(shì)來(lái)看,這兩種能力的齊備是最后還能留在一線的必要條件。
昆侖萬(wàn)維在研發(fā)人員方面也是國(guó)內(nèi)的第一梯隊(duì),相較于國(guó)內(nèi)幾個(gè)創(chuàng)業(yè)團(tuán)隊(duì)百十人的規(guī)模,有數(shù)倍的優(yōu)勢(shì)。而且這些研發(fā)人員質(zhì)量也非常高,海內(nèi)外知名院校博士就超過(guò)百人,其他大部分也都來(lái)自于微軟、阿里、百度這樣的行業(yè)大廠,技術(shù)水準(zhǔn)有更好的保障。
AI發(fā)展如火如荼,這其中不僅僅需要技術(shù)能力的支撐,也需要對(duì)未來(lái)發(fā)展方向的準(zhǔn)確判斷和精準(zhǔn)投入。畢竟AI發(fā)展就像滾雪球,好處是越來(lái)越大,領(lǐng)先優(yōu)勢(shì)也越來(lái)越明顯,后來(lái)者很難追上。壞處就是一旦方向錯(cuò)了,很容易尾大不掉,難以轉(zhuǎn)向。
從目前的發(fā)展趨勢(shì)來(lái)看,多模態(tài)的方向已經(jīng)相當(dāng)確定,而天工在海內(nèi)外的領(lǐng)先優(yōu)勢(shì)也比較明顯。接下來(lái)就是要拉開(kāi)差距和分勝負(fù)的時(shí)刻了。期待更強(qiáng)大的產(chǎn)品出現(xiàn),也期待AI改變世界早日到來(lái)。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
趕超GPT-4的階段性升級(jí),可以看作是國(guó)產(chǎn)大模型有序迭代部署、不斷拉近差距的標(biāo)志,切莫像手機(jī)跑分那樣,在過(guò)度營(yíng)銷的作用下,淪為被群嘲的對(duì)象。
文|智能相對(duì)論作者|沈浪知名科學(xué)雜志《Nature》發(fā)表了一篇關(guān)于大模型規(guī)模參數(shù)大小爭(zhēng)議的文章《InAl,isbiggeralwaysbetter?》——AI大模型,越大越好嗎?隨著大模型應(yīng)用走向?qū)嵺`,這一問(wèn)題不可避免地成為了當(dāng)前AI行業(yè)發(fā)展的焦點(diǎn)與爭(zhēng)議。有人認(rèn)為,大模型當(dāng)然是越大越好,參數(shù)越大,性
拋開(kāi)營(yíng)銷戰(zhàn),或許在中國(guó)也可以探索新的大模型應(yīng)用聚合方式、供給方式以及商業(yè)利潤(rùn)分配的方式,對(duì)大模型公司來(lái)說(shuō),這將是一個(gè)新議題。
大模型熱潮涌動(dòng)了一年多后,越來(lái)越多人平復(fù)了激動(dòng)的情緒,開(kāi)始從客觀的視角重新思考大模型的價(jià)值和機(jī)會(huì)。紅杉資本在AlAscent2024的開(kāi)場(chǎng)演講中提到,大模型的創(chuàng)造能力和推理能力,第一次實(shí)現(xiàn)了以類似人類的方式進(jìn)行交互,將支撐起數(shù)十萬(wàn)億美元的市場(chǎng)。然而和AGI的遙遠(yuǎn)夢(mèng)想相比,大模型的創(chuàng)業(yè)者們卻不得不正視
關(guān)注盧松松,會(huì)經(jīng)常給你分享一些我的經(jīng)驗(yàn)和觀點(diǎn)。昨晚,李彥宏內(nèi)部講話稱:AI大模型開(kāi)源意義不大,百度絕不搶開(kāi)發(fā)者飯碗。但你一定要說(shuō)話算話哦,可千萬(wàn)別說(shuō):“我永遠(yuǎn)不做手機(jī),誰(shuí)再敢提做手機(jī)就給我走人”,結(jié)果5年后自己的手機(jī)銷量排名第一。如果百度也這么干的話估計(jì)AI也沒(méi)人用了。李彥宏認(rèn)為:從商業(yè)模式的角度來(lái)
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開(kāi)發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開(kāi)源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20
9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G
9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來(lái)西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商