OpenAI Sora畫的餅，AI行業(yè)集體給它圓了......嗎？

2024-08-26 10:58 來源：A5專欄我來投稿撤稿糾錯

AI文生視頻領域，幾乎只剩Sora還是個期貨了。

最近兩個月，國內(nèi)外的AI-generated Video應用持續(xù)爆發(fā)，中國的快手、字節(jié)、智譜AI、生數(shù)科技、愛詩科技，海外的谷歌、Luma、Runway，格局如八仙過海。

雖然不同平臺水平差異依舊存在，但整體可用性已經(jīng)大大提高，而且風格化特征也比較全面。唯一的缺憾是，在融入工作流方面，AI視頻工具們的水平還是差了一點。Sora畫的餅，要交給這些后來者去圓了。

放棄期貨，文生視頻應用爆發(fā)

業(yè)界民間都把視頻視為AI應用落地的重點領域。英偉達CEO黃仁勛在7月30日的全球頂級計算機圖形學會議SIGGRAPH 2024上邀請了Meta的CEO扎克伯格進行對話，雙方都認可視頻能力會是AI大模型的進化方向。

出身于英偉達研究小組的Luma AI首席科學家宋佳銘，在與a16z合伙人Anjney Midha對談時說，視頻關聯(lián)著3D世界，從學習角度看，視頻數(shù)據(jù)使模型更好地理解和推理3D世界。所以，實時高質(zhì)量的視頻生成，最終會推動具身AI的發(fā)展。

視頻就是這樣一座“橋”，而現(xiàn)在大量的AI公司正在試圖搶先通過它，尤其是OpenAI讓Sora變成了外界用不到的期貨，給了其他平臺進一步發(fā)展的空間。

（整理自公開信息）

（圖源：天眼查）

超長戰(zhàn)線背后是這些公司的試探。一部分是關于商業(yè)模式，另一部分是關于技術應用前景。

可靈、即夢、Vidu等都推出了會員訂閱模式，在C端進行應用普及化嘗試。愛詩科技創(chuàng)始人王長虎此前在接受財新采訪時表示：“愛詩目前的策略以2C（面向消費者）為主，廣泛收集國內(nèi)外用戶反饋，以更好地基于用戶體驗迭代底層模型。”至于更遠的應用，現(xiàn)在來談則為時尚早，主要是因為C端的收費模式無法承擔成本。

Luma AI采取了To C的產(chǎn)品形態(tài)，不過它原本專注于3D領域，進入視頻生成領域是為了探索3D生成與重建的更多可能性，以視頻驅(qū)動3D發(fā)展。這在產(chǎn)業(yè)領域有更多的應用前景，例如批量制造電影需要的三維素材等。

最重要的是，Luma AI的期望不是售賣技術或者素材，而是建立類似TikTok這樣的平臺，也就是一個基于3D的生態(tài)系統(tǒng)。王長虎也在和極客公園創(chuàng)始人張鵬對話時表示，愛詩科技也瞄準的是“AIGC時代的平臺性機會”，但平臺的形態(tài)暫時無法預測，因為AI產(chǎn)業(yè)不會以復制現(xiàn)在已有的平臺的方式成長。

不僅如此，目前讓AI-generated Video進入完整工作流的應用已經(jīng)在成形。開源視頻編輯工具Clapper最近熱度上升，它的特色就是集合各類AI技術，用prompt的方式調(diào)動AI Agent生成和迭代故事，直接跳過了手工編輯文件的過程。

（圖源：機器之心）

由此可見，AI-generated Video的進化速度遠比我們想象得要快。目前，行業(yè)的重點無疑在于生成速度和生成效率兩個方面。但是，大模型并不提供完全確定的商業(yè)模式方向，這更多取決于團隊的選擇。而在這個過程中，除了商業(yè)化之外，AI公司還要思考怎么避免陷入合規(guī)困境、成本困境。所以，把文生視頻變得成熟并不容易，現(xiàn)在僅僅相當于ChatGPT剛剛問世的階段。

AI-generated Video的“硬傷”和突破口

a16z之前就發(fā)表過觀點，巨頭在從科研成果到商業(yè)產(chǎn)品的轉(zhuǎn)化中需要更關注法律安全、版權等問題，所以往往效率會慢。我們不去考慮Sora是不是因為這個原因始終不露面，單看行業(yè)都要面對的相關問題，邏輯其實是一樣的。

1.商業(yè)化的“落差”，目前的AI-generated Video很難滿足甲方們的需求

彭博社曾報道，OpenAI一直試圖向好萊塢推薦Sora，但并不成功。用Sora制作的第一則商業(yè)化廣告是6月公開的玩具反斗城廣告。然而，這則視頻不但用了一些舊素材，公開新聞稿也沒有說完全由AI生成。

導演Nik Kleverov還在一條已經(jīng)刪除的動態(tài)里表示，制作這些鏡頭的創(chuàng)意機構Native Foreign提供了大約十幾個工作人員參與工作，Sora支持了80%到85%的流程。這對需要高效低成本的AI-generated Video來說算不上什么好消息。

2.訓練成本、高質(zhì)量數(shù)據(jù)集難以滿足

視頻的本質(zhì)可以視為一系列圖像，圖像有很多公開的數(shù)據(jù)集，但是視頻沒有。OpenAI遇到過違規(guī)使用YouTube視頻進行訓練的指控，英偉達最近被媒體曝光從Netflix和YouTube收集了大量數(shù)據(jù)，用來訓練自己的Cosmos項目，用于支持其AI產(chǎn)品往現(xiàn)實世界發(fā)展。它每天可以下載相當于80年的視頻內(nèi)容。

這體現(xiàn)了兩個關鍵點：一是黃仁勛和Luma的觀點類似，AI視頻的發(fā)展確實對AI進入3D世界意義重大，英偉達也是這樣做的：文本——圖像——視頻——三維模型——現(xiàn)實世界。二是視頻數(shù)據(jù)集是個大問題，除了版權問題，這些視頻數(shù)據(jù)還缺乏標簽，斯坦福大學教授Stefano Ermon說，現(xiàn)階段缺乏篩選和過濾好視頻的方法，而且篩選后還要考慮它們的標簽和描述。

3.AI資產(chǎn)泡沫的問題，AI必須為用戶解決重要復雜的問題才能有價值，但現(xiàn)在它的發(fā)展成效，遠遠不能和互聯(lián)網(wǎng)等技術當年初生時的情況相比

Benchmark合伙人Michael Eisenberg在最近的一期訪談中，引用了其好友Atreides Management創(chuàng)始人Gavin Baker關于大模型發(fā)展的觀點：“基礎模型是歷史上貶值最快的資產(chǎn)。”

他所舉的例子來自Seeking Alpha的創(chuàng)始人，類似金融領域這種每分鐘都會進行業(yè)務和數(shù)據(jù)更新的高頻領域，訓練出來的模型只能完成寫報告之類的常規(guī)工作，但無法應對數(shù)據(jù)的高速刷新，滿足金融預測未來的需求。

而且，其他技術的發(fā)展是確定性的，互聯(lián)網(wǎng)發(fā)展早期雖然泡沫巨大，但已經(jīng)體現(xiàn)了應用路徑；而AI渾身都是不確定性。互聯(lián)網(wǎng)發(fā)展的邊際成本幾乎約等于0（或者說其中不少都分擔給了運營商和用戶），然而AI成長的邊際成本涉及大量固定資產(chǎn)，現(xiàn)在都由創(chuàng)業(yè)者自己承擔，而且越投入邊際改善效應越弱。大量的早期投入，很可能是一個陷阱。

技術革命之后必須伴隨產(chǎn)業(yè)革命，產(chǎn)業(yè)革命則需要現(xiàn)象級產(chǎn)品的引領。AI更需要的是一個成功的場景。目前看來，AI-generated Video還沒有拿到這類成果的起色。

Perplexity的創(chuàng)始人Arin對此提供了另外一個觀點，那就是基礎模型的價值本質(zhì)映射著背后團隊的價值，即Sora之于OpenAI，文心大模型之于百度。不是Sora能革了視頻的命，只是外界相信由OpenAI領導的Sora具備這樣的可能性而已。當Sora沒能提供符合我們預期的突破時，誰能在這個領域擔起大任呢？

由此出發(fā)，關鍵或許在于誰能先把AI-generated Video真正融入到某一個商業(yè)系統(tǒng)的工作流中去，就像Clapper對視頻制作的探索一樣。而這就是一個更大的問題了，因為它涉及到和其他領域的融合——氣象、城市、影視、汽車、制造業(yè)。也許Sora會在今年的某天拿出一個更具體的成果，也許是其他的創(chuàng)業(yè)公司顛覆了我們對AI視頻的認知。

來源：松果財經(jīng)

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關標簽: ai智能

科技泡沫論中，中國AI初創(chuàng)企業(yè)如何煉成“吸金大法”？

作為這一輪全球AI科技周期的風向標企業(yè)，自2023年初截至今年6月31日，英偉達股價翻了近7.5倍。然而，自6月創(chuàng)下了歷史高點后，截至當?shù)貢r間8月12日收盤，其股價回撤幅度約20%。同時，這一時期，英偉達多位高管也在持續(xù)拋售公司股份。據(jù)統(tǒng)計，在6月13日至8月9日期間，CEO黃仁勛已累計套現(xiàn)超5.5

標簽：

ai智能
AI時代的“另類博弈”，調(diào)薪只是大廠變革的開始

大廠員工們的喜大普奔時刻，騰訊宣布“漲薪”了。具體內(nèi)容：一是將服務獎，即「十三薪」，均攤到每月月薪中，折算后每月漲薪8%；二是將“易居”計劃的年度房補，納入月薪中。兩項調(diào)整給新老員工的月薪帶來了不小的變化。今年，裁員潮的陰影一直籠罩全球，但包括騰訊在內(nèi)的國內(nèi)互聯(lián)網(wǎng)大廠卻開始了一波“反向操作”，這背后

標簽：

ai智能
超預期的業(yè)績增長未能“沸騰”股價，谷歌的AI戰(zhàn)事升級？

近日，谷歌母公司Alphabet在美股盤后公布了第二季度財報，其中，總營收847億美元，同比增長14%，高于分析師普遍預期的842億美元

標簽：

ai智能
現(xiàn)階段的AI落地，只是一場大模型廠商的“賣家秀”？

商業(yè)化愿景下，AI應用元年已經(jīng)到來。2024年以來，諸多已布局AI大模型技術的科技公司都開始加速推出AI應用產(chǎn)品。比如，今年7月16日，騰訊旗下大模型應用“騰訊元寶”推出“3D角色夢工廠”玩法，成為首個擁有打印級3D生成能力的通用大模型App。無獨有偶，百度也推出了一款名為“文小言”的AI數(shù)字人社交

標簽：

ai智能
掉隊的百度，突然用AI應用重新殺回？

文|智能相對論作者|葉遠風松弛感，是這屆奧運會開幕式給很多人留下的直觀感受。而讓用戶觀看奧運的過程也獲得松弛感，同樣是各路APP在奧運季努力的方向。從各種大型賽事報道來看，一般來說，APP們往往致力于整合信息、形成專題頁面，方便用戶一站式瀏覽，從容選擇、查看。但“智能相對論”觀察到，一些嘗試推動用戶

標簽：

ai智能

百度智能云PaddleOCR 3.1正式發(fā)布：關鍵能力支持MCP

百度AI團隊今日正式推出PaddleOCR3.1版本，以突破性的多語言組合識別（MultilingualCompositionPerception,MCP）技術為核心，徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別，為全球化企業(yè)、跨境業(yè)務及多元文化場

標簽：

ai智能

ai技術
宇樹科技加速沖刺科創(chuàng)板IPO，人形機器人龍頭估值飆至120億元

“宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務飛輪，自研率超95%的技術壁壘讓其成為全球機器人賽道不可忽視的中國力量?！笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日，據(jù)每日經(jīng)濟新聞從宇樹科技投資方處獲悉，國內(nèi)人形機器人領軍企業(yè)宇樹科技（UnitreeRobotics）已明確計劃于科創(chuàng)板IPO，預計

標簽：

宇樹科技
OpenAI推出GPT-5：AI大統(tǒng)一時代的到來？

推理與多模態(tài)的終極融合，將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日，OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強大模型，特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”，為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負

標簽：

chatgpt
中小AI企業(yè)，沒有“高考”資格

高考一結(jié)束，忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉，去年高考期間，大模型的成績才勉強過一本線，今年集體晉升985。據(jù)悉，豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎，中小AI創(chuàng)企的處境卻日益尷尬

標簽：

ai智能
大模型搶灘高考志愿填報，能否頂替「張雪峰」們？

文/二風來源/節(jié)點財經(jīng)每年高考成績放榜后，數(shù)千萬考生和家長將迎來另一場硬仗——填報志愿。今年，這一領域迎來了AI的全面介入，多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報產(chǎn)品，為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù)，2023年中國高考志愿填報市場付費規(guī)模約9.5億元，近九成考生愿意借助志愿填報服

標簽：

大模型
蘋果AI掉隊？現(xiàn)在唱衰或許還為時過早

蘋果還沒從WWDC25的“群嘲”中走出，又迎來了一次新的痛擊。據(jù)路透社報道，21日，蘋果公司遭到股東集體起訴，被指在信息披露中低估了將先進生成式AI整合進語音助手Siri所需的時間，導致iPhone銷量受影響、股價下滑，構成證券欺詐。在這份訴訟中，庫克、首席財務官凱文·帕雷克及前首席財務官盧卡·馬埃

標簽：

蘋果公司

ai智能

DeepSeek、豆包向左，盤古大模型向右

華為的盤古大模型終于推出新版本了。6月20日華為云計算CEO張平安宣布基于CloudMatrix384超節(jié)點的新一代昇騰AI云服務全面上線，盤古大模型5.5同步發(fā)布。不過，當前國內(nèi)的AI大模型競爭可謂是相當激烈，華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從

標簽：

deepseek

豆包ai

盤古大模型
數(shù)字人羅永浩一場直播賣了5000萬，數(shù)字人能取代真人主播嗎？

一場沒有羅永浩的“羅永浩直播”，正在改寫帶貨規(guī)則當數(shù)字人羅永浩在百度直播間舉起青島啤酒，以標志性幽默回應粉絲提問時，彈幕瘋狂刷出“這是真的還是假的？”的疑問。這場持續(xù)近7小時的直播，創(chuàng)下1300萬人次觀看、GMV突破5500萬元的驚人戰(zhàn)績，甚至超過了他本人一個月前真人直播5000萬元的成績。數(shù)字人主

標簽：

數(shù)字人

數(shù)字人直播

羅永浩
新東方發(fā)布首款原創(chuàng)AI教育產(chǎn)品，開啟一對一智能學習時代

高頻互動、個性化教學、突破成本壁壘，AI老師讓英語學習更普惠。6月24日，新東方正式推出面向消費者的首款原創(chuàng)AI教育產(chǎn)品——“新東方AI1對1”。這款產(chǎn)品標志著新東方在教育+AI戰(zhàn)略布局中邁出關鍵一步，旨在以科技力量推動優(yōu)質(zhì)教育資源的普惠發(fā)展。在發(fā)布會現(xiàn)場，新東方教育科技集團CEO周成剛表示：“AI

標簽：

ai智能
AI工作流是什么？coze扣子工作流怎么搭建和使用？

大家好，我是白楊SEO，專注SEO十年以上，全網(wǎng)SEO流量實戰(zhàn)派，AI搜索優(yōu)化研究者。為什么想分享這個AI工作流及coze扣子這個？因為我們搞流量的如果學會了用AI給我們生產(chǎn)提效將更有助于我們?nèi)カ@客。目前白楊SEO用得并不是很好，分享僅供參考，希望給你一些啟發(fā)。老規(guī)矩，先說下文章大綱如下：1、AI工

標簽：

ai智能

加載更多

99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

OpenAI Sora畫的餅，AI行業(yè)集體給它圓了......嗎？

相關文章

科技泡沫論中，中國AI初創(chuàng)企業(yè)如何煉成“吸金大法”？

AI時代的“另類博弈”，調(diào)薪只是大廠變革的開始

超預期的業(yè)績增長未能“沸騰”股價，谷歌的AI戰(zhàn)事升級？

現(xiàn)階段的AI落地，只是一場大模型廠商的“賣家秀”？

掉隊的百度，突然用AI應用重新殺回？

百度智能云PaddleOCR 3.1正式發(fā)布：關鍵能力支持MCP

宇樹科技加速沖刺科創(chuàng)板IPO，人形機器人龍頭估值飆至120億元

OpenAI推出GPT-5：AI大統(tǒng)一時代的到來？

中小AI企業(yè)，沒有“高考”資格

大模型搶灘高考志愿填報，能否頂替「張雪峰」們？

蘋果AI掉隊？現(xiàn)在唱衰或許還為時過早

DeepSeek、豆包向左，盤古大模型向右

數(shù)字人羅永浩一場直播賣了5000萬，數(shù)字人能取代真人主播嗎？

新東方發(fā)布首款原創(chuàng)AI教育產(chǎn)品，開啟一對一智能學習時代

AI工作流是什么？coze扣子工作流怎么搭建和使用？

熱門排行

編輯推薦

OpenAI Sora畫的餅，AI行業(yè)集體給它圓了......嗎？

相關文章

熱門排行

編輯推薦

OpenAI Sora畫的餅，AI行業(yè)集體給它圓了......嗎？