2月5日,春節(jié)將至年味漸濃,阿里云通義千問APP上線多項免費新應(yīng)用,涵蓋全家福、拜新年、萬物成龍等圖像生成的新玩法,共提供超300套照片模板,用戶上傳照片即可生成全家福、團圓照、拜年照、千里江山主題照;此外,一個月前火爆全網(wǎng)的全民舞王應(yīng)用也迎來上新,用戶可通過一張照片生成拜年視頻,用更輕松、接近真人出鏡的方式向親朋好友傳遞新年的美好祝福。
足不出戶即可免費「拍」全家福
春節(jié)是中國人約定俗成的團圓時刻。AI大模型技術(shù)正在讓人們突破時空阻礙,用最便捷的方式相聚、慶祝,春節(jié)團圓的儀式感拉滿。在通義千問APP照相館應(yīng)用的全家福板塊,用戶上傳照片即可生成精美的全家福照片,即便是奮斗在工作崗位、就地過年無法團圓的游子,也能通過科技的方式生成自己的獨家記憶。
通義千問APP為用戶提供了國風東方、時光回憶、唐宮夜宴、書香工筆等12套風格,每套風格支持2-8人的家庭組合,覆蓋了主流中國家庭結(jié)構(gòu)。用戶只需按照要求上傳家庭成員照片后即可生成對應(yīng)的數(shù)字形象,然后將數(shù)字人和模板中的人物形象匹配,由此足不出戶即可免費定制全家福照片。
目前國內(nèi)外已經(jīng)涌現(xiàn)了一批優(yōu)秀的單人人像生成應(yīng)用,但都無法滿足全家福這一多人人像生成需求。相比單人人像生成,多人人像生成難度更高、技術(shù)更復(fù)雜。針對該問題,阿里通義實驗室項目組研發(fā)了一種multi-id人像生成方法,實現(xiàn)了一次多人人像推理的能力,使得生成效率提升1倍以上;同時,基于全家福多人的場景,結(jié)合了表情生成、燈光融合等技術(shù),提升了整體圖像的質(zhì)量,讓生成的全家福更具真實感和氛圍感。
一張照片生成拜年視頻
拜年也是每個家庭的必備年俗。最新的AI技術(shù)又解鎖了拜年「新姿勢」。今年1月,通義千問APP上線全民舞王功能,一張照片來跳舞迅速火爆國內(nèi)外,激發(fā)了網(wǎng)友的創(chuàng)作熱情,萌娃、萌寵跳舞視頻在全網(wǎng)流傳,成為網(wǎng)友的快樂源泉。
春節(jié)前夕,全民舞王推出新春拜年舞模板,涵蓋拜年作揖、要紅包、貼春聯(lián)等經(jīng)典春節(jié)舞蹈動作,同時還新增了共舞IP貼紙、情侶拼跳玩法等,用戶可選擇與小龍共舞、與財神共舞,或邀請好友、愛人拼跳等,用「才藝表演」的形式傳遞傳遞喜慶紅火、歡愉溫暖的年味。
據(jù)介紹,該應(yīng)用基于阿里通義實驗室自研的Animate Anyone算法,集成了多項創(chuàng)新技術(shù),引入ReferenceNet,用于捕捉和保留原圖像信息,可高度還原人物、表情及服裝細節(jié);使用高效的Pose Guider姿態(tài)引導器 ,保證了動作的精準可控;通過時序生成模塊,有效保證視頻幀間的連貫流暢性。在相同數(shù)據(jù)集的測試下,Animate Anyone的性能表現(xiàn)顯著優(yōu)于國內(nèi)外同類模型。
在1月份版本基礎(chǔ)上,Animate Anyone繼續(xù)優(yōu)化,例如人物動作生成連續(xù)性提升,生成的視頻更流暢,并更好地適配男女老少、寵物等更多類型的角色,讓春節(jié)拜年更有新意。
傳統(tǒng)節(jié)日與科技擦出火花
過去一年,國內(nèi)外科技公司爭相入局大模型的研發(fā),大模型也逐漸從單一文本模態(tài),向語音、圖像、視頻等多模態(tài)方向演進,這些前沿技術(shù)不再遙不可及,展現(xiàn)了巨大的應(yīng)用潛力,改變千行百業(yè)的同時也開始走進千家萬戶。
作為國產(chǎn)大模型產(chǎn)品的代表之一,通義千問APP在去年9月首批通過備案后經(jīng)過多輪升級,目前可提供文本對話、文字作畫、涂鴉作畫、語音對話、翻譯、視頻生成等幾十項免費功能。
此次通義千問上線的春節(jié)系列應(yīng)用,進一步拉近大模型和普通人的距離,讓傳統(tǒng)節(jié)日在科技的加持下增添一份溫暖和喜慶。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
四個月前邀請碼炒至10萬元,如今官網(wǎng)變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時,Manus官方微博和小紅書
文/十界來源/節(jié)點財經(jīng)一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場
“宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機器人賽道不可忽視的中國力量。”首程資本管理合伙人朱方文在追加投資時如是評價。7月7日,據(jù)每日經(jīng)濟新聞從宇樹科技投資方處獲悉,國內(nèi)人形機器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計劃于科創(chuàng)板IPO,預(yù)計
推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負
高考一結(jié)束,忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績才勉強過一本線,今年集體晉升985。據(jù)悉,豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎,中小AI創(chuàng)企的處境卻日益尷尬
文/二風來源/節(jié)點財經(jīng)每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場硬仗——填報志愿。今年,這一領(lǐng)域迎來了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報市場付費規(guī)模約9.5億元,近九成考生愿意借助志愿填報服
蘋果還沒從WWDC25的“群嘲”中走出,又迎來了一次新的痛擊。據(jù)路透社報道,21日,蘋果公司遭到股東集體起訴,被指在信息披露中低估了將先進生成式AI整合進語音助手Siri所需的時間,導致iPhone銷量受影響、股價下滑,構(gòu)成證券欺詐。在這份訴訟中,庫克、首席財務(wù)官凱文·帕雷克及前首席財務(wù)官盧卡·馬埃
華為的盤古大模型終于推出新版本了。6月20日華為云計算CEO張平安宣布基于CloudMatrix384超節(jié)點的新一代昇騰AI云服務(wù)全面上線,盤古大模型5.5同步發(fā)布。不過,當前國內(nèi)的AI大模型競爭可謂是相當激烈,華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從