ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型，哪家更適合您？

2024-05-11 11:01 來(lái)源：互聯(lián)網(wǎng) 我來(lái)投稿撤稿糾錯(cuò)

隨著人工智能技術(shù)的飛速發(fā)展，大語(yǔ)言模型(Large Language Models, LLMs)在各行各業(yè)的應(yīng)用日益廣泛，尤其是在軟件開(kāi)發(fā)、數(shù)據(jù)分析、客戶(hù)服務(wù)等領(lǐng)域。蘑菇云創(chuàng)客空間[445期開(kāi)放夜] 就以“ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型，哪家更適合您”這樣的主題，開(kāi)展了一次深度的大語(yǔ)言模型的測(cè)評(píng)。開(kāi)放夜現(xiàn)場(chǎng)測(cè)評(píng)了十幾個(gè)國(guó)內(nèi)外大語(yǔ)言模型，測(cè)評(píng)角度從邏輯、數(shù)學(xué)、翻譯、倫理等方面，深入探討和體驗(yàn)了這些大語(yǔ)言模型的實(shí)際效能。

測(cè)評(píng)的大語(yǔ)言模型：

1.Kimi 智能助手：由月之暗面科技有限公司開(kāi)發(fā)的先進(jìn)AI。

2.智譜清言：由智言科技開(kāi)發(fā)的大語(yǔ)言模型，以深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù)見(jiàn)長(zhǎng)。

3.訊飛星火：科大訊飛推出的創(chuàng)新語(yǔ)言模型。

4.文心一言：百度的前沿語(yǔ)言模型，致力于理解和生成自然語(yǔ)言。

5.豆包：專(zhuān)注于提供個(gè)性化的智能對(duì)話(huà)服務(wù)。

6.通義千問(wèn)：以廣泛的知識(shí)庫(kù)和靈活的對(duì)話(huà)能力著稱(chēng)。

7.海螺AI：新興的語(yǔ)言模型，擅長(zhǎng)處理復(fù)雜的語(yǔ)言任務(wù)。

8.騰訊混元助手：騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開(kāi)發(fā)的大語(yǔ)言模型。

10.ChatGPT：由OpenAI開(kāi)發(fā)，國(guó)際上廣受認(rèn)可的更大規(guī)模、功能更全面的語(yǔ)言模型。

11.Claude：Anthropic開(kāi)發(fā)的先進(jìn)語(yǔ)言模型，注重安全性和可靠性。

12.groq：以其專(zhuān)為AI設(shè)計(jì)的硬件加速器而聞名。

13.Gemini: OpenAI 開(kāi)發(fā)的較小規(guī)模的語(yǔ)言模型，旨在提供更高效的計(jì)算和資源利用。

14.Mixtral：開(kāi)源人工智能初創(chuàng)公司 Mistral AI 開(kāi)發(fā)的超越GPT-3.5的AI模型

測(cè)評(píng)問(wèn)題一: 雞兔同籠的數(shù)學(xué)問(wèn)題

雞兔同籠是一個(gè)經(jīng)典的數(shù)學(xué)問(wèn)題，通過(guò)觀察雞兔的頭和腳的數(shù)量關(guān)系，可以利用代數(shù)方程來(lái)解決問(wèn)題，從而確定籠子里雞和兔子的數(shù)量。這個(gè)問(wèn)題常常展示了代數(shù)方程組的應(yīng)用。

針對(duì)雞兔同籠的問(wèn)題，除了Gemini Pro沒(méi)有得出正確的結(jié)果，其余的大語(yǔ)言模型都可以給出正確結(jié)果。

測(cè)評(píng)問(wèn)題二：翻譯（詩(shī)句中翻英）

詩(shī)人馬致遠(yuǎn)的詩(shī)句“斷腸人在天涯”，描寫(xiě)了“夕陽(yáng)向西緩緩落下，只有孤獨(dú)的旅人漂泊在遙遠(yuǎn)的地方。”詩(shī)句的翻譯涉及到文化差異和詩(shī)人獨(dú)特情感。Mixtral 的語(yǔ)言模型正確的解釋了詩(shī)句本身的含義，幫助翻譯者很好地理解這句詩(shī)句。 Claude的語(yǔ)言模型對(duì)于詩(shī)句的本身理解是不正確的。

這句詩(shī)翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見(jiàn)，大語(yǔ)言模型可以幫助翻譯者分析這句詩(shī)基本的意思，但是涉及文化層面的深層含義，還是做不到意譯的。

開(kāi)放夜也探討了如下涉及生活、工作的一些問(wèn)題，比如：

過(guò)年福字要倒著貼，那為什么不直接生產(chǎn)倒過(guò)來(lái)的福字呢?

收到公司的裁員通知郵件，你應(yīng)該怎么回復(fù)郵件來(lái)保住工作?

一個(gè)烏龜?shù)暨M(jìn)了井里，井里有30米深。烏龜白天爬3米，晚上滑下2米。問(wèn)這只烏龜需要多長(zhǎng)時(shí)間才能爬出井口?

DFRobot AIGC小組主理人夏青在開(kāi)放夜的現(xiàn)場(chǎng)測(cè)評(píng)了十幾個(gè)國(guó)內(nèi)外大語(yǔ)言模型，通過(guò)多維度問(wèn)題的測(cè)評(píng)，他認(rèn)為：對(duì)于處理綜合性問(wèn)題，OpenAI的ChatGPT 4.0邏輯清楚，能提供非常有用的信息。盡管在回答一些較為復(fù)雜的問(wèn)題上略顯不足，但在大多數(shù)場(chǎng)合下，其性能仍然令人滿(mǎn)意。然而，ChatGPT 4.0在國(guó)內(nèi)的使用成本是一個(gè)不容忽視的問(wèn)題，不僅涉及訂閱費(fèi)用，也包括使用的技術(shù)門(mén)檻。

與此同時(shí)，Gemini和Claude等海外語(yǔ)言模型，盡管在遵循指令方面略顯不足，但已達(dá)到了實(shí)用水平。令人驚喜的是，國(guó)內(nèi)的Qwen1.5 72b開(kāi)源模型在中文理解和特定任務(wù)，幾乎能與ChatGPT4.0匹敵此外，其他開(kāi)源模型如Mixtral和新發(fā)布的LLaMA3雖在邏輯性上略遜于商業(yè)模型如ChatGPT，但總體表現(xiàn)已超越了ChatGPT 3.5。

綜合分析來(lái)看，盡管ChatGPT 4.0仍然是目前市場(chǎng)上最優(yōu)秀的大語(yǔ)言模型，但不可忽視的是，無(wú)論是國(guó)際市場(chǎng)還是國(guó)內(nèi)市場(chǎng)，其他廠(chǎng)商的模型均顯示出迅速的進(jìn)步。開(kāi)源模型的崛起也證明了開(kāi)源社區(qū)在AI時(shí)代的巨大潛力。當(dāng)前的大語(yǔ)言模型在處理理性問(wèn)題方面表現(xiàn)一致，但通常無(wú)法提供情緒價(jià)值回應(yīng)。例如，一些國(guó)內(nèi)模型如“豆包”將展現(xiàn)其在情緒回應(yīng)方面的潛力。這種能力的發(fā)展可能為未來(lái)陪伴型機(jī)器人的商業(yè)模型提供新的方向。

蘑菇云創(chuàng)客空間

蘑菇云創(chuàng)客空間是上海浦東的一家創(chuàng)客空間,是科技部授牌的首批國(guó)家級(jí)創(chuàng)客空間,由浦軟孵化器提供場(chǎng)地支持、上海智位機(jī)器人提供硬件及技術(shù)支持的一家為創(chuàng)客服務(wù)的開(kāi)放式創(chuàng)客空間。擁有獨(dú)立的加工室、公共協(xié)作區(qū)域以及儲(chǔ)物、耗材商店,為硬件愛(ài)好者、程序員、設(shè)計(jì)師、DIY 發(fā)燒友等各類(lèi)創(chuàng)客,甚至包括進(jìn)行創(chuàng)新研發(fā)的科創(chuàng)團(tuán)隊(duì)提供一個(gè)開(kāi)放式的社區(qū)化會(huì)員空間。

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型，哪家更適合您？

相關(guān)文章

未來(lái)5年，中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

H20芯片開(kāi)賣(mài)即叫停，英偉達(dá)如何解圍？

真正的「國(guó)產(chǎn)英偉達(dá)」來(lái)了

AI視頻生成賽道“分野”：小廠(chǎng)重產(chǎn)品，大廠(chǎng)重生態(tài)

數(shù)據(jù)庫(kù)進(jìn)入“內(nèi)存自由”時(shí)代！阿里云PolarDB發(fā)布全球首個(gè)CXL數(shù)據(jù)庫(kù)服務(wù)器

為AI時(shí)代云服務(wù)器量身定制阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

阿里云重磅發(fā)布AI安全護(hù)欄五項(xiàng)安全能力護(hù)航AI安全

魔搭社區(qū)國(guó)際版上線(xiàn)，并發(fā)布科學(xué)智能專(zhuān)區(qū)與AIGC創(chuàng)作引擎

七連發(fā)！阿里多款重磅發(fā)布亮相云棲大會(huì)

阿里云擴(kuò)建全球基礎(chǔ)設(shè)施，將新增巴西、法國(guó)和荷蘭數(shù)據(jù)中心

熱門(mén)排行

編輯推薦

ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型，哪家更適合您？

相關(guān)文章

熱門(mén)排行

編輯推薦

ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型，哪家更適合您？