凱發(fā)K8最新官方app下載最新全球模型榜單:阿里 Qwen25-Max超DeepSeek V3當(dāng)?shù)貢r間2月4日,在全球知名的AI模型評測平臺Chatbot Arena公布了最新一期的榜單。其中,阿里通義千問團隊的最新大語言模型Qwen2.5-Ma取得了優(yōu)異成績,在總體排名中躋身第7,領(lǐng)先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等頂級專有大語言模型。
分別看打分項,Qwen2.5-Max在技術(shù)領(lǐng)域表現(xiàn)尤為出色,在數(shù)學(xué)和編程方面排名第一,在處理復(fù)雜任務(wù)的硬提示(hard prompts)方面排名第二。
過去一年,阿里不斷擴展Qwen模型家族,推出了涵蓋文本、音頻和視覺格式的多種規(guī)模模型,以滿足全球開發(fā)者和客戶日益增長的AI需求。
1月29日凌晨,凱發(fā)K8最新官方app下載阿里通義千問團隊悄悄上線-Max,該模型一經(jīng)發(fā)布便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主要基準(zhǔn)測試中取得領(lǐng)先成績,展現(xiàn)出與全球頂級模型比肩的性能。
據(jù)介紹,最新的Qwen2.5-Max采用了先進的專家混合(MoE)模型架構(gòu),預(yù)訓(xùn)練數(shù)據(jù)量超過20萬億個token,運用監(jiān)督微調(diào)(SFT)和人類反饋強化學(xué)習(xí)(RLHF)技術(shù)進行優(yōu)化,在知識、編程、通用能力和人類對齊等方面表現(xiàn)優(yōu)異。
目前,全球開發(fā)者和企業(yè)可通過阿里云的生成式AI開發(fā)平臺Model Studio訪問Qwen2.5-Max。
,此前過度聚焦DeepSeek,卻忽視了包括阿里通義在內(nèi)的中國AI整體性追趕。行業(yè)媒體《信息平權(quán)》表示,若阿里Qwen-2.5-max這次的確性能超過V3,可以對其RL推理模型給予更大期待。
有網(wǎng)友生動地概括,Qwen2.5-Max相當(dāng)于“中文版的ChatGPT”,但水平要比后者“高得多”。
有用戶表示,Qwen2.5-Max“重新定義”了視頻生成功能,已經(jīng)超過OpenAI的Sora。
還有網(wǎng)友制作梗圖,猜測繼DeepSeek-R1后,這款來自中國的強大AI模型將進一步加劇OpenAI的擔(dān)憂。