用戶投出來的大模型榜單-GPT4o、訊飛星火位居前列

每日快訊

2024

08/02

16:02

評論

從去年的“百模大戰(zhàn)”到今年的“優(yōu)勝劣汰”，AI大模型賽道呈現(xiàn)賽馬機制，不少國產(chǎn)大模型以GPT-4o為標桿快速迭代，在核心能力上持續(xù)趕超。近期，由國內(nèi)權(quán)威大模型評估平臺OpenCompass（司南）公布的CompassArena周榜上，科大訊飛星火大模型連續(xù)三周位列前三，兩次摘得第二桂冠。由于榜單采用專業(yè)用戶投票方式，結(jié)合了用戶對各款大模型的真實體驗，更具客觀性和說服力，含金量十足。

微信截圖_20240802113719副本

OpenCompass（司南）是由上海人工智能實驗室發(fā)布的開源大模型評測體系，目前已成為業(yè)界權(quán)威的大模型評估平臺，涵蓋學(xué)科、語言、知識、理解、推理等評測維度，可全面評估大模型的綜合能力。在最新三期專業(yè)用戶投票的周榜評選中，訊飛星火以Elo-1078和Elo-1081位居前三，榜單前四強還出現(xiàn)阿里通義千問和百度文心一言的身影，它們共同組成了國產(chǎn)大模型的第一梯隊，不斷向榜單第一名的GPT-4o發(fā)起挑戰(zhàn)。

配圖 (1)

根據(jù)CompassArena榜單排名規(guī)則，平臺會利用Bradley-Terry模型，基于歷史匿名對戰(zhàn)數(shù)據(jù)評估大模型競技場Elo的等級分數(shù)，并使用該分數(shù)對大模型進行排名。最終數(shù)據(jù)可以公正、開放、透明的反映當前各家大模型產(chǎn)品的綜合實力。

作為明確提出對標OpenAI的國內(nèi)大模型公司，科大訊飛在今年6月27日發(fā)布的星火V4.0版本上，已完成了對GPT-4 Turbo的整體超越。根據(jù)八個國際主流測試集的橫向評測，訊飛星火V4.0排名第一，在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力等方面完成了整體超越。這些測試集既有HumanEval、WinoGrande、GPQA等英文評測，也有C-Eval、CMMLU等中文評測，充分展現(xiàn)了訊飛星火的全方位實力。

此前，訊飛星火還在國際權(quán)威的《麻省理工科技評論》橫評中脫穎而出，憑借領(lǐng)先的語言能力、數(shù)學(xué)、理綜等多項核心能力，超越了同期的其它國產(chǎn)大模型選手，并以1013分的總分斬獲國產(chǎn)主流大模型榜首席位。該機構(gòu)還認為，訊飛星火在工作提效方面具有明顯優(yōu)勢，是一款優(yōu)秀的提效類工具。

目前，訊飛星火憑借領(lǐng)先技術(shù)優(yōu)勢和出色的體驗，持續(xù)領(lǐng)跑國內(nèi)大模型第一梯隊。根據(jù)訊飛星火V4.0發(fā)布會上公布的數(shù)據(jù)，其安卓端APP的累計下載量已經(jīng)高達1.31億次，位列國內(nèi)工具類通用大模型APP第一。更有大量圍繞日常工作、生活與學(xué)習(xí)的實用助手“源源不斷”地涌現(xiàn)，持續(xù)幫助用戶解放生產(chǎn)力，釋放想象力。

歷經(jīng)一年多迭代，訊飛星火快速成長為國內(nèi)領(lǐng)先的大模型，對標GPT-4o的下一代版本也在研發(fā)中。隨著核心能力的持續(xù)升級，訊飛星火不僅將穩(wěn)居國產(chǎn)大模型第一梯隊，更有機會成為國產(chǎn)大模型的代表去對戰(zhàn)GPT-4o。

THE END

廣告、內(nèi)容合作請點擊這里尋求合作

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；旨在傳遞信息，不代表砍柴網(wǎng)的觀點和立場。

男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

用戶投出來的大模型榜單-GPT4o、訊飛星火位居前列

相關(guān)熱點

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產(chǎn) Apple Car 汽車電池

關(guān)注我們

男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

用戶投出來的大模型榜單-GPT4o、訊飛星火位居前列

相關(guān)熱點

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產(chǎn) Apple Car 汽車電池

關(guān)注我們

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！