史上最卷 12 月：全球 15 家 Top 級(jí) AI 公司瘋狂上新

創(chuàng)投圈

2024

12/16

17:39

評(píng)論

2024 年的最后一個(gè)月，全球 AI 圈好像約好了，一起開(kāi)啟年底狂卷模式，批量發(fā)布新品。

據(jù) " 四木相對(duì)論 " 統(tǒng)計(jì)，這場(chǎng)年末上新的 " 戰(zhàn)局 "，至少有 15 家全球 Top 級(jí) AI 公司參與，上新了 20+ 個(gè)功能。

在海外，最受關(guān)注的無(wú)疑是 OpenAI 開(kāi)啟 12 天大放送，期貨 Sora 終于兌現(xiàn)。

差不多同期，Google、xAI、World Labs、Meta、Amazon、Pika、Runway 等海外名企也都上新了 AI 功能。

國(guó)內(nèi)的 12 月，大廠、六小虎和 AI 鯰魚(yú) DeepSeek，無(wú)一不踏入戰(zhàn)局。

" 卷王 " 字節(jié)首當(dāng)其沖。它在豆包和即夢(mèng)中上新了圖像理解能力。

六小虎中的 MiniMax、階躍星辰、智譜 AI，有的卷模型，有的卷 Agent 應(yīng)用。Deepseek 和騰訊直接上新并開(kāi)源了模型。

整體來(lái)看，各大公司近期的更新呈現(xiàn)以下特點(diǎn)：

視覺(jué)能力和生產(chǎn)力場(chǎng)景是兩大主題；

80% 以上的更新都圍繞 " 視覺(jué) "；

可協(xié)作、可編輯是產(chǎn)品層更新的方向；

解析理解能力依舊是模型層的重點(diǎn)。

但卷歸卷，不少產(chǎn)品也出于缺乏曝光等因素，發(fā)布得 " 悄無(wú)聲息 "。

還有些萬(wàn)眾期待的產(chǎn)品，比如 Sora，收獲了滿(mǎn)屏差評(píng)。

在這個(gè)轟轟烈烈的 12 月，目前你記住了誰(shuí)？

海外：OpenAI 擠牙膏，其他家無(wú)人 care？

在這個(gè) 12 月，已經(jīng)加入 AI 上新戰(zhàn)局的海外公司至少有 OpenAI、Google、xAI、Meta、Amazon、Pika ……

" 營(yíng)銷(xiāo)專(zhuān)家 "OpenAI 的聲勢(shì)最大。

12 月 6 日，它拉開(kāi)了 " 雙十二 " 的陣仗，要連做十二場(chǎng)發(fā)布會(huì)。

目前日程已經(jīng)進(jìn)入到第七天，發(fā)布成果如下：

Day1：發(fā)布 o1 正式版以及 o1 Pro 版本，以及 200 美金的 ChatGPT Pro 會(huì)員。

Day2：介紹強(qiáng)化微調(diào)（Reinforcement Finetuning）功能，即通過(guò)少量數(shù)據(jù)讓模型在專(zhuān)業(yè)領(lǐng)域到達(dá)專(zhuān)家水平。

Day3：Sora 登場(chǎng)，接入了新模型 Sora Turbo 的 Sora，最高上限支持生成 1080p、20 秒視頻，支持橫屏豎屏各種常見(jiàn)尺寸。

Day4：發(fā)布生產(chǎn)力工具 Canvas，該功能允許用戶(hù)與 ChatGPT 合作寫(xiě)作和編碼。

Day5：ChatGPT 融入蘋(píng)果生態(tài)。

Day6：三個(gè)功能發(fā)布：實(shí)時(shí)視頻通話(huà)、實(shí)時(shí)理解屏幕、圣誕老人限定語(yǔ)音。

Day7：推出了 Projects In ChatGPT 功能，可以將 ChatGPT 的各種功能整合至一處，便于用戶(hù)創(chuàng)建并管理各類(lèi)項(xiàng)目。

不僅是 OpenAI，Google、Pika、Midjourney、xAI 也在這周有了新動(dòng)作。

12 月 14 日，Pika 上新模型 2.0，引入場(chǎng)景元素（Scene Ingredients）功能。

這一功能允許用戶(hù)自由選擇角色、物品、服裝和場(chǎng)景元素，根據(jù)需求構(gòu)建特點(diǎn)鏡頭。同時(shí)， Pika 2.0 支持多人在同一畫(huà)布上協(xié)作。

12 月 12 日凌晨，谷歌發(fā)布了 Gemini2.0，聲稱(chēng)"Gemini2.0 是我們迄今為止最新、功能最強(qiáng)大的 AI 模型。"

這一模型可以支持圖片、視頻和音頻等多模態(tài)的輸入和輸出，速度也是 1.5Pro 的兩倍，還能直接調(diào)用 Google Search、代碼執(zhí)行等工具。

在 Gemini2.0 架構(gòu)之上，谷歌還推出或升級(jí)了三個(gè)新的 AI Agent 原型：通用大模型助手 Project Astra、瀏覽器助手 Project Mariner、編程助手 Jules。

不過(guò)，Gemini2.0 的聲量相較于 Sora 小得多。

幾乎在官宣之后不到半小時(shí)，Gemini 2.0 詞條的熱度在 Twitter 上就已經(jīng)掉到了第 8。在不斷下降的過(guò)程中，網(wǎng)友們還在分享 Sora 的鬼畜視頻，以及 Hunyuan、Hailuo、Kling 與 Sora 的能力對(duì)比。

這可能也是因?yàn)?Gemini 2.0 的更新雖然好評(píng)很多，但從表述上看起來(lái)很 " 常規(guī) "：更快速的響應(yīng)、支持聯(lián)網(wǎng)搜索、新上線(xiàn)的 " 深度研究 " 功能支持多輪復(fù)雜推理、代碼生成增強(qiáng)、第三方工具調(diào)用能力補(bǔ)充。

同一天，Midjourney 官宣了 patchwork 功能更新。

這是一個(gè)允許多人在線(xiàn)共同創(chuàng)建出一個(gè)世界的實(shí)驗(yàn)性功能，所有參與者將在一塊白板畫(huà)布上共同創(chuàng)作（有點(diǎn)像 Canva 和 Figma 的共同編輯）。

而且畫(huà)布還給每個(gè)用戶(hù)的世界創(chuàng)建了一個(gè)傳送門(mén)，可以連接到別人的世界中。

之前 Midjourney 的更新基本都圍繞著圖片生成的能力，比如支持 AI 修圖、支持新畫(huà)風(fēng)的模型等等。

但這次的 Patchwork 讓 MJ 在玩法上有了大不同，從一個(gè)只能一個(gè)人用的圖片生成工具，變成了一個(gè)可以讓大家一起玩起來(lái)的 AI 藝術(shù)創(chuàng)作產(chǎn)品。

手握巨卡的 xAI，同樣在卷視覺(jué)方向。

12 月 10 日，xAI 發(fā)布了首款完全自研圖像生成模型 Aurora。

Aurora 已經(jīng)直接集成到了 Grok 中，這是一個(gè)自回歸混合專(zhuān)家模型（MoE），在混合文本和圖像數(shù)據(jù)集上完成了訓(xùn)練。除了圖片生成，Grok 還有編輯能力，用戶(hù)可以直接在生成的圖像上進(jìn)行修改，這一功能也將上線(xiàn) X。

Meta 也在 12 月 7 日發(fā)布了 Llama 3.3，在性能上開(kāi)卷。據(jù)說(shuō)現(xiàn)在 70B 的版本就能實(shí)現(xiàn)以前 405B 的性能。

它在指令遵循（IFEval）、數(shù)學(xué)（MATH）、推理（GPQA Diamond）等領(lǐng)域的水平都超過(guò)了七月份發(fā)布的 Llama 3.1 405B。在語(yǔ)言（MMLU）、代碼（HumanEval）、長(zhǎng)文本和多語(yǔ)種能力上，它的成績(jī)也和 Llama 3.1 405B 比較接近。

官方將 Llama 3.3 的進(jìn)步歸功于新的對(duì)齊過(guò)程和在線(xiàn)強(qiáng)化學(xué)習(xí)技術(shù)的進(jìn)步。

Runway 則在前一天，也就是 12 月 6 日更新了自己的 act-one 功能。這個(gè)新功能允許用戶(hù)將自己拍攝的表演動(dòng)作或聲音直接 " 套用 " 到已有的視頻角色上（包括 AI 角色）。

在 12 月最早打響發(fā)布 " 競(jìng)賽 " 的其實(shí)是 "AI 教母 " 李飛飛。

12 月 3 日，李飛飛創(chuàng)立的 World Labs 首次官宣了 " 空間智能 " 模型，利用一張圖就能生成一個(gè) 3D 世界。

這些 3D 場(chǎng)景都能在瀏覽器中實(shí)時(shí)渲染，還能實(shí)現(xiàn)可控的相機(jī)效果，可調(diào)節(jié)的模擬景深。

也是在同一天，亞馬遜對(duì)外發(fā)布了多模態(tài)模型 Nova 系列。

亞馬遜這次直接發(fā)了一個(gè)大號(hào)全家桶，包括：超快速文本生成模型 Amazon Nova Micro，能夠處理文本、圖像和視頻并生成文本的多模態(tài)模型 Amazon Nova Lite、Amazon Nova Pro 和 Amazon Nova Premier，用于生成高質(zhì)量圖像的 Amazon Nova Canvas 和用于生成高質(zhì)量視頻的 Amazon Nova Reel。

不管這一波海外的年底上新如何轟轟烈烈，看起來(lái)，很多人只關(guān)注了 Sora。

好吧，OpenAI 的營(yíng)銷(xiāo)又贏了。

國(guó)內(nèi)：六小虎大廠混戰(zhàn)視覺(jué)

相比海外，國(guó)內(nèi)廠商們的 " 卷 " 勢(shì)更早出現(xiàn)。各家的方向從模型卷到產(chǎn)品，離不開(kāi)視覺(jué)和生產(chǎn)力兩個(gè)話(huà)題。

" 四木相對(duì)論 " 也對(duì)近半個(gè)月的新品進(jìn)行了匯總：

在大公司里，字節(jié)和騰訊是 12 月最卷的大廠（通義千問(wèn)在 11 月 28 日發(fā)布了 QWQ 模型）。

在這個(gè) 12 月，前者在豆包和即夢(mèng)上先后更新功能，后者一下子開(kāi)源了視頻生成模型。

先看字節(jié)。

12 月 10 日，豆包官方表示，電腦版的視頻生成功能已經(jīng)開(kāi)啟內(nèi)測(cè)。

獲得內(nèi)測(cè)資格的賬號(hào)每日可免費(fèi)生成十支視頻。內(nèi)測(cè)申請(qǐng)通過(guò)后，選擇 " 視頻生成 " 功能，上傳一張圖片，輸入提示詞，并添加運(yùn)鏡、分鏡信息，就能生成短視頻。

再往前的 12 月 5 日，豆包增加了 AI 生成文字圖功能。也就是說(shuō)，用戶(hù)現(xiàn)在可以在提示詞中加入文本要求，生成帶有指定文字的圖片，做海報(bào)、做表情包都能用。

（四木用豆包做的圖，強(qiáng)調(diào)了 " 四木廚房 "）

類(lèi)似的功能還體現(xiàn)在即夢(mèng)上。

12 月 2 日晚，即夢(mèng)上新 2.1 模型。這次的模型突破體現(xiàn)在中文文字可以穩(wěn)定生成，當(dāng)然也支持英文。

騰訊混元這個(gè)月最大的動(dòng)作，就是正式上線(xiàn)視頻生成能力。

12 月 3 日，騰訊不僅上線(xiàn)了這個(gè) 130 億參數(shù)的模型，還把它開(kāi)源了。

目前，模型已上線(xiàn)騰訊元寶 APP，用戶(hù)可在 AI 應(yīng)用中的 "AI 視頻 " 板塊申請(qǐng)?jiān)囉谩Ｆ髽I(yè)客戶(hù)通過(guò)騰訊云提供服務(wù)接入，API 同步開(kāi)放內(nèi)測(cè)申請(qǐng)。

" 四木相對(duì)論 " 觀察到，騰訊混元系列模型在這兩個(gè)月動(dòng)作比較頻繁。

11 月初，它宣布最新的 MoE 模型 " 混元 Large" 以及混元 3D 生成大模型 "Hunyuan3D-1.0" 正式開(kāi)源。12 月又上新文生視頻能力，正式加入了卷視頻模型的隊(duì)列。

大廠之外，大模型六小虎中的三虎——智譜 AI、MiniMax 和階躍星辰也在本月上新。

先來(lái)看智譜。

12 月的智譜在模型和應(yīng)用兩端發(fā)力。首先是多模態(tài)模型—— GLM-4V-Flash 上線(xiàn)了智譜的開(kāi)放平臺(tái)，可以免費(fèi)調(diào)用。

GLM-4V-Flash 模型擁有圖像描述生成、圖像分類(lèi)、視覺(jué)推理、視覺(jué)問(wèn)答（VQA）以及圖像情感分析等圖像處理功能。

多模態(tài) / 視覺(jué)類(lèi)的 API 都非常貴，號(hào)稱(chēng)視覺(jué)能力對(duì)標(biāo) GPT-4o mini 模型的 GLM-4V-FlashAPI 免費(fèi)，也稱(chēng)得上是真卷。

產(chǎn)品方面，Auto-GLM 是智譜近期的重點(diǎn)。

首先智譜在 11 月 29 日發(fā)布了 Auto-GLM 的手機(jī)版和電腦版。半個(gè)月之后的 12 月 12 日，Auto-GLM 又更新了一個(gè)版本。

用戶(hù)打開(kāi) AutoGLM 后，可以通過(guò)語(yǔ)音發(fā)指令，讓智能體接管自己的手機(jī)，并在可操作的 App 上自動(dòng)執(zhí)行購(gòu)買(mǎi)外賣(mài)，訂高鐵票、目的地導(dǎo)航等任務(wù)。

經(jīng)過(guò) " 四木相對(duì)論 " 測(cè)試，更新之后，Auto-GLM 支持的應(yīng)用更穩(wěn)定。同時(shí)它還增加了自定義高頻短口令，快速觸發(fā)常用任務(wù)等功能。

智譜 CEO 張鵬在發(fā)布會(huì)現(xiàn)場(chǎng)的 AI 發(fā)紅包操作一度刷屏，" 四木相對(duì)論 " 也復(fù)刻成功了。

Minimax 同樣在這個(gè)月卷起了多模態(tài)。

12 月 3 日，海螺 AI 圖生視頻模型 I2V-01-Live 上線(xiàn)了。

視頻生成一定是 MiniMax 今年的亮點(diǎn)之一。之前，MiniMax 的亮點(diǎn)幾乎全部集中于 Talkie，但海螺視頻的上線(xiàn)打破了這一印象。

這次的 I2V-01-Live 更新了二維插畫(huà)的動(dòng)態(tài)呈現(xiàn)方式，讓動(dòng)畫(huà)穩(wěn)定性和細(xì)膩表現(xiàn)力有了增強(qiáng)。一張圖 + 一句話(huà)就能將 2D 插畫(huà)轉(zhuǎn)化為動(dòng)態(tài)視頻。

一直略顯低調(diào)的另一只小虎階躍星辰也有模型層的更新。

周五（12 月 13 日）階躍星辰發(fā)布了端到端語(yǔ)音大模型—— Step-1o 。

從官方介紹來(lái)看，Step-1o 支持語(yǔ)音、文本等混合形式的輸入和輸出，能理解和模仿音色、韻律、方言、個(gè)性化的口語(yǔ)表達(dá)習(xí)慣等聲音特征。它還能夠通過(guò)自學(xué)和模仿不斷提升回復(fù)質(zhì)量，提供解決問(wèn)題的專(zhuān)業(yè)建議。

從場(chǎng)景上看，它支持包括新聞播報(bào)、聊天陪伴、有聲讀物、在線(xiàn)教育、智能硬件、汽車(chē)等語(yǔ)音交互技術(shù)需求。

近期，Step-1o 還將接入躍問(wèn) App 端，實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音通話(huà)服務(wù)。

國(guó)內(nèi) AI 圈另一無(wú)法忽視的角色—— DeepSeek，在短短半月內(nèi)進(jìn)行了兩次上新。

最新開(kāi)源的 DeepSeek-VL2（12 月 13 日發(fā)布）是一個(gè)專(zhuān)家混合（MoE）語(yǔ)言模型。

DeepSeek-VL2 比一代 DeepSeek-VL 多一倍優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)，引入梗圖理解、視覺(jué)定位、視覺(jué)故事生成等新能力。視覺(jué)部分使用切圖策略支持動(dòng)態(tài)分辨率圖像，語(yǔ)言部分采用 MoE 架構(gòu)低成本高性能。

這次，大模型價(jià)格 " 卷王 " 更是在視覺(jué)模型上開(kāi) " 卷 "。

根據(jù) DeepSeek 提供的評(píng)測(cè)對(duì)比，DeepSeek-VL2 在相似或更少的激活參數(shù)下實(shí)現(xiàn)了最先進(jìn)的性能。

另外，DeepSeek V2.5 系列的最終版微調(diào)模型—— DeepSeek-V2.5-1210 也在 2 月 10 日更新。

據(jù)官網(wǎng)介紹，這次更新通過(guò) Post-Training 全面提升了模型各方面能力表現(xiàn)，包括數(shù)學(xué)、代碼、寫(xiě)作、角色扮演等。同時(shí)，新版模型優(yōu)化了文件上傳功能，并且全新支持了聯(lián)網(wǎng)搜索，可以服務(wù)各類(lèi)工作生活場(chǎng)景。

不同于某些 AI 公司只強(qiáng)調(diào)功能或者模型的偏好，這次 DeepSeekV2.5-1210 模型更新后，它的 Chat 窗口呈現(xiàn)出兩個(gè) Tag —— " 深度思考 " 和 " 聯(lián)網(wǎng)搜索 "。

這似乎在告訴外界：產(chǎn)品日常場(chǎng)景和模型推理能力我全都要。真的是卷王了。

12 月才剛剛過(guò)半，接下來(lái)，AI 圈的上新還會(huì)繼續(xù)。

畢竟，OpenAI 的年末發(fā)布剛剛走過(guò)一半。字節(jié)也會(huì)在下周舉行大會(huì)，強(qiáng)調(diào)豆包、即夢(mèng)的更新。

最卷 12 月，AI 永不眠。

來(lái)源：四木相對(duì)論

THE END

廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里尋求合作

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；旨在傳遞信息，不代表砍柴網(wǎng)的觀點(diǎn)和立場(chǎng)。

男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

史上最卷 12 月：全球 15 家 Top 級(jí) AI 公司瘋狂上新

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬(wàn)塊”

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒(méi)跑了！

iPhone 13機(jī)模曝光：值得等！

蘋(píng)果計(jì)劃在美國(guó)生產(chǎn) Apple Car 汽車(chē)電池

關(guān)注我們

男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

史上最卷 12 月：全球 15 家 Top 級(jí) AI 公司瘋狂上新

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬(wàn)塊”

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒(méi)跑了！

iPhone 13機(jī)模曝光：值得等！

蘋(píng)果計(jì)劃在美國(guó)生產(chǎn) Apple Car 汽車(chē)電池

關(guān)注我們

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒(méi)跑了！

iPhone 13機(jī)模曝光：值得等！