界面新聞記者 | 宋佳楠
自去年6月對旗下全模型矩陣進行降價后,“清華系”智譜AI再次調(diào)整API接口價格。
4月24日,智譜BigModel開放平臺宣布,其GLM-4-FlashX模型,每億tokens僅10元;GLM-Z1-Air,每億tokens50元;GLM-Z1-AirX,每億tokens為500元。
此外,即日起,GLM-4-Plus降價90%,從50元/百萬Tokens降至5元/百萬Tokens(相當于每億tokens 500元),較行業(yè)價格低92%。上述模型在代碼計算、數(shù)據(jù)分析、機器翻譯、內(nèi)容生成等領(lǐng)域,能滿足金融、互聯(lián)網(wǎng)、教育等多行業(yè)場景需求。
智譜BigModel開放平臺是新一代國產(chǎn)自主通用AI大模型開放平臺,由北京智譜華章科技有限公司開發(fā),其核心團隊來自清華大學計算機系。該平臺模型集成較為豐富,可提供多種API,例如智能體開發(fā)、模型API、Alltools API以及批處理API等。平臺也可根據(jù)不同企業(yè)需求,提供定制化的模型微調(diào)服務(wù)。
此次降幅最大的GLM-4-Plus是該公司推出的新一代基座大模型,其語言文本能力和GPT-4o、一定參數(shù)量的Llama 3.1等模型不相上下,可實現(xiàn)從單一文字模態(tài)到多模態(tài)交互的突破,應(yīng)用場景更廣泛。
作為對比,目前DeepSeek-V2 API定價為每百萬tokens輸入1 元、輸出2元。DeepSeek-V3的API服務(wù)價格為每百萬輸入tokens0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。智譜GLM-4-Plus的價格仍高于DeepSeek-V3緩存命中時的輸入價格,與DeepSeek-V2的輸入價格相比也較高。但在輸出方面,GLM-4-Plus未明確區(qū)分輸入輸出價格,整體有一定競爭力。
字節(jié)跳動的豆包大模型最強版本的主力模型推理輸入定價為0.0008元/千tokens,即每百萬tokens 0.08元,低于智譜GLM-4-Plus。
除智譜外,過去一年,阿里通義千問、豆包、騰訊混元、DeepSeek等均有過價格調(diào)整,反映出各大模型廠商競爭激烈,試圖通過降價來吸引用戶、提高競爭力。但同時,算法優(yōu)化、硬件性能提升以及數(shù)據(jù)資源的豐富,使得大模型的訓練和推理成本逐漸降低,為降價提供了空間。
下一步,隨著大模型技術(shù)持續(xù)普及化,有助于其在更多行業(yè)和領(lǐng)域得到廣泛應(yīng)用,也可能導(dǎo)致一些效率低下或資金不足的玩家被淘汰出局。
此前零一萬物創(chuàng)始人兼CEO李開復(fù)曾預(yù)測,中國市場最終可能只剩下DeepSeek、阿里和字節(jié)跳動三家主要的AI模型公司,其中DeepSeek目前勢頭最強。而在美國方面,馬斯克的xAI、OpenAI、谷歌和Anthropic四家公司將主導(dǎo)美國市場。