通信界訊 近日,擁有清華系研發(fā)創(chuàng)始團隊的面壁智能開源發(fā)布了端側旗艦大模型MiniCPM,顯著特點有三,以小博大,在最接近用戶體感的 MT-Bentch 上,表現(xiàn)優(yōu)異;其次,部署多模態(tài)能力,能說會看,還具備編程能力;其三,高效且部署成本低。
網易科技獲悉,面壁智能成立于2022年8月,深耕通用 AI 領域,專注大模型技術創(chuàng)新與應用轉化。目前,公司正在構建 Al Agent 智能體協(xié)作平臺以充分釋放大模型高效生產力。
此次發(fā)布的端側旗艦大模型MiniCPM就是團隊在助力通往AGI道路上的重要一步,目前,眾多主流手機、PC 與汽車品牌相繼宣告接入大模型,端側模型則是云端協(xié)同的關鍵一環(huán)。

據(jù)介紹,Mistral-7B 是“以小博大”的標桿模型。相比而言,面壁 MiniCPM 以2B 的參數(shù)規(guī)模、1T tokens,中英文平均成績超越 Mistral-7B,表現(xiàn)優(yōu)異。
與此同時,在同等規(guī)模模型中,面壁 MiniCPM 取得主流榜單的大幅領先成績,相比 Llama2-13B、甚至40B 量級的大個子,也在代碼、邏輯能力等重要榜單上毫不遜色。
演示中,我們可以看到,語言能力方面,面壁 MiniCPM 可以把中英語言夾雜的句子翻譯成法語。

他還能準確地進行知識問答,譬如準確答出山東最高山是泰山,還知道它和黃山的準確海拔,并計算出差值。

此外,可以為你言語中的情感流露配上可愛小表情,也能對人物性格進行活靈活現(xiàn)的演繹。

MiniCPM 還能夠寫出一串「復刻自己」的代碼片段。

具體在部署方面,面壁 MiniCPM 可以支持 CPU 推理,降低模型推理成本。同時發(fā)布的量化版本,可以做到壓縮75%,性能基本無損。
面壁智能 CEO 李大海以現(xiàn)場演示所使用手機為例,做了一道數(shù)學題。驍龍855芯片,成本約600元人民幣,按照運行5年計算,每秒7.5 tokens,那么170萬 tokens 的推理成本是人民幣1元。低成本端側推理之外,僅需一臺電腦、一張顯卡就能完成對 MiniCPM 的 SFT。
據(jù)了解,團隊還對 iOS,、Android 和 Harmony 等操作系統(tǒng)進行了模型適配。目前,MiniCPM 已跑通了國際主流手機品牌和終端 CPU 芯片。
值得一提的是,面壁還一并開源了一個12B 多模態(tài)模型 OmniLMM,并取得 Object HalBench 榜單第一,在 MMHal-Bench 僅次于 GPT-4。
李大海表示,這是面壁“大模型+Agent ”雙引擎戰(zhàn)略的關鍵一步,從智能發(fā)展而言,我們堅定認為智能體化是未來邁向通用智能的必由之路,而智能體必然要在端側服務用戶,我們接下來會進一步探索 Agent +云端協(xié)同的工作機制,實現(xiàn)智能賦能萬物。
面壁智能聯(lián)合創(chuàng)始人、清華大學副教授劉知遠認為:從技術研判而言,2023年 ChatGPT 和 GPT-4的推出,表明大模型技術路線已經基本確定。
“接下來就是要探索其科學機理,并極致地優(yōu)化效率,我們這次推出端側大模型,也是向大家分享一個2B 級別大模型所能達到的性能機制,讓大家認識到即使2B 尺寸大模型的效果極限還沒有被充分挖掘出來,這是一個科學問題也是一個技術問題,需要大家共同探索!