商湯大模型的進(jìn)化邏輯:認(rèn)知領(lǐng)先與能力領(lǐng)先帶來的復(fù)利效應(yīng)
1
進(jìn)化的商湯大模型
筆者在長(zhǎng)期的商業(yè)研究過程中發(fā)現(xiàn),企業(yè)競(jìng)爭(zhēng)不是比拼誰起步更早,而是比拼誰能走得更久、更遠(yuǎn)。
而要想走得久遠(yuǎn),最核心的根源便是企業(yè)的進(jìn)化能力,包括戰(zhàn)略、組織、品牌與產(chǎn)品等各個(gè)領(lǐng)域的進(jìn)化。其中,產(chǎn)品進(jìn)化最為關(guān)鍵,尤其在一些產(chǎn)業(yè)變化迅速的新興領(lǐng)域。
大模型便是這樣的一個(gè)典型領(lǐng)域。
隨著ChatGPT走紅帶來的大模型熱潮,短短數(shù)個(gè)月內(nèi),國(guó)內(nèi)便有近百家冠以“大模型”之名的企業(yè)出現(xiàn)。好的影響是,這股強(qiáng)大的力量將大大利于中國(guó)大模型產(chǎn)業(yè)的加速發(fā)展,但不好的影響是,這些企業(yè)中的大多數(shù)最終都無法逃脫被淘汰出局的宿命。接下來,產(chǎn)業(yè)內(nèi)將面臨一場(chǎng)空前激烈的競(jìng)爭(zhēng),誰的產(chǎn)品進(jìn)化更快,擁有更好的用戶體驗(yàn),誰才有可能“剩者為王”。
從目前來看,兼具實(shí)力與靈活性的商湯科技表現(xiàn)出了最強(qiáng)的進(jìn)化能力。就在前不久的2023世界人工智能大會(huì)(WAIC)上,商湯科技召開了“大愛無疆·日日新”人工智能論壇,在論壇上重磅推出了“商湯日日新SenseNova”大模型體系的全面升級(jí),以及該體系下的一系列產(chǎn)品更新和落地成果。
例如,商湯商量SenseChat 2.0版本是商湯大模型體系中最為引人矚目的千億級(jí)參數(shù)自然語言處理模型,其突破了大語言模型輸入長(zhǎng)度的限制,并推出了不同參數(shù)量級(jí)的模型版本,在知識(shí)信息準(zhǔn)確性、邏輯判斷能力、上下文理解能力、創(chuàng)作性等方面均有大幅提升,可完美適配移動(dòng)端、云端等不同終端及場(chǎng)景的應(yīng)用需求,部署成本也大大降低。目前,商湯商量SenseChat 2.0版本已落地服務(wù)于醫(yī)療、金融、移動(dòng)終端、代碼開發(fā)等領(lǐng)域。

商湯秒畫SenseMirage 3.0是商湯的自研生成式大模型,參數(shù)從今年4月首次發(fā)布以來的10億大幅提升至70億量級(jí),能夠?qū)崿F(xiàn)專業(yè)攝影級(jí)的圖片細(xì)節(jié)刻畫,有進(jìn)階需求的創(chuàng)作者,還可通過簡(jiǎn)單拖拽的方式快速完成模型微調(diào),打造個(gè)人專屬的生成式AI模型。

商湯如影SenseAvatar 2.0數(shù)字人生成平臺(tái)相較1.0版本的語音和口型流暢度提升30%以上,能夠?qū)崿F(xiàn)4K高清視頻效果,并帶來AIGC生成形象及數(shù)字人歌唱功能。

商湯瓊宇SenseSpace 2.0的空間重建效率提升20%,渲染性能提升50%,每100平方公里場(chǎng)景的建圖時(shí)間僅需38小時(shí)即可完成(1200 TFLOPS/秒算力支持),可更高效地應(yīng)用于城市級(jí)數(shù)字孿生場(chǎng)景。

商湯格物SenseThings 2.0對(duì)小物體的紋理及材質(zhì)還原達(dá)到毫米級(jí)精細(xì)度,并突破對(duì)高反光和鏡面物體的采集難題,這個(gè)突破讓“格物”能夠精確還原物品的外觀和特征,小到珠寶首飾、服飾、鞋包,大到家居裝飾、文物展覽、藝術(shù)展覽等,都能提供精細(xì)化的復(fù)刻效果。

從上述變化來看,商湯日日新(SenseNova)大模型體系的此次進(jìn)化絕非簡(jiǎn)單升級(jí),而是在多維度實(shí)現(xiàn)了重大突破。
另外,值得一提的是,此次升級(jí)進(jìn)化,距離“日日新”大模型4月10日的發(fā)布日期僅有3個(gè)月的時(shí)間,這與“日日新”寓意“模型迭代速度和處理問題的能力可以日日更新”高度匹配。
那么,商湯是如何在短短3個(gè)月時(shí)間,便實(shí)現(xiàn)了如此大的進(jìn)化呢?
2
商湯憑什么?
筆者在對(duì)商湯科技這家企業(yè)進(jìn)行詳細(xì)研究后發(fā)現(xiàn),其在大模型領(lǐng)域所取得的成績(jī)絕非偶然,也非一蹴而就。而是受益其在人工智能領(lǐng)域長(zhǎng)期深耕而實(shí)現(xiàn)的能力領(lǐng)先與認(rèn)知領(lǐng)先。
眾所周知,算力、算法與數(shù)據(jù)是人工智能領(lǐng)域的三個(gè)核心要素。商湯科技則憑借長(zhǎng)期投入,在這三個(gè)領(lǐng)域都實(shí)現(xiàn)了深厚積累。公開數(shù)據(jù)顯示,截至2022年末,商湯研發(fā)隊(duì)伍高達(dá)3466人,占員工總數(shù)近70%,全年研發(fā)支出接近40億元。
首先在算法方面,商湯從2016年便開始在計(jì)算機(jī)視覺領(lǐng)域深耕,2017年發(fā)力決策智能,2019年涉足NLP語言類項(xiàng)目,在這個(gè)過程中積累了人工智能各個(gè)細(xì)分領(lǐng)域的算法,為大模型的研發(fā)打下了很好的算法基礎(chǔ)。并且在2019年還發(fā)布了10億參數(shù)的視覺大模型,到2022年參數(shù)升級(jí)到320億,為全球之最。
在算力方面,從2020年開始,商湯便在上海臨港建設(shè)了人工智能的算力中心AIDC。這個(gè)面積足足有20個(gè)足球場(chǎng)大的智算中心,擁有5000個(gè)服務(wù)器機(jī)柜和27000張GPU,規(guī)模遠(yuǎn)超業(yè)界廣為流傳的“萬張GPU的大模型入場(chǎng)券”。

算力的優(yōu)勢(shì)除了體現(xiàn)在GPU卡的數(shù)量,還體現(xiàn)在多卡并行下的真實(shí)有效利用率。由于在大模型訓(xùn)練時(shí)需要大量的GPU卡,當(dāng)越來越多的卡連在一起,卡和卡之間的通信、網(wǎng)絡(luò)消耗就會(huì)越多,相應(yīng)能夠真正發(fā)揮的有效算力就越少。
例如,行業(yè)公認(rèn)1000塊連在一起的卡往往只能發(fā)揮60%的算力,剩余的40%在鏈接過程中就被損耗掉了。但商湯卻可以把千卡能效做到90%,耗損控制在10%,這也創(chuàng)造了行業(yè)天花板。
在數(shù)據(jù)方面,除了通用數(shù)據(jù)與專用數(shù)據(jù)的積累,商湯科技在整合、處理與使用數(shù)據(jù)等領(lǐng)域也具有豐富的經(jīng)驗(yàn)。
在算力、數(shù)據(jù)與算法三個(gè)核心要素上的積累,讓商湯科技具備了在大模型領(lǐng)域持續(xù)進(jìn)化的基礎(chǔ)能力。而在這些基礎(chǔ)能力之外,商湯科技還擁有另外一個(gè)更為重要,但較易被行業(yè)忽略的軟實(shí)力,就是對(duì)AI產(chǎn)業(yè)的深刻理解與前瞻判斷。
熟悉人工智能領(lǐng)域的產(chǎn)業(yè)人士,多熟知商湯人工智能算力中心5000P的強(qiáng)大算力,但較為忽視它背后的認(rèn)知價(jià)值。從某種意義上講,5000P的總算力并非獨(dú)一無二,國(guó)內(nèi)具備5000P規(guī)模的智算中心也還有數(shù)家,但它們大部分都是化整為零、分散布置,由一個(gè)個(gè)200P、300P的節(jié)點(diǎn)組成。
在傳統(tǒng)的互聯(lián)網(wǎng)應(yīng)用中,這種分散布置并無大礙。但在AI大模型訓(xùn)練時(shí),這些算力就必須集中在一個(gè)物理點(diǎn),否則網(wǎng)絡(luò)就沒法支撐它去做同一個(gè)任務(wù)。商湯之所以在兩三年前,便將5000P算力放在一起,與長(zhǎng)期深耕人工智能產(chǎn)業(yè)所形成的差異化認(rèn)知密不可分。目前,商湯的AI大裝置已能夠以最大4000卡規(guī)模集群進(jìn)行單任務(wù)訓(xùn)練,并可做到七天以上不間斷地穩(wěn)定訓(xùn)練。
另外,在2021年中推出“AI大裝置SenseCore”時(shí),為了解決AI的長(zhǎng)尾問題,商湯果斷選擇了用“超大算力+大參數(shù)模型”來實(shí)現(xiàn)AI具備更多通用能力的思路,這在當(dāng)時(shí)是極為前瞻的思路。2022年底,ChatGPT的火爆,最終印證了商湯這種思路的前瞻性。

再以千卡集群90%的利用率為例,其主要得益于商湯科技超前預(yù)判市場(chǎng)需求,提前找到一批做高性能計(jì)算優(yōu)化以及網(wǎng)絡(luò)調(diào)試的細(xì)分人才,然后投入大量的時(shí)間與資源、一遍遍地調(diào)試,一點(diǎn)點(diǎn)積蓄優(yōu)勢(shì),最終提升了整體利用率。
事實(shí)上,不管是大規(guī)模布局算力還是在細(xì)微處提升多卡利用率,這些事情并不復(fù)雜,誰堅(jiān)持到最后就能形成難以復(fù)制的高核心能力。但關(guān)鍵難點(diǎn)在于,是否能在關(guān)鍵時(shí)點(diǎn)確定正確方向。
商湯科技的這種認(rèn)知優(yōu)勢(shì)一方面得益于創(chuàng)始團(tuán)隊(duì)行業(yè)領(lǐng)先的專業(yè)基因,另外一方面則是源于長(zhǎng)期實(shí)踐過程中的積累。在這個(gè)過程中,其一直處在中國(guó)人工智能產(chǎn)業(yè)的最前沿,深入芯片、服務(wù)器、基礎(chǔ)軟件、工具軟件、算法生產(chǎn)到應(yīng)用各環(huán)節(jié),形成了對(duì)整個(gè)AI全流程的理解力,并沉淀了大量的專業(yè)認(rèn)知與工具。
前期正確預(yù)判往往要比后期行動(dòng)更有價(jià)值。正是在上述認(rèn)知領(lǐng)域的領(lǐng)先,最終帶來了商湯科技在能力上的領(lǐng)先,進(jìn)而帶來在大模型產(chǎn)品上的更優(yōu)體驗(yàn)與更快進(jìn)化。
3
產(chǎn)業(yè)是大模型的最終歸宿
熟悉大模型領(lǐng)域的讀者會(huì)敏銳地注意到,最近一段時(shí)間中國(guó)的大模型產(chǎn)業(yè)正在發(fā)生著一個(gè)重要變化,就是越來越多的企業(yè)開始在大模型前面冠上“產(chǎn)業(yè)”二字。
在此背后,源于公眾對(duì)大模型的研究越來越多,也越來越意識(shí)到通用大模型所采用的通用信息存在一些錯(cuò)誤、謠言與偏見,且專業(yè)知識(shí)與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致該類模型的數(shù)據(jù)“噪音”過大,行業(yè)針對(duì)性與精準(zhǔn)度不足,無法創(chuàng)造出深層次的價(jià)值。
在產(chǎn)業(yè)場(chǎng)景中,專業(yè)服務(wù)要求高、容錯(cuò)性低,需要能夠在實(shí)際場(chǎng)景中真正解決具體的問題。因此,企業(yè)使用的大模型必須可信、可用、可控,而且最好是經(jīng)過反復(fù)與充分測(cè)試。
而商湯科技由于之前在人工智能領(lǐng)域產(chǎn)業(yè)的探索,其深知產(chǎn)業(yè)才是大模型的最終歸宿,“寫寫詩,聊聊天”并不能解決實(shí)際問題。所以在大模型領(lǐng)域,商湯一開始便建立了根深蒂固的產(chǎn)業(yè)思維。
在2023世界人工智能大會(huì)論壇現(xiàn)場(chǎng),商湯科技CEO徐立便通過簡(jiǎn)單地鼠標(biāo)拖動(dòng),將商湯大模型在產(chǎn)業(yè)場(chǎng)景中的應(yīng)用進(jìn)行了直觀展現(xiàn),引得觀眾一片贊嘆。在徐立的現(xiàn)場(chǎng)“炫技”背后,是商湯領(lǐng)先的行業(yè)理解力與場(chǎng)景落地能力。如今,這些能力正通過商湯大模型融合滲透到金融、醫(yī)療、電商、移動(dòng)終端與產(chǎn)業(yè)園區(qū)等各個(gè)產(chǎn)業(yè)賽道。

例如,在金融領(lǐng)域,商湯如影數(shù)字人可以助力金融機(jī)構(gòu)智能客服、智慧營(yíng)銷等工作,并通過大語言模型能力實(shí)現(xiàn)投研分析、撰寫等新功能。
在數(shù)字內(nèi)容領(lǐng)域,商湯數(shù)字人與多個(gè)短視頻、直播頭部平臺(tái)達(dá)成戰(zhàn)略合作,共建“云+AIGC+短視頻直播”生態(tài)。商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青直言,AIGC讓數(shù)字人進(jìn)入了一個(gè)“真正可用的階段”。
目前,商湯的AI數(shù)字人已支持構(gòu)建數(shù)字人講解員、數(shù)字人主播、數(shù)字人醫(yī)生、數(shù)字人老師等,廣泛部署于購(gòu)物中心、展館、旅游景區(qū)、銀行等行業(yè)。
在醫(yī)療場(chǎng)景,商湯打造的中文醫(yī)療語言大模型“大醫(yī)”,可提供導(dǎo)診、問診、健康咨詢、輔助決策等多場(chǎng)景會(huì)話服務(wù),未來將支持醫(yī)學(xué)圖像、文本、結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)分析,并提升醫(yī)療語言理解和推理能力。
而在智能汽車領(lǐng)域,商湯大模型的加持更是全方位的:它們正按照由內(nèi)到外、由淺到深的邏輯展開。例如,在座艙內(nèi),商湯通過視聽多模態(tài)融合,全方位感知、標(biāo)記用戶偏好,提供更好的個(gè)。擬人化交互的“車艙大腦”還能為用戶帶來集安全、娛樂、教育及效率于一體的智能座艙體驗(yàn)。
在車艙外,商湯與聯(lián)合實(shí)驗(yàn)室首個(gè)提出了感知決策一體化的自動(dòng)駕駛通用大模型UniAD,開創(chuàng)了以全局任務(wù)為目標(biāo)的自動(dòng)駕駛大模型架構(gòu),為自動(dòng)駕駛技術(shù)與產(chǎn)業(yè)發(fā)展提出了新方向。同時(shí),這個(gè)大模型也斬獲了行業(yè)最佳論文獎(jiǎng)。

而在更外圍的智能交通領(lǐng)域,借助路側(cè)視覺感知大模型,瓊宇2.0以及格物2.0構(gòu)建智能交通孿生與仿真,并利用商量2.0的感知推理和人機(jī)交互能力,商湯還打造出車路云協(xié)同的交通體系。
在商湯看來,自動(dòng)駕駛?cè)斯ぶ悄芟到y(tǒng)的核心是決策與判斷,而大模型經(jīng)過反復(fù)訓(xùn)練學(xué)習(xí)可以無限接近正確決策。而在決策之外,語言大模型還可以輸出中間的邏輯推理過程,這讓未來自動(dòng)駕駛系統(tǒng)有了可修復(fù)性。
上述各個(gè)產(chǎn)業(yè)的具體應(yīng)用案例,充分展示了商湯大模型的技術(shù)領(lǐng)先性。不過大模型的對(duì)外賦能,除了技術(shù)領(lǐng)先帶來的用戶體驗(yàn),還很重要的是要能夠做到對(duì)外服務(wù)的成本領(lǐng)先。如果不能以較具競(jìng)爭(zhēng)力的價(jià)格提供服務(wù),也很難獲得客戶的信賴。
商湯科技聯(lián)合創(chuàng)始人,大裝置事業(yè)部負(fù)責(zé)人楊帆預(yù)測(cè),未來國(guó)內(nèi)平臺(tái)型AI公司或只能存活3-5家,成本控制能力是決勝的關(guān)鍵要素之一。而商湯科技前瞻布局的AI基礎(chǔ)設(shè)施“商湯AI大裝置SenseCore”,實(shí)現(xiàn)了算法、算力與平臺(tái)的打通,以及軟硬件一體化協(xié)同的AI系統(tǒng)工程能力,這為商湯科技低成本,高質(zhì)量的行業(yè)賦能提供了保障,有望讓商湯科技成為大模型領(lǐng)域最具競(jìng)爭(zhēng)力的角逐者之一。
4
結(jié)語
在2023世界人工智能大會(huì)上,徐立表示,商湯科技將“通過‘大模型+大裝置’持續(xù)推動(dòng)AI基礎(chǔ)設(shè)施能力的躍進(jìn)提升,不僅打造通用能力更加強(qiáng)大的基礎(chǔ)模型,也進(jìn)一步高效融合不同垂直領(lǐng)域的專業(yè)知識(shí),構(gòu)建更懂行業(yè)、更具專長(zhǎng)的專業(yè)大模型,從根本上降低大模型的下游應(yīng)用成本和門檻,讓大模型的產(chǎn)業(yè)價(jià)值在千行百業(yè)中綻放。”
簡(jiǎn)言之,“更懂行業(yè)的大模型、更低的成本與門檻、更廣泛的產(chǎn)業(yè)賦能”,是徐立為商湯大模型中短期制定的務(wù)實(shí)方向。隨著產(chǎn)業(yè)的變遷,推動(dòng)AGI(通用人工智能)時(shí)代的到來則是長(zhǎng)期遠(yuǎn)景。
一方面是長(zhǎng)期深耕AI產(chǎn)業(yè)形成的認(rèn)知領(lǐng)先,另一方面是在算力、算法與數(shù)據(jù)等領(lǐng)域長(zhǎng)期積累形成的能力領(lǐng)先,二者將支撐商湯科技未來在大模型領(lǐng)域的持續(xù)進(jìn)化。而一個(gè)能夠持續(xù)進(jìn)化的大模型,將是助力商湯科技實(shí)現(xiàn)中短期戰(zhàn)略方向的最大底氣,也是支撐其實(shí)現(xiàn)未來AGI時(shí)代長(zhǎng)期遠(yuǎn)景的重要前提。
猜你喜歡
國(guó)產(chǎn)GPU新秀曦望Sunrise完成近10億元融資
本輪融資由華胥基金、第四范式、游族網(wǎng)絡(luò)、北京利爾、松禾資本、海通開元等多家機(jī)構(gòu)共同參與。商湯完成戰(zhàn)略組織架構(gòu)重組,建立新“1+X”架構(gòu)
“1”代表商湯核心業(yè)務(wù),“X”代表商湯的生態(tài)企業(yè)矩陣。商湯大模型的進(jìn)化邏輯:認(rèn)知領(lǐng)先與能力領(lǐng)先帶來的復(fù)利效應(yīng)
一方面是作為AI產(chǎn)業(yè)先行者形成的認(rèn)知領(lǐng)先,另一方面是在算力、算法與數(shù)據(jù)等領(lǐng)域長(zhǎng)期積累形成的能力領(lǐng)先,以及在產(chǎn)業(yè)應(yīng)用端的落地經(jīng)驗(yàn),將支撐商湯科技未來在大模型領(lǐng)域的持續(xù)進(jìn)化。商湯澄清:控股股東沒有出售股份和出售計(jì)劃
7月12日晚,對(duì)于市場(chǎng)傳言“公司執(zhí)行董事兼控股股東湯曉鷗減持公司股份”一事,商湯集團(tuán)股份有限公司(下稱“商湯”)發(fā)布澄清公告。