租2000張芯片做大模型:一家創(chuàng)業(yè)公司的生死抉擇
“野蠻人”已來(lái),創(chuàng)業(yè)者打響反擊戰(zhàn)。
文|《中國(guó)企業(yè)家》記者 閆俊文
編輯|李薇
頭圖來(lái)源|視覺(jué)中國(guó)
一項(xiàng)新技術(shù)興起時(shí),創(chuàng)業(yè)公司是等著大公司做出來(lái),還是自己投真金白銀做?
一家名叫中科深智的虛擬人創(chuàng)業(yè)公司選擇了后者。近期,中科深智發(fā)布了一款大模型,包含20億和200億參數(shù)兩個(gè)版本。為此,他們租用了2000張英偉達(dá)A100顯卡,十幾個(gè)人的團(tuán)隊(duì)沒(méi)日沒(méi)夜忙了兩個(gè)月,花費(fèi)了數(shù)百萬(wàn)元現(xiàn)金。
中科深智創(chuàng)始人、CEO成維忠說(shuō),當(dāng)下,接入API響應(yīng)速度太慢,不適應(yīng)虛擬人的實(shí)時(shí)要求。并且,大廠的大模型并不會(huì)公布核心算法,這讓創(chuàng)業(yè)公司無(wú)法迭代基礎(chǔ)算法,鼻子被大公司牽著走。
中科深智成立于2016年,最近獲得的一次融資在2021年11月,由晨山資本領(lǐng)投的B輪千萬(wàn)美元融資,老股東馬來(lái)西亞MYEG Capital持續(xù)跟投。雖然成立已7年,但中科深智目前也只有100多人,以研發(fā)人員為主,公司年?duì)I收數(shù)千萬(wàn)元。
當(dāng)技術(shù)浪潮到來(lái)時(shí),巨頭公司有更多資源來(lái)應(yīng)對(duì),也有更多試錯(cuò)成本。但是創(chuàng)業(yè)公司完全不同,他們力量單薄,既不能放手錯(cuò)過(guò)時(shí)機(jī),更不能盲目追風(fēng),這讓他們?nèi)缏谋”?/strong>
不做,就會(huì)死
大模型火熱,但成維忠他們發(fā)現(xiàn),能用的開(kāi)源大模型一個(gè)也沒(méi)有。
中科深智CTO宋健說(shuō),一個(gè)可用的開(kāi)源模型,有三重定義:第一,訓(xùn)練的數(shù)據(jù)開(kāi)源,比如數(shù)據(jù)是怎么處理的,用什么數(shù)據(jù)訓(xùn)練,如何去重;第二,訓(xùn)練過(guò)程開(kāi)源,比如算法;第三,訓(xùn)練的模型開(kāi)源,比如參數(shù)。
“這三點(diǎn)基本上就決定了目前市面上的開(kāi)源大模型很少。中文大模型沒(méi)有一家,英文大模型大概有兩三家,但他們的license(許可)限制很多,比如不能商用等等。”宋健說(shuō)。他預(yù)計(jì),在2024年就可以看到更多可用的性能很好的開(kāi)源大模型,可以快速切換。
大模型最流行的商業(yè)模式是調(diào)用API接口,具體到中科深智的賽道虛擬人業(yè)務(wù)場(chǎng)景,因?yàn)樗懔ο拗埔约靶枨蟮凝嫶?,ChatGPT4.0五六秒回答一次,延時(shí)對(duì)虛擬人場(chǎng)景足以致命,消費(fèi)者不會(huì)多等一秒鐘。
就算接入了API接口,創(chuàng)業(yè)公司的算法也不能迭代。成維忠說(shuō),中科深智的產(chǎn)品是基于NLP(自然語(yǔ)言處理)來(lái)輸出語(yǔ)言,用的是CLAP算法,如果用大模型來(lái)提升算法,那么就需要大模型的源代碼,尤其是做多模態(tài)的訓(xùn)練,必須有源代碼。
“大公司當(dāng)下不可能開(kāi)放源代碼,未來(lái)不好說(shuō)。另外,我們的客戶也很擔(dān)心數(shù)據(jù)安全問(wèn)題。”成維忠說(shuō)。
中科深智創(chuàng)始人、CEO成維忠。來(lái)源:受訪者
大公司如何看創(chuàng)業(yè)公司在大模型創(chuàng)業(yè)潮中的機(jī)會(huì)?
“云計(jì)算發(fā)展到現(xiàn)在,很重要的環(huán)節(jié)就是通過(guò)開(kāi)源一系列模型,降低學(xué)習(xí)成本,能夠去嘗試自己的一些突破?!卑⒗镌艭TO周靖人說(shuō)。誰(shuí)能夠更加敏捷,快速探索出一條業(yè)務(wù)發(fā)展創(chuàng)新的道路,誰(shuí)就會(huì)占據(jù)有利的地位。今天大家都是跟時(shí)間在賽跑。
目前,中科深智還沒(méi)有盈利,但成維忠沒(méi)有退路:“如果不自己做大模型,半年后,公司業(yè)務(wù)的賽道就跟自己沒(méi)有關(guān)系了?!?/strong>
據(jù)IT桔子數(shù)據(jù)統(tǒng)計(jì),2022年虛擬人領(lǐng)域的融資數(shù)達(dá)51起,融資總額40.96億元。截至2023年5月,該領(lǐng)域也有數(shù)十起融資,比如成立于2019年的萬(wàn)像科技在4月宣布完成數(shù)千萬(wàn)人民幣A2輪融資。
大公司也在競(jìng)逐這個(gè)領(lǐng)域。7月,阿里云通義大模型家族迎來(lái)新成員。AI繪畫創(chuàng)作大模型通義萬(wàn)相開(kāi)啟定向邀測(cè),該模型可輔助人類進(jìn)行圖片創(chuàng)作,未來(lái)可應(yīng)用于藝術(shù)設(shè)計(jì)、電商、游戲和文創(chuàng)等應(yīng)用場(chǎng)景。
4月,商湯發(fā)布了大模型體系商湯日日新大模型。發(fā)布會(huì)上,商湯演示了2D數(shù)字人視頻生成平臺(tái)“如影SenseAvatar”——僅需一段5分鐘的真人視頻素材,就可以生成聲音動(dòng)作自然、口型準(zhǔn)確、多語(yǔ)種精通的數(shù)字人分身。
大模型的“推理”能力,突破了NLP的局限,讓人機(jī)對(duì)話變得更流暢,更智能。技術(shù)的變化帶來(lái)了創(chuàng)業(yè)者與投資人的涌入。虛擬人賽道成為目前大模型可落地應(yīng)用的最大場(chǎng)景之一。
租算力做大模型
中科深智通過(guò)自己的途徑,以小時(shí)付費(fèi)的方式租用算力來(lái)開(kāi)發(fā)大模型,一小時(shí)十幾元,和往年相比,單價(jià)漲了3倍。算力主要用在數(shù)據(jù)訓(xùn)練以及微調(diào)上,折合算下來(lái),他們估算用了2000張英偉達(dá)A100顯卡。
中科深智推出的20億和200億參數(shù)大模型,主要應(yīng)對(duì)垂直場(chǎng)景落地,比如電商賣貨,不需要考慮通用性。以虛擬主播帶貨為例,將積累數(shù)年的場(chǎng)景數(shù)據(jù)做訓(xùn)練,最重要的是響應(yīng)速度。
“從三五秒鐘提升到0.5秒,這就夠了,不用去關(guān)心作文或者摘要寫的怎么樣?!背删S忠說(shuō)。
20億和200億參數(shù)的大模型,在數(shù)千億參數(shù)的ChatGPT以及文心一言面前,就是“小弟弟”。但小有小的好處,那就是勝在速度快。大公司致力于打造出千億參數(shù)級(jí)別的通用人工智能大模型,他們是“既要又要還要”,但對(duì)于創(chuàng)業(yè)公司而言,他們是“只要”。
成維忠反饋說(shuō),一些電商客戶接入通用大模型后,發(fā)現(xiàn)不僅API響應(yīng)速度慢,有些回答還不專業(yè),影響C端用戶留存轉(zhuǎn)化。客戶反過(guò)來(lái)尋求中科深智的SDK(軟件開(kāi)發(fā)工具包),運(yùn)用中科深智的大模型。
中科深智開(kāi)發(fā)了一個(gè)名為“虛擬助播”的技術(shù),讓真人與虛擬人互動(dòng),此前,基于傳統(tǒng)的NLP技術(shù)做不到產(chǎn)品的需求。現(xiàn)在,在虛擬人背后接入大模型,就可以支撐虛擬人,真人可以讓虛擬人唱歌、跳舞、回答問(wèn)題以及自主賣貨。
來(lái)源:受訪者
大模型似乎正在變成大公司的“壞生意”,創(chuàng)業(yè)公司的“好生意”。
“壞”在它目標(biāo)設(shè)定高,建立通用人工智能技術(shù)底座,投入無(wú)底洞,變成了一項(xiàng)長(zhǎng)周期的投入;而創(chuàng)業(yè)公司只需要迭代算法和技術(shù),就可以局部建立優(yōu)勢(shì),實(shí)用為主,一邊用一邊學(xué)。
不管是騰訊云的行業(yè)大模型還是百度的文心一言,都在從通用人工智能轉(zhuǎn)向場(chǎng)景落地,但這恰好是行業(yè)公司的硬核優(yōu)勢(shì)。行業(yè)頭部企業(yè)下場(chǎng)做行業(yè)模型,更容易推廣和落地。從這個(gè)角度上說(shuō),垂類大模型的確更有優(yōu)勢(shì)。
但一些技術(shù)問(wèn)題仍然晦暗不明。
不同于文生圖以及圖生文等場(chǎng)景,虛擬人直接將大模型能力推進(jìn)到多模態(tài)領(lǐng)域,但沒(méi)人告訴創(chuàng)業(yè)公司這條路是否能走得通。以前是動(dòng)作捕捉生成技術(shù),現(xiàn)在是否要切換到大模型的definition(定義),生成端依然有很多技術(shù)不確定性。
高風(fēng)險(xiǎn)時(shí)代,創(chuàng)業(yè)公司如何擴(kuò)張
大公司擴(kuò)張新業(yè)務(wù),上線新產(chǎn)品,不管是百度還是阿里巴巴都上線了基于大模型功能的新產(chǎn)品,比如阿里巴巴的通義聽(tīng)悟、通義萬(wàn)相,它還用大模型改造了釘釘?shù)犬a(chǎn)品,上線了會(huì)議摘要及總結(jié)等功能。
一些人將此次AI革命的爆發(fā)周期定義為10年,但技術(shù)革命爆發(fā)初期,技術(shù)路線和落地路徑還不是很清晰,噪音和泡沫橫飛,對(duì)于創(chuàng)業(yè)公司而言,擴(kuò)張新業(yè)務(wù)要尤其謹(jǐn)慎。
在技術(shù)變革期,每個(gè)創(chuàng)業(yè)者似乎都能看到機(jī)會(huì)。以此次大模型為例,機(jī)器人公司會(huì)覺(jué)得交互革命到了,社交軟件創(chuàng)業(yè)者會(huì)覺(jué)得做出下一個(gè)微信的機(jī)會(huì)出現(xiàn)了,3D虛擬人創(chuàng)業(yè)者會(huì)說(shuō),未來(lái)需要1000億個(gè)虛擬人。
這種“機(jī)會(huì)錯(cuò)覺(jué)”會(huì)激發(fā)創(chuàng)始人的野心,甚至蒙蔽他們的雙眼。但有的創(chuàng)業(yè)者也容易被風(fēng)險(xiǎn)所恫嚇,變得畏首畏尾。
中科深智是研發(fā)型的公司,算法是他們的核心競(jìng)爭(zhēng)力,長(zhǎng)周期投入研發(fā),業(yè)績(jī)又受到宏觀經(jīng)濟(jì)影響。中科深智的投資人,包括自己的團(tuán)隊(duì),對(duì)大模型沒(méi)底,又花不少錢去訓(xùn)練,大家都會(huì)有疑慮。
成維忠是這樣說(shuō)服自己的:不把大模型這事兒神化,用平常心去看待它,平常做業(yè)務(wù)的時(shí)候,你會(huì)去想我應(yīng)該不應(yīng)該做這件事嗎?我覺(jué)得它能賺錢,對(duì)我公司長(zhǎng)期有幫助,我就去做了大模型。
他預(yù)測(cè),未來(lái)10年和20年其實(shí)就是XR加AI,不能單純地講AI,AI大模型帶來(lái)的是工具AI化、應(yīng)用AI化、服務(wù)3D化,這意味著未來(lái)虛擬空間需要越來(lái)越多的虛擬人。
想好了就去做,但要緊密結(jié)合自己的場(chǎng)景和業(yè)務(wù)去做。
上一次移動(dòng)互聯(lián)網(wǎng)浪潮時(shí),成維忠錯(cuò)過(guò)了一次技術(shù)浪潮。2008年,他創(chuàng)辦了互聯(lián)網(wǎng)營(yíng)銷公司。等到移動(dòng)互聯(lián)網(wǎng)起來(lái)的時(shí)候,成維忠是謹(jǐn)慎派,覺(jué)得技術(shù)不成熟、終端差、網(wǎng)絡(luò)不行,他覺(jué)得需要等等再入局。
“現(xiàn)在回頭再看,這是一個(gè)非常錯(cuò)誤的決定?!背删S忠反思。移動(dòng)互聯(lián)網(wǎng)的創(chuàng)業(yè)浪潮在2007年、2008年和2010年就已劃定。
像成維忠這樣的移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)者,在守成之余,開(kāi)始在新技術(shù)浪潮中主動(dòng)出擊,但是成是敗,還需時(shí)間檢驗(yàn)。