相比于單體智能,甲光群體智能才是智能的本質(zhì)。
作者|甲小姐 田思奇
ChatGPT呼嘯而來(lái)的年對(duì)近兩年,市場(chǎng)的大共識(shí)是AI即未來(lái)。但大概念之下,劉路諸多命題爭(zhēng)議并未收斂:開(kāi)源還是閉源?商業(yè)如何閉環(huán)?Scaling law的天花板在哪里?通往世界模型與AGI的途徑是否唯一?AI最終是否會(huì)失控?
這些討論中蘊(yùn)含一個(gè)關(guān)鍵命題:Transformer機(jī)制是否是永遠(yuǎn)的主導(dǎo)范式?
從全球AI從業(yè)者的行動(dòng)來(lái)看,Transformer架構(gòu)已經(jīng)吸附了巨量的資本和人才,讓挑戰(zhàn)這一“鐵王座”的任務(wù)變得格外艱巨。然而,凡平科技爆發(fā)如同自然進(jìn)化和物種演進(jìn),沒(méi)有變異就沒(méi)有進(jìn)化的原動(dòng)力,缺乏多樣性往往意味著生態(tài)的脆弱,因此,「甲子光年」始終在尋找挑戰(zhàn)這一“鐵王座”的孤勇者。
這一次,群體我們迎來(lái)了RockAI巖芯數(shù)智。這家隸屬于巖山科技的挑戰(zhàn)新銳公司剛剛成立一年多,但早在2024年初便發(fā)布了非Transformer架構(gòu)的Yan架構(gòu)大模型,并在9月將其迭代至具有多模態(tài)能力的Yan1.3模型,實(shí)現(xiàn)了在手機(jī)、電腦,甲光甚至樹(shù)莓派等廣泛設(shè)備端上的無(wú)損部署。
當(dāng)前,年對(duì)大部分人工智能從業(yè)者所置身的是一場(chǎng)“由OpenAI提出概念,Meta負(fù)責(zé)開(kāi)源,國(guó)內(nèi)市場(chǎng)專(zhuān)注應(yīng)用”的技術(shù)接力賽,但RockAI CEO劉凡平放棄了這條路。
在行業(yè)持續(xù)加碼數(shù)據(jù)和算力的劉路軍備競(jìng)賽中,劉凡平致力于基礎(chǔ)理論層創(chuàng)新,他認(rèn)為,算法仍有機(jī)會(huì)在2024年實(shí)現(xiàn)革命性突破。在OpenAI等巨頭投入海量資源,凡平旨在開(kāi)發(fā)如神明一般無(wú)所不能的人工智能時(shí),劉凡平堅(jiān)信,行業(yè)不需要“造神”,也足以抵達(dá)AI巨變的另一種可能——群體智能。
本文,群體甲小姐對(duì)話RockAI巖芯數(shù)智CEO劉凡平。
1.“如果投入的挑戰(zhàn)資源和結(jié)果不成正比,那一定是在某個(gè)環(huán)節(jié)出了問(wèn)題,我們認(rèn)為這個(gè)環(huán)節(jié)就是算法”
甲小姐:在全球人工智能行業(yè)的聚光燈下,擺在AI從業(yè)者面前的是兩條路:一是不斷加大資金、能源和數(shù)據(jù)的甲光投入追趕OpenAI等領(lǐng)先者的“造神”之路,二是尋找新的路徑。為什么RockAI選擇了后者?年對(duì)
劉凡平:我們也曾走在第一條路上,但到了2021年初,我意識(shí)到Transformer架構(gòu)無(wú)法支撐我走得更遠(yuǎn)。它在算力消耗、劉路數(shù)據(jù)處理等方面存在諸多問(wèn)題。因此,我們決定走一條全新的路,開(kāi)發(fā)一種更優(yōu)秀的模型。
眾所周知,人工智能的發(fā)展離不開(kāi)三大要素:數(shù)據(jù)、算法和算力。其中,數(shù)據(jù)和算力都是有限的資源。我們不能依賴有限的資源來(lái)創(chuàng)造更偉大的成就,這種投入的成本也高得難以估量。“造神”工程對(duì)于現(xiàn)階段的我們來(lái)說(shuō)越來(lái)越難。
如果投入的資源和結(jié)果不成正比,那一定是在某個(gè)環(huán)節(jié)出了問(wèn)題,我們認(rèn)為這個(gè)環(huán)節(jié)就是算法。當(dāng)然算法的突破并非一蹴而就,我們需要在漫長(zhǎng)的過(guò)程中不斷挑戰(zhàn)底層邏輯來(lái)實(shí)現(xiàn)創(chuàng)新。
甲小姐:目前市場(chǎng)在算力和數(shù)據(jù)方面投入越來(lái)越多,是什么讓你堅(jiān)信當(dāng)前的主要癥結(jié)仍在于算法?
劉凡平:我舉個(gè)例子,你知道人類(lèi)大腦的功率是多少瓦嗎?
甲小姐:30瓦。
劉凡平:沒(méi)錯(cuò),30瓦不到,而一臺(tái)GPT服務(wù)器的功率遠(yuǎn)超于此。人類(lèi)僅憑20多瓦的功率就能產(chǎn)生更高級(jí)的智能——這表明,人類(lèi)的聰明程度并不與算力直接相關(guān)。
在數(shù)據(jù)層面,我們訓(xùn)練Transformer大模型通常需要10TB的數(shù)據(jù)。然而從小學(xué)到博士,我們學(xué)習(xí)的數(shù)據(jù)總量遠(yuǎn)低于10TB。為什么人類(lèi)能在如此低的數(shù)據(jù)量和算力下產(chǎn)生智能?我們認(rèn)為是因?yàn)闄C(jī)器缺乏合適的算法。因此,算法才是核心。
從人工智能的發(fā)展來(lái)看,Transformer架構(gòu)誕生于2017年,但在此之前我們已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,RNN、LSTM等模型在當(dāng)時(shí)也很優(yōu)秀,但總有更優(yōu)秀的模型來(lái)替代它們。所以,盡管Transformer架構(gòu)在當(dāng)下很優(yōu)秀,它也并不能代表未來(lái)。
甲小姐:不得不承認(rèn),Transformer在此時(shí)此刻是主導(dǎo)性范式。全世界和你持有相同觀點(diǎn)的人有多少?
劉凡平:挺多的。獲得圖靈獎(jiǎng)的深度學(xué)習(xí)三巨頭(楊立昆、本杰奧和辛頓)在不同場(chǎng)合都提過(guò)現(xiàn)有模型架構(gòu)的一些問(wèn)題。今年上半年英偉達(dá)舉行GTC大會(huì)時(shí),《Attention is All You Need》論文的作者之一也提到我們需要比Transformer更好的架構(gòu)。
甲小姐:在今年5月的甲子引力大會(huì)上,我詢問(wèn)了包括朱嘯虎、傅盛等嘉賓關(guān)于Transformer是否是“鐵王座”的問(wèn)題。大家的觀點(diǎn)是,也許它并非最佳,但也看不到第二條出路。如果你要重新定義主流范式,那達(dá)到什么程度時(shí),會(huì)讓你覺(jué)得這條路跑通了?
劉凡平:我們已經(jīng)成功驗(yàn)證了我們的技術(shù)路線,Yan架構(gòu)大模型在某些方面已經(jīng)超越了Llama3的表現(xiàn);特別是在訓(xùn)練效率、成本控制及推理吞吐量等方面,都展現(xiàn)出了明顯的優(yōu)勢(shì)。
其次,我們的追求是讓每個(gè)人都能享受到AI帶來(lái)的便利,讓更多設(shè)備用上AI?,F(xiàn)階段我們也達(dá)到了這樣的狀態(tài),我們最低在樹(shù)莓派上就可以運(yùn)行——相當(dāng)于家里的機(jī)頂盒都可以用上大模型。這會(huì)讓每一個(gè)覺(jué)得大模型很遙遠(yuǎn)的人都感受到它近了。
我們9月發(fā)布的Yan 1.3是完全在設(shè)備端運(yùn)行的版本。最近舉行的開(kāi)放日活動(dòng)上,我們展示了搭載Yan1.3的多種設(shè)備,包括無(wú)人機(jī)、機(jī)器人、樹(shù)莓派、手機(jī)、AIPC等。Yan1.3還具備了多模態(tài)交互的能力,它能夠處理文本、視覺(jué)和音頻輸入,同時(shí)提供文本和音頻輸出,從而實(shí)現(xiàn)人機(jī)交互的過(guò)程。
甲小姐:在這么多終端上的多模態(tài)部署是如何實(shí)現(xiàn)的?
劉凡平:以樹(shù)莓派這類(lèi)開(kāi)發(fā)板為例,它不僅能被應(yīng)用于家庭中的機(jī)頂盒,還能被集成到冰箱、洗衣機(jī)等多種家電產(chǎn)品中。這表明我們的技術(shù)可以廣泛應(yīng)用于家庭和工作場(chǎng)所等多種環(huán)境。
但是把傳統(tǒng)的Transformer架構(gòu)集成到這些設(shè)備上存在很多困難。目前主流的做法,如模型的量化、裁剪和蒸餾等,雖然可以將大模型壓縮來(lái)適應(yīng)小型設(shè)備,但這些方法可能導(dǎo)致模型失真。失真是指在模型壓縮過(guò)程中,原始模型中的參數(shù)值被簡(jiǎn)化為近似值,例如π被簡(jiǎn)化為3.14。大量的參數(shù)縮減可能導(dǎo)致模型性能的顯著下降,從而影響實(shí)際應(yīng)用的效果。我們希望實(shí)現(xiàn)無(wú)損部署,把自主學(xué)習(xí)能力衍生下來(lái)。
甲小姐:怎么做到從有損到無(wú)損的部署?
劉凡平:我們改變了Transformer的Attention機(jī)制。 在GTC大會(huì)上,有演講者提到,即使是執(zhí)行簡(jiǎn)單的計(jì)算任務(wù),如2+2,傳統(tǒng)AI模型中的所有參數(shù)都會(huì)參與運(yùn)算。然而人類(lèi)的大腦并非這樣工作。你開(kāi)車(chē)的時(shí)候會(huì)集中注意力在路面信息上,這時(shí)大腦中的視覺(jué)皮層會(huì)被大量激活,而當(dāng)你在晚上睡覺(jué)時(shí)閉上眼睛思考問(wèn)題,視覺(jué)皮層的活動(dòng)就會(huì)減少,因?yàn)檫@時(shí)不需要處理視覺(jué)信息。
這個(gè)例子說(shuō)明,人腦在處理不同任務(wù)時(shí),只有相關(guān)的神經(jīng)元會(huì)參與運(yùn)算?;谶@一原理,我們也在我們的AI模型中實(shí)現(xiàn)了類(lèi)似的類(lèi)腦機(jī)制。我們希望模型在執(zhí)行特定任務(wù)時(shí),只有與該任務(wù)相關(guān)的參數(shù)參與運(yùn)算。
這不意味著其他參數(shù)沒(méi)有意義,而是它們?cè)诓煌臈l件下才會(huì)被激活。這樣的設(shè)計(jì)模擬了人腦的工作方式,使得模型在處理信息時(shí)更加高效和有針對(duì)性。
甲小姐:你用類(lèi)腦機(jī)制規(guī)避了Transformer那種暴力性的投入。但大腦是很難被理解的。我也不知道睡前半夢(mèng)半醒的狀態(tài)下,我的哪些腦細(xì)胞被激活了,哪些參數(shù)被壓抑了。我們都還沒(méi)有完全理解我們的大腦,你如何做到類(lèi)腦?
劉凡平:我們的途徑是類(lèi)腦智能,而不是復(fù)制一個(gè)真正的大腦。人類(lèi)大腦已經(jīng)演化出一套高效的機(jī)制和反應(yīng)方式,我們可以將這些特性整合到我們的AI模型中。這些模型應(yīng)該借鑒大腦的最佳特性來(lái)提高性能和效率。說(shuō)得更直白一些,Attention機(jī)制的早期理念也包含類(lèi)腦的元素,但它沒(méi)有按照完整的類(lèi)腦方式去實(shí)現(xiàn)。既然生物界已經(jīng)有很好的方案,我們?yōu)槭裁床灰?
甲小姐:Transformer有意地讓渡了很多人為設(shè)計(jì),是為了更好地泛化到不同的場(chǎng)景中。在面對(duì)高度復(fù)雜的端側(cè)環(huán)境或應(yīng)用場(chǎng)景時(shí),如何確保你們的機(jī)制具備類(lèi)似transformer的泛化能力和適應(yīng)性?
劉凡平:類(lèi)腦分區(qū)激活的過(guò)程完全是模型自我形成的,沒(méi)有外部的人為干預(yù)。神經(jīng)元的激活模式完全由模型根據(jù)其所處環(huán)境自主決定,從而在底層技術(shù)上確保了這一機(jī)制的自然性和適應(yīng)性。
我們的理念是讓機(jī)器直接與現(xiàn)實(shí)世界交互并從中學(xué)習(xí),這比單純依賴于人工準(zhǔn)備的數(shù)據(jù)集進(jìn)行訓(xùn)練更為有效。正如兒童通過(guò)與社會(huì)的實(shí)際互動(dòng)來(lái)獲取知識(shí)和技能一樣,機(jī)器也需要置身于真實(shí)的環(huán)境中實(shí)現(xiàn)更加豐富和深刻的學(xué)習(xí)體驗(yàn)。因此,我們要使更多的設(shè)備能夠承載這些先進(jìn)的模型,并將其廣泛部署到千家萬(wàn)戶之中,從而允許它們?cè)诙鄻踊膽?yīng)用場(chǎng)景中不斷學(xué)習(xí)和完善自身。從技術(shù)和數(shù)據(jù)的角度來(lái)看,更真實(shí)的數(shù)據(jù)有助于推動(dòng)模型變得更聰明。
甲小姐:具體到端側(cè),Yan模型是如何在機(jī)器人、無(wú)人機(jī)這種設(shè)備下體現(xiàn)你所說(shuō)的這些特征的?
劉凡平:比如在無(wú)人機(jī)應(yīng)用場(chǎng)景中,我拿著甲小姐的照片給無(wú)人機(jī)看,指示它識(shí)別并尋找甲小姐是否位于室外的某個(gè)地方,比如操場(chǎng)或運(yùn)動(dòng)場(chǎng)。無(wú)人機(jī)就能夠理解我的指令,自動(dòng)起飛,前往指定區(qū)域內(nèi)搜索甲小姐并拍照。再比如集體拍照環(huán)節(jié),我可以跟無(wú)人機(jī)說(shuō),等到我招手或者集體起跳的時(shí)候再拍照。這種感知能力是傳統(tǒng)模型達(dá)不到的。
甲小姐:可是,你把這樣的智能做到無(wú)人機(jī)和路由器里,我也并不會(huì)認(rèn)為無(wú)人機(jī)活了,或者路由器活了,他們和我們直覺(jué)里的“智能”不太一樣。
劉凡平:但是你會(huì)感覺(jué)到它的智能,因?yàn)樗_實(shí)解決了你的實(shí)際問(wèn)題。原來(lái)空調(diào)是沒(méi)有智能的,現(xiàn)在我們隱約感覺(jué)到它有了智能,包括冰箱也是。大家正在適應(yīng)這個(gè)過(guò)程,而我們?cè)谧龅氖羌铀龠@個(gè)過(guò)程,幫助我們通往人機(jī)共融共生的智能時(shí)代。
未來(lái)智能體的數(shù)量會(huì)遠(yuǎn)超人口總數(shù)的很多倍。這一比例變高不是壞事,它意味著人能獲得的服務(wù)越來(lái)越好,生產(chǎn)效率也越高。
2.“相比于單體智能,群體智能才是智能的本質(zhì)”
甲小姐:你選擇了一條hard模式的創(chuàng)業(yè)路。通常創(chuàng)業(yè)公司會(huì)乘著時(shí)代紅利加強(qiáng)創(chuàng)新成功的概率,但你要挑戰(zhàn)最主流的范式,在基礎(chǔ)理論層做創(chuàng)新。你認(rèn)為RockAI可以脫穎而出的“法門(mén)”是什么?
劉凡平:RockAI致力于底層邏輯的創(chuàng)新,核心目標(biāo)是實(shí)現(xiàn)群體智能。群體智能由多個(gè)能夠自主學(xué)習(xí)的智能單元組成,它們通過(guò)環(huán)境感知、自我組織、相互交流和協(xié)同合作來(lái)完成復(fù)雜任務(wù),并在復(fù)雜環(huán)境中實(shí)現(xiàn)整體智能的提升。
從螞蟻到狼群,再到人類(lèi)社會(huì),都存在邁向群體智能的過(guò)程。通過(guò)這種方式,我們可以更有效地利用資源,實(shí)現(xiàn)智能的全面提升,而不僅僅依賴單一的技術(shù)創(chuàng)新或概念。
甲小姐:你剛才說(shuō)過(guò)“造神式”的人工智能投入產(chǎn)出比不合理,你所做的群體智能是否僅僅是因?yàn)橘Y源有限才退而求其次的戰(zhàn)術(shù)選擇?
劉凡平:并非如此。相比于單體智能,群體智能才是智能的本質(zhì)。比如我們體內(nèi)的一個(gè)白細(xì)胞對(duì)于免疫系統(tǒng)來(lái)說(shuō)沒(méi)有意義,但一群白細(xì)胞就能產(chǎn)生免疫作用。狼群也通過(guò)相互協(xié)作來(lái)捕食獵物。人類(lèi)社會(huì)也早已證明,在追求最高智能的過(guò)程中,還是要依靠群體的智慧。我們所有的成果,包括前沿科技,航空航天等等,都是群體智能的成果。
甲小姐:群體智能和傳統(tǒng)的云端協(xié)作有什么區(qū)別?
劉凡平:云端協(xié)作中有一些任務(wù)在設(shè)備端完成,有一些在云端完成。人類(lèi)社會(huì)中也有群體智能。假設(shè)在辦公室里,每一個(gè)人是獨(dú)立的個(gè)體,云相當(dāng)于公司,每個(gè)人會(huì)遵守公司的一些制度。我們所理解的群體智能中的端和云,是價(jià)值的傳遞和能力的對(duì)齊與理解。
甲小姐:OpenAI的核心是造出強(qiáng)大的“單一神明”,可以解決我所有的問(wèn)題和疑惑,成為我的助理。而你要做的是智能的集體,每一個(gè)單體在協(xié)作機(jī)制下涌現(xiàn)出更符合自然法則的智能體系?
劉凡平:是的。OpenAI造出的“神”需要人的信仰與崇拜,它會(huì)加速信息不公平。我們更希望每個(gè)人都能公平地獲得信息。
為什么要追求OpenAI的模式,創(chuàng)造一個(gè)所謂的“神”?從更高的維度來(lái)說(shuō),為什么我們要尋找單一最聰明的智能體?一個(gè)小孩長(zhǎng)到10歲左右,他的知識(shí)面可能還不夠廣泛,但我們能判斷出這個(gè)孩子有潛力。這說(shuō)明我們更看重孩子的學(xué)習(xí)能力,而不是他出生時(shí)的聰明程度。智能體最重要的是與社會(huì)進(jìn)化同步的能力,而不是它絕對(duì)的聰明程度。
甲小姐:OpenAI的做法可能代表工程師特有的一種野心。工程師都喜歡造物,都想扮演造物主。
劉凡平:但是人類(lèi)無(wú)法創(chuàng)造這類(lèi)生物,因?yàn)楦袃r(jià)值的東西不是創(chuàng)造生物,而是以人類(lèi)為中心去創(chuàng)造價(jià)值。我們應(yīng)該以人為中心,而不是以神為中心。
甲小姐:人造神具有一種神秘感,讓這個(gè)賽道更性感,可以讓估值沖上百億甚至千億美金。如果OpenAI宣傳的是要做輔助人類(lèi)拍照的工具,就不可能支撐它今天的市值。而你是在祛魅,直接說(shuō)我們可以降低30%成本甚至更多,實(shí)現(xiàn)多模態(tài)的終端智能等等。這可能意味著你的創(chuàng)業(yè)之路沒(méi)有神秘光環(huán)護(hù)法。
劉凡平:我們需要的不是神秘光環(huán),而是實(shí)現(xiàn)我們的群體智能。這才是最核心的——其他的光環(huán)如果不能轉(zhuǎn)換成為社會(huì)服務(wù)的價(jià)值,我們認(rèn)為沒(méi)有意義。
甲小姐:行業(yè)很多人選擇蹲守、后發(fā)、追趕,而你本來(lái)也可以不用辛苦地扛大旗,等群體智能的行業(yè)領(lǐng)導(dǎo)者出現(xiàn)了,你再跟進(jìn)就可以。你為什么要選擇自己突破一個(gè)全新的范式?
劉凡平:我們已經(jīng)在跟隨了,行業(yè)老大就是大自然。生物界已經(jīng)給了我們明確答案。
甲小姐:這讓我想到幾年前我和達(dá)特茅斯會(huì)議的參與者特倫斯·謝諾夫斯基的對(duì)話。他當(dāng)時(shí)也告訴我,當(dāng)我們無(wú)路可走的時(shí)候,就回歸自然。我們可以遵循自然的機(jī)制,而不是在腦海中杜撰一個(gè)烏托邦。
他的觀點(diǎn)有點(diǎn)類(lèi)似“道法自然”的東方哲學(xué),而西方哲學(xué)更強(qiáng)調(diào)個(gè)人英雄主義和英雄敘事,比如漫威中的超級(jí)英雄,往往以改變世界、重塑秩序的個(gè)人力量為核心。
劉凡平:群體智能中也有個(gè)人英雄,但這些角色是動(dòng)態(tài)變化的。比如在產(chǎn)業(yè)領(lǐng)域,甲小姐可能更擅長(zhǎng);當(dāng)話題轉(zhuǎn)向計(jì)算機(jī)科學(xué),另一位成員更了解技術(shù)細(xì)節(jié),他就成為新的中心節(jié)點(diǎn)——這種角色的轉(zhuǎn)換體現(xiàn)了群體智能的重要特征:中心點(diǎn)的去中心化。它不僅僅依賴于個(gè)體的專(zhuān)業(yè)能力,更重要的是如何靈活調(diào)整角色以適應(yīng)不同情境下的需求,從而實(shí)現(xiàn)整體效能的最大化。
甲小姐:在具體實(shí)現(xiàn)群體智能的過(guò)程中,RockAI把群體智能的實(shí)現(xiàn)分為創(chuàng)新型基礎(chǔ)架構(gòu)、多元化硬件生態(tài)、自適應(yīng)智能進(jìn)化、協(xié)同化群體智能四個(gè)階段,確定這四個(gè)階段的條件和標(biāo)準(zhǔn)是什么?
劉凡平:我們已經(jīng)實(shí)現(xiàn)了第一個(gè)自主架構(gòu)模型,多元化的硬件生態(tài)系統(tǒng)也已構(gòu)建完畢。在自主學(xué)習(xí)與自適應(yīng)進(jìn)化方面,一個(gè)關(guān)鍵特性是“訓(xùn)推同步”,即訓(xùn)練與推理過(guò)程能夠同時(shí)進(jìn)行,這類(lèi)似于人際交流:當(dāng)我表達(dá)觀點(diǎn)時(shí)(推理階段),同時(shí)也通過(guò)傾聽(tīng)你的介紹來(lái)進(jìn)行自我學(xué)習(xí)(訓(xùn)練階段)。因此,系統(tǒng)能夠在執(zhí)行任務(wù)的同時(shí)不斷優(yōu)化自身性能,實(shí)現(xiàn)持續(xù)的學(xué)習(xí)與改進(jìn)。“訓(xùn)推同步”不僅是模型自我完善的核心機(jī)制,也是驗(yàn)證其自主學(xué)習(xí)能力的有效方式。將邊學(xué)習(xí)、邊輸出、邊討論的理念融入整個(gè)過(guò)程中,就可以顯著加速系統(tǒng)的成長(zhǎng)速度和知識(shí)積累效率。
甲小姐:從執(zhí)行角度來(lái)看,哪些是你確定已經(jīng)完成的事情,哪些未來(lái)還有留白和風(fēng)險(xiǎn)?
劉凡平:對(duì)于架構(gòu)我們完全確定,另外自主學(xué)習(xí)與自適應(yīng)智能進(jìn)化代表的第三階段也在我們實(shí)驗(yàn)室里運(yùn)行到比較好的狀態(tài),明年會(huì)正式對(duì)外發(fā)布。目前正在挑戰(zhàn)的是第四階段,也就是機(jī)器與機(jī)器之間如何協(xié)作的過(guò)程。人類(lèi)的信息交流是通過(guò)語(yǔ)言,但語(yǔ)言溝通需要時(shí)間成本,機(jī)器溝通的效率會(huì)更高,我們還在探索如何通過(guò)最高的效率實(shí)現(xiàn)相互合作,預(yù)計(jì)2026年會(huì)進(jìn)入群體智能階段。
甲小姐:我可否理解為,你相信智能的本質(zhì)不是在運(yùn)動(dòng)場(chǎng)上比誰(shuí)跳得高,而是人類(lèi)作為一個(gè)集體,在這項(xiàng)運(yùn)動(dòng)上可以達(dá)到什么程度?在這條路上你的勝算有多大?
劉凡平:我們非常有信心,100%。
甲小姐:為什么?
劉凡平:2020年底,我在一個(gè)AI和機(jī)器人的大會(huì)上講完自己大模型的內(nèi)容,一位行業(yè)大佬拍著我肩膀說(shuō),你走錯(cuò)路了,但我當(dāng)時(shí)很堅(jiān)定。等到ChatGPT火起來(lái)的時(shí)候,我們的模型早已交付。所以我相信自己的判斷力。隨著我們的模型在社會(huì)上投入應(yīng)用,越來(lái)越多廠商接觸到我們,從自我認(rèn)可到外部認(rèn)可的過(guò)程已經(jīng)開(kāi)始顯現(xiàn)。
3.“2024年到2025年,基礎(chǔ)算法的變化一定會(huì)發(fā)生”
甲小姐:ChatGPT之所以讓人驚艷,是因?yàn)樗龀龅漠a(chǎn)品讓人覺(jué)得“像人”。從智能的本質(zhì)來(lái)說(shuō),很多人認(rèn)為智能有沒(méi)有意識(shí)、怎么想不重要,只要它看著像智能,聽(tīng)著像智能,用著像智能,它就是智能。而你選擇的道路,讓智能看起來(lái)并不“像人”。
劉凡平:我不太認(rèn)同“像人”是唯一標(biāo)準(zhǔn)。我覺(jué)得智能還是源自物理世界,它是從物理世界逐步衍生出來(lái)的。大家心中感受到的智能只是表象。第一,每個(gè)人的感覺(jué)不完全一樣。第二,現(xiàn)在大家用ChatGPT的頻率也不一定有剛發(fā)布時(shí)那么高了。
甲小姐:Transformer的作者之一表示,要想讓人工智能真正邁進(jìn),你得做到顯著優(yōu)秀,讓人一看就知道。他也因此認(rèn)為,當(dāng)前業(yè)界發(fā)展還過(guò)于靜態(tài),一直留在原點(diǎn)。你怎么評(píng)價(jià)他的觀點(diǎn)?
劉凡平:他提到要顯著被看到,這個(gè)觀點(diǎn)我認(rèn)同。但另一方面,智能化存在演進(jìn)的過(guò)程,他說(shuō)的靜態(tài)也許是相對(duì)的。就好比我們?nèi)嗽诖?我相對(duì)于船,我是靜態(tài)的,但相對(duì)于岸邊的人,其實(shí)我在運(yùn)動(dòng)。也許他作為業(yè)內(nèi)人士看到的內(nèi)容相對(duì)靜止,但宏觀世界已經(jīng)在向前。
甲小姐:業(yè)內(nèi)有一些和你們類(lèi)似的架構(gòu)或者團(tuán)隊(duì),比如去年發(fā)布的RWKV和Mamba模型被稱(chēng)為T(mén)ransformer的強(qiáng)勁對(duì)手,包括最近MIT推出的LFM架構(gòu),據(jù)稱(chēng)在性能上已經(jīng)超越了Llama3.2。你有沒(méi)有關(guān)注他們?
劉凡平:他們也是我們關(guān)注的一部分,但是從實(shí)踐效果來(lái)說(shuō),我們現(xiàn)階段比較樂(lè)觀,因?yàn)槲覀兊讓蛹軜?gòu)的原理比他們先進(jìn)很多。
甲小姐:從某種意義上來(lái)說(shuō),你現(xiàn)在可能要呼喚競(jìng)爭(zhēng)對(duì)手,因?yàn)樾枰喾荰ransformer路線的孤勇者把這個(gè)大方向點(diǎn)亮。
劉凡平:有可能他們也在呼喚我們。
甲小姐:很多人跟我說(shuō)市場(chǎng)已經(jīng)非常卷了。你認(rèn)為國(guó)內(nèi)大模型研發(fā)是否也陷入模式化的困境?如何避免國(guó)內(nèi)人工智能行業(yè)走向加拉帕格斯時(shí)刻(指孤立的生態(tài)系統(tǒng)遵循獨(dú)立范式,一旦有外來(lái)范式或者物種加入,原有的體系變得異常脆弱)?
劉凡平:困境是存在的,Transformer現(xiàn)在的確陷入這樣的怪圈里面。目前國(guó)內(nèi)和國(guó)外的狀態(tài),我覺(jué)得可以比喻成一場(chǎng)技術(shù)的接力賽:OpenAI提出概念,Meta負(fù)責(zé)開(kāi)源,而國(guó)內(nèi)則專(zhuān)注于應(yīng)用。這并非我們追求的方向。
甲小姐:沒(méi)錯(cuò),很多人都在蓄勢(shì)待發(fā)地等著當(dāng)“第二名”。我在2024年5月的甲子引力大會(huì)上也提到,AI已經(jīng)變成了一場(chǎng)明牌游戲——一旦先行者跑通了,驗(yàn)證了,后來(lái)者的速度就加快了。從結(jié)果看,AI很像是一場(chǎng)“me too”競(jìng)爭(zhēng):你一旦有,我馬上有。
劉凡平:但這是一場(chǎng)多樣化的比賽,我們不應(yīng)該僅僅看到Transformer,并且Transformer現(xiàn)在的困境也和太多人投入在上面有關(guān)。
甲小姐:幾年前,關(guān)于人工智能的討論還充滿了自信與熱情,人們積極探討真智能的定義及對(duì)未來(lái)的憧憬?,F(xiàn)在我感到許多人似乎放棄了獨(dú)立思考,轉(zhuǎn)而依賴OpenAI來(lái)設(shè)定智能標(biāo)準(zhǔn)和技術(shù)突破的方向。每當(dāng)OpenAI預(yù)告GPT-5的重大進(jìn)展,公眾便翹首以盼;若GPT-5遭遇挑戰(zhàn),OpenAI推出GPT-4o和o1之類(lèi)的新模型,大眾的關(guān)注點(diǎn)又迅速轉(zhuǎn)移。
劉凡平:問(wèn)題在于,為什么我們要等OpenAI呢?事實(shí)上在OpenAI創(chuàng)業(yè)之初,它并不是主流。當(dāng)時(shí)Transformer架構(gòu)的Bert是主流。而現(xiàn)在的OpenAI是不是當(dāng)年的Google Bert?為什么現(xiàn)在不能再產(chǎn)生新的路線?我認(rèn)為 follow OpenAI不是一條合理的路,而且也不適合我們國(guó)內(nèi)的產(chǎn)品。
甲小姐:每個(gè)時(shí)代的技術(shù)自有屬于它的代際使命。我想知道你對(duì)人工智能行業(yè)發(fā)展的判斷,第一是關(guān)于人工智能在2024年的預(yù)測(cè),第二是對(duì)5年后人工智能的預(yù)判,最后是關(guān)于人工智能的終極預(yù)判。
劉凡平:我內(nèi)心一直有明確的答案。2024年,人工智能還會(huì)發(fā)生很大變化,核心體現(xiàn)在算法層面,我相信很重要的算法很快就會(huì)誕生。就像剛剛獲得諾貝爾物理學(xué)獎(jiǎng)的辛頓,他很早就用FF算法挑戰(zhàn)過(guò)自己提出的反向傳播算法,而反向傳播是現(xiàn)在人工智能最關(guān)鍵的底層算法。像他一樣的很多人都看到了改變底層算法的必要性。2024年到2025年,基礎(chǔ)算法的變化一定會(huì)發(fā)生,可能還會(huì)更快,因?yàn)榍把氐难芯空叨家庾R(shí)到了這一點(diǎn)。
5年以后,不管硅谷或者國(guó)內(nèi)會(huì)有什么預(yù)判,通用人工智能的水平一定遠(yuǎn)遠(yuǎn)超過(guò)現(xiàn)在的水平。
至于終極的形態(tài),我還是認(rèn)為會(huì)走向群體智能。只有走向群體智能,才可能真正邁向更廣泛的大眾化人工智能。
甲小姐:你的三個(gè)判斷很具體,尤其算法在2024年內(nèi)就可能迎來(lái)重要的革新,這件事被大量媒體忽略了。還有什么是你想分享的?
劉凡平:我想強(qiáng)調(diào)的是,從我個(gè)人和團(tuán)隊(duì)的創(chuàng)業(yè)歷程來(lái)看,創(chuàng)新才是科技公司的本質(zhì),而不是一味地follow。follow這條路有它的價(jià)值,但不能改變太多。我們相信基礎(chǔ)層的創(chuàng)新能對(duì)應(yīng)用層和未來(lái)的市場(chǎng)價(jià)值帶來(lái)巨大的改變,所以我們?cè)敢馊プ鲆患覄?chuàng)新的科技企業(yè)。