
前言:第四次工業(yè)革命是人工智能之前我們一直判斷美國經(jīng)濟(jì)會進(jìn)入衰退,但美國經(jīng)濟(jì)沒有衰退,美國搞出了ChatGPT,相當(dāng)于一次真正的工業(yè)革命。之前我們對工業(yè)革命有個二次判斷失誤,一次失誤是以德國為主的工業(yè)4.0,搞機(jī)器聯(lián)網(wǎng);第二次判斷失誤是搞iot物聯(lián)網(wǎng),物聯(lián)網(wǎng)代表代表第四次工業(yè)革命,代表未來趨勢,但真正的工業(yè)革命可能是AI。所以目前大家不敢創(chuàng)業(yè)、創(chuàng)新了呢,當(dāng)前進(jìn)入一個什么了一個無IP不商業(yè),無AI不創(chuàng)業(yè)時代,今天如果不搞AI,拿到投資都不可能。 可以大言不慚地說,我們是業(yè)內(nèi)最早在網(wǎng)上發(fā)文給工業(yè)4.0潑冷水的(參見舊文《給4.0潑冷水:制造企業(yè)應(yīng)該如何正確看待和開展工業(yè)4.0項目》,《工業(yè)4.0的冷處理》,《2021,和工業(yè)4.0說拜拜》),而且在各種場合和工業(yè)4.0的主流觀點唱反調(diào),并建議企業(yè)謹(jǐn)慎投資工業(yè)4.0概念相關(guān)的項目。我們反對工業(yè)4.0的非常重要的原因之一,就是它名不配位。把大數(shù)據(jù),物聯(lián)網(wǎng),數(shù)字孿生之類的技術(shù)說成是第四次工業(yè)革命,和蒸汽機(jī)(蒸汽革命),發(fā)電機(jī)(電力革命),計算機(jī)(信息革命)比肩過于牽強(qiáng)。就好比說四大發(fā)明有造紙術(shù),印刷術(shù),指南針和充電寶;四大美女有西施,貂蟬,王昭君和李小璐;四大天王有劉德華,張學(xué)友,郭富城和黃曉明... ...就像是三句半表演的第四位,承擔(dān)了全場的笑點。所以我們一直認(rèn)為工業(yè)4.0絕算不上第四次工業(yè)革命,最有希望成為第四次工業(yè)革命導(dǎo)火索的技術(shù)是人工智能,其次是離我們還有些遙遠(yuǎn)的量子計算機(jī)。我們看來,前兩次工業(yè)革命都是動力革命:工業(yè)1.0時代最主要的動力設(shè)備是水輪機(jī)(其實水力在人類制造業(yè)發(fā)展史中占有極其重要的地位,參見《工業(yè)0.0,一個被我們忽略的水力時代》)和蒸汽機(jī);工業(yè)2.0之后,主要的動力源就變成了內(nèi)燃機(jī)和電動機(jī)。之后盡管出現(xiàn)了蒸汽輪機(jī),燃?xì)廨啓C(jī),沖壓發(fā)動機(jī),核反應(yīng)堆等,但都不足以改變世界。下一次科技革命如果是動力革命,那么標(biāo)志性技術(shù)肯定非核聚變莫屬。工業(yè)3.0的標(biāo)志性技術(shù)是計算機(jī)和互聯(lián)網(wǎng),工業(yè)4.0的標(biāo)志性技術(shù)是人工智能和呼之欲出的量子計算機(jī),后兩次科技革命我稱之為“算力革命”。即便量子計算機(jī)一時半會兒還出不來,但也絕不妨礙人工智能引領(lǐng)本輪科技革命。 ChatGPT的橫空出世意味著初代人工智能已經(jīng)實現(xiàn)。經(jīng)過實測的人都會認(rèn)為ChatGPT說的是人話,認(rèn)為ChatGPT完全可以通過圖靈測試(即盲測聊天時讓人類無法分辨聊天對象是自己的同類還是和機(jī)器),即便有些問題受到人為的限制,在解除算法約束條件后,ChatGPT的表現(xiàn)只會更加出色。所以既然ChatGPT能夠通過圖靈測試,那么說明人工智能已經(jīng)實現(xiàn),這意味著第二次算力革命已經(jīng)開始,它將直接影響到包括工業(yè)和制造業(yè)在內(nèi)的各個領(lǐng)域。 應(yīng)該說ChatGPT是專門針對語言邏輯這類范式問題的人工智能。除了自然語言的組織已經(jīng)看不出和人類的區(qū)別,ChatGPT真正厲害的地方是對機(jī)器語言的組織和生成。只要是標(biāo)準(zhǔn)的機(jī)器代碼它都可以生成于是我繼續(xù)循循善誘繼續(xù)引導(dǎo),而ChatGPT似乎也馬上理解了,而且用中文給出了非常正確且清晰的原因描述。 目前ChatGPT的聊天能力已經(jīng)空前強(qiáng)大,既然可以按照人類自然語言的描述生成計算機(jī)代碼,那么就可以自動運(yùn)行這些代碼,進(jìn)而控制機(jī)器,實現(xiàn)信息自動化。 信息化的主要作用是解決繁瑣流程問題,比如各種審批流程,整理財務(wù)報表等等。如果工作流程比較復(fù)雜繁瑣,那么就需要上信息化軟件。現(xiàn)代企業(yè)的業(yè)務(wù)因為都比較復(fù)雜,所以信息系統(tǒng)幾乎是必須的。所以說數(shù)字化轉(zhuǎn)型是智能制造的基礎(chǔ)這句話一點沒錯。 對于智能化的定義大家的分歧都很大,我的看法是:能夠用人工智能的方式解決決策問題的系統(tǒng)才算是智能化系統(tǒng)。 既然我可以用Chat GPT生成數(shù)控機(jī)床的G代碼,就說明AI已經(jīng)作為一個通用性的工具,影響到工業(yè)領(lǐng)域了。按照我之前的定義,工業(yè)領(lǐng)域的人工智能才算得上第四次工業(yè)革命,所以Chat GPT的成功意味著工業(yè)4.0的開始。人類的思維實際上就體現(xiàn)在語言上。思考就是自己和自己的對話。想明白一件事其實就是被自己頭腦里的那個聲音說服了。接受某個人的思想或認(rèn)同某個人的觀念,表現(xiàn)形式就是同意這個人說過的話和寫過的文字。 因此,語言即思想。

人工智能引領(lǐng)的第四次科技和工業(yè)革命已經(jīng)到來。掌握ChatGPT,對個人有什么好處,首先人人都可以成為程序員,你不需要在去學(xué)習(xí)各種編程語言,機(jī)器代碼,ChatGPT智慧會把人類的語言,要求變成機(jī)器語言。從用戶直達(dá)機(jī)器,省去中間產(chǎn)品經(jīng)理,程序員。一個不懂編程的人,也可以自己開發(fā)需要的網(wǎng)站。 你不用在擔(dān)心全球旅游語言不通,AI人工智能翻譯軟件,可以無障礙讓你與任何國家的人交流; 你也不用費(fèi)力再考駕照了,未來所有路上行駛的人工智能駕駛汽車,不是按照計算機(jī)導(dǎo)航指令行駛,而是模仿人類神經(jīng)網(wǎng)絡(luò),快速學(xué)習(xí)能力,根據(jù)實際路況預(yù)判,超過人類任何老司機(jī)實現(xiàn)絕對的安全行駛;
甚至你可以不懂繪畫、音樂、影視編輯,ChatGPT可以幫你做出任何超過你預(yù)期的作品。 當(dāng)然ChatGPT可以做很多需要超強(qiáng)學(xué)習(xí)力的事情,目前已經(jīng)進(jìn)化到了GPT4,馬上到了GPT5,已經(jīng)超過人力目前最強(qiáng)大腦,大家可以想象下,未來包括宇宙探索,飛碟制造,生物醫(yī)藥,新能源、新材料創(chuàng)新,創(chuàng)造都可以成為人類最佳助手,但他永遠(yuǎn)代替不了人類的選擇與責(zé)任擔(dān)當(dāng)。

正文
我們即將進(jìn)入第四次工業(yè)革命時代,其規(guī)模之大不可想象——任正非
我們正處于傳統(tǒng)信息技術(shù)時代的黃昏,和人工智能時代的黎明。
在過去的260年間,人類社會經(jīng)歷了三次巨大的科技創(chuàng)新浪潮,蒸汽機(jī)、電力和信息技術(shù),將全球GDP提升了近千倍。每一次科技浪潮都通過某一項先進(jìn)生產(chǎn)力要素的突破,進(jìn)而引起大多數(shù)行業(yè)的變革:比如蒸汽機(jī)的出現(xiàn)推動了汽車、火車、輪船、鋼鐵等行業(yè)的巨大發(fā)展,140年前美國鐵路行業(yè)的惡性競爭史,就如同現(xiàn)今互聯(lián)網(wǎng)行業(yè)BAT之間的競爭。而鐵路行業(yè)發(fā)展、兼并所需的巨額金融資本,又驅(qū)動了華爾街的發(fā)展,逐漸成為全球的金融中心。
二戰(zhàn)之后以信息技術(shù)為核心的第三次科技革命迄今已逾70年,將全球GDP提升約60倍。其中可分為兩段:1950年-1990年,是半導(dǎo)體產(chǎn)業(yè)迅猛發(fā)展的時代,推動了大型計算機(jī)向個人PC的小型化;1990年至今是近30年的互聯(lián)網(wǎng)全球化時代,而互聯(lián)網(wǎng)時代又細(xì)分為桌面互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)兩段。
但隨著摩爾定律的失效和信息技術(shù)紅利徹底用盡,加上疫情黑天鵝影響,全球GDP衰退,引發(fā)并加劇了全球地緣政治和軍事沖突,開始向逆全球化發(fā)展。
所以未來到底屬于web3、元宇宙,還是碳中和?到底什么樣的革命性技術(shù)可以引領(lǐng)人類社會走出經(jīng)濟(jì)衰退、疫情和戰(zhàn)爭的影響,并將全球經(jīng)濟(jì)體量再向上推動增長下一個50倍?
我們的答案是,我們早已處于人工智能時代之中。就像直到2010年iphone4發(fā)布,絕大多數(shù)人也并未意識到移動互聯(lián)網(wǎng)革命早已開始一樣,如今人工智能其實也已廣泛應(yīng)用,比如到處遍布的攝像頭和手機(jī)人臉識別,微信語音和文本轉(zhuǎn)換,抖音動態(tài)美顏特效、推薦算法,家庭掃地機(jī)器人和餐廳送餐機(jī)器人,背后都是人工智能核心技術(shù)在過去十年不斷取得的巨大突破。
互聯(lián)網(wǎng)已經(jīng)是傳統(tǒng)行業(yè)。
互聯(lián)網(wǎng)技術(shù)作為過去30年最先進(jìn)的生產(chǎn)力要素,改變了全球的所有人、所有產(chǎn)業(yè)、社會經(jīng)濟(jì),甚至是政治、軍事、宗教。
雖然互聯(lián)網(wǎng)的技術(shù)紅利已基本用盡,但我們?nèi)钥赏ㄟ^研究其歷史規(guī)律,來預(yù)測未來新技術(shù)發(fā)展的可能路徑。
30年的互聯(lián)網(wǎng)發(fā)展歷程總體可分為桌面互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)兩個時代,按產(chǎn)業(yè)滲透規(guī)律,又可分為信息互聯(lián)網(wǎng)、消費(fèi)互聯(lián)網(wǎng)和產(chǎn)業(yè)互聯(lián)網(wǎng)三大階段。
系統(tǒng)硬件都是最先起步,包括底層芯片、操作系統(tǒng)、聯(lián)網(wǎng)通信、整機(jī)等,進(jìn)而初步向媒體工具、文娛游戲行業(yè)滲透,因為這些領(lǐng)域最易受新技術(shù)的影響。當(dāng)2002年中國網(wǎng)民達(dá)到6000萬人,2012年中國智能手機(jī)出貨量達(dá)到2億部之后 ,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)開始全面開花,滲透變革了直接to C的眾多行業(yè),如零售消費(fèi)、交通出行、教育、金融、汽車、居住、醫(yī)療等。而當(dāng)用戶量進(jìn)一步上漲、新技術(shù)的滲透進(jìn)一步加深,企業(yè)服務(wù)、物流、制造、農(nóng)業(yè)、能源等to B產(chǎn)業(yè)被影響。
而這個過程中可以發(fā)現(xiàn),移動互聯(lián)網(wǎng)時代對產(chǎn)業(yè)的滲透深度比桌面互聯(lián)網(wǎng)更深,桌面互聯(lián)網(wǎng)介入行業(yè)基本停留在信息連接層面,而到移動互聯(lián)網(wǎng)時代,眾多掌握先進(jìn)技術(shù)要素的公司開始自己下場開超市、組車隊、重構(gòu)教育內(nèi)容和金融機(jī)構(gòu),甚至是賣房、造車。也有些公司雖然誕生在桌面時代,但成功抓住移動爆發(fā)紅利殺出重圍,比如美團(tuán)、去哪兒、支付寶。
抖音的崛起是中國移動互聯(lián)網(wǎng)時代的最大變數(shù),也是數(shù)據(jù)通信傳輸技術(shù)不斷提升的必然,引發(fā)了用戶流量結(jié)構(gòu)的重組,進(jìn)而催生了一大批抓住抖音流量紅利崛起的消費(fèi)品牌,如完美日記、花西子等等。但最終都逃不過被平臺收割的命運(yùn),就像當(dāng)年淘品牌的結(jié)局一樣。微信支付、支付寶的普及極大推動了線下連鎖零售的數(shù)字化程度和管理半徑,減少了上下游現(xiàn)金收款產(chǎn)生的風(fēng)險,促使其在資本市場被重新認(rèn)可,連鎖化率進(jìn)一步提升,比如喜茶、瑞幸、Manner等等。這兩條邏輯共同構(gòu)成了過去幾年的消費(fèi)投資熱潮主線。
如何評判一個新技術(shù)是否能引領(lǐng)未來的發(fā)展方向?
我們要看它能否從本質(zhì)上解放生產(chǎn)力、發(fā)展生產(chǎn)力。
蒸汽機(jī)之所以推動了第一次科技革命,是因為其極大的提升了勞動生產(chǎn)力,并將大量勞動人口從第一產(chǎn)業(yè)農(nóng)業(yè)的低級勞動中解放出來,進(jìn)入第二產(chǎn)業(yè)工業(yè)。電力加速了這一過程,并推動了第三產(chǎn)業(yè)服務(wù)業(yè)的出現(xiàn)和發(fā)展。信息技術(shù)將更多的人口從第一、二產(chǎn)業(yè)中釋放,進(jìn)入第三產(chǎn)業(yè)(如大量年輕人不再進(jìn)廠而去送外賣、跑滴滴),于是形成了如今全球第三產(chǎn)業(yè)GDP占比55%,中國第三產(chǎn)業(yè)勞動人口占比50%的格局。
機(jī)器人即是人工智能技術(shù)的硬件形態(tài),在可見的未來,將第一二三產(chǎn)業(yè)的勞動人口從低級勞動中大比例釋放和替代,并在這個過程中推動全球GDP繼續(xù)百倍增長。
同時可大膽預(yù)言,以創(chuàng)新為職業(yè)的第四產(chǎn)業(yè)將會出現(xiàn),而這個職業(yè)在人類的歷史長河中其實一直存在于第一二三產(chǎn)業(yè)的邊緣,不斷用突破性創(chuàng)新推動著人類技術(shù)的進(jìn)步,且社會生產(chǎn)力的提升促使該職業(yè)人群不斷擴(kuò)大。這大約能證明劉慈欣的技術(shù)爆炸假說來源。
人工智能從模塊上可分為感知、計算和控制三大部分,由表及里可分為應(yīng)用層、數(shù)據(jù)層、算法層、算力層,而隨著2012年芯片進(jìn)入28nm制程后的量子隧穿效應(yīng)導(dǎo)致摩爾定律失效,“每提升一倍算力,就需要一倍能源”的后摩爾定律或?qū)⒊蔀槿斯ぶ悄軙r代的核心驅(qū)動邏輯,算力的發(fā)展將極大受制于能源,當(dāng)前全球用于制造算力芯片的能源占全球用電量的約1%,可以預(yù)測在人工智能大規(guī)模普及的未來數(shù)十年后,該比例將會大幅提升至50%甚至90%以上。而全球如何在減少化石能源、提升清潔能源占比,從而確保減少碳排放遏制全球升溫的同時,持續(xù)提升能源使用量級,將推動一系列能源技術(shù)革命。關(guān)于該方向的研究可參考我們的另一篇報告《碳中和:能源技術(shù)新革命》。
早在第一次科技革命之前260年,哥倫布地理大發(fā)現(xiàn)就使西班牙成為了第一個全球化霸主。蒸汽機(jī)驅(qū)動英國打敗西班牙無敵艦隊,電力和兩次世界大戰(zhàn)使美國超過英國,信息技術(shù)又讓美國贏得和蘇聯(lián)的冷戰(zhàn)對抗,全球過了30年相對和平的單極霸權(quán)格局。
因此中國如果僅在現(xiàn)有技術(shù)框架中與歐美競爭,只會不斷被卡脖子,事倍功半。只有引領(lǐng)下一代人工智能和碳中和能源技術(shù)科技革命浪潮,才能從全球競爭中勝出。
盡管中國已經(jīng)躋身人工智能領(lǐng)域的大國,但是我們必須認(rèn)識到中美之間在AI領(lǐng)域仍然有著明顯的差距。從投資金額和布局上看,從2013年到2021年,美國對人工智能公司的私人投資是中國的2倍多。當(dāng)前美國AI企業(yè)數(shù)量領(lǐng)先中國,布局在整個產(chǎn)業(yè)鏈上,尤其在算法、芯片等產(chǎn)業(yè)核心領(lǐng)域積累了強(qiáng)大的技術(shù)創(chuàng)新優(yōu)勢。更關(guān)鍵的是,盡管近年來中國在人工智能領(lǐng)域的論文和專利數(shù)量保持高速增長,但中國AI研究的質(zhì)量與美國仍然有較大差距(集中體現(xiàn)在AI頂會論文的引用量的差距上)。
2013-2021年中美在AI領(lǐng)域私有部門(如風(fēng)險投資、個人投資等)投資金額上差距逐漸拉大
中國在AI頂會上發(fā)表的文章數(shù)量已經(jīng)反超美國,但影響力上仍然與美國有較大差距
因此,中國需要持續(xù)加大在AI領(lǐng)域的研發(fā)費(fèi)用規(guī)模,特別是加大基礎(chǔ)學(xué)科的人才培養(yǎng),吸引全世界優(yōu)秀的AI人才。只有這樣,中國才能有朝一日趕超美國,在基礎(chǔ)學(xué)科建設(shè)、專利及論文發(fā)表、高端研發(fā)人才、創(chuàng)業(yè)投資和領(lǐng)軍企業(yè)等關(guān)鍵環(huán)節(jié)上的擁有自己的優(yōu)勢,形成持久領(lǐng)軍世界的格局。
一、AI發(fā)展簡史
人工智能的概念第一次被提出是在1956年達(dá)特茅斯夏季人工智能研究會議上。當(dāng)時的科學(xué)家主要討論了計算機(jī)科學(xué)領(lǐng)域尚未解決的問題,期待通過模擬人類大腦的運(yùn)行,解決一些特定領(lǐng)域的具體問題(例如開發(fā)幾何定理證明器)。
那么到底什么是人工智能?目前看來,Stuart Russell與Peter Norvig在《人工智能:一種現(xiàn)代的方法》一書中的定義最為準(zhǔn)確:人工智能是有關(guān)“智能主體(Intelligent agent)的研究與設(shè)計”的學(xué)問,而“智能主體”是指一個可以觀察周遭環(huán)境并做出行動以達(dá)致目標(biāo)的系統(tǒng)。這個定義既強(qiáng)調(diào)了人工智能可以根據(jù)環(huán)境感知做出主動反應(yīng),又強(qiáng)調(diào)人工智能所做出的反應(yīng)必須達(dá)成目標(biāo),同時沒有給人造成“人工智能是對人類思維方式或人類總結(jié)的思維法則的模仿”這種錯覺。
到目前為止,人工智能一共經(jīng)歷了三波浪潮。
第一次AI浪潮與圖靈和他提出的“圖靈測試”緊密相關(guān)。圖靈測試剛提出沒幾年,人們似乎就看到了計算機(jī)通過圖靈測試的曙光:1966年MIT教授Joseph Weizenbaum發(fā)明了一個可以和人對話的小程序——Eliza(取名字蕭伯納的戲劇《茶花女》),轟動世界。但是Eliza的程序原理和源代碼顯示,Eliza本質(zhì)是一個在話題庫里通過關(guān)鍵字映射的方式,根據(jù)人的問話回復(fù)設(shè)定好的答語的程序。不過現(xiàn)在人們認(rèn)為,Eliza是微軟小冰、Siri、Allo和Alexa的真正鼻祖。圖靈測試以及為了通過圖靈測試而開展的技術(shù)研發(fā),都在過去的幾十年時間里推動了人工智能,特別是自然語言處理技術(shù)(NLP)的飛速發(fā)展。
第二次AI浪潮出現(xiàn)在1980-1990年代,語音識別(ASR)是最具代表性的幾項突破性進(jìn)展之一。在當(dāng)時,語音識別主要分成兩大流派:專家系統(tǒng)和概率系統(tǒng)。專家系統(tǒng)嚴(yán)重依賴人類的語言學(xué)知識,可拓展性和可適應(yīng)性都很差,難以解決“不特定語者、大詞匯、連續(xù)性語音識別”這三大難題。而概率系統(tǒng)則基于大型的語音數(shù)據(jù)語料庫,使用統(tǒng)計模型進(jìn)行語音識別工作。中國學(xué)者李開復(fù)在這個領(lǐng)域取得了很大成果,基本上宣告了以專家系統(tǒng)為代表的符號主義學(xué)派(Symbolic AI)在語音識別領(lǐng)域的失敗。通過引入統(tǒng)計模型,語音識別的準(zhǔn)確率提升了一個層次。
第三次AI浪潮起始于2006年,很大程度上歸功于深度學(xué)習(xí)的實用化進(jìn)程。深度學(xué)習(xí)興起建立在以Geoffrey Hinton為代表的科學(xué)家數(shù)十年的積累基礎(chǔ)之上。簡單地說,深度學(xué)習(xí)就是把計算機(jī)要學(xué)習(xí)的東西看成一大堆數(shù)據(jù),把這些數(shù)據(jù)丟進(jìn)一個復(fù)雜的、包含多個層級的數(shù)據(jù)處理網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò)),然后檢查經(jīng)過這個網(wǎng)絡(luò)處理得到的結(jié)果數(shù)據(jù)是不是符合要求——如果符合,就保留這個網(wǎng)絡(luò)作為目標(biāo)模型;如果不符合,就一次次地、鍥而不舍地調(diào)整網(wǎng)絡(luò)的參數(shù)設(shè)置,直到輸出滿足要求為止。本質(zhì)上,指導(dǎo)深度學(xué)習(xí)的是一種“實用主義”的思想。實用主義思想讓深度學(xué)習(xí)的感知能力(建模能力)遠(yuǎn)強(qiáng)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,但也意味著人們難以說出模型中變量的選擇、參數(shù)的取值與最終的感知能力之間的因果關(guān)系。
需要特別說明的是,人們往往容易將深度學(xué)習(xí)與“機(jī)器學(xué)習(xí)”這一概念混淆。事實上,在1956年人工智能的概念第一次被提出后,Arthur Samuel就提出:機(jī)器學(xué)習(xí)研究和構(gòu)建的是一種特殊的算法而非某一個特定的算法,是一個寬泛的概念,指的是利用算法使得計算機(jī)能夠像人一樣從數(shù)據(jù)中挖掘出信息;而深度學(xué)習(xí)只是機(jī)器學(xué)習(xí)的一個子集,是比其他學(xué)習(xí)方法使用了更多的參數(shù)、模型也更加復(fù)雜的一系列算法。簡單地說,深度學(xué)習(xí)就是把計算機(jī)要學(xué)習(xí)的東西看成一大堆數(shù)據(jù),把這些數(shù)據(jù)丟進(jìn)一個復(fù)雜的、包含多個層級的數(shù)據(jù)處理網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò)),然后檢查經(jīng)過這個網(wǎng)絡(luò)處理得到的結(jié)果數(shù)據(jù)是不是符合要求——如果符合,就保留這個網(wǎng)絡(luò)作為目標(biāo)模型,如果不符合,就一次次地、鍥而不舍地調(diào)整網(wǎng)絡(luò)的參數(shù)設(shè)置,直到輸出滿足要求為止。本質(zhì)上,指導(dǎo)深度學(xué)習(xí)的是一種“實用主義”的思想。實用主義思想讓深度學(xué)習(xí)的感知能力(建模能力)遠(yuǎn)強(qiáng)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,但也意味著人們難以說出模型中變量的選擇、參數(shù)的取值與最終的感知能力之間的因果關(guān)系。
二、AI的三大基石解析
如前所述,人工智能由表及里可分為應(yīng)用層、數(shù)據(jù)層、算法層和算力層。
1.算力
算力層包括具備計算能力硬件和大數(shù)據(jù)基礎(chǔ)設(shè)施。回顧歷史我們就會發(fā)現(xiàn),歷次算力層的發(fā)展都會顯著推動算法層的進(jìn)步,并促使技術(shù)的普及應(yīng)用。21世紀(jì)互聯(lián)網(wǎng)大規(guī)模服務(wù)集群的出現(xiàn)、搜索和電商業(yè)務(wù)帶來的大數(shù)據(jù)積累、GPU和異構(gòu)/低功耗芯片興起帶來的運(yùn)算力提升,促成了深度學(xué)習(xí)的誕生,促成了人工智能的這一波爆發(fā)。而AI芯片的出現(xiàn)進(jìn)一步顯著提高了數(shù)據(jù)處理速度:在CPU的基礎(chǔ)上,出現(xiàn)了擅長并行計算的GPU,以及擁有良好運(yùn)行能效比、更適合深度學(xué)習(xí)模型的現(xiàn)場可編程門陣列(FPGA)和應(yīng)用專用集成電路(ASIC)。
當(dāng)前,人工智能的算力層面臨巨大的挑戰(zhàn)。隨著2012年芯片28nm的工藝出現(xiàn),原先通過在平面上增加晶體管的數(shù)量來提升芯片性能的思路因為量子隧穿效應(yīng)而不再可取,摩爾定律開始失效。晶體管MOSFET這個芯片里最基礎(chǔ)的單元,由平面結(jié)構(gòu)變成立體結(jié)構(gòu)(由下圖中的Planar結(jié)構(gòu)轉(zhuǎn)向FinFET結(jié)構(gòu),2018年之后進(jìn)一步從FinFET結(jié)構(gòu)轉(zhuǎn)向GAAFET結(jié)構(gòu))。
三代MOSFET的柵極結(jié)構(gòu)演化。其中灰色代表電流流經(jīng)區(qū)域,綠色代表充當(dāng)閘門的柵極
芯片結(jié)構(gòu)的改變直接導(dǎo)致了芯片制造步驟的增加,最終體現(xiàn)為成本的上升。在2012年28nm工藝的時候,處理器的生產(chǎn)大概需要450步。到了2021年的5nm工藝時,生產(chǎn)環(huán)節(jié)已經(jīng)增加到了1200步。對應(yīng)到每1億個柵極的制造成本上,我們從圖中可以清楚地看到,從90 nm 工藝到7nm工藝,生產(chǎn)成本先下降后上升。這就使得摩爾定律的另一種表述形式——“同樣性能的新品價格每18-24個月減半”不再成立。未來我們很可能見到的情況是,搭載了頂級技術(shù)和工藝生產(chǎn)出來的芯片的電子產(chǎn)品或設(shè)備價格高昂,超過了一般消費(fèi)者的承受力度。
每 1 億個柵極的制造成本
圖片來源:Marvell Technology, 2020 Investor Day
不過算力層的這個變化讓半導(dǎo)體制造企業(yè)受益最大,因為只要需求存在,臺積電、三星、英特爾等幾家掌握先進(jìn)工藝的廠商就會持續(xù)投入資金和人力,不斷設(shè)計和制造新一代芯片,然后根據(jù)自身成本給產(chǎn)品定價。
想要徹底解決摩爾定律失效的問題,需要跳出當(dāng)前芯片設(shè)計的馮·諾依曼結(jié)構(gòu)。類腦芯片、存算一體、尋找基于硅以外的新材料制造芯片,甚至量子計算等等都是潛力巨大的解決方案,但是這些方案距離成熟落地還非常遙遠(yuǎn)(最樂觀地估計也需要幾十年的時間),無法解決當(dāng)下芯片行業(yè)的困局。在這段時期內(nèi),行業(yè)內(nèi)為了提升芯片性能,開始廣泛應(yīng)用Chiplet技術(shù),或者使用碳基芯片、光芯片等等。
Chiplet技術(shù)
Chiplet技術(shù)的原理有點類似搭積木,簡單來說就是把一堆小芯片組合成一塊大芯片。這種技術(shù)能夠以較低的成本制造過于復(fù)雜的芯片,并且保證足夠優(yōu)秀的良率,從2012年開始就逐步被使用。當(dāng)前Chiplet技術(shù)已經(jīng)能夠在二維平面上實現(xiàn)用不同的材料和工藝加工拼接的小核心,Intel等公司正在把Chiplet技術(shù)引入新的階段發(fā)展:在垂直方向上堆疊多層小核心,進(jìn)一步提升芯片的性能(例如Intel于2018年開發(fā)的Foveros 3D Chiplet)。不過Chiplet技術(shù)路線面臨的最大問題來源于芯片熱管理方面:如果在三維結(jié)構(gòu)上堆疊多層小核心,傳統(tǒng)的通過CPU頂部銅蓋一個面散熱的方案將無法解決發(fā)熱問題,因此可能需要在芯片的內(nèi)部嵌入冷卻裝置來解決發(fā)熱功率過高的問題。
碳納米管技術(shù)
使用碳納米管可能是另一個短期解決方案。這項技術(shù)屬于碳基芯片領(lǐng)域,具體來說就是用碳納米管承擔(dān)芯片里基礎(chǔ)元件開關(guān)的功能,而不是像傳統(tǒng)芯片一樣使用摻雜的半導(dǎo)體硅來傳輸電子。這種技術(shù)的優(yōu)勢在于導(dǎo)電性好、散熱快、壽命長,而且由于其本質(zhì)上仍然保留了馮·諾依曼架構(gòu),當(dāng)前的生產(chǎn)工藝、產(chǎn)業(yè)鏈等匹配設(shè)施都不需要做出太大的調(diào)整。但是目前碳納米管的大規(guī)模生產(chǎn)和應(yīng)用還有一些困難,距離把碳納米管按照芯片設(shè)計的要求制造出來可能還需要幾十年。
短期內(nèi),圍繞Chiplet技術(shù)在熱管理方面的探索,和碳納米管技術(shù)的靈活生產(chǎn)制造突破是算力層面上我們重點關(guān)注的機(jī)會。當(dāng)然,我們也要了解目前類腦芯片、存算一體和量子計算等終局解決方案的相關(guān)情況。這里為大家簡單介紹如下:
類腦芯片
類腦芯片的靈感源于人腦。類腦芯片和傳統(tǒng)結(jié)構(gòu)的差異體現(xiàn)在兩方面:第一,類腦芯片中數(shù)據(jù)的讀取、存儲和計算是在同一個單元中同時完成的,也即“存算一體”;第二,單元之間的連接像人類神經(jīng)元之間的連接一樣,依靠“事件驅(qū)動。
目前,類腦芯片的相關(guān)研究分為兩派。一派認(rèn)為需要了解清楚人腦的工作原理,才能模仿人類大腦設(shè)計出新的結(jié)構(gòu)。但是目前人類對人腦的基本原理理解得仍然很粗淺,因此這一派取得的進(jìn)展相當(dāng)有限。另外一派則認(rèn)為,可以先基于當(dāng)前已有的生物學(xué)知識,比照人腦的基礎(chǔ)單元設(shè)計出一些結(jié)構(gòu),然后不斷試驗、優(yōu)化、取得成果,實現(xiàn)突破。目前這一派的研究人員依照神經(jīng)元的基礎(chǔ)結(jié)構(gòu),給類腦芯片做了一些數(shù)學(xué)描述,也搭建了模型,并且做出了不少可以運(yùn)行的芯片。
存算一體
存算一體可以簡單被概括為“用存儲電荷的方式實現(xiàn)計算”,徹底解決了馮諾依曼結(jié)構(gòu)中“存儲”和“計算”兩個步驟速度不匹配的問題(事實上,在以硅為基礎(chǔ)的半導(dǎo)體芯片出現(xiàn)之后,存算速度不匹配的情況就一直存在)。存算一體機(jī)構(gòu)在計算深度學(xué)習(xí)相關(guān)的任務(wù)時表現(xiàn)突出,能耗大約是當(dāng)前傳統(tǒng)計算設(shè)備的百分之一,能夠大大提升人工智能的性能。除此之外,這種芯片在VR和AR眼鏡等可穿戴設(shè)備上有廣闊的應(yīng)用前景,也能推動更高分辨率的顯示設(shè)備價格進(jìn)一步降低。
目前,存算一體仍然有兩個問題沒有突破:第一是基礎(chǔ)單元(憶阻器)的精度不高,其次是缺少算法,在應(yīng)對除了矩陣乘法以外的計算問題時表現(xiàn)遠(yuǎn)不如馮·諾依曼結(jié)構(gòu)的芯片。
量子計算
量子計算是用特殊的方法控制若干個處于量子疊加態(tài)的原子,也叫作“量子”,通過指定的量子態(tài)來實現(xiàn)計算。量子計算機(jī)最適合的是面對一大堆可能性的時候,可以同時對所有可能性做運(yùn)算。為了從所有的結(jié)果中找一個統(tǒng)計規(guī)律,我們需要使用量子計算機(jī)進(jìn)行多次計算。不過由于退相干的問題,量子計算很容易出錯。目前量子計算的糾錯方法有待突破,只有解決了這個問題量子計算才可能被普遍使用。
當(dāng)前量子計算機(jī)體積過大、運(yùn)行環(huán)境嚴(yán)苛、造價昂貴。目前來看量子計算與經(jīng)典計算不是取代與被取代的關(guān)系,而是在對算力要求極高的特定場景中發(fā)揮其高速并行計算的獨特優(yōu)勢。中科大的量子物理學(xué)家陸朝陽曾總結(jié)道,“到目前為止,真正可以從量子計算中受益的實際問題仍然非常有限,享受指數(shù)級加速的就更少了——其他的僅有更有限的加速”。
總體而言,量子計算機(jī)的相關(guān)成果都只停留在科學(xué)研究的階段,距離實際應(yīng)用還很遙遠(yuǎn)。
2.算法
算法層指各類機(jī)器學(xué)習(xí)算法。如果根據(jù)訓(xùn)練方法來分類,機(jī)器學(xué)習(xí)算法也可以分成“無監(jiān)督學(xué)習(xí)”、“監(jiān)督學(xué)習(xí)”和“強(qiáng)化學(xué)習(xí)”等。按照解決問題的類型來分,機(jī)器學(xué)習(xí)算法包括計算機(jī)視覺算法(CV)、自然語言處理算法(NLP)、語音處理和識別算法(ASR)、智慧決策算法(DMS)等。每個算法大類下又有多個具體子技術(shù),這里我們?yōu)榇蠹液唵谓榻B:
2.1 計算機(jī)視覺
計算機(jī)視覺的歷史可以追溯到1966年,當(dāng)時人工智能學(xué)家Minsky要求學(xué)生編寫一個程序,讓計算機(jī)向人類呈現(xiàn)它通過攝像頭看到了什么。到了1970-1980年代,科學(xué)家試圖從人類看東西的方法中獲得借鑒。這一階段計算機(jī)視覺主要應(yīng)用于光學(xué)字符識別、工件識別、顯微/航空圖片的識別等領(lǐng)域。
到了90年代,計算機(jī)視覺技術(shù)取得了更大的發(fā)展,也開始廣泛應(yīng)用于工業(yè)領(lǐng)域。一方面是由于GPU、DSP等圖像處理硬件技術(shù)有了飛速進(jìn)步;另一方面是人們也開始嘗試不同的算法,包括統(tǒng)計方法和局部特征描述符的引入。進(jìn)入21世紀(jì),以往許多基于規(guī)則的處理方式,都被機(jī)器學(xué)習(xí)所替代,算法自行從海量數(shù)據(jù)中總結(jié)歸納物體的特征,然后進(jìn)行識別和判斷。這一階段涌現(xiàn)出了非常多的應(yīng)用,包括相機(jī)人臉檢測、安防人臉識別、車牌識別等等。
2010年以后,深度學(xué)習(xí)的應(yīng)用將各類視覺相關(guān)任務(wù)的識別精度大幅提升,拓展了計算機(jī)視覺技術(shù)的應(yīng)用場景:除了在安防領(lǐng)域應(yīng)用外,計算機(jī)視覺也被應(yīng)用于商品拍照搜索、智能影像診斷、照片自動分類等場景。
再細(xì)分地來看,計算機(jī)視覺領(lǐng)域主要包括圖像處理、圖像識別和檢測,以及圖像理解等分支:
圖像處理:指不涉及高層語義,僅針對底層像素的處理。典型任務(wù)包括圖片去模糊、超分辨率處理、濾鏡處理等。運(yùn)用到視頻上,主要是對視頻進(jìn)行濾鏡處理。這些技術(shù)目前已經(jīng)相對成熟,在各類P圖軟件、視頻處理軟件中隨處可見; 圖像識別和檢測:圖像識別檢測的過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配,可以用來處理分類問題(如識別圖片的內(nèi)容是不是貓)、定位問題(如識別圖片中的貓在哪里)、檢測問題(如識別圖片中有哪些動物、分別在哪里)、分割問題(如圖片中的哪些像素區(qū)域是貓)等。這些技術(shù)也已比較成熟,圖像上的應(yīng)用包括人臉檢測識別、OCR(光學(xué)字符識別)等,視頻上可用來識別影片中的明星; 圖像理解:圖像理解本質(zhì)上是圖像與文本間的交互,可用來執(zhí)行基于文本的圖像搜索、圖像描述生成、圖像問答(給定圖像和問題,輸出答案)等。圖像理解任務(wù)目前還沒有取得非常成熟的結(jié)果,商業(yè)化場景也正在探索之;
2.2 語音識別

前端信號處理:語音的前端處理涵蓋說話人聲檢測、回聲消除、喚醒詞識別、麥克風(fēng)陣列處理、語音增強(qiáng)。 語音識別:語音識別的過程需要經(jīng)歷特征提取、模型自適應(yīng)、聲學(xué)模型、語言模型、動態(tài)解碼等多個過程。 語音合成:語音合成的幾個步驟包括文本分析、語言學(xué)分析、音長估算、發(fā)音參數(shù)估計等。基于現(xiàn)有技術(shù)合成的語音在清晰度和可懂度上已經(jīng)達(dá)到了較好的水平,但機(jī)器口音還是比較明顯。目前的幾個研究方向包括如何使合成語音聽起來更自然、如何使合成語音的表現(xiàn)力更豐富,以及如何實現(xiàn)自然流暢的多語言混合合成。
2.3 自然語言處理

知識圖譜:知識圖譜基于語義層面,對知識進(jìn)行組織后得到的結(jié)構(gòu)化結(jié)果,可以用來回答簡單事實類的問題,包括語言知識圖譜(詞義上下位、同義詞等)、常識知識圖譜(“鳥會飛但兔子不會飛”)、實體關(guān)系圖譜(“劉德華的妻子是朱麗倩”)。知識圖譜的構(gòu)建過程其實就是獲取知識、表示知識、應(yīng)用知識的過程。 語義理解:核心問題是如何從形式與意義的多對多映射中,根據(jù)當(dāng)前語境找到一種最合適的映射。以中文為例,需要解決歧義消除、上下文關(guān)聯(lián)性、意圖識別、情感識別等困難。 對話管理:為了讓機(jī)器在與人溝通的過程中不顯得那么智障,還需要在對話管理上有所突破。目前對話管理主要包含三種情形:閑聊、問答、任務(wù)驅(qū)動型對話。
2.4 規(guī)劃決策系統(tǒng)

2.5 算法的發(fā)展趨勢和面臨的瓶頸
從解決凸優(yōu)化問題到解決非凸優(yōu)化問題
從監(jiān)督學(xué)習(xí)向非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的演進(jìn)
從“堆數(shù)據(jù)”到研發(fā)低訓(xùn)練成本的算法


3.數(shù)據(jù)
收集數(shù)據(jù):數(shù)據(jù)的數(shù)量和質(zhì)量直接決定了模型的質(zhì)量。 數(shù)據(jù)準(zhǔn)備:在使用數(shù)據(jù)前需要對數(shù)據(jù)進(jìn)行清洗和一系列處理工作。 模型選擇:不同的模型往往有各自擅長處理的問題。只有把問題抽象成數(shù)學(xué)模型后,我們才能選擇出比較適合的模型,而這一步往往也是非常困難的。 訓(xùn)練:這個過程不需要人來參與,機(jī)器使用數(shù)學(xué)方法對模型進(jìn)行求解,完成相關(guān)的數(shù)學(xué)運(yùn)算。 評估:評估模型是否較好地解決了我們的問題。 參數(shù)調(diào)整:可以以任何方式進(jìn)一步改進(jìn)訓(xùn)練(比如調(diào)整先前假定的參數(shù))。 預(yù)測:開始使用模型解決問題。
產(chǎn)業(yè)招商專業(yè)自媒體【園區(qū)產(chǎn)業(yè)招商】
超過24000園區(qū)招商人關(guān)注了我們!
↑ 關(guān)注公眾號:園區(qū)產(chǎn)業(yè)招商
↑ 加入行業(yè)交流群(如群滿,請關(guān)注公眾號后加入)
本平臺提供產(chǎn)業(yè)園招商代理服務(wù)
【中南高科招商品牌:燈塔瓴科】
是全國領(lǐng)先的招商運(yùn)營平臺,成功運(yùn)營86城市、近200產(chǎn)業(yè)園區(qū),以高效專業(yè)著稱。項目去化最快1個月,正常12個月。現(xiàn)向全國產(chǎn)業(yè)園區(qū)提供專業(yè)招商運(yùn)營代理服務(wù)。利用我們強(qiáng)大招商團(tuán)隊和數(shù)字化平臺招商,確保高質(zhì)量、快速完成招商。
【重點承接上海、蘇州、無錫、嘉興、杭州、寧波等區(qū)域產(chǎn)業(yè)園區(qū)項目】
園區(qū)代理業(yè)務(wù)對接 葛毅明 13524678515 微信同號
