2021,還有3天就結束了。回顧過去一年,科技圈有什么BIG NEWS還印在你的腦海?元宇宙、AlphaFold2開源、IBM首發2nm工藝... 2021,AI從不缺重磅新聞。展望2022,科技領域將會有哪些大趨勢?
2021,還有3天就結束了。
回顧過去一年,科技圈有什么 BIG NEWS還印在你的腦海?
扎克伯格宣布將 Facebook改名Meta,全力進軍「元宇宙」 ;微軟推出混合現實會議平臺Mesh;英偉達全能阿凡達平臺的3個虛擬人同時亮相...
過去,當馬斯克說要在人類大腦植入芯片時,你一定認為他瘋了。
但Neuralink在今年5月讓 一只植入芯片的猴子用意念打乒乓球游戲 時,全世界都被震驚。
另外, DeepMind今年開源了AlphaFold2 ,并能夠預測出98.5%的蛋白質結構,讓學術圈再次沸騰。
不僅如此,研究人員還將其做成了數據集,將其免費開放。
1750億參數GPT-3在2020年發布后, NLP大模型 也在不斷刷新紀錄。
微軟和英偉達聯手發布了5300億參數的「威震天」,智源1.75萬億參數的「悟道2.0」,阿里達摩院發布創紀錄的10萬億參數多模態大模型「M6」,并且實現GPT-3同規模僅需1%能耗…….
還有IBM首發2nm工藝,人形機器人Ameca蘇醒......
2021年并不缺重磅新聞,人工智能依然能夠殺出重圍,走進主流視野。
展望2022年,科技領域會有哪些大趨勢?
今天,達摩院重磅發布2022十大科技趨勢,這是連續第四年發布。
通過「 定量發散 」與「 定性收斂 」,達摩院分析了近三年來的770萬篇公開論文、8.5萬份專利,通過挖掘其中熱點及重點技術突破,深度訪談近100位科學家,提出了2022年可能照進現實的十大科技趨勢。
AI仍是最濃墨重彩的主角,但基本范式正在發生變革;芯片技術將更迭;下一代互聯網即將到來……
科學研究是在星辰大海里探索未知,其中,實驗科學和理論科學是數百年來科學界的兩大基礎范式。
而 人工智能正在催生新的科研范式 。
以蛋白質為例,通過研究其3D結構,生物學家不僅可以更加快速地研發出針對各類疾病的藥物,甚至能夠揭開生命之謎。而「蛋白質折疊問題」在過去的50年里一直是生物學的一個巨大挑戰。
1969年,賽勒斯·萊文塔爾 (Cyrus Levinthal) 指出,通過蠻力計算列舉出典型蛋白質的所有可能構型所需的時間比已知宇宙的年齡還要長:一個典型的蛋白質可能有10的300次方種折疊形式。
不過,隨著人工智能的發展,2021年7月,DeepMind先是在Nature上開源了利用AI對蛋白質結構進行預測的AlphaFold 2,隨后又發布了來自人類和20種其他生物共350000種蛋白質結構的預測結果。
經過訓練的深度神經網絡可以根據蛋白質的基因序列預測蛋白質的特性。主要判斷依據是氨基酸對之間的距離和連接這些氨基酸的化學鍵之間的角度。通過已知信息,可以推斷出蛋白質折疊之后的角度和距離信息,從而推斷出整個蛋白質的結構。
2021年12月,DeepMind首次利用人工智能幫助數學家們提出了兩個全新的數學猜想,登上Nature封面。
作者猜測低維拓撲中存在未知的非線性關系,產生了很多數據并用神經網絡擬合了近似函數,發現其中三個量在擬合過程中起到了很重要的作用。通過反正做擬合實驗,產生新的數據,得到新的觀察模型,最終數學家利用智慧猜出了一個不等式結構,并進一步給了嚴格的證明。
由此可以看出,機器學習能夠處理多維、多模態的海量數據,解決復雜場景下的科學難題,帶領科學探索抵達過去無法觸及的新領域。
而 人工智能也將成為科學家繼計算機之后的新生產工具 :
1. 帶來效率的顯著提升,人工智能將伴隨科研的全流程,從假設、實驗到歸納總結,讓科學家不需要像過去一樣十年寒窗才能產出科學成果,而是能在一生中保持高產;
2. 讓科學不再依賴少數天才,人工智能對科學研究產生猜想,讓科學家就其中有意義有價值的部分進行實驗與證明,讓更多人能夠參與到科學研究中。
阿里達摩院預測在未來的三年內,人工智能技術在應用科學中將得到普遍應用,在部分基礎科學中開始成為研究工具。
AI能夠取得這些成就的背后,少不了模型的支撐。
隨著規模的不斷擴大,預訓練模型在文本、圖像處理、視頻、語音等多個AI領域實現了突破性進展,并逐漸成為人工智能的基礎模型。
2018年,谷歌提出3億參數BERT模型驚艷四座,大規模預訓練模型也因此逐漸走進人們的視野,成為人工智能領域的焦點。
2019年2月,OpenAI推出了15億參數的GPT-2,能夠生成連貫的文本段落,做到初步的閱讀理解、機器翻譯等。
緊接著,英偉達推出了83億參數的威震天Megatron-LM,谷歌推出了110億參數的T5,微軟推出了170億參數的圖靈Turing-NLG。
2020年6月,大模型來到了一個分水嶺,OpenAI以1750億參數的GPT-3,直接將參數規模刷到千億級別,直逼人類神經元的數量。作詩、聊天、生成代碼等等,無所不能。
在沉寂了一段時間之后,微軟和英偉達在2021年10月聯手發布了5300億參數的Megatron-Turing自然語言生成模型(MT-NLG)。同時奪得單體Transformer語言模型界「最大」和「最強」兩個稱號。
除了千億規模的稠密單體模型,還有萬億規模的稀疏混合模型。
2021年1月,谷歌推出了1.6萬億參數的Switch Transformer。12月,這個記錄被達摩院的M6模型的10萬億參數打破,大模型參數直接提升了一個量級,而且達摩院只用了512張GPU進行訓練。
然而,同樣隨著模型規模擴大的是訓練對資源消耗越來大,而參數數量增加所帶來的性能提升與消耗提升不成比例。
大模型確實帶來了非常驚艷的表現,但也有研究開始對「模型參數越多,性能也越好」是否始終成立提出了質疑。
例如,谷歌的研究人員開發了一個參數量遠小于GPT-3的模型——微調語言網絡(fine-tuned language net, FLAN),這個1370億個參數的模型在許多有難度的基準測試中性能都大幅超過GPT-3。
阿里達摩院認為, 接下來大模型的參數規模發展將進入冷靜期,大模型與相關聯的小模型協同將是未來的發展方向 。
其中,大模型沉淀的知識與認知推理能力向小模型輸出,小模型基于大模型的基礎疊加垂直場景的感知、認知、決策、執行能力,再將執行與學習的結果反饋給大模型,讓大模型的知識與能力持續進化,形成一套有機循環的智能系統。參與者越多,模型進化的速度也越快。
而這樣的一種新的智能體系,將會帶來 三點優勢 :
1. 讓小模型更容易獲取通用的知識與能力,小模型專注在特定場景做極致優化,提升了性能與效率;
2. 解決了過去大模型數據集過于單一的問題,小模型在真實場景回收的增量數據,讓大模型有再進化的元素;
3. 全社會不需要重復訓練相似的大模型,模型可以被共享,讓算力與能源的使用效率最大化。
對此,南京大學計算機科學與技術系主任兼人工智能學院院長周志華也提出了自己的觀點:
大模型未來會在一些重大任務上發揮作用,而在其他一些場景下或許會通過類似集成學習的手段來利用小模型,尤其是通過很少量訓練來「復用」和集成已有的小模型來達到不錯的性能。
阿里達摩院預測在未來的三年內,個別領域將以大規模預訓練模型為基礎,對協同進化的智能系統進行試點探索。
在未來的五年內,協同進化的智能系統將成為體系標準,讓全社會能夠容易地獲取并貢獻智能系統的能力,往通用人工智能再邁進一步。
就像《黑客帝國》所描繪情景,未來的虛擬世界是否是矩陣模擬中的那樣,這是未知的。
拉近點距離,我們如何才能進入這個虛擬世界才是最重要的一步。
這里就不得不提,頭號玩家中那副眼鏡或許是打開新世界的大門。
未來,眼鏡有望成為新的人機交互界面,推動形成有別于平面互聯網的XR(未來虛實融合)互聯網。
XR互聯網將改變用戶的信息感知和獲取方式,最大的特征是由二維平面走向三維立體的沉浸式體驗,信息會以自然的方式被獲取,讓用戶所見即所得。
阿里達摩院預計未來3年內會產生新一代的XR眼鏡,融合AR與VR的技術,成為下一代互聯網的關鍵入口。
據報道,蘋果明年預計會推出首款AR/MR頭顯,將配備3D傳感器,能夠實現手眼動作全追蹤。
其實,眼鏡只是構成XR互聯網所需要的四大要素其中的一種。
完整的XR互聯網包括:硬件(如XR眼鏡等)、內容(如娛樂、購物、社交等)、人工智能(如空間感知、數字孿生)、基礎設施(如5G、云計算等)。
四大要素中硬件和內容會率先發展,硬件是獲取數據與用戶交互的基礎,也是互聯網平臺的載體。
XR眼鏡將會成為XR互聯網的第一入口 ,同時云網端協同將改變眼鏡的形態,使其向著體積更小、重量更輕、響應速度更快的方向發展。
內容則以娛樂社交和辦公場景開始,再逐漸發展至購物、教育、醫療等對遠距互動有一定需求的場景。
就比如,微軟推出的混合現實會議平臺Mesh,人們可以通過虛擬化身的形式見面和互動,還能共享Office文件等。
XR互聯網改變人與科技互動的方式:
· 模擬真實世界的時空,解決真實世界遠距移動的問題,如遠程教育、遠程醫療、遠程辦公等,克服地理空間的限制。
· 創造真實世界不存在的時空,解決真實世界不完美的問題,如游戲、社交等,讓用戶能夠重新建立自我認可,并以接近真實世界的方式進行交互。
XR互聯網也將重塑現有的產業結構,催生一批從元器件、設備、操作系統到應用的新產業生態。
除了AI for Science、大小模型協同進化、XR互聯網之外,阿里達摩院還預測了2022另外七大科技趨勢。
當前,硅基半導體已經推進到5nm和3nm,IBM今年也宣布了突破2nm的「PPT 工藝」。
電子芯片發展逼近摩爾定律極限,集成技術進步趨于飽和,高性能計算對數據吞吐要求不斷增長,亟需技術突破。
光子芯片是用光子代替電子進行信息傳輸,可以承載更多的信息和傳輸更遠的距離。
光電融合是未來芯片的發展趨勢,硅光子和硅電子芯片取長補短,充分發揮二者優勢,促使算力的持續提升。
未來三年,硅光芯片將支撐大型數據中心的高速信息傳輸;未來五到十年,以硅光芯片為基礎的光計算將逐步取代電子芯片的部分計算場景。
特斯拉AI日上,馬斯克宣布明年即將推出Tesla Bot;波士頓動力公司的機器人Atlas上演驚艷跑酷;還有英國Engineered Arts開發的人形機器人Ameca讓人直呼恐懼。
近年來,柔性機器人結合柔性電子、力感知與控制、人工智能技術,獲得了力覺、視覺、聲音等感知能力,應對多任務的通用性與應對環境變化的自適應性大幅提升。
預計未來5年,兼具柔性和類人感知的機器人將逐步替代傳統工業機器人,成為產線上的主力設備,并在服務機器人領域開始規模化應用。
綠色能源AI :人工智能助力大規模綠色能源消納,實現多能互補的電力體系
高精度醫療導航 :人工智能與精準醫療深度融合,助力診療精度與效率提升
全域隱私計算 :破解數據保護與流通兩難,隱私計算從小數據走向大數據
星地計算 :衛星及地面一體化的通信與計算,促進空天地海全面數字化
云網端融合 :云網端融合形成新計算體系,催生云上新物種
過去一年,我們見證了人工智能以全新的方式深入我們的生活,這些進步賦予未來很多可能。
2022年,對于AI必將是令人興奮的一年。
未來可期。
本文來自微信公眾號 “新智元”(ID:AI_era),作者:新智元,編輯:桃子好困,36氪經授權發布。