消息人士稱,OpenAI正在訓(xùn)練下一代的人工智能,暫名“Q*”(讀作Q-star)。新的一年,OpenAI下一代產(chǎn)品可能發(fā)布
數(shù)據(jù)瓶頸指的是可用于訓(xùn)練AI的高質(zhì)量數(shù)據(jù)的有限性,合成數(shù)據(jù)有望打破這一瓶頸。除了對大量高質(zhì)量數(shù)據(jù)的需求導(dǎo)致合成數(shù)據(jù)受到追捧以外,對數(shù)據(jù)安全的考量也是重要原因
作為全球性能最強(qiáng)的AI,ChatGPT已遇到算力等方面的瓶頸。在此背景下,討論量子計(jì)算機(jī)在人工智能領(lǐng)域的應(yīng)用就成為一種頗具潛力的未來解決方案
文 | 譚笑間
2023年
,世人見證了ChatGPT在全球范圍的大火
。以生成式人工智能為代表的新一代人工智能問世,改變了人工智能(AI)技術(shù)與應(yīng)用的發(fā)展軌跡
,加速了人與AI的互動(dòng)進(jìn)程
,是人工智能發(fā)展史上的新里程碑。2024年
,人工智能技術(shù)與應(yīng)用的發(fā)展又會呈現(xiàn)出哪些趨勢
?讓我們一同展望這些值得關(guān)注的重大趨勢
。
全模擬光電智能計(jì)算芯片效果圖
。經(jīng)長期聯(lián)合攻關(guān),清華大學(xué)研究團(tuán)隊(duì)突破傳統(tǒng)芯片的物理瓶頸
,創(chuàng)造性提出光電融合的全新計(jì)算框架
,并研制出國際首個(gè)全模擬光電智能計(jì)算芯片(簡稱ACCEL)
趨勢一:從AI大模型邁向通用人工智能
2023年
,ChatGPT開發(fā)者OpenAI被置于前所未有的聚光燈下
,也使GPT-4后續(xù)版本的開發(fā)被推向了風(fēng)口浪尖。據(jù)消息人士稱,OpenAI正在訓(xùn)練下一代的人工智能
,暫名“Q*”(讀作Q-star)
。新的一年,OpenAI下一代產(chǎn)品可能發(fā)布
。
據(jù)媒體爆料
,“Q*”可能是第一次采用“從零開始”的方式訓(xùn)練的人工智能
。其特點(diǎn)是
,智能不來自人類活動(dòng)的數(shù)據(jù),且其有能力修改自身代碼以適應(yīng)更復(fù)雜的學(xué)習(xí)任務(wù)
。前者使得人工智能能力的發(fā)展變得愈發(fā)不透明
,而后者向來被看作是誕生人工智能“奇點(diǎn)”的必要條件。在人工智能發(fā)展領(lǐng)域
,“奇點(diǎn)”特指機(jī)器擁有了自我迭代的能力,進(jìn)而在短時(shí)間內(nèi)迅猛發(fā)展
,導(dǎo)致超出人類控制
。
雖然一些報(bào)道稱,“Q*”目前還只能解決小學(xué)難度的數(shù)學(xué)問題
,距離“奇點(diǎn)”還遠(yuǎn)
。但鑒于虛擬環(huán)境中人工智能迭代速度可能遠(yuǎn)超想象,其仍然可能在不遠(yuǎn)的將來自主發(fā)展出在各個(gè)領(lǐng)域均可超過人類水平的AI
。2023年
,OpenAI預(yù)言
,各方面超越人類水平的人工智能在十年內(nèi)就會出現(xiàn)
;英偉達(dá)創(chuàng)始人黃仁勛表示,通用人工智能可能在五年內(nèi)超越人類
。
一旦通用人工智能得以實(shí)現(xiàn)
,就可被用于解決各種復(fù)雜的科學(xué)難題,譬如尋找外星人與地外宜居星系
、人工核聚變控制、納米或超導(dǎo)材料篩選
、抗癌藥研發(fā)等
。這些問題通常需要花費(fèi)人類研究員數(shù)十年的時(shí)間來尋找新的解決方案,部分前沿領(lǐng)域的研究量已超出人力極限
。而通用人工智能在自己的虛擬世界中擁有幾乎無限的時(shí)間和精力
,這使得其在部分容易虛擬化的任務(wù)中
,有可能成為人類研究員的替代。但屆時(shí)
,人類如何監(jiān)督這些從智能水平上超過人類的人工智能,確保其不會危害人類
,又是一個(gè)值得思考的問題
。
當(dāng)然,我們也不應(yīng)過分高估硅谷巨頭們的部分言論
,因?yàn)樵谌斯ぶ悄馨l(fā)展史上,已經(jīng)歷三次“AI寒冬”
,其中不乏宏大的技術(shù)愿景因各方面限制化為泡影的例子
。但目前可以肯定的是
,大模型技術(shù)仍然有著不小的上升空間
。除GPT-4外,谷歌的“雙子座”(Gemini)
,Anthropic的Claude2
,目前都是僅次于GPT-4的大模型,國內(nèi)的百度“文心一言”與阿里“通義千問”
,也是國產(chǎn)大模型中的佼佼者
。它們在新的一年中是否會發(fā)布更具革命性的產(chǎn)品,同樣值得期待
。
趨勢二:合成數(shù)據(jù)打破人工智能訓(xùn)練數(shù)據(jù)瓶頸
數(shù)據(jù)瓶頸指的是可用于訓(xùn)練AI的高質(zhì)量數(shù)據(jù)的有限性,合成數(shù)據(jù)有望打破這一瓶頸
。
合成數(shù)據(jù)是在模仿真實(shí)數(shù)據(jù)的基礎(chǔ)上
,由機(jī)器學(xué)習(xí)模型利用數(shù)學(xué)和統(tǒng)計(jì)科學(xué)原理合成的數(shù)據(jù)。關(guān)于什么是合成數(shù)據(jù)
,有一個(gè)較為淺顯易懂的比喻:這就像是在給AI編寫專門的教材
。例如
,盡管英文課本的對話中出現(xiàn)的可能是“小明”“小紅”這樣的虛構(gòu)人名
,但并不影響學(xué)生們由此掌握英語,因此從某種意義上
,對于學(xué)生而言
,教材就可以看作一種經(jīng)過編纂、篩選和處理的“合成數(shù)據(jù)”
。
有論文表明
,模型的規(guī)模至少要達(dá)到620億參數(shù)量后
,才可能訓(xùn)練出“思維鏈”能力
,即進(jìn)行分步驟的邏輯推理
。但現(xiàn)實(shí)的尷尬在于,迄今為止人類產(chǎn)生的不重復(fù)的
、可供訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)并沒有這么多
。使用ChatGPT等生成式人工智能以前所未有的數(shù)量產(chǎn)生高質(zhì)量合成數(shù)據(jù),未來的AI將由此獲得更高的性能
。
除了對大量高質(zhì)量數(shù)據(jù)的需求導(dǎo)致合成數(shù)據(jù)受到追捧以外
,對數(shù)據(jù)安全的考量也是重要原因
。近年來
,各國紛紛出臺更嚴(yán)格的數(shù)據(jù)安全保護(hù)法律,使得客觀上利用人類產(chǎn)生的數(shù)據(jù)訓(xùn)練人工智能變得更為繁瑣
。這些數(shù)據(jù)中不僅可能隱含個(gè)人信息
,其中的許多數(shù)據(jù)還受版權(quán)保護(hù)。在互聯(lián)網(wǎng)隱私與版權(quán)保護(hù)尚未形成統(tǒng)一標(biāo)準(zhǔn)與完善架構(gòu)的當(dāng)下
,使用互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練
,極易導(dǎo)致大量法律糾紛。而若考慮對這些數(shù)據(jù)進(jìn)行脫敏
,又面臨篩查識別準(zhǔn)確率方面的挑戰(zhàn)。兩難之下
,合成數(shù)據(jù)就成為最惠而不費(fèi)的一種選擇
。
此外,使用人類數(shù)據(jù)進(jìn)行訓(xùn)練
,還可能導(dǎo)致人工智能學(xué)到有害內(nèi)容
。一些諸如使用日用品制造炸彈、管制化學(xué)品的方法
,另一些則包括許多人工智能本不應(yīng)當(dāng)出現(xiàn)的壞習(xí)慣
,譬如像人一樣在任務(wù)執(zhí)行過程中偷懶
、為了取悅用戶而說謊
、產(chǎn)生偏見和歧視。若改用合成數(shù)據(jù)
,使人工智能在訓(xùn)練中盡可能減少接觸有害內(nèi)容
,則有望克服以上使用人類數(shù)據(jù)訓(xùn)練時(shí)附帶的缺點(diǎn)。
從以上分析中可以看出
,合成數(shù)據(jù)可以說是頗具開創(chuàng)性的
,有望解決此前發(fā)展人工智能與數(shù)據(jù)隱私保護(hù)不可得兼的問題
。但與此同時(shí),如何確保相關(guān)的公司和機(jī)構(gòu)負(fù)責(zé)任地制作合成數(shù)據(jù)
,如何制作出既符合本國文化與價(jià)值觀,又在規(guī)模和技術(shù)水平上足以媲美西方以英文網(wǎng)絡(luò)資料為中心的合成數(shù)據(jù)訓(xùn)練集
,也將成為中國面臨的一個(gè)頗具挑戰(zhàn)性的課題
。
除此之外,合成數(shù)據(jù)帶來的一個(gè)重大變化是
,來自人類社會的
大數(shù)據(jù)或?qū)⒉辉偈茿I訓(xùn)練所必需
。在今后的數(shù)字世界中,人類數(shù)據(jù)的產(chǎn)生
、存儲和使用仍將遵循人類社會的法則和秩序
,包括維護(hù)國家數(shù)據(jù)安全、保守商業(yè)數(shù)據(jù)秘密和尊重個(gè)人數(shù)據(jù)隱私
,而AI訓(xùn)練所需的合成數(shù)據(jù)則采用另一套標(biāo)準(zhǔn)進(jìn)行管理
。
趨勢三:量子計(jì)算機(jī)可能率先應(yīng)用于人工智能
作為電子計(jì)算機(jī)發(fā)展到今天的最前沿應(yīng)用
,人工智能始終存在算力不足的隱憂
。ChatGPT問世數(shù)月后
,OpenAI總裁奧爾特曼曾公開表示
,其并未鼓勵(lì)更多用戶注冊O(shè)penAI。2023年11月
,OpenAI甚至宣布暫停ChatGPT Plus付費(fèi)訂閱新用戶的注冊
,以確保現(xiàn)有用戶擁有高質(zhì)量體驗(yàn)
。顯然
,作為全球性能最強(qiáng)的AI,ChatGPT已遇到算力等方面的瓶頸
。在此背景下
,討論量子計(jì)算機(jī)在人工智能領(lǐng)域的應(yīng)用就成為一種頗具潛力的未來解決方案。
首先
,人工智能領(lǐng)域的算法
,大部分屬于并行計(jì)算的范疇。舉例而言
,AlphaGo在下圍棋的過程中
,其需要同時(shí)考慮對手在不同位置落子后的應(yīng)對招數(shù),從中找到最有可能贏得棋局的下法
。這就需要計(jì)算機(jī)優(yōu)化并行計(jì)算的效率來實(shí)現(xiàn)
。而量子計(jì)算機(jī)擅長進(jìn)行并行計(jì)算,因?yàn)樗梢酝瑫r(shí)計(jì)算和存儲“0”和“1”兩種狀態(tài)
,無需像電子計(jì)算機(jī)那樣消耗額外的計(jì)算資源
,譬如串聯(lián)多個(gè)計(jì)算單元,或?qū)⒂?jì)算任務(wù)在時(shí)間上并列
。計(jì)算任務(wù)越復(fù)雜
,量子計(jì)算就越具備優(yōu)勢。
其次
,運(yùn)行ChatGPT所需的硬件條件
,同樣也十分適合導(dǎo)入當(dāng)前體積龐大的量子計(jì)算機(jī),二者都需要安裝在高度集成的計(jì)算中心里
,由一支專業(yè)化技術(shù)團(tuán)隊(duì)進(jìn)行管理支撐
。
什么是量子計(jì)算機(jī)?量子計(jì)算機(jī)是一類遵循量子力學(xué)規(guī)律進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算
、存儲及處理量子信息的物理裝置
。其不僅體積龐大
,而且作為核心零部件的“量子芯片”
,通常需要被置于接近絕對零度(零下273.15攝氏度)的極低溫中,利用在這種極低溫下部分微觀粒子表現(xiàn)出的量子特性進(jìn)行信息運(yùn)算和處理
,且運(yùn)行結(jié)果只能存在幾毫秒的時(shí)間
。
既然量子計(jì)算機(jī)“又大又難維護(hù)”,為什么還要發(fā)展
?原因在于
,量子計(jì)算機(jī)蘊(yùn)含巨大的算力潛能,以至于在一些算法上已經(jīng)體現(xiàn)出相對于電子計(jì)算機(jī)在速度上的“絕對碾壓”
,即“量子優(yōu)越性”
。但實(shí)現(xiàn)“量子優(yōu)越性”只是一個(gè)起點(diǎn)
。目前的量子計(jì)算機(jī)只能完成一些專屬于量子領(lǐng)域的計(jì)算任務(wù)
,想要真正用好這種“量子優(yōu)越性”,先要使其量子位足夠多
,以實(shí)現(xiàn)通用計(jì)算和可編程
。而且,在實(shí)現(xiàn)通用計(jì)算后
,量子計(jì)算機(jī)依然需要保持相對于電子計(jì)算機(jī)的優(yōu)勢
,這被稱作“量子優(yōu)勢”。
2022年
,來自谷歌
、微軟
、加州理工學(xué)院等機(jī)構(gòu)的研究者從原理上證明了“量子優(yōu)勢”在預(yù)測可觀測變量、量子主成分分析以及量子機(jī)器學(xué)習(xí)中確實(shí)存在
。量子機(jī)器學(xué)習(xí),實(shí)際上就是量子計(jì)算在人工智能領(lǐng)域的應(yīng)用
,也體現(xiàn)出未來量子計(jì)算與人工智能兩大前沿技術(shù)合流的趨勢
。
理論上證明了,實(shí)踐上就需要進(jìn)一步拓展量子計(jì)算的應(yīng)用前景
。在2019年推出商用量子計(jì)算機(jī)“量子系統(tǒng)一號”后
,美量子計(jì)算巨頭IBM又于2023年12月推出了“量子系統(tǒng)二號”。新系統(tǒng)的最大突破在于可以模塊化擴(kuò)展
,是該公司的首臺模塊化量子計(jì)算機(jī)
。“量子系統(tǒng)二號”擁有超過1000量子位
。IBM還宣布計(jì)劃10年內(nèi)建成10萬量子位的量子計(jì)算機(jī)
。這些不斷增加的量子位并非只是為了競賽
,其對于實(shí)現(xiàn)通用計(jì)算和可編程有著不可或缺的作用
。也正因如此,量子計(jì)算機(jī)的模塊化
,標(biāo)志著其更加具備實(shí)用性
。
有關(guān)量子機(jī)器學(xué)習(xí)算法的研究
,已成為新的研究熱點(diǎn)
。不過,未來量子計(jì)算機(jī)不會完全取代電子計(jì)算機(jī)
,更有可能出現(xiàn)的是量子計(jì)算機(jī)和電子計(jì)算機(jī)在不同的應(yīng)用場景下發(fā)揮各自所長
,實(shí)現(xiàn)協(xié)同發(fā)展,既極大提升算力
,也兼顧成本和可行性
。
趨勢四:AI代理和無代碼軟件開發(fā)帶來“沖擊波”
在AI應(yīng)用方面
,2024年值得關(guān)注的是AI代理和無代碼軟件開發(fā)帶來的“沖擊波”
。
一是AI代理對勞動(dòng)力結(jié)構(gòu)的沖擊。
截至目前
,全球至少已有近兩億人使用人工智能大模型
。但人們已不再滿足于坐在電腦前跟AI“聊天”,而是開始開發(fā)能夠自動(dòng)根據(jù)任務(wù)需要向人工智能發(fā)出提示的工具
。當(dāng)自動(dòng)提示工具與大模型兩相結(jié)合
,AI代理便由此誕生
。
2023年4月,OpenAI聯(lián)合創(chuàng)始人布羅克曼現(xiàn)場演示了GPT的“自動(dòng)模式”
。在該演示中,AI代理幾乎“包辦”了一場晚宴:不僅根據(jù)要求生成了一份晚宴的推薦菜單
、一份圖文并茂的邀請函
,還自動(dòng)將該菜單需要購買的食材加入生鮮電商APP的購物車,并自動(dòng)發(fā)布了一條有關(guān)該晚宴的社交網(wǎng)站帖子
。
AI代理還能根據(jù)比較模糊的需求提示自動(dòng)制作網(wǎng)站
,自動(dòng)完成各種需要使用Office軟件完成的文字和表格處理工作,甚至自動(dòng)根據(jù)已有論文數(shù)據(jù)進(jìn)行歸納總結(jié)生成分析論文等
。
比爾·蓋茨近日發(fā)長文解讀AI代理未來
,表示AI代理將徹底改變?nèi)藗兪褂糜?jì)算機(jī)的方式,帶來自鍵盤
、屏幕和鼠標(biāo)發(fā)明以來人類與計(jì)算機(jī)互動(dòng)方式上最重大的革新
。
AI被看作對人類的信息收集
、分析和處理進(jìn)行增強(qiáng)的擴(kuò)展性工具
,使得人的工作水平更上新臺階。但與此同時(shí)
,AI代理也給許多現(xiàn)有的工作崗位帶來沖擊
,因?yàn)槠髽I(yè)可能嘗試雇用更少的人來完成相同的任務(wù)。這種由創(chuàng)新帶來的對現(xiàn)有經(jīng)濟(jì)結(jié)構(gòu)的破壞
,被美國經(jīng)濟(jì)學(xué)家熊彼特稱為“創(chuàng)造性毀滅”
。隨著AI代理代替大量只需要較少的計(jì)算機(jī)技能就可完成的任務(wù),這些被迫再就業(yè)的勞動(dòng)力將不得不適應(yīng)新的勞動(dòng)力市場需求
,這注定將是一個(gè)較長時(shí)期的
、伴隨陣痛的過程。
二是無代碼軟件開發(fā)給數(shù)字經(jīng)濟(jì)創(chuàng)新帶來的影響
。
盡管生成式人工智能可能淘汰掉一批傳統(tǒng)數(shù)字崗位
,但在關(guān)上一扇門的同時(shí)也打開了一扇窗,這就是“無代碼軟件開發(fā)”
。目前,以AI大模型為基礎(chǔ)的編程輔助工具已經(jīng)發(fā)展到一個(gè)新的階段
,能夠根據(jù)用戶十分模糊的指令來生成軟件或網(wǎng)頁代碼
。例如,2023年的GPT-4演示中,演示人員僅僅是在A4紙上手寫了一個(gè)十分潦草的結(jié)構(gòu)示意圖
,GPT-4就根據(jù)其自動(dòng)生成了能夠?qū)嶋H訪問的網(wǎng)頁
。這無疑大大降低了開發(fā)IT服務(wù)的門檻。只要一個(gè)人有足夠有創(chuàng)意的
、能夠滿足許多人需求的數(shù)字服務(wù)“點(diǎn)子”
,就可以成為互聯(lián)網(wǎng)創(chuàng)新的風(fēng)口,“人人皆可創(chuàng)新”的時(shí)代已然到來
。
對此
,政府需轉(zhuǎn)變觀念,兼顧市場監(jiān)管與促進(jìn)創(chuàng)新
,一方面降低數(shù)字創(chuàng)新過程中的注冊與融資門檻
,打通中小企業(yè)發(fā)展壯大過程中的痛點(diǎn),讓就業(yè)與創(chuàng)新政策適應(yīng)“人人皆可創(chuàng)新”的新需求
;另一方面需要探索更有利于保護(hù)創(chuàng)新“點(diǎn)子”的版權(quán)與專利保護(hù)新政策
,從而激勵(lì)那些能夠不斷提出創(chuàng)新“點(diǎn)子”的人才
。
綜上所述
,展望2024年,無論是人工智能技術(shù)自身的迭代發(fā)展
,還是其對數(shù)據(jù)價(jià)值的重塑
,抑或是向各行業(yè)、各領(lǐng)域的應(yīng)用滲透
,人工智能的影響可謂無處不在
,既為科研、創(chuàng)新和經(jīng)濟(jì)賦能
,又帶來新的挑戰(zhàn)與風(fēng)險(xiǎn)
。我們應(yīng)以開放的心態(tài)看待人工智能帶來的諸多改變,審慎研究和應(yīng)對其可能帶來的新課題與新風(fēng)險(xiǎn)
。
(作者為中國現(xiàn)代國際關(guān)系研究院科技與網(wǎng)絡(luò)安全研究所人工智能項(xiàng)目負(fù)責(zé)人)
Copyright ?英和數(shù)據(jù) 版權(quán)所有
蘇ICP備2022020863號
咨詢熱線:
0510-68186618
電 話:0510-68186618
、68186628
地 址:無錫市梁溪區(qū)人民西路98號12樓