AI之後的下一個風口:量子計算與它的Transformer時刻

文|矽谷101

“ 先進電晶體是傳奇的過去,AI是蓬勃的當下,量子計算是不可避免的未來。& rdquo;

曾長期被視為“ 未來科技” 的量子計算正在加速從實驗室走向現實。 2月11日,量子計算公司QuEra宣佈獲得2.3億美元投資,這是量子計算領域迄今最大的單筆投資之一。

這家從哈佛大學和麻省理工學院分拆出來的公司,使用原子和雷射來製造量子比特,此前這種技術被認為誤差過高,但與穀歌、IBM等巨頭採用的超導電路和離子阱路線相比,這種中性原子科技不需要超導電路,具有穩定性高、無需笨重製冷系統等優勢。

就在三個月前,穀歌宣佈基於Willow晶片的新一代量子電腦僅需不到5分鐘就完成了一項傳統電腦需要“ 10的25次方” 年才能算完的標準數學運算,並且克服了高錯誤率的難題。 這一突破被業界稱為量子計算的“ Transformer時刻”。

然而,行業內對真正實現“ 有用的量子計算” 的時間存在不同的預測。 英偉達CEO黃仁勳預測,量子計算的大規模商業應用至少需要二十年,而穀歌的目標是五年內推出可用的量子計算服務。

AI之後的下一個風口:量子計算與它的Transformer時刻插图1

本期矽谷101,主理人泓君邀請到Roger Luo,Anyon Technologies創始人兼CEO,加州理工博士與伯克利大學的博士後,和Jared Ren(任恒江),Anyon Technologies創始人兼CTO,加州理工博士與博士後深一起討論黃仁勳關於量子計算的時間預測,穀歌Willow晶片的重要性,矽谷公司在量子計算領域的佈局和科技路徑,以及它將如何影響加密貨幣、銀行體系,以及整個密碼學領域。

以下是部分訪談精選

01理解量子計算,量子比特的疊加態與糾纏態

泓君:
我們或許可以先從一個通識性的問題入手。 能否用盡可能通俗的語言向聽眾解釋一下,什麼是量子計算? 它是用來做什麼的?

Jared: 
理解量子計算可以用經典電腦來做類比。 我們現在市面上幾乎所有的計算設備—& mdash; 無論是CPU、 GPU、 手機,還是簡單的小算盘—& mdash; 本質上都屬於經典電腦。

我們可以把經典電腦理解為一長串由0和1組成的字串,也就是所謂的 
比特(bit)
。比特只能處於0或1的狀態,而所有計算,無論設備多複雜或多簡單,本質上都是在處理這些0和1組成的字串。 類比於量子小算盘的話,它也是一長串的字串,不過它的基本單元是 
量子比特(qubit)

那量子比特跟比特的區別是什麼呢? 區別在於,它不僅可以是0或1,還可以同時處於0和1之間的
  疊加態
。也就是說,量子比特可以在多個狀態之間共存,而不像經典比特那樣只能在0和1之間二選一。

AI之後的下一個風口:量子計算與它的Transformer時刻插图3

來源: devopedia.org

量子比特還有另外一個特性,那就是量子的另外一個原理,也就是它的糾纏態。 它不僅僅是說每一個量子比特是單獨的量子比特,而是不同的量子比特之間可以糾纏在一起,同時發生改變。 這兩個一起發生作用,就產生了跟經典電腦顯著的不同。

經典電腦的狀態是由比特(bit)組成的,比如一個只有三比特比特的經典電腦,它的所有可能狀態就是 
000、001、010、011、100、101、110、111
,總共有 
8種
  可能的組合。 如果想要進行運算的話,它只能一個一個地去改變每一個位數。 如果它要去到這八個不同的狀態的話,要進行八次運算。

但量子電腦不同,如果有一個三個量子比特構成的量子電腦,由於疊加原理和糾纏原理,它可以同時存在在這八個狀態裡面,然後同時對這八個狀態進行計算。 如果只有三位數的話,他們的差距可能不這麼明顯,一個要進行八次運算,一個進行一次運算就可以完成。

但是如果比特的數量繼續加倍的話,那量子電腦它其實是一個指數增長的過程。 如果有四比特的話,經典電腦就要進行16次計算才能窮盡16個狀態,但是量子電腦還是只需要一次就可以窮盡所有的16次狀態,這就是所謂的量子電腦相對於經典電腦的計算來說的話指數的加速過程。

泓君:
我可不可以理解成量子電腦非常適合去解决複雜高難度的計算,越難的計算它越有優勢。

Jared: 
我們可以理解為它的
覈心優勢在於能够在某些特定的問題上實現指數級的加速。
量子電腦它不是經典電腦的代替品,就像GPU不能像是完全是CPU的代替品一樣。 他們兩個是共同存在、相互協同的作用。 量子電腦特別擅長某些特定問題上實現指數級的加速,像是矩陣運算因數分解、量子化學、類比和組合優化等領域,它會在這些高複雜度計算的任務中發揮非常重要的作用。

泓君:
哪些領域會運用到這些高複雜度的計算? 如果你們能想像未來量子計算的應用場景,它相比傳統電腦,最具優勢的場景和問題是什麼呢? 能不能舉一個具體場景的例子。

Jared: 
它有幾種特殊的算灋。 有的特殊算灋對矩陣運算有特別好的指數級的加速效果,有的運算對因數分解有特別好的加速效果。 這個世界本身是量子的,用經典電腦對量子世界進行類比本身是非常困難的。 比如一些化學運算,它本身是量子的,所以用量子電腦進行這方面的運算將會更加容易。 我剛才提到的三個例子所對應的其實就非常明顯,我們現在所有的人工智慧學習,本質上就是矩陣運算。

因式分解的話,能想到的就是
Shor算灋(Shor’s algorithm)
  所對應的安全問題、加密問題。 現在大部分的加密手段都是通過類似的情况進行加密的,那量子計算對於破解這樣的加密就非常有優勢。

量子化學類比很明顯就可以想到油氣、化工、藥物的研發等等,是一個非常直接的作用。

還有一個領域就是量子電腦對組合優化的求解過程是非常的迅速,也有指數級的加速作用。 所以說對於一些物流之類的需要優化的內容,這些領域也是非常有幫助的。

泓君:
剛剛提到了好幾個點,比如說在矩陣運算方面,它對人工智慧的加速表現在哪裡? 比如說有了量子電腦,大家再去訓練大模型的時候,它會有特別的優勢嗎? 還是說它只能在一個極小的領域裡面,針對某一個特定問題,可能會有一些特定的解法。

Jared: 
我理解的是人工智慧無論模型是什麼,它的本質是矩陣運算。 這就回到了根本的問題:為什麼GPU比CPU在處理人工智慧模型時的速度快這麼多?

本質上就是GPU對矩陣運算的速度會比CPU快很多。 CPU擅長比較複雜的問題和比較少線程的運算,而矩陣的運算不需要特別複雜和重複的過程,而需要特別多的覈心同步運算,這就是GPU的作用。 所以在人工智慧上,GPU上比CPU上優勢更大,就是因為GPU對矩陣運算會比CPU快很多。

像量子電腦中用到了HHL(Harrow-Hassidim-Lloyd)之類的算灋,對矩陣的運算也能加速的話,可以類比為人工智慧大模型的開發,實現了從CPU到GPU的這樣一種跨越式的加速發展。

AI之後的下一個風口:量子計算與它的Transformer時刻插图5

來源: yanwarfauziaviandi.com

Roger:
  量子計算在這個具體的問題上,
通過加速矩陣求逆算灋相關的算灋,可以總體加速整個人工智慧學習和inference(推理)的進度
。比如說一個模型有1000億的參數,你用GPU去跑的話,對應的大概是1000億乘以1000億的算灋複雜度。 對於量子電腦來說,就是一個求指數底數的管道,相當於log 1000億的複雜度。 相對來說在處理巨大的模型的時候,它的操作數量會指數級下降,那可以以更少的能量和資源付出計算一個巨型模型。

02明貶暗捧的英偉達:表面保守預測,暗地快速佈局

泓君:
量子計算現在到底能不能實現,比如說我們說的訓練人工智慧,這個能力發展到哪個階段了? 這個問題是由英偉達的創始人黃仁勳在今年的CES上提出來的。 我記得他說,如果說十五年內能實現“非常有用”的量子計算,他覺得這個是一個非常偏早的預測; 如果說是三十年時間,又可能偏穩,所以他覺得一個合理的區間是在二十年。 但是他這個話一說,有一批量子計算股票的股價就紛紛下跌。 所以也是想聽一下兩位,你們怎麼去看黃仁勳說的量子計算的實現時間。

Roger: 
首先黃仁勳在NVIDIA的投資者會議上也被問到了,他正面回答了這個問題,已經把這個時間說到了遠不止二十年了。

因為一旦在這種會議上開始回答這個問題,就意味著投資者會考慮是否要將量子計算在未來十年對公司股價的影響計入定價(price in)。 眾所周知,華爾街計算股價時會將未來十年的預期增長(assumed growth)和壟斷地位(monopoly)計入定價。

所以這對他來說實際上存在利益衝突。 如果他表現出量子計算在未來十年可能會對GPU產生影響,那麼第二天英偉達的股價就會下跌。 相比讓英偉達股價要跌來說的話,那量子計算的股價跌對他來說是一個非常合理的决定,畢竟坐在哪個位置上回答哪樣的問題。

從另一個角度來看,我很尊敬黃仁勳,他確實是比特很厲害的人物。 但是不要只看他說什麼,要看他做什麼。 英偉達在量子計算領域已經是一條大魚了,他們也是我們的合作夥伴。 他們在各個方面都表現得非常主動,包括我們即將參加的超算會議,我們還要一起做demo。 所以整體上來說,這個就代表一個邏輯。

從他“ 做” 的角度來看,我們可以回顧一下歷史。 CUDA發佈於2007年,CUDA DNN發佈於2014年,Transformer發佈於2016年,GPT-3.5則是在2022年。 即使從CUDA算起,從英偉達開始佈局這個方向到科技完全落地,總共也不過十五年時間。

從邏輯上講,在21世紀的科技發展速度下,如果一項科技還需要十五年才能成熟,那我可能連它一半的發展歷程都沒聽說過。 所以任何需要二十年才能實現的科技都不太現實,至少納斯達克市值前三的公司CEO不太可能正面回應這種長期科技,更不用說讓公司正式參與其中,這個有點違背邏輯。 當然,還是那句話,他做什麼比他說什麼更重要,因為他“ 說” 什麼要考慮次級市場的影響,他自己也有英偉達的股票的利益。

第三點,他用詞非常精准,說的是
“ very useful quantum computer”
,在這個脉络下,這可以理解為“ Large-scale fault-tolerant quantum computer(大規模容錯量子電腦)”, 也就是量子計算的最終形態。 這有點類似於AI領域中我們討論的AGI(通用人工智慧),是一個非常長遠的目標。 如果它能够實現,基本上就會重新定義人類文明的下一個階段,因為我們將能够開發出無數新材料,以及可能出現遠超人類能力的人工智慧系統。

所以他這個“ very useful” 的意思就是量子計算徹底站在了當下GPU所處的覈心位置,這個的確我個人不認為在十五年之內有比較大的概率能出現。 我覺得工業界共識來說,就是Large-scale fault-tolerant quantum computer(大規模容錯量子電腦)這種處在壟斷階段的量子計算,可能也要十五年的時間。 我覺得他的說法本質上沒有偏離他們自己公司內部調研和工業界的公式。 他只是把它講成了一個可能投資者聽起來會更加友好的說法。

泓君:
是不是可以這樣理解:如果量子計算真的實現了,它可能不需要那麼多GPU就能完成運算,所以對GPU和晶片的需求會减少? 我想知道這對NVIDIA股價的衝擊,以及大家是怎麼思考這個邏輯的。

Roger:
對,NVIDIA現在將自己定位為“
a supercomputer infrastructure company
” (超級電腦基礎設施公司)。 他們認為未來的超級計算(supercomputing)將涵蓋AI、天氣預報,以及化學類比等高複雜度的計算問題。 從他們的角度來看,這將是未來的覈心業務。 但有趣的是,量子計算(Quantum Computing)也是這麼說的。

 

但實際上,量子計算在一定程度上確實會侵蝕,或者說參與英偉達在複雜運算領域的市場份額。 比如在進行極其複雜的蛋白質反應類比時,不是像AlphaFold那樣的預測,而是用第一性原理進行類比,精准地發現新藥。 對於這類任務,英偉達去算顯然是不現實的。

泓君:
對公司來說,成本太高了。

Roger:
如果有個中心願意買100萬個NVIDIA未來的GPU晶片去算這個問題,對他們來說股價肯定是好的。 但這個時候如果量子計算給到一個預期,說不需要100萬個GPU,差不多1萬個GPU就能實現這些目標。 這個相當於它的市場就得不到了,就是說你的量子計算任務基本上不需要跟GPU分擔工作量,就能完整的去處理這些複雜的問題。

所以我覺得黃仁勳把量子計算放到十五年二十年這個時間段,相當於是告訴華爾街不要將未來的不確定性計入當前定價。 從NVIDIA的角度來看,未來十年計算需求會持續上升,公司的股價應該是水漲船高,這個邏輯是合理的。

在未來十年,量子計算本身也需要GPU來做混合量子計算
,這也是為什麼我們要跟英偉合作。 所以,未來十到十五年其實是一個共同存在、共同增長的階段,並不存在誰取代誰的問題。 嚴格來說,這是一個增量市場的擴展,而不是存量市場裏相互爭奪份額的競爭。

 

泓君:
你們跟英偉達的合作是什麼樣的?

Roger:
我們更加重視的是產品和科技層面,作為一家硬體公司,我們主要關注兩個方向。

首先是利用GPU的軟件系統和算灋來優化量子電腦的晶片設計和量子測控,以及使用GPU來優化量子電腦的運行。 其次是通過量子電腦結合GPU來增强AI模型的泛化能力(generalizability),即使用更少的參數(parameters)和數據(data)來訓練出具有更强泛化性的AI模型。 這就是所謂的量子增强AI(quantum-enhanced AI)路徑。

大家也聽到有一些非常知名的AI公司,最近也在招募量子機器學習的人才去做相應的開發。 其實這也是一個趨勢。 比如大家聽說過的SSI(Safe Super Intelligence),Ilya的那家公司。 另一方面,我們和他們的合作當然不是在軟件層面,而是更側重於構建計算平臺。

 

從另一個角度看,我們與英偉達的合作不在軟件層面,而是在構建計算平臺。 我們將他們的CUDA Quantum軟件作為膠水,把他們的GPU和我們的QPU(量子處理器)黏合成一個完整的量子計算平臺。 通過高速直接互聯,我們讓量子處理器和GPU能够進行即時資料互動,從而增强計算能力。 在量子電腦運行的同時,還可以提升它在人工智慧學習等領域的解決方案。

相當於在這個體系中,我們在英偉達的生態系統中被定位為“ quantum backend provider” (量子後端提供商)。 他們自稱為“ GPU and backend provider” (GPU和後端提供商),所以我們實際上是一種並行關係,同時把它變成一個完整的量子增强計算平臺。 我們是有自己的量子晶片,有自己完整的量子電腦,只是將我們的量子電腦跟NVIDIA的GPU系統進行了一個互聯,然後用他們的軟件去協同兩邊的工作,通過量子硬體去增强GPU在人工智慧學習問題中的一些作用。

泓君:
你們的晶片是自己造的,還是市場上有專門針對量子計算設計的晶片?

Roger:
這個問題很好,我們的晶片是我們自己造的,因為我們自己的獨立的設計和專利和制程。 但是實際上有公司在賣量子晶片,好不好我不評估。 但是基本上美國的公司都是自己造晶片。 或者這麼說,很多科技要在一個快車道的計算面進行突破,如果你這麼早的就給到一些可能並沒有那樣科技積累的團隊去給造晶片,是有點不算明智的。

03 Willow晶片與量子計算的“ Transformer時刻”

泓君:
你怎麼看穀歌新發的Willow晶片?

Roger:
他們從2014年一直以來都在向這個方向走,就是公開路線圖,實現
量子糾錯
,證明這個可擴展性的情况下去實現黃仁勳口中的“ very useful quantum computer”, 這是他們一直以來的目標。

為什麼大家可能有點困惑,因為不同公司目標不太一樣。 比如有些公司的目標就是AGI,而有些公司就像OpenAI一樣,能發佈一個GPT3.5就認為可以了。

所以穀歌推出Willow這個晶片,作為Sycamore的繼任者,從我們的角度來看是個延續性工作。 穀歌在Sycamore之前的一些demo中發現,無論是規模還是晶片效能,Sycamore都不足以真正驗證量子計算,特別是機遇量子糾錯計算的可擴展性。

要證明可擴展性,就意味著“ The more, the better” , 也就是晶片造得越來越大,電腦的可靠性和計算能力應該越强。 以前我們的實驗發現,當你晶片造得越大,整體效能並不會相應提升,原因是總體錯誤率也會上升。

所以要把量子電腦做到所謂的“ very useful quantum computer”,
量子糾錯成為了一個至關重要的前置科技。
所以Willow相當於是穀歌基於過去十年的發展,終於證明了量子計算加上糾錯機制的可擴展性。

 

泓君:
Willow晶片是在一個什麼樣的階段? 開始製造了嗎?

Roger:
是的,他們也有論文了。 他們用的不是全世界最領先的量子比特和保真度,但是加上各種工程提升,讓這個晶片做到了能驗證量子計算在硬體層面,在實驗實現上的一個可擴展性。

這一點我要強調
實驗的可擴展性
。因為量子計算本身能做到複雜超級計算,這個本身不是個問題。 從算灋層面,從原理層面,大概十幾二十年就搞得很清楚了。 過去十年穀歌、IBM和整個工業界幹了什麼事兒呢? 就是從實驗、物理可實現的設備層面去證明這一點,證明我們真正能做出一個足够理想化的晶片去做到可擴展性,做到大規模運算。 所以穀歌Willow晶片的意義就在於從實際的物理層面把它做出來。

泓君:
他會開放給協力廠商的合作夥伴採購嗎? 還是他們只自己用。

Roger:
穀歌從來都不是個硬體公司,從來都不靠賣硬體。 所以他們最早做出的TPU也沒有賣,基本上都是自己用。 對他們來說,這就是這是一個非常好的驗證,能做到就是在十年內做到所謂的“ very useful quantum computer” 的一個階段證明。

泓君:
那你覺得它的晶片造出來了,會加速整個量子計算的研究嗎?

Roger:
從加速層面來說的話,肯定會的。 但是更多來說就是他們證明了能做出來。 這個情况下來說,就能促使他們這個隸屬於穀歌AI的部門獲得更多的資源,將晶片做的越來越大,越來越能解决一些實際問題。

所以加速層面不是說用這個晶片加速他們別的發展,而是用這個晶片去作為一個活生生的證明,然後去獲得更多的資源,把這個東西擴大到成為一個商業化,或者成為一個“ very useful quantum computer” 的形態。 加速肯定會加速的,因為管理層現在被說服了。

泓君:
被說服了什麼? 就是效果是ok的。

Roger:
穀歌CEO也發了帖子,因為管理層需要看到這個概念得到驗證。 當你說你可以擴展(scale),那就擴展給我看。 現在從穀歌管理層的角度來看,這種可擴展性(scalability)在基礎層面已經得到了驗證。

這有點類似於Transformer moment:你證明你的機器學習模型可以擴展,然後通過擴展到足够大的規模,看能不能做出類似GPT這樣的模型。

 

泓君:
所以Willow晶片相當於量子計算界的Transformer moment。

Roger:
對,我這有點拾人牙慧了。 因為是有一個投資人問過我,這是不是Transformer moment,我想了想好像有點像。 因為的確是穀歌做出了一個活生生的驗證,這玩意能擴展(scale),那好的我們就來擴展它。 如果從AI的路徑上來說的話,實際上我更加樂觀地認為就是未來十年以內的事情,我對黃仁勳的這個評估覺得有點過於保守。

泓君:
你的估計比黃仁勳的這個估計更樂觀,而且尤其是在穀歌的Willow晶片發佈以後,你覺得它對真正實現的非常有用的量子計算,它能够加速到多少年? 比如說沒有這個晶片跟有了這個晶片的本質區別是什麼?

Roger:
其實我覺得如果沒有這個晶片的話,大家會更加傾向於像黃仁勳的預測,大概十五到二十年。 但是有這個活生生的驗證後,大家對未來時間線收斂的預測會縮短到十五年以內。 當然這個可能也是為什麼他會在這個會議上被投資人正式地問到這個問題,因為他們就要開始考慮是不是要將這個事情考慮在股價定價裏。

泓君:
關於Willow晶片,之前提到它解决的是量子糾錯在實驗實現的可擴展性。 能不能解釋一下,它解决了量子計算中哪一個最覈心的問題,它的原理是什麼?

Jared:
我大概談一下量子糾錯的基本原理。 我們知道
量子計算的使用最大的障礙之一就是譟音
。同樣也可以用經典電腦來類比量子電腦中的譟音。

所謂的經典電腦也是譟音非常嚴重的。 現在我們正常的使用日常生活中的電子產品、手機、電腦,不會感受到這些譟音,是因為他們在很早以前就有底層的經典領域的糾錯算灋,已經在硬體和軟件的銜接層面把這些譟音或者說錯誤給糾錯了。

AI之後的下一個風口:量子計算與它的Transformer時刻插图7

來源: Q-CTRL

打個比方,在GPU中,如果有一個1.2伏特的GPU,那理想情况下1.2伏就代表邏輯1,然後0伏就代表邏輯0。 但是在實際操作中,由於量產的GPU晶片不可能是完全一樣的,每一次運算它所施加的電壓也是有一定的不同的。 所以說這個電壓並不一定一直是1.2伏或者是0伏。 不同的電晶體之間,不同的時間,不同的輸出會有不同,那電腦的底層就會把一個範圍內的誤差都算作0或者1。 比如說出來一個1伏的電壓,那也會被認為是1.2伏,也就是邏輯1,那1.5伏也會歸類為邏輯1。 這樣來說對經典電腦是一個相對比較簡單的糾錯過程。

但是回到量子計算中,這個就非常不一樣了。 因為不像經典計算中,它可以達到1伏這樣相對來說比較大的一個數值,來方便進行糾錯。 量子比特的能量是非常小的,像我們所用的超導系統中,它只有一個光子的能量。 量子比特非常脆弱,也極易受到環境的干擾和內部誤差的影響,從而導致量子資訊的遺失。

還有一些跟經典比特之間的對比的例子,比如說經典比特只會出現0或者1的翻轉錯誤。 而量子比特像之前描述的,它其實是一個疊加的狀態,不僅僅包括0和1的翻轉,它可能還會包括一些相位上的偏移的錯誤。 這也會對計算結果或者計算過程造成譟音的影響。

由於量子比特有糾纏的特性,所以它不可以像經典計算中每個比特可以單獨拎出來進行糾錯。 如果要對量子集團進行糾錯,需要對所有糾纏在一起的量子比特統一進行糾錯。 這也就是為什麼量子糾錯會被認為是實現量子計算,然後推動量子計算真正走向實用化的一個核心技術。

泓君:
所以穀歌的Willow晶片是極大地解决了這個問題。

Jared:
我認為
Willow用現在最主流的一個量子糾錯的方案,這個糾錯的方案叫做表面碼,
也是源自於加州理工的量子糾錯的科技。 通過利用表面碼的糾錯碼和比較優化的量子硬體,穀歌向世界證明了我們可以用這種方法,用這條以前已經規劃好的路線繼續走下去。

只要是按照這個路線繼續走下去,我們就能逐漸擴大量子電腦的規模和運算能力,而同時不會使錯誤率隨著規模的更大而變得更加的嚴重,反而是隨著規模的更加擴大,它的錯誤率反而是下降的,也就是說計算能力整體是提升的。 按照我們這條路線繼續走下去,最終我們是可以實現像剛才描述的非常有用的量子計算。 也就是我們業內人士叫的叫做完全糾錯的量子電腦。

04科技巨頭的路徑之爭

泓君:
大家覺得穀歌有了這個晶片以後—& mdash; 剛剛你們也提到了,其實你們之前也是跟亞馬遜有過這樣的工作交集—& mdash; 它會對其他做量子計算的公司形成顯著優勢嗎? 比如說IBM、微軟、亞馬遜、英特爾,還有一些創新型公司如D-Wave、IonQ和Rigetti。

Roger:
從這個層面來說,穀歌其實是一個很好的公司。 為什麼呢? 因為他們首先有願景,願意花費早期的時間和精力,像發明Transformer那樣,給大家證明這個大方向是對的,然後大家就可以沿著這個路子走下去,相當於掃清了很多不確定性。

我們可以看一下其他大公司的回應。 比如說IBM以前從來沒有把量子糾錯放在他們的路線圖裡面,至少沒有明確放過,但在前幾個月卻放上去了。 因為穀歌這個東西也不是立刻出來的,說實話我們內部早就能看到論文了,因為這些都是需要同行評議的,大家都能看到。

泓君:
所以論文它只要發出來,它就開源了,大家可能都知道這個方法了。

Roger:
首先,穀歌的路線圖一直是明牌。 他們要通過scale和量子糾錯算灋來實現目標。 這個算灋來自於Caltech,叫做
表面碼(surface code)
,是由Caltech的Alexei Kitaev發明的糾錯算灋。

硬體公司與軟體公司有一個很大的不同點:在硬體領域,我可以把物理過程(physical process)這個大方向指清楚,因為具體的物理實現在哪裡都是一樣的,這樣大家就可以根據這個大方向去努力。 IBM之所以不放弃,是因為它認為量子糾錯的實現時間線會拉得更長。 它認為通過暴力新增量子比特數量的管道,能够更早地實現商業價值,或者實現所謂的“very useful quantum computer”。

換一個角度來說,為什麼IBM作為這個行業最早的參與者,在這方面反而顯得有點保守? 這是因為大公司往往傾向於更保守,更堅定地遵循其早期路線圖。 IBM之前更多地在思考如何用現有的、不需要糾錯的科技就能做出有用的應用,這是它的路徑。 所以它不停地在探索商業化途徑-雖然在做科技,但也在做商業化。 相比之下,穀歌完全不做商業化,專門去做糾錯。

 

IBM的策略已經經歷了幾次演變。 現在大家都知道,IBM認為量子糾錯是可行的,因為這方面的改進是可以實現的。 而且關鍵是穀歌的團隊比IBM的人員要少得多。 所以IBM就一直在做這些事情。 作為行業先鋒,有時候年輕企業反而比它更有效率。 比如另外一家大公司(因為這是非公開資訊,我就不具體說是哪家),也在把自己的路線圖轉向量子糾錯,要對標穀歌。 一看到其他大公司取得突破,他們也想突然倒戈,轉向這個方向。 因為他們以前認為可能要很晚才能做出東西,但現在做的反而是最早的。

D-wave有點難,因為他們的路徑一直是做
量子退火計算
,這就意味著他們的路徑是跟量子糾錯完全是背道而馳的。 但是也有歷史原因,為什麼D-wave是最早的純量子計算公司? 說實話,在那個年代大家認為可程式設計通用電腦是不存在的,所謂的數位電腦是不存在的,或者很難造出來的。

所以他們的公司創始初衷就是通過簡單易實現的退火量子計算去做專一化的量子電腦,它不能被用來程式設計來做所謂的量子糾錯,也不能通過程式設計去做通用量子算灋。 但是他們認為通過做專業化的量子電腦可以更早的實現商業化價值。 現在回頭看,這是一個錯誤的選擇。

泓君:
你不認可這條路線? 那他們現在有轉變嗎?

Roger:
他們公司的創始到現在都是走量子退火方向,所以他們要轉變也是要有過程的,相當於要徹底換方向了。 我不是完全不認可,他們也許能找到很多使用案例,但是會發現之前認為很難實現的量子計算的路徑,反而現在可能更早實現,而且關鍵實現之後的影響還更大。

 

泓君:
所以糾錯現在看起來是一個比較主流,更受大家認可的方向?

Roger:
對,因為已經做出來了,活生生的例子也擺在那裡了。 就像黃仁勳或者說很多人說張口閉口就是什麼要十五年、二十年、三十年。 但是大家仔細想一想,有什麼科技人類開發了十幾、二十年,或者說到現在這個階段還要開發十幾二十年的?

泓君:
可控核聚變?

Roger:
可控核聚變它本質上並不完全是個科技實驗問題。 因為想當年人類做核子物理,從證明做出了第一個裂變反應,就真的只是做了一個實驗室的很小規模,裂變反應是分下來幾個核子弹的規模,到最後產生一個兩代產品直接“ 落地”, 字面意義的“ 落地”, 用了三年的時間,再跨越一個世代,用了可能不到十年的時間。

所以實際上會發現可控核聚變,本質上它在市場需求上並不是那麼迫切,因為人類有大量的可裂變反應堆可以用。 說白了一定要用的話,還有氫彈可以用,其實也是可以發電的,蘇聯有相關的方案。 如果要實現可控核聚變的話,那是一個非常優雅且非常理想的目標。 但是坦率來說,ROI可能還沒有把第一遍做大點高,就人類現在的能量需求的話。 所以我覺得如果還要幾十年的話,這種技術大概率已經前置成熟了。

比如說核聚變,已經有氫彈了,所以聚變這個反應其實已經落地了,它相當於是第二代或者更先進的改進過程。 如果是量子計算,我們談的更多是第一代落地的本身。 我覺得並不存在有這樣的科技是還要十幾二十年去做出來的。

AI之後的下一個風口:量子計算與它的Transformer時刻插图9

來源: ResearchGate

泓君:
亞馬遜現在的路線是怎麼樣的?

Roger:
他們做的是一種比較新穎的超導量子比特來進行scale。

所有大公司都做
超導量子比特
,包括穀歌、 IBM、 亞馬遜,只是不同的超導量子比特。 從公開資訊來說,亞馬遜做的是一種比較新的超導量子比特,叫Cat Qubit(猫量子比特),但是穀歌顯然是產生了(更大的)影響。

泓君:
微軟呢?

Roger:
微軟當年覺得量子計算很遙遠,他們其實開始的很早,應該不比穀歌晚,但是他們走的一個是叫
拓撲量子比特
的路子,就是一個完全到現在為止都沒有能證明的東西,他們八成已經放弃了。

所以他們現在更多的是想去做跟別的量子計算公司進行深度合作。 比如說他們現在之前跟Honeywell的分拆公司叫做Quantinuum合作了所謂的
邏輯量子比特
計算。 最近又跟UC Berkeley的一個分拆公司做基於原子的邏輯量子比特計算。

 

微軟其實一開始也很像穀歌一樣重視容錯量子計算,穀歌其實更保守。 穀歌為什麼選超導量子的路線? 因為這個工程上早就被證明,你可以真的是把晶片造出來能用。 所以說從公司層面上來說的話,實際上你只需要對它進行所謂的工程優化,就可以慢慢去產出成果。

至於快和慢,很多時候跟你的投入和市場需求有直接掛鉤的關係。 就像剛剛說的曼哈頓計畫的例子,市場有巨大的需求,那這三年就能交付了。 如果市場需求需要等待時機或者證明商業上的合理性的話,那就可能會拖得長一點。 但是總體上來說,用超導路徑你是可以直接把它給預期做出來的。 微軟當時就覺得這條路子可能都要走個十幾二十年。

就像我說的,最早是大家的對未來的估算都容易有分歧,很容易就會說三十年之後,所以他們選了一個叫拓撲量子比特,這種拓撲比特的好處就是上來就容錯。 他也對應的開發了很多軟件,算是比較早的量子軟體發展公司。

現在硬體廢了之後,他們就把軟件跟別的量子計算公司進行合作,在別的量子硬體上的運行邏輯量子比特。 所以實際上它跟穀歌很像,也很重視所謂的容錯量子計算。 只是最後實現路徑的時候,穀歌其實選擇一條硬體上更能證實的管道去軟硬結合的去做這個事情。 而微軟因為決策上的一些失誤,所以現在只有軟件了,跟硬體公司合作。

泓君:
所以整個過程大家對科技方向的把控還是需要一些關鍵決策的。 還有幾家創業公司呢? 比如說IonQ?

Roger:
IonQ的路徑主要是
離子阱
。離子阱路徑其實曾經很長一段時間,甚至在10年以前,被認為是比超導更有前景的路徑。 因為基於離子阱的量子實驗其實是人類最早的量子實驗,拿了不少諾貝爾獎。

超導在很長的時間,在2007年— 09年之前被認為是一個非常差的平臺。 因為當時實驗上做出來量子比特都非常差。 大概在2009年,耶魯的研究員開始把量子比特做得越來越好了。 然後到了2014年的時候,可以到了糾錯的閾值,也是穀歌參加的一個時間點。

IonQ他們路徑為什麼最好呢? 因為這套量子體系是歷史最久的,在小規模量的體系裡面是最好的操縱的,可動性很强。 所以說他們當時的路徑就認為離子阱這個路線可能會更早的實現所謂的商業落地和“ very useful quantum computer”。 但是事實來說,他們公司從創始到上市到現在,量子比特的數量可能就翻了一個倍。

 

泓君:
現在是多少個量子比特?

Roger:
他們2017年創始的時候,因為是學校出來的,所以從大學實驗室搬的那套就有11個量子比特可以相互糾纏和計算了,當年發了很多論文,其實都還不錯的工作。 但是後來發現離子阱這個路徑,當你要超越11個量子比特的時候,工程上面有巨大量的科學調整。 一個是工程挑戰大家都很大,但是你可以一步一步去實現它,一個是有科學挑戰。

泓君:
科學挑戰會更難,它需要依靠基礎的突破。

Roger:
就是有更多的不確定性在裡面,你需要有更多的創新去驅動他們。

泓君:
所以你剛剛說他們翻了一個倍,現在是22個量子比特。

Roger:
差不多,在二十多個到三十個之間。

泓君:
現在業界最多的是多少個量子比特?

Roger:
離子阱最多的應該是Honeywell的32個。 但是現在的問題變成了當你的量子比特變多的情况下,其實他們的一個取捨就是現離子阱的效能越來越接近超導了。 量子比特變多,它的運行效能,比如說保真度這些名額越來越接近超導了,應該說是超導越來越接近他們。 導致一個很有趣的一個跨界,就是以前認為超導不可能做到保真度大於99.9的,現在能做到了。

 

科技發展其實是一個很有趣的過程,你會發現彎道超車在科技發展早期並不存在可能性。 就像AI,怎麼從Transformer去到GPT,你不能為了避免用Transformer換一個完全不一樣的架構去試錯,對吧? 很多人以為自己可以彎道超車的例子,反而翻車了。

泓君:
這就是“ 彎道翻車”。

Roger:
所以說IonQ的問題在於沒有一個清晰的路線去做到現在超導這種scale。 他們會說我們有路線圖了,但是我們需要看到實際的展示。

泓君:
Regetti呢?

Roger:
Regetti這個公司很傳奇,Regetti本人就是當年在耶魯把第一個超導比特量子能做出來的人,就是他的畢業論文。 然後他把這套帶到IBM,所以IBM最早的路徑圖就是根據他的那一套架構起來的。 他後來自己開公司,反正各種原因,他的公司的超導比特的一些小細節也變了。

Regetti我覺得其實在量子公司創業裡面算是前輩了,先驅。 但是因為可能有點太早了,他2013年創建。 比如你在Transformer之前創建一個AI公司,你可能會變成先驅,可能後面你就會沒辦法去用最新的科技,最新的資訊去做更明智的决定。 Regetti整個公司的不論科技層面還是商業層面,其實都現在有點落後,他們CEO現在也退休了。

05後量子時代的密碼學:銀行與科技巨頭佈局新一代加密技術

泓君:
今年VC投量子計算,你們有感受到這個市場有在變熱,錢在大批的往裡面湧嗎?

Roger: 我覺得現在來說,因為降息也是一個相對近期的時間,並沒有明顯感覺到傳統VC的投資變多。

泓君:
那什麼樣的投資變多?

Roger:
戰畧VC和國家主權VC。 比如說John Martinis,就以前穀歌的量子計算的負責人,他的新公司叫Qolab。 他這個公司就在去年拿到了1600萬美元,從日本的發展銀行還有一些別的機构拿的錢。

 

現在處在敏感階段的三個行業,先進電晶體、AI量子。 我們可以總結說,先進電晶體是一個非常傳奇的過去,然後AI是個非常蓬勃的當下,量子計算是不可避免的未來。
在一個加息週期裏,政府會對這個不可避免的未來更感興趣。 但隨著减息週期的開始,我覺得VC對於整個行業會更加關注,
特別是Willow的出現,就看下一個加息週期持續到什麼時候了。

泓君:
你剛剛提到的這家公司就是日本發展銀行有投到他們,我理解是不是量子計算如果實現了,它對整個全球的密碼系統會要求有一個整體的密碼系統的陞級,需要在安全層面上有一些佈局?

Roger:
這個已經開始了,兩年前拜登的有個行政命令要求所有聯邦機构將自己的加密數改成所謂的抗量子加密。 國家標準製定局大概在去年的時候定下了三個標準,進行抗量子加密,所以實際上兩三年前就開始了。

去年2月份的時候,
新加坡金管局建議所有新加坡的金融機構採用抗量子加密和QKD(量子金鑰分發),
讓應用數據不被洩露出去。 這個邏輯其實也是涉及到剛才大家說時間線的問題。 為什麼從兩年前金管局,也就就是新加坡央行,都在做這個事情呢? 滙豐其實已經在英國做過抗量子加密和安全通訊的試點網絡了。 很多銀行也在做,像摩根大通, Chase, 他們也算是這個領域裡面非常大條魚,他們有活躍的抗量子加密和量子通訊的基礎設施和項目發展,都是公開的資訊。

 

泓君:
所以抗量子算灋的密碼學也是在蓬勃發展。

Roger:
其實這些東西很有趣的。 之前說政府在主導,這個可以理解。 從去年開始是金融界在這方面的進步非常大的,基本上你聽過的銀行都有這方面的獨立項目和共同項目,甚至央行。 所以回到剛才的問題,我覺得很多人就是不要看他說什麼,要看他做什麼。 如果可以破解加密數的量子電腦還有十到十五年出來。 為什麼現在大家這麼急著去改變自己的基礎設施。

泓君:
所以你覺得量子計算什麼時候可以破解銀行的密碼呢? 因為就是在穀歌Willow晶片發佈的那一天,我觀察了一下比特幣的價格是大跌的。 其實市場上已經很廣泛且很長時間就流行一種說法,量子計算是非常容易去破解比特幣的算灋的。

因為比特幣的算灋其實分成兩部分,一部分是它挖礦的機制的算灋,還有一部分就是它的橢圓曲線簽名。 在這兩部分的算灋裡面,據說橢圓曲線的簽名它是最容易被破解的,甚至它比破解傳統銀行系統的密碼還要更容易。 你們理解是這個樣子嗎?

 

Jared:
對,比特幣確實是分兩種加密系統。 這裡就要提到一種剛才已經聊到的算灋,Shor算灋。

它是一種
專門針對大數分解和離散對數問題的一種量子算灋
,可以在以多項式時間內破解這個橢圓曲線簽名。 這種針對的不僅僅是比特幣系統,而是針對所有的公開金鑰是公開的加密系統,都會相對輕易地被這個Shor算灋所攻破。

這與銀行系統不同,銀行系統它是沒有公開的金鑰的,銀行系統的金鑰它本身也是機密資訊,不會暴露在外。 但是比特幣用戶的錢包的公開金鑰是公開的,在鏈上可查的。 任何人都可以通過區塊鏈網絡去訪問這些公開金鑰。

所以說沒有量子電腦的時代,你拿到公開金鑰是絕對不可能算出,也不能說絕對不可能,是一個非常大的成本,可能幾萬年才能算得出私密金鑰。 但是有了量子電腦和Shor算灋的情况下,在量子電腦有足够能力的情况下,拿到公開金鑰之後算出私密金鑰是一個非常可行的過程。

泓君:
多少量子比特才能破解? 有人說需要4000個,但是其實我們現在離4000個量子比特還是有很遠的距離的。

Roger:
這一點我先更正一下,不管是4000個、3000個比特數量,Shor算灋要求的是你的量子比特是沒有錯誤的,就是完全容錯量子電腦。 你要有一個4000個量子比特,所謂大規模容錯量子電腦去跑。 所以這個就是黃仁勳那個“ very useful quantum computer”。

按照他的預測是在大概在十五年之後,你看大家的動作來說顯然不是了,畢竟當這個東西已經開始威脅到自己的錢包的時候,大家的敏感度就變高了。 所以我覺得能破解到加密數的這個量子電腦,就是所謂的大規模容錯量子電腦的出現,可能還是要十年之後。 而很多機构和公司,特別是銀行,還有比特幣,現在已經自己配寘了這套加密數了。 原因在於,萬一呢?

因為這個不是說一個絕對的,這是一個估計,對吧? 就好像GPT Moment,說實話在2022年初的時候,2021年的時候,大家不知道這個進展,當時的普遍認為就是像GPT這種能通過圖靈測試的AI還要8到10年的時間,實際上也就幾個月的時間。

所以說實際上經過這趟之後,很多人意識到科技突破,有點像科技爆炸,你無法預測它什麼時候發現,我只能說我合理推測的10年左右會出來。 但是如果五年之後出來,甚至是明年出來,我不會極端的驚訝。 沒有物理規律說不可能,這個本質上是工程學問題。

泓君:
你剛剛提到了可能實現的完全容錯的量子電腦,它出現的時間可能是快速的,它不是勻速的,我可不可以理解成現在就變成一場競賽了,看誰先出來。 如果說有這麼强的量子計算先實現了,那就會對還沒有來得及陞級的這些密碼系統造成非常大的威脅。 另外一端就是大家在抗量子密碼學的改善上,大家有很多的陞級,那它可能是一個非常平緩的過渡。

Roger:
首先密碼學的替換,這個相對來說比較簡單。 抗量子加密數本身是個加密機制的一個替換,這個很大程度上是個軟體升級問題,或者是一個硬體的替換問題。 比如說你要用高速加密的話,你可能需要一個單獨的硬體。 但這個包括去年國家標準製定局製定了三個標準抗量子加密演算法之後,實際上大家商業化程度角度來講,你就去符合標準去配寘就好了。 你會看到像滙豐銀行其實去年也發佈了他們的crypto,在香港發佈的。 那個crypto還帶了抗量子加密。

 

抗量子加密這個東西,本身並不是一個很慢的過程,你得去做。 更複雜的反而是像那個通訊,叫QKD,很多銀行也在做QKD,完全不依靠你的加密數本身抗量子加密,而是靠物理層面的格局,這個也是一條路子。

但這個更慢一些,因為它畢竟涉及到光纖網絡這些東西。 但是很多銀行其實也自己在推,甚至我們接觸的一個銀行合作夥伴,他們說現在很有趣的情况是銀行再去要求這些通訊公司,像AT& T去部署,叫光纖QKD網絡,來幫助他們在華爾街可以進行安全的通訊。

這個還是挺有趣的。 反而是銀行倒逼通訊公司做這個事情,因為通訊公司幹不出來,大銀行也是自己在搞。 所以說實際上我
不是很擔心因為解密的能力的提升導致所謂的金融體系或者虛擬貨幣體系的崩潰,從科技層面上我不覺得
。三體有句話說的很好:& ldquo; 傲慢才是最大的問題。& rdquo;

泓君:
還有“ 我消滅你,與你無關。& rdquo;

Roger:
我覺得現在大家都搭建得很好,包括銀行金融機構,你以為它很傲慢,但他們其實反而是想打安全牌。 所以說實際上我覺得包括像加密貨幣,他們其實也可以再反覆運算他們的加密方法,是讓他們的更加安全。 這個我覺得是可以做到的,這不是一個“ 火箭科學” (Rocket science)的問題。

現在處在一個很有趣的階段,就像很多大公司和國家都在想,肯定有地方可以攫取第一筆紅利。 與其別人得到,不如我去得到。 所以就給我們這邊帶來了比較大的一個契機。 我們可以給大公司和一些基礎設施發展項目計算進行配套量子計算設備或者說新增一些設備,就是我們本質上變成了一個服務器供應商,這一點其實也是我們現時客戶的主要的角度。 我們最大的收入來自於向這些資料中心提供我們的量子電腦。

泓君:
對於普通人而言,量子計算它會去影響普通人的日常生活嗎? 還是說它其實只是會在高精尖的領域裡面去默默運轉?

Roger:
這個東西就有點像電腦早期誕生的時候,它會服務的是什麼呢? 就是一個大型跨國機构,或者說甚至是一個國家政府的基礎設施的需求。 它提供的是更多的後臺的需求,為比如說未來的能服務於普通人的化學產品,或者金融產品,或者AI產品提供助力。

有點像GPU。 GPU其實很多年以來都是這些遊戲玩家在玩,有段時間是給挖礦,現在GPU才慢慢進入到所謂的無論玩不玩遊戲,你都得跟我打交道的階段,但是也是從資料中心的角度來服務福斯的。

我覺得量子計算也會經歷這樣的過程,我們會先去服務一些比較特定的高價值客戶,像電腦早期一樣、基礎設施項目、大型機构,然後通過他們去間接服務普通人。 但隨著根據老黃的“ very useful quantum computer” 出現在那個年代,其實不光意味著量子電腦可能到了一個完整的形態。 甚至我覺得在那個年代這個產業鏈更加成熟,生產效率也更高,所以這個成本也會變得越來越低。

 

電腦早期很貴的,IBM是最早做電腦產品的公司,造出了Watson電腦,當時的IBM公司主席經典的誤判就是說全世界只需要5臺電腦。 因為他數了數,需要電腦的就是政府、軍隊、銀行,後來發現明顯誤判了,因為有更多人去用了,發現更多的用途了,就會有更多需求,更多的需求驅動了更多的產量,更多的產量會讓成本下降。

原文網址:https://zh.gushiio.com/ai/2036.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *