原文作者:Advait (Leo) Jayant
編譯:LlamaC
「推薦寄語:全同態加密(FHE)常被譽為密碼學的聖杯,本文探討了 FHE 在人工智能領域的應用前景,指出了當前面臨的局限性。並 list 了一些致力于在加密領域利用全同態加密(FHE)進行 AI 應用的項目,對于加密貨幣愛好者來說,可通過本文對全同態加密進行一次深入了解,enjoy!」
正文?
A 希望在 Netflix 和 Amazon 上獲得高度個性化的推薦。B 不希望 Netflix 或 Amazon 了解他們的偏好。
在當今的數字時代,我們享受著亞馬遜和 Netflix 等服務帶來的個性化推薦便利,這些推薦精准地迎合了我們的趣味。然而,這些平台深入我們私人生活的行為正引發越來越多的不安。我們渴望在不犧牲隱私的前提下享受定制化服務。過去,這似乎是一個悖論:如何在不對基于雲的人工智能系統分享大量個人數據的情況下實現個性化。全同態加密(FHE)提供了一個解決方案,使得我們能夠兼得魚與熊掌。
人工智能(AI)如今在應對包括計算機視覺、自然語言處理(NLP)和推薦系統在内的多個領域的複雜挑戰中扮演著關鍵角色。然而,這些 AI 模型的發展給普通用戶帶來了重大挑戰:
1.數據量:構建精確模型往往需要龐大的數據集,有時甚至會達到千萬億字節的規模。
2.計算能力:像轉換器這樣的複雜模型需要數十個 GPU 的強大算力,通常連續運行數周。
3.領域專長:這些模型的微調需要深厚的專業知識。
這些障礙使得大多數用戶難以獨立開發強大的機器學習模型。

進入 AI 即服務(AIaaS)時代,這一模式通過提供由科技巨頭(包括 FAANG 成員)管理的雲服務,讓用戶得以接觸到最先進的神經網絡模型,從而克服了上述障礙。用戶只需將原始數據上傳至這些平台,數據便會在平台上被處理,進而生成富有洞察力的推斷結果。AIaaS 有效地普及了高質量機器學習模型的使用權,將先進的 AI 工具開放給更廣泛的群體。然而,遺憾的是,當今的 AIaaS 在帶來這些便利的同時,卻犧牲了我們的隱私。

在 AI 即服務過程中,服務器能夠訪問輸入和輸出數據。這種情況使得普通用戶共享敏感信息(如醫療和財務數據)變得複雜。諸如 GDPR 和 CCPA 之類的法規加劇了這些擔憂,因為它們要求用戶在數據被共享之前明確同意,並保證用戶有權了解其數據如何被使用。GDPR 還進一步規定了傳輸過程中數據的加密和保護。這些法規設定了嚴格的標准,以確保用戶的隱私和權利,倡導對個人信息有明確的透明度和控制。鑒于這些要求,我們必須在 AI 即服務(AIaaS)流程中開發強大的隱私機制,以維護信任和合規性。

全同態加密(FHE)為雲計算中關聯的數據隱私問題提供了解決方案。FHE 方案支持密文加法和乘法等操作。其概念簡單明了:兩個加密值之和等于這兩個值之和的加密結果,乘法亦然。
實際操作中,其工作原理如下:用戶在本地對明文值?和?執行加法運算。隨後,用戶加密?和?,並將密文發送至雲服務器。服務器能夠在加密值上(同態地)執行加法運算並返回結果。從服務器解密得到的結果將與?和?的本地明文加法結果一致。這一過程既保障了數據隱私,又允許在雲端進行計算。

除了基本的加法和乘法運算外,在 AI 即服務流程中,利用全同態加密(FHE)進行神經網絡處理的技術已取得顯著進展。在此背景下,用戶可以將原始輸入數據加密成密文,並僅將這些加密數據傳輸至雲服務器。服務器隨後對這些密文進行同態計算,生成加密輸出,並將其返回給用戶。關鍵在于,只有用戶持有私鑰,使其能夠解密並訪問結果。這構建了一個端到端的 FHE 加密數據流,確保用戶數據在整個過程中的隱私安全。
基于全同態加密的神經網絡在 AI 即服務中為用戶提供了顯著的靈活性。一旦密文被發送到服務器,用戶便可離線,因為客戶端與服務器之間無需頻繁通信。這一特性對物聯網設備尤為有利,它們通常在限制條件下運行,頻繁通信往往不切實際。
然而,值得注意的是全同態加密(FHE)的局限性。其計算開銷巨大;FHE 方案本質上耗時、複雜且資源密集。此外,FHE 目前難以有效支持非線性操作,這對神經網絡的實現構成了挑戰。這一限制可能會影響基于 FHE 構建的神經網絡的准確性,因為非線性操作對這類模型的性能至關重要。

(Lam 等人,2024 年)描述了一種用于 AI 即服務的隱私增強神經網絡協議。該協議首先通過使用誤差學習(LWE)來定義輸入層的參數。LWE 是一種加密原語,用于通過加密來保護數據,使得無需先解密即可對加密數據進行計算。對于隱藏輸出層,參數則通過環 LWE(RLWE)和環 GSW(RGSW)來定義,這兩種高級加密技術擴展了 LWE,以實現更高效的加密操作。
公共參數包括分解基 ? 及 ??? 給定一個輸入向量 ? 長度為 ? , 一組 ? LWE 密文 (??,??)為每個元素 ?[?] 生成了使用 LWE 私鑰 ? ,關于 ? 的評估密鑰為索引生成 ?[?]>0 及 ?[?]<0此外,還針對 ? 設置了一組 LWE 切換密鑰。這些密鑰支持在不同加密方案間進行高效切換。
輸入層被指定為第 0 層,輸出層為第 ? 層對于每一層 ? 從 1 到 ? 神經元數量為 ??在第 0 層已確定。權重矩陣 ?? 偏置向量 ??從第 0 層開始在第 0 層上疊加被定義。對于每個神經元 ℎ 從 0 到 ??−1 來自第 ?−1 層的 LWE 密文在同態加密下進行評估。這意味著計算是在加密數據上執行的,以計算 ℎ 中的線性函數。第 ? 層中的第-th 個神經元,結合權重矩陣和偏置向量。隨後,在 ℎ 中評估查找表(LUT)。-th 神經元,以及從 ?′ 的切換到較小的 ? 執行操作後,接著對結果進行舍入和重新縮放。該結果被納入第 ? 層 LWE 密文集合中。
最後,協議將 LWE 密文返回給用戶。用戶隨後可以使用私鑰 ? 解密所有密文。查找推理結果。
此協議通過利用全同態加密(FHE)技術,高效實現了隱私保護的神經網絡推理。FHE 允許在加密數據上進行計算,而不向處理服務器泄露數據本身,確保了數據隱私的同時,提供了 AI 即服務的優勢。
FHE(全同態加密)使得在加密數據上進行安全計算成為可能,不僅開拓了衆多新的應用場景,同時確保了數據的隱私性和安全性。
廣告中的消費者隱私:(Armknecht 等人,2013 年)提出了一種創新的推薦系統,該系統利用全同態加密(FHE)。此系統能夠在向用戶提供個性化推薦的同時,確保這些推薦内容對系統本身完全保密。這保證了用戶偏好信息的私密性,有效解決了定向廣告中的重大隱私問題。
醫療應用:(Naehrig 等人,2011 年)為醫療保健行業提出了一個引人注目的方案。他們建議使用全同態加密(FHE)持續將患者的醫療數據以加密形式上傳至服務提供商。這一做法確保了敏感的醫療信息在其整個生命周期内保持機密性,既增強了患者隱私保護,又使得醫療機構能夠無縫進行數據處理和分析。
數據挖掘:挖掘大型數據集能夠産生重大洞見,但往往以用戶隱私為代價。(Yang, Zhong, 和 Wright, 2006)通過在全同態加密(FHE)背景下應用函數加密解決了這一問題。這種方法使得從龐大的數據集中提取有價值的信息成為可能,同時不損害被挖掘數據個體隱私的安全性。
財務隱私:設想一個場景,一家公司擁有敏感數據和專有算法,必須保密。(Naehrig 等人,2011 年)建議采用同態加密來解決這一問題。通過應用全同態加密(FHE),公司能夠在不暴露數據或算法的情況下,對加密數據進行必要的計算,從而確保財務隱私和知識産權的保護。
法醫圖像識別:(Bosch 等,2014)描述了一種利用全同態加密(FHE)外包法醫圖像識別的方法。這一技術對執法機構尤其有益。通過應用 FHE,警方及其他機構能夠在不暴露圖像内容的情況下,檢測硬盤上的非法圖像,從而保護調查中數據的完整性和機密性。
從廣告和醫療保健到數據挖掘、金融安全和執法,全同態加密有望徹底改變我們在各個領域處理敏感信息的方式。隨著我們不斷發展和完善這些技術,在一個日益數據驅動的世界中保護隱私和安全的重要性再怎麽強調也不為過。
盡管具有潛力,我們仍需解決一些關鍵限制
以下是一些致力于在加密領域利用全同態加密(FHE)進行 AI 應用的公司:
在全同態加密(FHE)、人工智能(AI)和加密貨幣領域前沿運營的公司數量仍然有限。這主要是因為有效實施 FHE 需要巨大的計算開銷,要求強大的處理能力以高效執行加密計算。
全同態加密(FHE)通過允許在未解密的情況下對加密數據進行計算,為增強 AI 中的隱私提供了一種有前景的方法。這一能力在醫療和金融等對數據隱私至關重要的敏感領域尤為寶貴。然而,FHE 面臨重大挑戰,包括高計算開銷以及在處理深度學習所必需的非線性操作方面的局限性。盡管存在這些障礙,FHE 算法和硬件加速的進步正在為 AI 中更實用的應用鋪平道路。該領域的持續發展有望極大提升安全、保護隱私的 AI 服務,平衡計算效率與強大的數據保護。
内容来源:PANews
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)