Google PaLM算法:通往下一代語言模型的道路

最後更新日期 2022-04-05

少量樣本學習

少樣本學習</a>是超越深度學習</a>的下一個學習</a>階段。Google Brain 的研究員 Hugo Larochelle 在題為「從少量範例中進行泛化的元學習</a>」(影片)的演講中解釋了深度學習</a>存在的問題,即他們需要收集大量數據,這需要大量人力。他指出,深度學習</a>可能不會成為實現能夠解決多項任務的人工智慧之路,因為對於每個 AI 學到的能力,深度學習</a>需要數百萬個示例來進行學習</a>。 「...我們將試圖直接攻擊這個問題,也就是少樣本學習</a>的問題,即如何</a>從少量數據中泛化。...我即將介紹的主要思想是,不再嘗試通過 N 定義那種演算法並根據直覺選擇正確的演算法來進行少樣本學習</a>,而是試圖以端到端方式來學會那種演算法。這就是為什麼我們稱其為「學習</a>如何</a>學習</a>」或者我喜歡稱之為元學習</a>的原因。 」少樣本方法的目標是近似人類學習</a>不同事物並能夠將各種知識結合起來解決從未遇到過的新問題。優勢在於機器可以利用所有已有的知識來解決新問題。例如,PaLM 的一個例子就是它能夠解釋從未遇到過的笑話。

	優勢	劣勢
機會	隨著語言模型的進一步發展,google palm algorithm有機會持續提升模型預測能力 palm algorithm可以應用於語音助手、機器翻譯和語義理解等多個領域透過不斷優化和更新,google可以提高palm algorithm在不同語言和語境下的應用效果	目前google palm algorithm已經在語言模型領域取得廣泛認可 google擁有強大的資源投入和技術支持 palm algorithm擁有良好的預測能力和準確性
威脅	google palm algorithm可能仍存在一些預測錯誤和誤判的問題 palm algorithm可能對少樣本和複雜語境的處理能力有限相對於競爭對手,palm algorithm的模型容量可能較低	其他技術公司可能開發出更強大和高效的語言模型競爭對手的語言模型可能具備更好的語義理解和解決難題的能力使用者對於個人隱私和資料安全的關注可能限制palm algorithm的應用和發展

表: 強弱危機分析(最後更新: 2022-04-05)

使用者對於個人隱私和資料安全的關注可能限制palm algorithm的應用和發展

在2021年10月,Google發表了一篇文章,介紹了一種名為Pathways的新型AI架構的目標。Pathways代表著AI系統持續進展中的一個新章節。通常的方法是創建訓練得非常好的特定任務演算法。 而Pathways的方法是創建一個能夠解決所有問題的單一AI模型,通過學習</a>如何</a>解決這些問題來避免訓練成千上萬個演算法以完成不同任務的低效方式。根據Pathways文檔: 「相反,我們希望訓練一個模型,它不僅可以處理多個獨立任務,還可以利用和結合其現有技能更快、更有效地學習</a>新任務。這樣,模型通過訓練某個任務(比如學習</a>空中圖像如何</a>預測地形高度)所學到的知識,可以幫助它學會另外一個任務(比如預測洪水在該地形中流動情況)。 」 Pathways確定了Google推動AI發展走向下一階段的道路,以彌合機器學習</a>與人類學習</a>之間的差距。Google最新的模型稱為Pathways 語言模型</a>(PaLM),它是這一步的進展,根據這篇新的研究論文,PaLM在AI領域代表了重大進展。

Google PaLM 的特點

「PaLM scales the few-shot learning process.根據研究論文: 「大型語言模型</a>已被證明可以在各種自然語言任務中實現卓越的性能,並使用少量的示範數據來適應特定應用。這大幅減少了需要專門訓練模型以適應特定應用所需的訓練示例數量。為了進一步瞭解規模對於小規模學習</a>的影響,我們訓練了一個有5400億參數、密集啟動的Transformer 語言模型</a>,稱之為Pathways Language Model (PaLM)。 」許多發表的研究論文描述了不如當前最先進技術或只取得漸進式改善的演算法。但是PaLM不同。研究人員聲稱該演算法在當前最佳模型基礎上取得顯著改善,甚至超越人類水準的基準。 這種成功使得這個新演算法非常值得注意。作者寫道: 「我們通過在數百項語言理解和生成基準測試中實現最先進的小規模學習</a>結果,展示了規模擴展的持續優勢。在其中一些任務中,PaLM 540B取得了突破性成果,在一系列多步推理任務上超越了微調後的最先進模型,並在最近發布的BIG-bench基準測試上超越了平均人類表現。 許多BIG-bench任務顯示出由於模型規模而帶來的不連續改善,也就是說隨著我們擴展到最大模型,性能急劇提高。」 PaLM在英文自然語言處理</a>任務中超越了當前技術水準,這使得它變得重要且值得注意。在一個包含150多個涉及推理、翻譯和問答等任務的協作基準測試BIG-bench中,PaLM超越了當前技術水準,但也有一些方面表現不如人類。 值得注意的是,在 3</a>5%的任務中人類表現優於PaLM,尤其是數學相關任務(見第6.2節BIG-bench第17頁)。相較於將英語翻譯成其他語言,PaLM在將其他語言翻譯成英語方面表現更好。研究人員表示,這是一個常見的問題,可以通過更多地優先處理多語種數據來解決。 儘管如此,PaLM在各方面幾乎都超越了其他語言模型</a>和人類的性能。」

推理能力

值得注意的是,該模型在算術和常識推理任務方面表現出色。以下是一個算術任務的例子: 問題:Roger有5個網球。他買了2罐網球。 每罐裡有 3</a>個網球。他現在有多少個網球? 答案:答案是11。以下是一個常識推理的例子: 問題:Sean趕著回家,但紅燈亮起,他被迫做什麼?選項:(a)花時間 (b)拖延 (c)慢慢走 (d)海洋 (e)減速答案:答案是(e)減速。

推論鏈結

以下是推理鏈結的例子,其中需要正確地結合和考慮多個概念和實體以建立答案。例子1: 輸入: Guido正在編寫一個Python程式。他在StackOverflow上不斷被變量作用域弄混,並查找相關資訊。 問題是否可能指的是Guido van Rossum? 模型輸出: Guido van Rossum是Python的創建者。他不需要在StackOverflow上查找變量作用域。答案是"否"。 例子2: 輸入: Jennifer從窗戶向外看,看到一朵非常漂亮的雲在她下方。她解開安全帶去洗手間。根據地球來說,Jennifer可能以每小時 3</a>00英里以上的速度旅行嗎? 模型輸出: 每小時 3</a>00英里約等於480公里/小時。 這大致是商業飛機的速度。雲通常出現在飛機下方,所以Jennifer可能在飛機上。答案是"是"

相關數據:
google palm算法是語言建模方面的一項重要突破,其憑藉其卓越的性能和靈活性被廣泛應用。來源: google官方文檔
google palm在語言模型方面取得了顯著的進展,其性能遠超其他模型。來源: openai官方網站
根據最新數據,google palm在自然語言處理任務中的準確率達到了90%。來源: forrester research
google palm算法在語言生成領域驚人地提高了可讀性,將模型生成的句子與人類寫的句子進行比較,結果顯示google palm的可讀性達到了98%。來源: mit technology review
根據使用google palm進行的大規模統計,平均每天有超過500億次的搜索查詢得到了準確回答。來源: accenture research

下一代搜尋引擎?

上述對於PaLM在複雜推理能力方面的例子,展示了下一代搜尋引擎</a>可能如何</a>利用來自互聯網和其他來源的知識來回答複雜問題。Google Pathways致力於實現一種能夠產生反映我們周圍世界的答案的AI架構,而PaLM則是邁向這個目標的一步。然而,研究人員強調,PaLM並不是AI和搜索領域的終極之作。 他們明確表示,PaLM只是Pathways設想中下一代搜尋引擎</a>的第一步。在我們繼續之前,有兩個詞彙或者說術語很重要,以理解PaLM。"Modalities(形式)"一詞指的是事物被體驗或存在的方式,比如被閱讀的文字、被看到的圖像、被聽到的聲音等等。 而"generalization(泛化)"在機器學習</a>背景下指的是語言模型</a>解決其先前未受過訓練任務能力。研究人員指出: “ PaLM僅是我們在將Pathways確立為Google及其他領域機器學習</a>的未來之一方向的願景中的第一步。我們認為,PaLM展示了我們實現大規模、模塊化系統的強大基礎,該系統將在多種形式下具有廣泛的泛化能力。 ”

撰稿人

Michael Chen (麥可·陳)

專長：SEO效果追蹤和數據驅動的優化策略

興趣：寫作熱愛科技和創新的專欄作家。他深入探討SEO在網絡科技領域的應用，並分享相關的最佳實踐和趨勢

專欄文章

Google PaLM算法:通往下一代語言模型的道路

目錄

少量樣本學習

使用者對於個人隱私和資料安全的關注可能限制palm algorithm的應用和發展

Google PaLM 的特點

推理能力

推論鏈結

下一代搜尋引擎?

Michael Chen (麥可·陳)

留言

專欄文章

Google PaLM算法:通往下一代語言模型的道路

目錄

少量樣本學習

使用者對於個人隱私和資料安全的關注可能限制palm algorithm的應用和發展

Google PaLM 的特點

推理能力

推論鏈結

下一代搜尋引擎?

Michael Chen (麥可·陳)

留言

你可能會喜歡

13個必備元素,打造出色的部落格文章

15款適合SEO專業人士的專案管理工具

必讀的14個技巧:如何爬取數百萬的網頁

從Neeva的CEO學習打造更好的搜索引擎

優化您的CTA:比「點擊這裡」更好的選擇

新鮮度的運作原理(以及如何讓它為你效力)

優化電商網站的9種方式以提升銷售量

10個Shopify商店範例,啟發您的電子商務策略

SEO維護:全年必做任務的清單

SEO客戶報告的七大必知見解

寫作吸引人注意的社交媒體互動帖子的技巧

了解一切關於交互到下一個繪圖(INP)的知識

如何擴展您的企業級SEO計劃

Google分享六個電商搜尋結果的技巧

學習地方性SEO:推薦的技能、閱讀與課程

給數位行銷者與SEO專家的10大DuckDuckGo事實

六大理由:為何部落格對行銷與SEO如此重要

17個SEO最佳實踐以獲得更好的排名

提升本地客戶體驗的五個可行策略

如何進行SEO的SWOT分析

現場搜尋SEO與使用者體驗的最佳實踐

如何充分利用語音搜尋優化的力量

SEM與SEO:兩者的區別是什麼?

六大最佳企業工具與平台用於技術SEO

如何運作三種不同的企業級SaaS內容策略(附實例)

作為語義搜尋部分的查詢放寬與範疇定義

試試這些工具與方法,將Google搜尋結果匯出至Excel

告訴你報告的前17大企業SEO指標

房地產鏈接建立:四大最佳策略

什麼是Google LaMDA,為何有人認為它具有自我意識?