I/O 2023大會AI唱主角，谷歌攜PaLM2迎接大模型“背水一战”

2023-05-11 14:00:31

北京時間今日凌晨，谷歌I/O全球开發者大會在加州山景城舉行，與往年I/O大會安卓系統唱主角不同，今年的I/O大會是一場以AI爲核心的大會，谷歌展現了一系列人工智能領域的最新技術成果。

谷歌母公司Alphabet CEO桑達爾皮查伊（Sundar Pichai）表示：“我們正在重新塑造包括搜索在內的所有核心產品。”

在大會上，谷歌在今年的I/O大會上發布了多款基於其大型語言模型（LLM）的新產品。同時，谷歌正在將生成式AI整合到搜索引擎和其他產品中，例如可以生成草稿信息的Gmail，以及可以對圖像進行重大修改的Google Photos。

大語言模型PaLM2亮相，實現端側大模型

大模型作爲目前人工智能行業的焦點，谷歌在 I/O 开發者大會上宣布了全新的大語言模型 PaLM 2，據悉，PaLM 2是谷歌去年4月發布的PaLM語言模型的升級版本，它將爲谷歌的更新版Gmail和 Bard 聊天工具提供支持，以挑战OpenAI的GPT-4。

據谷歌介紹，PaLM 2 在訓練過程中使用了大量的數學和科學數據集，在邏輯和推理方面進行了廣泛的訓練，相比於去年的 PaLM 模型，PaLM 2 在多語言處理、推理和編碼能力上有了顯著的提升，並且接受了多語言文本訓練，支持超過100種語言。

谷歌沒有透露 PaLM 2 的具體參數規模，只是提到 PaLM 2 是基於最新的 JAX 和 TPU v4 計算設施構建的。谷歌對 PaLM 2 進行了算法優化，使得它在體積上比 PaLM 要小，但整體性能更強，計算效率更高。

在介紹環節，谷歌也不忘對標一下“競爭對手” ，谷歌官方測試顯示，PaLM 2 的部分結果（例如數學）比 GPT-4 還要優秀。

據悉，爲了讓模型的能力更靈活地服務於產品，PaLM 2分爲四種規格，從小到大依次爲Gecko、Otter、Bison和Unicorn，其中體積最小的Gecko可在移動設備上使用，每秒大約可處理20個Token，开發者們不用花費大量的時間和資源來創建和調整PaLM 2，而是能夠直接拿來就用進行部署。

基於PaLM 2 微調，谷歌還展示了一種名爲 Med-PaLM 的多模態大語言模型，專門用於醫療領域。它可以根據 X 光片診斷病人的傷情，據稱是首個在美國醫療執照考試中達到專家水平的大語言模型。

另一種是 Sec-PaLM 2，它是針對網絡安全的大語言模型，它可以分析和解釋潛在的惡意腳本，並評估其危險性。

谷歌表示，目前已有超過25個產品和App正在使用PaLM 2的能力。

Duet AI發布，全面對標微軟Copilot

Duet AI 是 Google Workspace 的最新工具，是谷歌在Workspace應用中提供的一系列AI工具的品牌名稱，利用谷歌AI 技術提供智能輔助：

首先，Gmail移動應用現在將根據一個提示，在一個新的“Help me write（幫我寫）”功能中爲你完整的電子郵件回復。此外，Gmail移動應用很快將增加上下文輔助功能，“讓你能夠創建自動填充姓名和其他相關信息的專業回復。”

Duet AI也出現在Google Slides中，與Midjourney或DALL-E 2類似，Duet AI現在可以將簡單的文本提示（輸入到Duet AI“Sidekick”側邊欄中）轉換爲AI生成的圖像，以增強Slides演示文稿。它可以幫助您省去在互聯網上尋找合適的幻燈片圖像的麻煩，同時爲它們增添一些原創性。基於此功能，Duet AI還可以在Google Meet中可以根據文本提示爲視頻通話生成自定義背景圖像。

在Google Sheets中，Duet AI可以理解單元格數據的上下文，並相應地進行標記。電子表格應用程序還添加了一個新的“help me organize”（幫我整理）”功能，用於創建自定義計劃。

Duet AI還在Google Docs的智能畫布中增加了一個“assisted writing experience（輔助寫作體驗）”。輸入一個描述你想寫的內容的提示，就會生成一個Docs草稿。

此外Duet AI還增加了一套基於機器學習的Google Cloud开發者工具，它可以提供實時代碼協助，並推薦生成的代碼塊，同時指出錯誤可，支持 Go、Java、Javascript、Python 和 SQL 等多種开發語言。

用AI重新定義搜索能力

會上，谷歌搜索也推出了全新的SEG（Search Generative Experience），在使用時會在一些查詢的搜索結果的最頂部看到AI生成的答案，這些答案可以爲你的搜索提供更多的上下文。你可以通過後續問題來縮小快照中的信息。這些AI快照是由Google在I/O上宣布的大型語言模型（LLM）的更新版本PaLM 2驅動的。這個新模型已經爲25個谷歌服務提供支持，包括公司的Bard聊天機器人，並且在推理、編碼和翻譯方面有所改進。

更加多模態、多元化的Bard

谷歌宣布，旗下AI的聊天機器人Bard現在將對所有人开放，從周三起，向約180個國家开放申請使用Bard，並增加對韓語和日語的支持。同時該公司還增加了一系列新功能，讓用戶可以更容易地將生成的文本導出到Google文檔和Gmail，加入了新的暗色模式和視覺搜索功能。谷歌還表示計劃在未來爲Bard添加更多功能，這包括使用Adobe的AI圖像生成器Firefly的AI圖像生成，以及與第三方服務如OpenTable和Instacart的集成。

面向AI的超算設施及學習工具

除了面向用戶的功能升級外，谷歌還爲开發者推出雲端機器學習平臺Vertex AI，增加了三款新的大模型：

Codey：text-to-code，可以幫助开發者編寫代碼；

Imagen：text-to-image，可以生成高品質的圖片；

Chirp：speech-to-text，可以方便地進行語音轉文字。

此外，在Vertex AI上還可以使用文本和圖像的嵌入式API。它可以將文本和圖像數據轉換爲多維數值向量、映射語義關系，從而讓开發者創建出更加有趣的應用。

除了模型方面，谷歌雲在訓練上還推出了下一代A3 GPU超算。通過將A3虛擬機和Nvidia H100結合，谷歌雲能夠提供更大的計算量和帶寬，能夠讓企業更快开發機器學習模型。

“親兒子”獨享AI賦能的安卓14

相比AI佔據了發布會的絕大多數時間，昔日的主角Android 14則成爲了這次大會的配角，且同樣爲安卓 14 系統引入兩項生成式 AI 特性，包括 Magic Compose 和生成式壁紙，其中後者爲Pixel 設備獨佔。

其中，Magic Compose可以在安卓系統的默認短信（Messages）應用中，通過AI 可以根據消息內容生成回復文本。

而生成式 AI 壁紙，則是通過引入文本轉圖片擴散模型，允許用戶輸入 prompts，描述想要獲取的圖片信息，系統將會自動生成相應的壁紙。谷歌還表示，它有一種新的“電影壁紙”（cinematic wallpaper），使用設備上的機器學習網絡將你最喜歡的照片轉換爲 3D 圖像，當你解鎖或傾斜設備時，這些圖像會呈現立體效果，給人栩栩如生的感覺。

除了軟件方面的升級之外，本次I/O大會上，谷歌還發布了售價1799美元的首款折疊屏手機Pixel Fold、直板手機Pixel 7a以及平板產品Pixel Tablet，而這些谷歌“親兒子”產品將和該系列其他產品一樣，率先獲得最新版的安卓大版本的升級，以及Pixel的獨享功能。

回顧谷歌 I/O 2023大會，可以說是一場擁抱AI、擁抱的大模型的大會。面對席卷全球的熱潮，谷歌作爲全球的互聯網科技巨頭，也難以逆勢而行。尤其是在OpenAI、微軟、百度、商湯、科大訊飛等企業紛紛推出大模型以強化自身業務能力，實現效能提升，谷歌也必然有所行動，用AI賦能現有的產品，供自己的江湖地位。

在I/O大會上谷歌推出的新功能上，速途網能夠看出谷歌已經想着大模型領域邁出了更加堅實的一步，而爲谷歌形成真正的優勢，不僅要看谷歌在這場大模型的角力中能否脫穎而出，還要看能否與產品與服務更加深度的整合，以合力打造一把“後中爭先”的利刃。

追加內容

本文作者可以追加內容哦 !

0/100

next & prev

優質房企獲得資本青睞，碧桂園發行兩筆合計17億元中期票據

理想“起飛”！股價大漲14%，盈利能力秒殺比亞迪