I/O 2023大會AI唱主角,谷歌攜PaLM2迎接大模型“背水一战”

2023-05-11 14:00:31

北京時間今日凌晨,谷歌I/O全球开發者大會在加州山景城舉行,與往年I/O大會安卓系統唱主角不同,今年的I/O大會是一場以AI爲核心的大會,谷歌展現了一系列人工智能領域的最新技術成果。

谷歌母公司Alphabet CEO桑達爾皮查伊(Sundar Pichai)表示:“我們正在重新塑造包括搜索在內的所有核心產品。”

在大會上,谷歌在今年的I/O大會上發布了多款基於其大型語言模型(LLM)的新產品。同時,谷歌正在將生成式AI整合到搜索引擎和其他產品中,例如可以生成草稿信息的Gmail,以及可以對圖像進行重大修改的Google Photos。

大語言模型PaLM2亮相,實現端側大模型

大模型作爲目前人工智能行業的焦點,谷歌 在 I/O 开發者大會上宣布了全新的大語言模型 PaLM 2,據悉,PaLM 2是谷歌去年4月發布的PaLM語言模型的升級版本,它將爲谷歌的更新版Gmail和 Bard 聊天工具提供支持,以挑战OpenAI的GPT-4。

據 谷歌 介紹,PaLM 2 在訓練過程中使用了大量的數學和科學數據集,在邏輯和推理方面進行了廣泛的訓練,相比於去年的 PaLM 模型,PaLM 2 在多語言處理、推理和編碼能力上有了顯著的提升,並且接受了多語言文本訓練,支持超過100種語言。

谷歌沒有透露 PaLM 2 的具體參數規模,只是提到 PaLM 2 是基於最新的 JAX 和 TPU v4 計算設施構建的。谷歌對 PaLM 2 進行了算法優化,使得它在體積上比 PaLM 要小,但整體性能更強,計算效率更高 。

在介紹環節,谷歌也不忘對標一下“競爭對手” ,谷歌官方測試顯示,PaLM 2 的部分結果(例如數學)比 GPT-4 還要優秀。

據悉,爲了讓模型的能力更靈活地服務於產品,PaLM 2分爲四種規格,從小到大依次爲Gecko、Otter、Bison和Unicorn,其中體積最小的Gecko可在移動設備上使用,每秒大約可處理20個Token,开發者們不用花費大量的時間和資源來創建和調整PaLM 2,而是能夠直接拿來就用進行部署。

基於PaLM 2 微調,谷歌還展示了一種名爲 Med-PaLM 的多模態大語言模型,專門用於醫療領域。它可以根據 X 光片診斷病人的傷情,據稱是首個在美國醫療執照考試中達到專家水平的大語言模型。

另一種是 Sec-PaLM 2,它是針對網絡安全的大語言模型,它可以分析和解釋潛在的惡意腳本,並評估其危險性。

谷歌表示,目前已有超過25個產品和App正在使用PaLM 2的能力。

Duet AI發布,全面對標微軟Copilot

Duet AI 是 Google Workspace 的最新工具,是谷歌在Workspace應用中提供的一系列AI工具的品牌名稱,利用谷歌AI 技術提供智能輔助:

首先,Gmail移動應用現在將根據一個提示,在一個新的“Help me write(幫我寫)”功能中爲你完整的電子郵件回復。此外,Gmail移動應用很快將增加上下文輔助功能,“讓你能夠創建自動填充姓名和其他相關信息的專業回復。”

Duet AI也出現在Google Slides中,與Midjourney或DALL-E 2類似,Duet AI現在可以將簡單的文本提示(輸入到Duet AI“Sidekick”側邊欄中)轉換爲AI生成的圖像,以增強Slides演示文稿。它可以幫助您省去在互聯網上尋找合適的幻燈片圖像的麻煩,同時爲它們增添一些原創性。基於此功能,Duet AI還可以在Google Meet中可以根據文本提示爲視頻通話生成自定義背景圖像。

在Google Sheets中,Duet AI可以理解單元格數據的上下文,並相應地進行標記。電子表格應用程序還添加了一個新的“help me organize”(幫我整理)”功能,用於創建自定義計劃。

Duet AI還在Google Docs的智能畫布中增加了一個“assisted writing experience(輔助寫作體驗)”。輸入一個描述你想寫的內容的提示,就會生成一個Docs草稿。

此外Duet AI還增加了一套基於機器學習的Google Cloud开發者工具,它可以提供實時代碼協助,並推薦生成的代碼塊,同時指出錯誤可,支持 Go、Java、Javascript、Python 和 SQL 等多種开發語言。

用AI重新定義搜索能力

會上,谷歌搜索也推出了全新的SEG(Search Generative Experience),在使用時會在一些查詢的搜索結果的最頂部看到AI生成的答案,這些答案可以爲你的搜索提供更多的上下文。你可以通過後續問題來縮小快照中的信息。這些AI快照是由Google在I/O上宣布的大型語言模型(LLM)的更新版本PaLM 2驅動的。這個新模型已經爲25個谷歌服務提供支持,包括公司的Bard聊天機器人,並且在推理、編碼和翻譯方面有所改進。

更加多模態、多元化的Bard

谷歌宣布,旗下AI的聊天機器人Bard現在將對所有人开放,從周三起,向約180個國家开放申請使用Bard,並增加對韓語和日語的支持。同時該公司還增加了一系列新功能,讓用戶可以更容易地將生成的文本導出到Google文檔和Gmail,加入了新的暗色模式和視覺搜索功能。谷歌還表示計劃在未來爲Bard添加更多功能,這包括使用Adobe的AI圖像生成器Firefly的AI圖像生成,以及與第三方服務如OpenTable和Instacart的集成。

面向AI的超算設施及學習工具

除了面向用戶的功能升級外,谷歌還爲开發者推出雲端機器學習平臺Vertex AI,增加了三款新的大模型:

Codey:text-to-code,可以幫助开發者編寫代碼;

Imagen:text-to-image,可以生成高品質的圖片;

Chirp:speech-to-text,可以方便地進行語音轉文字。

此外,在Vertex AI上還可以使用文本和圖像的嵌入式API。它可以將文本和圖像數據轉換爲多維數值向量、映射語義關系,從而讓开發者創建出更加有趣的應用。

除了模型方面,谷歌雲在訓練上還推出了下一代A3 GPU超算。通過將A3虛擬機和Nvidia H100結合,谷歌雲能夠提供更大的計算量和帶寬,能夠讓企業更快开發機器學習模型。

“親兒子”獨享AI賦能的安卓14

相比AI佔據了發布會的絕大多數時間,昔日的主角Android 14則成爲了這次大會的配角,且同樣爲安卓 14 系統引入兩項生成式 AI 特性,包括 Magic Compose 和生成式壁紙,其中後者爲Pixel 設備獨佔。

其中,Magic Compose可以在安卓系統的默認短信(Messages)應用中,通過AI 可以根據消息內容生成回復文本。

而生成式 AI 壁紙,則是通過引入文本轉圖片擴散模型,允許用戶輸入 prompts,描述想要獲取的圖片信息,系統將會自動生成相應的壁紙。谷歌還表示,它有一種新的“電影壁紙”(cinematic wallpaper),使用設備上的機器學習網絡將你最喜歡的照片轉換爲 3D 圖像,當你解鎖或傾斜設備時,這些圖像會呈現立體效果,給人栩栩如生的感覺。

除了軟件方面的升級之外,本次I/O大會上,谷歌還發布了售價1799美元的首款折疊屏手機Pixel Fold、直板手機Pixel 7a以及平板產品Pixel Tablet,而這些谷歌“親兒子”產品將和該系列其他產品一樣,率先獲得最新版的安卓大版本的升級,以及Pixel的獨享功能。

回顧谷歌 I/O 2023大會,可以說是一場擁抱AI、擁抱的大模型的大會。面對席卷全球的熱潮,谷歌作爲全球的互聯網科技巨頭,也難以逆勢而行。尤其是在OpenAI、微軟、百度、商湯、科大訊飛等企業紛紛推出大模型以強化自身業務能力,實現效能提升,谷歌也必然有所行動,用AI賦能現有的產品,供自己的江湖地位。

在I/O大會上谷歌推出的新功能上,速途網能夠看出谷歌已經想着大模型領域邁出了更加堅實的一步,而爲谷歌形成真正的優勢,不僅要看谷歌在這場大模型的角力中能否脫穎而出,還要看能否與產品與服務更加深度的整合,以合力打造一把“後中爭先”的利刃。

追加內容

本文作者可以追加內容哦 !

0/100