百度Create AI开發者大會:解決中國軟件卡脖子難題

2023-01-11 14:01:11

2022年已經過去,中國科技創新走到什么地步了?

1月10日,走到第五年的百度CreateAI开發者大會如期而至,從技術及產品進展上,帶着外界探詢的眼光一窺百度在科技創新上的思考。

當天,百度創始人、董事長兼首席執行官李彥宏發表了題爲《創新驅動增長,反饋驅動創新》的演講,結合昆侖芯片、AI大模型、智慧交通、自動駕駛出行服務等產品,向來自全球的开發者深度闡釋如何通過實踐反饋驅動有價值的創新。

而在剛剛過去的2022年,全球科技界浪潮迭起,從AI作畫走紅到ChatGPT風靡全球,從Figma關停中國用戶账號到EDA軟件被掐,國內科技企業既面臨危機,也能看到在人工智能等領域的新機會。

在這樣的背景下,百度展現出的衆多人工智能新技術落地成果,讓衆多參會的开發者們感到振奮,在當下全社會奮力拼經濟的背景下,爲科技產業發展注入更多信心。正如李彥宏在現場所說,“隨着技術應用門檻不斷降低,創造者們將迎來屬於人工智能的黃金10年。”

2022年,IT業內兩大熱點事件席卷了全球:一是AI作畫的浪潮猛然興起,全球範圍內的科技企業對AI作畫給予了前所未有的關注;二是年末ChatGPT的爆紅,讓人類進一步認識到人工智能的進化速度。這一切都展現出一個重要趨勢:人類正在跑步進入人工智能時代。

這樣的技術革命讓人想起過去幾十年中全球IT產業的發展。就好比PC時代的Windows系統、移動互聯網時代的安卓/IOS系統一樣,無數开發者基於這兩個操作系統开發出衆多應用軟件,搭建起繁榮的生態體系。那么,人工智能時代的操作系統將會是什么?

在這次的百度Create大會現場,李彥宏給出自己的答案:深度學習框架。他表示,這將“是第四次科技革命的標志”。

深度學習框架對底層語言和重要算法模型進行了封裝,讓开發者不需要去寫大量的重復代碼,可以將省卻的大量精力投入到應用的研發,這對於人工智能標準化、自動化和模塊化的形成意義重大。借用C++編程語言發明者 Bjarne Stroustrup 的話,在人工智能時代,“人類文明運行在深度學習框架之上”。

實際上,在百度內部也早已對深度學習框架的重要性有了一致認知。百度首席技術官王海峯曾表示:“在智能時代,深度學習框架起到了承上啓下的作用,下接芯片,上承各種業務模型、行業應用。”

然而,在深度學習框架領域,百度也看到了國內在這一方面的孱弱。過去,主流的深度學習框架大多來自海外企業或團隊的研究成果,如Caffe、TensorFlow、PyTorch等,國內也有不少互聯網企業、人工智能創業公司使用的深度學習框架就是這些海外產品。

全球化時代,中國互聯網以及IT產業的高速發展,曾在很大程度上得益於來自全世界的技術紅利,在商業模式、產品形態、开源技術等方面,吸收全球經驗加以本土化,推動國內產業發展。一大例證就是,國內手機企業的發展壯大在某種程度上,可以說是建立在高通等企業的芯片、谷歌的安卓操作系統的技術上。

如今,國際科技競爭、產業技術摩擦的日益激烈,讓這種脆弱的合作關系岌岌可危。中國手機等行業在芯片領域被卡脖子的遭遇已經證明,把產業建立在不受控制的外部技術根基上,將讓海外巨頭持續擴大壟斷優勢,壓制國內科技發展“天花板”,導致“無根”之痛。

人工智能時代,深度學習框架作爲底層技術創新,承載着無數开發者的關切。這些技術一旦被套上枷鎖,國內衆多重要行業的智能化轉型都將被制約,甚至影響國內第四次科技革命的進程。

在百度看來,人工智能時代,這樣的場景不應再重演。李彥宏在大會現場呼籲,“芯片卡脖子很要緊,但軟件卡脖子一樣要緊。”

解決人工智能時代無“根”之痛的道路在哪裏?李彥宏說,“必須要把軟件的根扎下去,才能讓創新持續發生,才能讓頂層的商業更加繁榮。”從實踐的層面來說,也就是要掌握深度學習框架的自主研發,才能在人工智能時代扎下根,發出芽,長出參天大樹。

百度從2012年就已埋下這顆種子。這一年,百度在國內最早开始投入研究深度學習平臺,大規模採購和建立GPU運算集羣;2013年成立了深度學習研究院,培養和吸納大批AI頂尖人才;2016年,推出了中國首個自主研發、功能豐富、开源开放的產業級深度學習平臺,百度“飛槳”。

百度飛槳集深度學習訓練和預測框架、模型庫、工具組件和服務平臺爲一體,還包括了飛槳企業版零門檻AI开發平臺EasyDL和全功能AI开發平臺BML,以及飛槳AI Studio學習與實訓社區,擁有兼顧靈活性和高性能的开發機制、工業級應用效果的模型、超大規模並行訓練、高效推理引擎多端部署以及系統化技術服務支持的五大優勢,能夠助力开發者快速實現AI想法,創新AI應用。

李彥宏在現場介紹,“飛槳就是人工智能時代的操作系統,讓开發者能夠像搭積木一樣構建AI應用,大大降低AI的應用門檻。”

飛槳的出現,意味着中國打造了自主可控的人工智能操作系統,填補了我國在深度學習基礎技術底座方面的空白,也打破了歐美國家對深度學習框架的壟斷。

做操作系統的挑战除了技術,更在生態。飛槳源於產業實踐,也始終致力於與產業深入融合,構建开放的生態體系。截至2022年11月底,飛槳平臺上已凝聚535萬开發者、創建67萬個AI模型,服務20萬家企事業單位。

飛槳的企業生態夥伴,一方面是中小型企業,他們基於飛槳开發大量不同種類的技術服務型應用或者模型,再進一步服務更大的企業應用;另一方面是大企業,大企業本身也會建設行業平臺,用到AI中臺和飛槳平臺。

與大公司相比,飛槳對於小型企業的賦能更能體現中國深度學習框架的易用性和先進性。廣州一家信息技術公司曾面臨一個考驗,爲了拿下一個客戶,他們需要做一個智能質檢一體化方案,這個方案需要算法基礎知識的支撐,但團隊成員完全沒有算法基礎。後來,團隊基於飛槳 AI 开發平臺,僅用 3 天就上手,3 個月將方案做成,並得到了客戶的認可。

經過多年發展,如今百度飛槳已是中國市場上唯一可與全球兩大主流深度學習框架美國TensorFlow、PyTorch正面交鋒的深度學習框架。根據 2021 年 6 月的 IDC 報告,百度飛槳位列中國深度學習平臺市場綜合份額第一,成爲中國使用最廣泛的平臺。

劉慈欣曾在《三體》中構建了一幅未來場景,三體人通過智子封鎖了地球文明的基礎科學,將人類科技鎖死在低級階段。而百度飛槳從0开始實現的增長說明,在當前的國際競爭中,科技創新領域的“卡脖子”並非牢不可破,破解之道的核心就在於加快自主創新。

破局的道路就在前面,難的是如何走完這條路。就像李彥宏在現場拋出的問題,“創新本身,它又是從何而來呢?”

“創新不是閉門造車。創新,是你有機會進入市場,不斷獲得用戶和客戶的反饋,摸着‘反饋’過河才能實現的。”在現場演講中,李彥宏將百度的創新心法總結爲“反饋驅動創新”。

他舉了一個盲人轉動魔方的思想實驗來說明反饋的力量:把魔方打亂,交給一個盲人還原,假設盲人每秒轉動一次,他需要多久才能將魔方復原呢?答案是137億年。但如果盲人每轉動一次魔方,就有人向他做一次反饋,告訴他是更接近目標了,還是更遠離目標了,盲人將魔方還原的時間直接被縮短到兩分半钟。

“沒有外部反饋的時候需要137億年,能及時獲得反饋的時候只需要兩分半钟,這就是反饋的神奇力量。”李彥宏強調。

大會現場,李彥宏列舉了多項“反饋驅動創新”的成果。

其中之一是百度昆侖芯片。作爲中國第一款自研雲端全功能 AI 芯片,百度在架構上進行了自研創新,使用了只有英偉達等少數頭部芯片企業使用的GDDR6技術,這是目前最新的第六代技術,相比此前主流的GDDR5,GDDR6更加先進,頻率更高,顯卡性能也有顯著提升。現在,百度昆侖芯性能達到國際領先水平,各項性能指標均超越同類產品。

在工業質檢領域,部署了昆侖芯產品的智能工廠,算法機能同時處理 24 個模型,處理完所有流程僅需 480 毫秒;深度學習算法能準確識別產品的全部 33 類缺陷,漏檢率控制在 0.1% 以內。有一家企業檢測產品,過去使用 PyTorch+GPU的方案,成本高且並非國產化方案,後來切換成飛槳+昆侖芯方案,成本降低65%、性能提升9%,更重要的是擺脫了對國外技術的依賴。

昆侖芯成功背後的祕訣,就是在百度的搜索業務中實現了“反饋驅動創新”。 李彥宏介紹,“百度的搜索服務,每天響應幾十億次真實的用戶使用需求,每天進行1萬億次深度語義推理與匹配,能夠提供最真實、最及時的反饋,從而倒逼大模型、深度學習框架和芯片的優化。”

正是因爲有業務的不斷反饋,才會有昆侖芯片的創新,另一個典型案例蘿卜快跑同樣如此。

蘿卜快跑是百度推出的自動駕駛出行服務平臺,2022年以來加速在深圳、武漢、陽泉、烏鎮等地實現了落地應用。截至 2022年7月,“蘿卜快跑”的訂單量累計超過100萬。其中,2022年Q2,蘿卜快跑提供服務28.7萬次。2022年Q3,蘿卜快跑共提供47.4萬次乘車服務,同比增長 311%,環比增長 65%。

加快落地速度的背後,是百度對於蘿卜快跑訂單量的重視。在百度內部,蘿卜快跑的單量是比創造了多少收入更重要的一個指標。

爲什么單量很重要?單量背後,是市場需求的真實反映,代表着用戶真實的想法。單越多,百度能夠獲得的反饋就越多,就能夠更快地從反饋中尋找到提升自動駕駛技術的關鍵點。“大量訂單量,意味着百度能夠獲得海量的市場和用戶反饋,從而反過來幫助百度不斷校正對蘿卜快跑的認知。”李彥宏在現場表示。

百度從數據中發現,北京有一個小夥一年打了600多次蘿卜快跑,已經超過傳統出行方式,成了他的出行首選。在社交平臺上,也有很多網友希望無人車出行服務能夠开到自己家門口。“這代表着,人們對自動駕駛的接受度很高,自動駕駛的落地速度,可能比預期要快。”李彥宏對蘿卜快跑的前景充滿希望。

在反饋驅動創新的路徑下,百度還以人工智能深入產業,賦能實體經濟發展。

2020 年 9 月,百度打造的全球首個高級別自動駕駛示範區落地亦莊,如今,每天有近 100 臺自動駕駛車輛在亦莊提供出行服務,ACE 的路口覆蓋量在過去一年擴大了近十倍,“聰明的車”和“智慧的路”構建了別具特色的“亦莊樣本”,讓出行更加安全、便捷、高效、綠色、經濟。

2022年8月,交通運輸部批準百度开展交通強國建設試點工作。隨後,百度在“服務無處不在”的高精地圖構建、安全可控的智能汽車技術研發及應用、全息感知的智能道路技術研發及應用、“計算無限可能”的實時雲平臺研發、智能交通產業生態發展等 5 個方面开展試點。在北京、上海、深圳、長沙、成都等城市落地智能交通及自動駕駛業務。

在百度的AI圖譜中,智能交通就像一個“智能調度系統”,可以通過智能紅綠燈控制交通流量,從而提升交通效率。通過對交通網絡的智能化改造,可以把通行效率提升15%至30%。

李彥宏預測,“智能交通方案可以使得,2027年之前,中國一线城市不再需要限購限行,從而激活汽車消費,爲城市疫情之後的經濟注入新活力。2032年之前,靠交通效率的提升,擁堵問題就基本可以解決。”

這無疑是一個很宏偉的愿望,其產生的價值不僅僅在於交通領域,還在於這爲能源、電力、水務等領域創造了一個行業範式,依靠AI創新應用,能夠實現效率的顯著提升。“這正是开發者和創造者們的機會。”

沿着這一路徑,不難預見,創造者們也將真正迎來屬於人工智能的黃金10年。

黃金時代开啓的一個重要標志,就是人工智能在技術和商業層面取得的巨大進展。

2022年8月31日,遊戲設計師Jason Allen憑借一副使用AI作畫軟件AI繪圖軟件MidJourney生成的美術作品《空間歌劇院》,在美國科羅拉多州博覽會中獲得一等獎。

到11月末,另一項AIGC裏程碑級應用ChatGPT面世,ChatGPT的交互界面簡潔,只有一個輸入框,AI將根據輸入內容進行回復,並允許在一個語境下持續聊天。

AIGC在2022年顯示出巨大的發展潛力,這背後,是大模型的產業化應用趨勢。李彥宏總結,“2022年是大模型產業化應用元年,大模型已成爲許多上層應用的技術底座。”

他在現場分享中提到,大模型能夠有效繼承自然語言處理、計算機視覺、智能語音等多模態能力,並結合多種行業和業務場景進行調優,“從而擺脫傳統AI應用碎片化、作坊式开發方式,爲深度學習技術進入新階段帶來了機遇。”

百度文心大模型就在這個AI發展的關鍵節點煥發出新的光彩。

文心大模型是百度自主研發的產業級知識增強大模型體系,全景圖由模型層、工具與平臺層、產品與社區層構成。

在模型層,文心大模型已經包括 36 個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求,構建了業界規模最大的產業大模型體系;在工具與平臺層,通過大模型开發套件、文心 API 和提供全流程开箱即用大模型能力的 EasyDL 和 BML 开發平臺,全方位降低應用門檻;產品與社區層,包括 AI 藝術與輔助創作平臺“文心一格”、產業級搜索系統“文心百中”和暘谷社區,讓更多人零距離感受到最先進的 AI 大模型技術帶來的新體驗。

以文心一格爲例,這是百度依托飛槳、文心大模型的技術創新推出的“AI 作畫”首款產品。作爲業內首個 AI 藝術和創意輔助平臺,文心一格可以實現一語成畫,只需輸入一段自己的創想文字,就可以生成創意精美的畫作。文心一格支持國風、油畫、水彩、水粉、動漫、寫實等十余種不同風格高清畫作的生成,還支持不同畫幅選擇。

目前,文心大模型已大規模應用於搜索、信息流、智能音箱等互聯網產品,並通過飛槳开源开放平臺、百度智能雲賦能工業、能源、金融、通信、媒體、教育等各行各業。

此外,大模型還成爲百度自動駕駛能力提升的核心驅動力。百度是行業首個將大模型技術應用於自動駕駛的企業,依托文心大模型特色優勢,百度幫助消防車、救護車等特殊車輛增強智能識別能力,即便是塑料袋等物體也能“一眼認出”。

如今,以昆侖芯、飛槳深度學習框架、百度文心大模型爲主的核心自研產品構成了百度AI大底座,推動百度AI實力持續攀峯。

發展的背後,是百度一直堅持壓強式、馬拉松式的研發投入。數據顯示,近十年百度累計研發投入超過 1000 億元。2021 年,百度核心研發費用 221 億元,佔核心收入比例 23%。現在,百度在北京、上海、深圳、新加坡、日本、美國設立了六大研發中心,共有 1 萬名研發人員,其中一部分面向前沿研究,也就是百度研究院。

在人才方面,百度已聯合了一批業內頂尖的高端人才,並且還在不斷培養創新人才。此前,百度推出AICA首席AI架構師培養計劃,由深度學習技術及應用國家工程研究中心與百度聯合發起,致力於培養高端復合型AI領軍人才。經過前六期的發展,AICA已累計培養了322名首席AI架構師深入產業界,成爲中國產業智能變革的中堅力量,覆蓋能源、工業制造、金融、交通物流、醫療、零售、文娛、企業服務等重點行業,課題項目更加具體和貼近產業一线難題,課題覆蓋的場景更廣更前沿。

2020年,百度提出未來五年預計培養AI人才500萬,爲中國智能經濟和智能社會的發展提供AI人才保障。據李彥宏現場分享的數據,截至2022年,百度已經培養超過300萬AI人才。

高強度投入下,百度AI 專利申請量及授權量連續四年蟬聯國內首位、深度學習全球專利申請量全球第一。截至 2022 年 12月,百度全球人工智能專利申請超過 2.2 萬件,其中,中國專利申請量超過 1.6 萬件,中國授權專利超過 5700件。百度人工智能專利申請量及授權量已連續 5 年蟬聯國內首位。

在智慧出行領域,百度研發了在世界範圍內、在全行業、第一個能在手機上實現純軟件方案回聲消除的技術,實現自由語音交互;通過車路一體的BEV自動駕駛感知方案,爲智慧出行裝上“千裏眼”;跨模態大模型“知一”與新一代索引“千流”兩大殺手鐗技術,進一步實現用戶需求和內容生態的高效連接……

這些成果,讓百度解決中國軟件“卡脖子”問題的愿景,一步步從設想走進了現實。

李彥宏說:

生機勃勃的新生命已經破冰而出,然而寒冷還沒有完全褪去。所有偉大的企業、偉大的創造者也是一樣,沒有一帆風順,只有不斷地歷經困難再凱旋。困難會刺激創新,而創新是增長的真正動力。”


追加內容

本文作者可以追加內容哦 !

0/100