京東最新發布

2023-07-14 02:01:07

中國基金報記者 尹振茂                  

“大模型真正實現自己的價值,一定是在產業應用中。”7月13日,京東集團CEO許冉在京東雲峯會稱,大模型的價值=算法×算力×數據×產業厚度的平方,技術在產業場景落地應用,創造實際價值才是關鍵。

當天上午,京東言犀大模型在2023京東全球科技探索者大會暨京東雲峯會上推出。

據介紹,言犀大模型是京東歷時六年、累計投入1000億元研發而成。該大模型將分三步走,在推出言犀之後,2023年下半年將大模型應用於京東內部核心業務並形成最佳實踐,2024年上半年將全面开放大模型能力,從服務京東發展到服務千行百業。

“從產業端切入大模型,如同從北坡攀登技術珠峯,道路雖然更加艱難,卻有更波瀾壯闊的風景。”許冉強調。         

大模型的關鍵:

在產業應用中創造實際價值

“大模型真正實現自己的價值,一定是在產業應用中。”京東集團CEO許冉在此次發布會上強調,大模型的價值=算法×算力×數據×產業厚度的平方。

“前三個指標固然重要,但技術在產業場景落地應用,創造實際價值才是關鍵。當產業效率和產業的邊界拓展得到質的提升以後,大模型才有更重要的實際價值和意義,這將不亞於又一次工業革命。”

在許冉看來,“從產業端切入大模型,如同從北坡攀登技術珠峯,道路雖然更加艱難,卻有更波瀾壯闊的風景。”

而產業場景正是京東擅長的領域。

作爲一家新型實體企業,京東自身發展就來自產業場景歷練,擁有包括零售、物流、科技、健康、工業等產業布局,既深入產業互聯網,又扎根消費互聯網。這爲京東每年積累下數百億條優質交互數據,訓練言犀大模型的數據庫,就由70%通用數據和30%供應鏈原生數據組成。

這些產業數據和行業Know-How,成爲京東布局大模型的核心優勢。

“數智供應鏈訓練了產業大模型,而大模型則依托供應鏈深入產業。”京東雲事業部總裁曹鵬表示,人工智能與產業的結合,一直是京東技術探索的重點。

“在零售場景,京東超過85%的商品採購,由機器自動完成的;在物流場景,亞洲一號裏的揀貨員與‘地狼’機器人配合默契,大幅提升揀貨效率;在服務場景,京東智能客服可以自動化應答90%的服務咨詢。作爲一家新型實體企業,我們思考更多的是大模型如何與實體結合。”

京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬則強調,“大模型的難點,不在技術追趕、而在產業突破。目前處於大模型‘百花爭豔’的狀態,站在這個時間點,我們應該思考的不是技術追趕,而是產業突破。” 

六年磨一劍、累計投入千億

在何曉冬看來,京東擁有零售、金融、物流、健康、工業品等多種業務,服務數十萬商家、近6億消費者,是人工智能發展的前沿陣地,

據其介紹,京東言犀大模型研發並非一蹴而就,靠的是持續投入,公司累計投入1000億元,申請專利超2萬個,2023年5月獲得國內人工智能領域的最高獎項。2017年,京東开始技術布局。2020年,开始對外輸出技術能力;2021年,推出十億規模K-PLUG;2022年,推出了百億級模型Vega;2023年,將推出千億級言犀大模型。

何曉冬指出,京東言犀大模型是扎根產業的原生大模型,擁有深厚的產業基因和供應鏈場景,有三個差異化的特性:產業原生,有更強的產業屬性;價值驅動,有更高的應用價值;开放協同,有更快的迭代效率。

目前來看,技術上各家都是基於transformer做大規模預訓練,並不斷地進行調優,“我相信國內的大模型在中文方向將很快超越國外的對話產品”。

“產業大模型是通用域大模型的進階版,需要通用大模型的常識能力+產業know-how。目前,AI早已告別了唯‘識別率’的時代,在產業界,上下差零點幾個百分點,對最終的效果影響並不大。”

何曉冬稱,新的AI三要素是場景、產品、新型算力,“大模型走向產業的難題在於知識深度、內容準度、模型迭代、安全可控等難題。”

何曉冬強調,大模型走到多模態之後,將從數字世界走向實體世界:一方面,具身智能已在物流領域實際應用,機械臂已經可以輔助人工分擔智能分揀等工作;另一方面,通過大模型驅動機械臂,在物理世界幫助做一些事情,這是京東探索研究院在前沿技術研發上的一個方向。 

三步走战略

“京東大模型將分三步走,即從服務京東到服務千行百業:

2023年7月,基於京東集團優質的場景和數據,推出京東言犀大模型和言犀AI开發計算平臺;2023年下半年,將大模型應用於京東內部核心業務並形成最佳實踐,針對一些重點場景的標杆客戶進行對外服務;2024年上半年,將全面开放大模型能力。”

對於京東大模型的未來推進進程,何曉冬在發布會上如是表示。

京東擁有豐富的供應鏈場景,京東的大模型一直在自有的零售、物流、健康、金融等場景中打磨。

在曹鵬看來,供應鏈產業鏈上的大模型更有價值,因爲供應鏈的鏈條越長,帶來的數據相關性更高,相關性高的訓練數據越多,模型越大,才越有可能產生產業端的智能湧現;同時,這些模型更切實地解決了實際場景中的問題,帶來更好的經濟和社會價值,也有助於模型獲取更多的資源持續發展。

7月13日,京東還把开發大模型的底層能力解耦出來,推出言犀AI开發計算平臺,爲客戶的大模型开發和行業應用提供定制化的解決方案,可以說是大模型的“訓練營”。

該平臺的第一個特點,是具備豐富的行業知識庫,京東在零售、物流、健康、金融等行業多年積累的知識都沉澱在平臺上;

第二個特點是开放,平臺不僅提供京東自研的言犀大模型,也支持行業各類开源通用模型;

第三個特點,是精選了京東技術團隊多年來开發出的100多種訓練和推理優化工具,可提供更加高效的大模型开發環境,讓用戶可以快速把一個通用模型,轉化成適合自身場景的專業模型。

通過言犀平臺,不到一周時間,即可完成從數據準備、模型訓練、到模型部署的全流程;之前需要10余人的科學家團隊工作,現在只需要1-2個算法人員;通過平臺模型加速工具優化,節約90%的推理成本。

追加內容

本文作者可以追加內容哦 !

0/100