國外瘋卷AIGC之時,一家中國上市遊戲公司悄悄做到了全球第一梯隊?

2022-12-20 05:01:09

一盤超脫於遊戲行業的大棋。


文/以撒

2022年,可以說是當之無愧的AIGC元年——AI繪圖和ChatGPT的發展,讓大量圈外人用上了以前想都不敢想的技術。這些技術在國內甚至已經有了相當“親民”的應用,比如有短視頻、美圖軟件就將AI繪畫作爲濾鏡、特效功能推向用戶,吸引了不少流量。

這些應用層的創新當然不是什么壞事,但葡萄君總覺得有點遺憾。因爲在國外公司瘋卷AIGC、三天兩頭就蹦出一個新突破的同時,國內好像缺少一個能在底層研究上扛起大旗,和它們掰掰手腕的公司站出來。

不過前幾天我立馬就被打臉了——12月15日,上市遊戲公司昆侖萬維召开了一場AIGC技術發布會,一口氣發布了與圖像、音樂、文本、編程有關的一系列AI算法與模型,並宣布模型將會全部开源(开源地址見文末附錄),這在AIGC領域可不算一件小事。


這樣的發布會,很難不讓人好奇——他們的模型到底有沒有真功夫?如果有,憑什么是他們率先有了突破?而且他人求之不得的模型,爲什么他們還要全部开源?最近,葡萄君和昆侖萬維CEO方漢聊了聊,發現他們並非一時興起趕AIGC的熱度,而是自兩年前就开始投入實際研發,並且在某些方面已經悄悄做到了全球頂尖的水平。

01

一口氣發布的四款模型,

到底有多強?

如果只是發布單款AI模型,或許昆侖萬維還不至於讓人這么好奇,畢竟國內研究AI的公司不少,總有人的賽道會與新興技術重合。但這次發布會他們卻是一網打盡,幾乎包攬了AIGC的主流領域,達成了在國內還少有人做到的“全家桶”成就,而且從使用體驗上來看,幾款模型的水平還普遍不低。

首先是AI圖像方面,他們的天工巧繪SkyPaint能支持中英雙語輸入內容,即使我用中英混雜的文本來生成圖像,它也能較好地理解我的意思,並在十幾秒內準確輸出:

另外,我發現這款模型對風格的理解能力也不錯。比如輸入“大象 剪紙疊加風格”,它就能生成好幾種不同樣式的剪紙大象,精細度也不低。雖然目前效果還比不上最頂尖的AI圖像模型,但它的底子很好——用的是Stable Diffusion的底層模型。也就是說只要訓練到位,將來的效果並不會差。而且據說研發團隊還會在此後,逐步加入圖像編輯、圖像修復等更細致的功能。

左劃可查看其他作品

其次在AI音樂方面,他們的天工樂府SkyMusic是國內第一款商用級作曲AI模型,這也讓昆侖萬維成了國內唯一一家,被傳統音樂版權代理機構接收商用AI音樂的公司。結合人類歌手的演唱,他們已經發布了近20首歌曲。說實話,如果不是提前知道,葡萄君根本分辨不出這是不是由AI作曲的音樂。

而在AI文本方面,他們的天工妙筆SkyText的表現也有點超出我預期。大家都知道中文文本的AIGC很難做,但這款模型顯然對中文有一些獨到的理解,甚至在某些特殊場景比ChatGPT還強。比如我選擇“創建採訪問題”類別並隨口胡謅了一個要求,結果它竟然真的懂了,而且問題都挺有意思。

當然,它也能做到許多別的要求,比如聊天、問答、翻譯、續寫內容、創建食譜、寫詩和對聯……而且生成的參數是可調整的,比如你可以爲內容設置敏感詞,也可以限定它寫八百字的小作文。

最後在AI編程方面,他們的天工智碼SkyCode能作爲插件安裝在編輯器中,並又快又好地補全、生成多種主流編程語言的代碼。方漢表示,這款模型目前是开源領域最好的輔助編程工具,能在工作中降低20%-30%的代碼工作量。

估計不少人要納悶:爲什么昆侖萬維之前看起來沒什么聲音,但突然就來了波大的,而且效果看上去都不錯?據葡萄君了解,其實他們入局AIGC始於2020年底。當時AIGC的概念尚不明確,但在看到GPT-3這款語言模型後,技術出身的高管層隨即決定建立團隊研發相關技術。李开復曾經提過一個“五秒钟準則”:未來10年,人類只需思考5秒以內的工作大部分都會被AI取代——方漢表示,GPT-3讓他們覺得,這個時間可能要變成5小時了,因爲大語言模型將會深刻地改變內容生成行業。

這AI不投則已,一投就是大幾千萬的花銷。首先是訓練成本:他們採用了目前市面上算力最高的顯卡集羣A100 80G,對圖像模型訓練時間超過9萬個顯卡時、寫作模型參數達到140億,再加上時不時要租用的雲服務,每年至少就要花一兩千萬;其次是人力成本,他們的AIGC團隊目前有200余人,每月也需要六七百萬維持开支。

而且拋开成本不談,找人在當年也是一件難事。因爲在GPT-3剛出世之時,國內基本還沒有研究大語言模型的團隊,想要組建團隊只能靠從頭培養。2021年他們开始研究AI音樂時也是一樣——方漢提到,全中國畢業的音頻專業碩士,每年可能還找不出200個。他們要走的路就是這么窄。

但恰恰是兩年前的選擇,給他們打下了良好的基礎。因爲語言模型可以說是AIGC最重要的底層積木,比如如今主流的AI圖像模型實際上就由兩部分構成:基於GPT-3的Clip模型以及Diffusion模型。在去年就做出國內領先的語言模型的前提下,今年能趕上新一波技術熱潮、做出“全家桶”也就順理成章了。

除了技術上的前瞻,他們也有一些其他的“拼圖”,比如昆侖萬維旗下擁有一款叫StarMaker的音頻社交產品——這是在海外最火的K歌軟件,它擁有大量正版的優質作品曲庫。這可以說是他們得天獨厚的優勢,因爲這款產品爲他們積累了極強的音頻處理能力和訓練基礎。因此方漢稱,昆侖萬維在AI音樂方面有全球的絕對領先地位。

02

AIGC能爲一家公司帶來

多大的可能性?

擁有這樣一套AI技術,對一家遊戲公司來說意味着什么?最大的影響當然是降本增效。一方面,降的是美術、音樂的外包成本。方漢稱,如今昆侖萬維自研遊戲的所有音樂和部分美術資產都將不再外包。他們的某款遊戲結合AI音樂,用不到一個月時間制作了200首高質量的BGM,幾乎抹消了這一塊的外包成本;

另一方面,增的是產品的研發、溝通效率。此前報道AI繪畫時,我們就試想過AIGC影響研發,甚至成爲遊戲人一項必備技能的可能性。事實證明,有許多遊戲公司已經驗證了這一點,昆侖萬維也不例外。比如如今他們的策劃對接美需時,都會以AI作品打樣來方便溝通。在語言模型成熟後,變化可能還會更大。

另外,AIGC也是元宇宙的一塊重要拼圖。因爲元宇宙作爲大型虛擬世界,其中的內容量實在太大了,人工去堆顯然不現實。但有了AIGC,不說靠它自動生成,即便只是發揮好降本增效,也會對內容量有極大的助力。

但如果你只從遊戲公司的角度來看這件事,那就顯得格局小了,畢竟昆侖萬維本身也不是遊戲行業的常規型選手,這讓他們可以有很刁鑽的打法。因爲不僅遊戲公司在音樂方面有剛需,娛樂、時尚等其他行業也有。昆侖萬維目前就已經與頭部車企達成了战略合作,甚至還與教育機構達成了AI音樂教育輔學合作。想想音樂的應用場景,只能說這項應用的行業跨度會非常恐怖。

不止是跨度,在深度上,AIGC也有極高的上限。方漢舉了一個例子:國外有一家公司叫Grammarly,主打用AI來進行英文語法糾錯,現在他們大概有四千萬用戶、一千萬付費用戶,它的上限可能就是覆蓋所有Office用戶。而這還只是語法糾錯這一條很窄的賽道,如果上升到更大的內容層面,AIGC對於行業的重塑程度會是顛覆性的。

但在音樂之外,AI生成文本和圖像的商業化其實還需要更多探索。方漢提到了他們的認知:現在的所有AIGC作品都只是素材而非內容——比如一張AI畫的畫,用戶最終是沒興趣看的,除非你能把它融入到你的產品、內容中供用戶消費。

而這樣的轉變,還需要整個行業共同的努力來推動。所以他們才選擇了免費开源,並且也會在這個過程中“打輔助”,通過將AIGC轉化爲生產力工具來盈利,比如制作Photoshop等日常工具的AIGC插件。在發布會上,方漢表示他們也會通過如Mango DB 、databricks的方法,在商業支持、雲服務方面形成收入來源,同時大力去做B端和C端的應用。

有一說一,這種想法在國內是比較難得的,畢竟在壁壘被反復強調的今天,誰掌握了領先技術都會想藏着掖着。但昆侖萬維在开源方面的認知確實有多年積累了,比如CEO方漢自己就是國內最早一批接觸互聯網的人,也是中國第一本Linux書的作者。昆侖萬維旗下的昆侖資本曾投資過國內最好的开源數據庫廠商PingCAP,據說當時他們讀了PingCAP的代碼、爬了社區的數據,在見面時給PingCAP團隊提了不少建議,還讓對方有些驚訝——昆侖萬維怎么會對开源社區這么了解?

03

AIGC是一盤超脫於

遊戲行業的大棋

帶着這樣的認知基礎,昆侖萬維才做出了开源的選擇。其實把技術閉源握在手裏,再通過賣API盈利,是大廠非常常見且正確的做法——掙錢嘛,不寒磣。但這樣做難免影響行業生態,因爲無法接觸底層技術,大部分中小廠商就只能購买API、做應用,以通過用戶付費盈利。而开源模型,則給了中小廠商另一種低成本的選擇。

這種選擇最大的意義,就是能快速推動技術全面發展。因爲在大量用戶使用开源模型後,羣衆的智慧會是無限的。此前火熱的Disco Diffusion和Stable Diffusion正是如此,如果Stability.AI沒有开源模型,Midjourney等一系列產品就不會誕生,AI繪畫也必定不會飛速發展、被探索出這么多有趣的玩法。

另外,开源也能讓一些更細分、長尾,但通常情況下難以商業化的領域百花齊放。比如有一款基於Stable Diffusion迭代的模型,專門用於生成美甲圖案。大廠不可能有精力來下場經營這樣的賽道,但开源恰恰就能滿足這種千人千面的需求。

如方漢所說,开源會推動技術民主化、降低行業的入局門檻,催生更多創新型的中小創業公司。這對遊戲行業來說同樣不難想象——如今幾乎所有頭部大廠都有自己的AI研發團隊,這種壁壘沒有多年積累是很難趕上的。但如果有一家公司站出來开源,或是提供全面的定制化服務,其他所有公司可能就都有了站在同一起跑线上的機會。

到了這一步,格局還能再大嗎?可以。方漢提到了一點:如今全球的內容產出比在很多方面都是不均衡的,比如要論小說,全世界的產出量估計都沒有中國的網文量大;但要論漫畫,中國則趕不上日、美、韓。創作者的不均,對一些文化領域是不公平的,比如某種語言如果只有500萬人使用,那可能就會極度缺乏各種內容。但AIGC的發展,很可能爲這種局面帶來變革,因爲它能讓所有文化領域都較爲均衡地獲取內容產品。

由此種種看來,其實AIGC遠不止是遊戲研發的助推器,而是一盤大棋。如今在棋局中有這么一家中國公司站出來,此後的局勢恐怕會更加精彩。畢竟AI不是我們的敵人,而是代表着內容產業變革的前兆,以及無限的可能性。

附錄

昆侖天工开源地址:

https://github.com/SkyWorkAIGC

天工巧繪官網:

https://sky-paint.singularity-ai.com/index.html#/

天工智碼官網:

https://sky-code.singularity-ai.com/index.html#/

遊戲葡萄招聘內容編輯,

點擊「閱讀原文」可了解詳情

推薦閱讀

無期迷途 | 原神抄不得 | 一人之下 漫威卡牌 | MMO不行了?| 暴雪網易 原神音樂 | 仿徨2022 | 專訪沐瞳

點擊下方公衆號名片,獲取遊戲行業更多信息


追加內容

本文作者可以追加內容哦 !

0/100