文心一言發布，復刻ChatGPT的5個條件+信念

2023-03-16 23:00:40

下午看了文心一言的發布會。

李彥宏提前打好預防針，說得很實在：爲什么今天要發布？因爲有市場需求，客戶和合作夥伴都在催。

看來這次發布確實是爲了迎合市場需求，頂着壓力被迫發布。從發布會謙虛低調的態度看，李彥宏和百度工程師們壓力都很大。但畢竟是國內第一個敢於發布的，勇氣值得肯定。

百度希望通過用戶接入使用和大量反饋，來快速迭代模型的能力。

從現場放的demo視頻看，文心一言的總結能力、邏輯推理能力、多模態內容生成以及內容輸出的順滑度都還不錯。

很多人懷疑這是提前精心調試好的案例，實際能力可能比較弱。由於沒有現場即興發揮，所以無法證僞，有點遺憾。

資本市場反應很快：

我本來對它並沒有太高的期望，只是跟大家一樣，希望中國應該在這個AI技術的制高點上有自己的模型，有更好的支持中文的模型。

之前我看過一些關於GPT3相關技術和實現的文章，了解到要復刻一個ChatGPT，絕不是朝夕之間就能趕上的。它有幾個重要條件：

1. 需要算力。模型訓練一次將近1000萬人民幣，OpenAI的背後是股東微軟提供的服務器集羣。國內大廠不差這些錢，但先進的GPU目前還有出口限制。

2. 高質量的語料。我之前看到統計數據，GPT3的語料中中文佔比不到10%。可能因爲文化不同，英文內容更愿意公开分享，高質量內容更多。比如關於計算機科學的高質量論文都在arxiv.org這個平臺上。

3. 有監督學習的標注語料。做過自然語言標注的人都知道，標注的門檻非常高。特別是對語義理解，只有在有同等文化背景和足夠知識儲備的人才能標注正確。這需要一個完整的培訓體系和高昂的成本。大的技術公司都不愿意做這種髒活。

4. 人工反饋。ChatGPT內部也是先做了很多人工反饋強化訓練，打磨差不多才發布。但因爲它有先發優勢，在短時間內就積累了大量的用戶反饋，這是非常寶貴的數據財富。

5. 工程細節打磨。前兩天發布的GPT-4其實在2022年8月就完成了模型訓練，又迭代了半年才發布。它並不是單純的技術突破，還有工程上無數細節的優化。

6. 信念和專注。在前途不明朗、根本沒人知道是否可行情況下，還能堅持那么多年（OpenAI是2015年創立），投入大量資金，最後能成功其實是有偶然性的。

像馬斯克、Sam Altman這類人，總是會習慣性地、主動地解決那些沒人敢碰的復雜問題，很讓人佩服。因爲有了這些先驅者，我們才知道這些技術是可行的。

本來我想着體驗看看文心一言的效果，但還需要邀請碼，體驗不了。

不過我相信國內的企業會一步步趕上來，需要多點耐心和時間。但愿早日能看到國內大模型的突破。

追加內容

本文作者可以追加內容哦 !

0/100

next & prev