李彥宏想借百度版ChatGPT洗恥莆田系 資本市場不看好

2023-03-12 14:01:19

點擊藍字

關注我們,了解更多

李彥宏想借百度版ChatGPT洗恥莆田系

資本市場不看好


百度版ChatGPT下周就要見面了,此前,百度的宣傳拉滿了弓,顯示出李彥宏對於這次賭博的重視,而回顧百度的創業史和豪賭史,李彥宏除了從infoseek工程師回來做中國搜索是正確的之外,其他很多事情都爲人不恥。

不過,資本市場似乎對百度版ChatGPT並不看好,除了內地A股資本市場的牛鬼蛇神炒作了很多夢想之外,百度正股在美國和中國香港資本市場都在跌,這有點如google當初的樣子。


//

莆田系:百度永遠的恥辱


在百度歷史留下的最大從恥辱就是莆田系醫院事件。當時,在經濟的壓力之下,百度鋌而走險,把莆田系醫院的詐騙垃圾廣告作爲主力收入,在百度的競價排名商業模式中,尤其就排搜索第一,不管你真假,最終一名叫魏則西的學生因爲得滑膜肉瘤,在通過百度搜索和央視得知“武警北京總隊第二醫院”後去醫藥看病,這家醫院其實是莆田系承包的黑醫院,魏則西全家人財兩空,而百度搜索也成爲全民聲討的對象。

當時,有公开媒體報道指出,莆田系在百度上投放了巨額的廣告推廣費用,“佔到百度廣告收入總額的一半。”此前,莆田市委書記梁建勇曾公开表示,“百度2013年的廣告總量是260億元,莆田的民營醫院在百度上就做了120億元的廣告。”


//

資本市場不看好


從百度股票知道走勢看,資本市場對百度能搞出什么並不看好。凌通社覺得是有道理的,因爲作爲最早的搜索引擎,李彥宏當初拷貝infoseek的技術和google的搜索模式,百度填補了中文搜索的空白。後來借助莆田系等金主,百度的收入也增加很快。

但是,後來百度的各種战略似乎沒有任何成功。從各種收購到電動汽車,到All in AI,都沒幹成。而此前百度的AI其實走偏了, 一直到ChatGPT出來,凌通社不知道作爲當初北大信息系的專業工作者,百度竟然沒有監控到全球AI的大趨勢?

百度版ChatGPT不被看好,首先是中文信息處理比英文復雜很多,記得當時凌通社在交大時,中文信息處理的專業很好但大家都知道很難出成果,因爲在中國老婆都有無數個說法,而且各種方言錯別字假消息造謠估計美帝牛逼機構也搞不成,所以你想別說機器訓練了,人都搞不清哪個是真假。當然,在美帝對中國制裁之後,其實百度也沒辦法弄到巨量的GPU還有巨量的電力和錢來訓練。

一篇外媒報道,在最後的時刻,百度开發團隊馬不停蹄地工作,包括在1月底爲期一周的春節假期期間。他們說,該項目目前已經降低目標,從此前希望創建能夠用中文和英文對話的雙語聊天機器人轉變爲以中文爲主的機器人。其實,凌通社覺得,這個目的大致也是無法達到的,最後的結果,百度能夠搞出比現在百家號已經在用的小工具已經不錯了。




//

文心一言夜以繼日趕工


此前,外媒報道,距離3月16日百度計劃推出名爲文心一言的聊天機器人僅剩一周時間,但夜以繼日趕工的員工說這款AI聊天機器人仍在接受訓練。

文心一言,(Ernie Bot),不知道李彥宏自己取的名字還是找取名大師取的, 完全不朗朗上口,不知道是什么。英文更是不能讀下去。這個开端很不好。

媒體報道,據知情人士透露,爲了开發這款名爲文心一言(Ernie Bot)的人工智能(AI)聊天機器人,數百名員工一直在夜以繼日地工作。他們說,其他團隊被要求支援人手和功能強大的計算機芯片。受美國制裁影響,中國公司不能再購买這類芯片。

其中一些知情人士表示,在預定的發布日期之前,這個聊天機器人基於的AI模型仍在接受數據訓練。本次發布在中國科技行業備受期待。一些員工說,他們沒有足夠的時間來打造一款功能完善的產品。

據聽取了該計劃簡報的人士透露,百度計劃分階段推出該產品,首先向部分用戶开放進行公开測試。上個月,百度表示,將首先在其搜索引擎中嵌入文心一言,並將於3月份向公衆开放。

上述趕工情況反映出,爲了搶在最近宣布類似計劃的中國競爭對手之前,百度正在進行一場精心策劃的冒險。該公司稱,已經與400多家中國公司籤署了協議,這些公司將能夠在其產品和服務中使用文心一言。百度表示,通過與生態夥伴合作,該聊天機器人能夠在不同場景下運行積累經驗,以幫助提高其性能。

百度近年來失去了投資者的青睞,如果文心一言成功推出,將有助該公司重新躋身中國最傑出科技公司之列。若失敗,則可能會導致該公司遭遇與谷歌類似的命運。谷歌直到最近還堅持對AI採取相對謹慎的做法,但在其AI聊天機器人搜索在演示中產生事實錯誤後,該公司市值蒸發了1,000億美元。

百度未予置評。



百度一直在依靠強大的英偉達芯片來幫助訓練文心一言。

多年來,百度在开發大語言模型方面投入了大量資金,將谷歌和OpenAI的此類模型的英文版本改編爲適用於中文。大語言模型是ChatGPT的基礎技術。百度在2019年發布了第一個相關模型,將其命名爲文心,英文名爲Ernie。此前谷歌將其模型命名爲Bert。Ernie和Bert都是美國兒童節目《芝麻街》(Sesame Street)中的角色。

去年12月下旬,隨着ChatGPT熱度上升,百度首席執行官李彥宏向員工談到了這項新發展。根據《華爾街日報》(The Wall Street Journal)看到的一份內部文字記錄,李彥宏當時表示,我們有這么酷的技術,那我們能不能把它變成人人都需要的產品?李彥宏說,這一步其實才是最難的,也是最偉大、最能夠產生影響力的。

據熟悉該項目情況的人士稱,1月初,百度的高管讓其自然語言處理團隊开始用文心大模型整合出一款對標ChatGPT的產品。

但上述人士表示,與其他從事類ChatGPT技術的AI开發者所遇到的情況一樣,這一項目面臨一些挑战。其中一個挑战是,需要教該模型對有多種釋義的短語或可指代多人的名字進行辨別,從而能對用戶的要求做出更精確的反應。另一個挑战是使該聊天機器人生成的語言看起來更像人類說的話。

第三個挑战是提高事實準確性,這是大語言模型的一個技術限制;大語言模型會根據不同詞語可能出現在一起的概率將句子串起來,而不是根據信息片段。這種限制也使得這種模型難以控制以避免敏感話題,這是審查方面的一個障礙。

這些人士說,百度已經聘請了合同工來幫助評估和改進聊天機器人的答案。

這些人士稱,每個步驟都需要時間。AI研究人員已表示,即使使用幾千塊芯片來訓練如此大型的模型,要得到相對理想的結果也可能需要數周或數月的時間。

知情人士說,本周,工程師和產品經理正加緊改善文心一言的基本功能,比如對用戶請求的響應速度,以及如何對搜索結果進行總結。



追加內容

本文作者可以追加內容哦 !

0/100