ChatGPT革命,掀起了全球科技競賽的巨浪。
據報道,因為ChatGPT大熱,三星、SK 海力士高帶寬內存接單量也大增,最新的 HBM3 解決方案價格已經翻了 5 倍。
國外的ChatGPT還沒弄明白,國內的“文心一言”已經開始行動了。
最近澎湃新聞、大眾日報、上游新聞、封面新聞、大象新聞、每日經濟新聞等新聞平臺,
鈦媒體、新浪財經、證券之星、電腦報、Tech星球、36氪等財經媒體都輪番宣布接入百度“文心一言”。
除了媒體外,攜程、愛奇藝、集度、金蝶、智聯等企業也加入文心一言生態圈。
甚至連少林寺都宣布介入了“文心一言”。
不僅是百度,阿里、京東、網易、小米等一線大廠也緊隨其后,紛紛承諾了對ChatGPT的投入和開發。
說到底,ChatGPT的火爆還是引發了許多人的思考,其中就包括習慣“觀望”的互聯網大廠。
但對于市場的普遍觀點來說,算法訓練是一件沒有辦法彎道超車的事情。
同時也可以具體到國內的技術發展上,第一時間便尋求變現或是以能夠看得見的變現為投入基礎,一直是國內普遍存在的缺點。
這種想法從某種程度上堆高了大廠的投資收入,但也壓垮了國內眾多行業深度發展起來的低線。
也可以說,國內創業公司對風險超強的把控,以及經久不息賺快錢的心態,讓越來越多的新興行業都有了一個“能看到頭”的未來。
不過,對于國內廠商來說當下最關鍵的是,如何確定一個具體的應用場景。
一、搜索引擎是中國AI的新起點?
搜索引擎的ChatGPT之爭將難以避免。
谷歌2022年Q3財報顯示,搜索引擎的廣告收入占其廣告收入的72.57%、總收入的57.23%。
搜索引擎在廣告層面的收入,顯而易見。
緊接著,微軟(MSFT.US)于北京時間2月8日宣布推出由OpenAI提供技術支持的最新版Bing(中文名“必應”)搜索引擎和Edge瀏覽器。
一夜之間,Bing和Edge瀏覽器在AppStore下載量猛增,Bing的下載量已經上升到AppStore免費應用榜中的前十名。
此時,根據Statcounter GlobalStats數據顯示,2022年全球搜索引擎市場份額中,谷歌為92.42%,必應市場份額為3.45%。
在微軟企圖通過OpenAI重新對抗昔日的老對手谷歌,而引發的ChatGPT爭奪戰之時,國內互聯網巨頭對于ChatGPT已經從關注轉向發展。
截至目前,從相關技術到項目名稱再到開放日期,百度是公布信息最明確的國內科技公司。
作為在人工智能和自然語義處理領域積累最多的中國互聯網公司,百度早就布局了深度學習大模型“飛槳”,甚至用通用AI芯片“昆侖芯”進行訓練。
這些是百度訓練“ChatGPT”的基本環境和前提。
不僅如此,據悉,百度CEO李彥宏2023年一季度OKR關鍵任務為“引領搜索體驗的代際變革”,這意味著百度搜索或將全線接入文心一言,搜索產品將迎來顛覆性變化。
此外,近期有媒體報道稱,字節正悄悄準備重啟已經關停了兩年的悟空搜索,如果對ChatGPT產品與搜索工具的關系進行想象,不難看出字節同樣對ChatGPT的“興趣”。
很顯然,當一大堆AI公司都在夢想著造出自己的ChatGPT之時,搜索引擎巨頭們則希望用其徹底改造搜索引擎行業。
結合來看,在廣泛的應用場景之下,即時的搜索工具似乎是彌補ChatGPT“離線模式”的不足,亦或者將ChatGPT賦能搜索工具提高搜索引擎的營收,而這些都成為了當下互聯網大廠角力的根本原因。
在眾多搜索引擎玩家紛紛宣布踏入“搜索引擎+ChatGPT”的當下,微軟已經發起了攻勢。
北京時間2月8日一早,“新必應”上線,簡介是:“提出實際問題。獲取完整的答案。”
與互聯網初代所不同,進入移動互聯網時代后,每一個移動端的App幾乎都是一座信息“孤島”。
也是在眾多內容社交平臺間斷性爆火的背景下,國內搜索引擎使用率開始下滑。
根據CNNIC發布的《第50次中國互聯網絡發展狀況統計報告》顯示,截至2022年6月,我國搜索引擎用戶規模達7.88億,較2021年12月減少737萬,占網民整體的78.2%,2020年6月,我國搜索引擎用戶的使用率為81.5%。
兩年時間,搜索引擎網民使用率同比下降3.3%。
如果說內容方在過去需要依賴搜索引擎,那么如今就是搜索引擎需要依靠眾多APP來實現自身以外的內容擴充。
可以說,為了完善自身的內容池,搜索引擎還需要進一步解決自身與APP之間的“壁”。
經過各大行業對ChatGPT長達三個多月的關注,C端更是對“AIGC”充滿了想象,那么在如此內卷的賽道中,互聯網大廠除了對“文本生成”類應用場景具有“幻想”以外,是否存在著更“高階”的應用場景呢?
誰能成為中國版的ChatGPT?
人工智能的技術棧可以分為四層:芯片層、框架層、模型層和應用層。
只有千億參數規模以上的大模型,才可能出現“突現能力”,而具備“突現能力”的大模型是ChatGPT得以誕生的必要條件。
訓練一個千億的大模型是對算力、算法、算據的全流程考驗。
公開資料顯示,ChatGPT的前身GPT-3參數量達到了驚人的1750億,訓練一次所要消耗的成本就高達近8400萬元人民幣。
2022年谷歌研究院聯合DeepMind和斯坦福大學發表論文,研究了谷歌、DeepMind和OpenAI的5個語言模型系列的8個“突現能力”,得出結論:
只有模型達到GPT3的規模, 即參數大于1000億, 模型才有可能形成“突現能力”。
國內大廠能不能做出ChatGPT?先發條件就是是否擁有千億參數規模的大模型。
先看呼聲最高的百度。
“文心一言”被很多人認為是“最可能的ChatGPT國產替代”。
百度文心是“純粹”的自然語言模型,有2600億參數規模的ERNIE 3.0 Titan的訓練框架, 訓練輸入都是結構化的文本內容。
根據官方2022年的公開資料,ERNIE 3.0 Titan模型和GPT3.0模型在知識問答數據集上的對比效果,準確率比GPT3.0高8%。
此外,百度還有上文提到的全棧打通的Paddle訓練框架生態,對標的是PyTorch和TenserFlow。
但百度的問題是,在算法、算力、數據、場景上都非常理想,但在“產品”上還有差距。核心搜索業務過于強勢,以及技術思維影響過大,導致了其他產品能力有點變形。
再看阿里。
近日,阿里也公布了申請的“人機對話及預訓練語言模型訓練方法、系統及電子設備”專利。
另據天眼查顯示,阿里巴巴達摩院(杭州)科技有限公司發生工商變更,注冊資本由1000萬人民幣增至3億人民幣,增幅高達2900%,持續投入人工智能(AI)等底層技術。
2022年9月,阿里發布最新大模型“全家桶”——通義M6。
公開資料里能看到,M6的訓練數據包括300GB文本和2TB圖像, 作為對比,GPT3.0用了45TB文本訓練,華為的盤古號稱用了40TB, 而阿里的M6訓練數據少的可憐。
而且M6的帶頭人楊紅霞已經在2022年9月離職,未來 M6走向何方,也要打個問號。
科技公司華為也一直被關注。
華為2020年開始在大模型布局,2021年發布了鵬城盤古大模型。
盤古NLP大模型和百度文心一樣,都是“純粹”的自然語言大模型,宣稱有2000億參數。
最后看騰訊。
BATH四巨頭中,騰訊的千億級別大模型最晚發布。去年4月,騰訊才對外公布了“混元”AI大模型的研發進展。
混元大模型的能力,被強調的是跨模態的“文本-視頻”的理解和檢索,也就是主要是視頻相關。
另外京東云旗下言犀人工智能應用平臺宣布推出了產業版ChatGPT:ChatJD,并公布了ChatJD的落地應用路線圖“125”計劃。
三、國產AIGC還不夠“萬能”
事實上,僅僅是從本土發展來看,AIGC產業鏈的發展算不上緩慢。
據量子位AIGC圖譜顯示,從上游的數據供給、開源算法,中游的行業玩家以及下游的包括文字、圖像、視頻、音頻、游戲等應用場景,關于AIGC的一條初步產業鏈已經悄然形成,產業生態的完善也為后期的發展奠定了基礎,而在不同的應用場景下,已出現了一批代表性的玩家。
需要注意的是,在國內,大多數AIGC的應用場景幾乎都聚焦在內容側。
首先,這是一個短期利潤和長期價值的博弈過程。
AIGC燒錢的程度,并不亞于互聯網發展的初期。
小冰CEO李笛舉過一個例子:若用ChatGPT的方法,以小冰框架當前支撐的對話交互量計算,每天成本將高達3億元,一年成本超過1000億元。
AIGC需要一定的工程技術,除了具備固定流動資金的大廠,創業公司即便對應用場景具有清晰的發展路徑,也幾乎很難按照OpenAI的路徑發展。
其次,國內AIGC的生態環境相對來說更獨立。
在長期投入的產品上,無論是創業公司亦或是大多數的大廠,幾乎都是專注垂直賽道的場景應用。
于是對于國內而言,渴望以最快的速度趕超海外的同時,大多數的AIGC業務其實還處于發展的邊緣地帶。
此外,據了解,GPT-3的模型參數不開源,僅以付費API(應用程序編程接口)的形式提供給海外用戶。
基于此,我們需要清醒認知到的是,現在國內僅僅是處于正在開啟智能時代大門的初期,距離生產力的革命還有很遠的路要走。
最后,在相關法規尚未形成之時,即便再心急,也可能會功虧一簣。
根據第一財經報道,中國初創公司元語智能在2月3日上線了中國首個“ChatGPT”,名叫ChatYuan,但上線后不久,ChatYuan界面就顯示“涉嫌違反相關法律法規和政策,已暫停服務”。
這顯示了ChatGPT在中國應用的風險,審查機制及與之相關的合規問題。
ChatGPT在提供回答時不會避開在中國較為敏感的問題。
參考資料:
郭靜的互聯網圈:ChatGPT爆紅,百度、搜狗、360等搜索引擎尷尬嗎?
華進知識產權:ChatGPT“中國化”,正在進行中......
剁椒TMT:“按ChatGPT模式做AI,我們一天成本要3億”
新京報:“中國版ChatGPT”將花落誰家?
中國科學報:ChatGPT火了!國內AI風往哪兒吹