2023年開年至今,幾乎每一個網友,都逃不掉狂飆和ChatGPT的“洗禮”,一個霸榜熱搜一個多月話題度絲毫不減,一個讓全球科技巨頭連夜秀肌肉馬不停歇,就在ChatGPT全球狂飆之際,傳來若干令人震驚的消息:
據媒體報道,ChatGPT背后竟有一座“血汗工廠”,他們沒日沒夜干著數據標注的工作,卻拿著最低僅9塊錢的時薪,堪稱復古級工業壓榨;
另外,讓全球科技巨頭欲罷不能的ChatGPT的運營成本也首度被曝光,一次運算耗資高達450萬美元,一天的成本高達3億,正如火如荼布局的國內的科技互聯網大廠們,錢能燒多久?ChatGPT會否像元宇宙一樣曇花一現?
ChatGPT全球狂歡:被忽視的“底層血汗”!
近日,美國《時代周報》的一則報道,讓所有關注ChatGPT的網友都感到后背一涼,據其稱“為了訓練ChatGPT,Open AI雇傭了時薪不到2美元的尼日尼亞外包員工,讓他們不分晝夜干著對龐大的數據庫進行手動數據標注的工作”
圖:時代周刊
先簡單科普一下,何為數據標注,一般來說,只有經過標注處理后的結構化數據才能被AI算法模型所訓練使用,所以,ChatGPT的每一次運行,都離不開億萬字節的被標注的大數據庫,對數據進行初級標注的稱之為標注工。
數據標注工通過簡單的專業培訓后即可上手,主要工作內容是對圖像、語音、3D點云或文本等內容載體進行標注,拿比較好理解的文本標注舉例,一段話,數據標注工需要對其打上語義、構成、語境、目的、情感等數據標簽,從而使AI機器人能更好地理解這些語言。
值得一提的是,數據標注本質是勞動密集型行業,它的一個顯性特質是工資低微,按行業慣例,多數數據標注公司都會選擇開在偏遠的鄉鎮以節省房租和運營成本,哪怕獲微軟重磅注資、如日中天的OpenAI同樣不例外:
《時代周刊》報道,Sama公司雇傭了肯尼亞、烏干達和印度的外包員工,來為OpenAI提供數據標注服務,OpenAI給Sama的項目報酬是每小時12.5美元,但Sama最后結算給數據標注工的時薪僅有1.32美元~2美元,相當于直接縮水了60%~90%。
也許有人說,為何不繞過中間商直接與OpenAI簽合同?我只能說有這種想法的太Na?ve了,是不可能直接給你簽的,外包是他們降低綜合風險的最佳方式,而且Sama等外包商就是專門吃這碗飯的,除了OpenAI還有別的大客戶,這是行業慣例!
分析到這里,想必你們也就明白為何數據標注工干著最苦最累的活,為何卻只能拿著極其低微的報酬了,一小時9塊錢,一天連續干10小時也才90,還不包吃不包住的,可能最多也就能填飽個肚子,但為了生存,他們只能選擇接受。
當然,最慘的是,除了拿錢少,還要承受巨大的心理煎熬,據《時代周刊》采訪到的四名員工表示,這份工作(數據標注工)給他們留下了持久的心理創傷(比如9小時完成至多20萬個單詞的標注工)并且他們要求與心理咨詢師的會面也被Sama管理層多次拒絕。
ChatGPT的無限風光背后,是全球千萬普通數據標注工的無聲泣淚,毫不夸張地講,這是一場建立在底層血汗基礎之上的高端游戲,如今在眾巨頭與各路資本的助力下,ChatGPT已在全球開枝散葉,國內的一眾巨頭們也都摩拳擦掌,生怕錯過這難得一見的風口。
它們是為了講新的商業故事、還是真正為了人工智能的進化?
ChatGPT為何讓巨頭著迷?
除了讓蘋果、微軟和谷歌等一眾巨頭興奮難掩,國產科技互聯網巨頭也是當仁不讓,百度前腳官宣“文心一言”,阿里達摩院緊接著官宣內測ChatGPT,科大訊飛亦表示將在AI學習機上率先落地ChatGPT……就連國內的數據標注公司海天瑞聲,進入兔年以來,股價都暴漲逾200%,瘋狂之象,前所未見!
來看一組ChatGPT迄今為止的卓越表現:
谷歌面試官稱ChatGPT能通過年薪18萬美元工程師的招聘考試;
《福布斯》報道稱全美已有89%的學生用ChatGPT寫作業;
北密歇根大學稱全校最出色的論文,出自ChatGPT之手;
《大西洋月刊》報道稱ChatGPT的出現,直接宣告了大學論文的死亡;
有人用它寫《植物大戰僵尸》的游戲代碼,被發現直接可用,有人告它,零基礎開發出了游戲;
人有用它生成了《老友記》20年后重聚劇本,情節無比自然流暢;
上面的例子可能還離普通白領比較遠,感知不強烈,那好,再來一個爆炸級應用實例:
用集成了ChatGPT的微軟Edge(任何一臺安裝了WIN10、WIN11的電腦都標配的瀏覽器)打開GAP的財報,并問邊欄的ChatGPT:“這幾十頁財報說了啥?”
ChatGPT很快給你將要點拎出并總結了一番;
繼續問ChatGPT:“跟Lululemon比呢?”
ChatGPT很快給你列了一個對比表,并且表格里的每一項數據都注明了數字來源;
你甚至可以想象一下這樣的工作場景,打開郵箱,看到一份幾十面的材料,你完全可以讓ChatGPT給你總結要點,并且讓ChatGPT給你列出決策項,并且可以針對每個決策寫郵件發給客戶,客戶收到你的郵件,也可以呼叫ChatGPT來信息處理乃至完成回信的操作
……
能分析會處理還能制表,這已經是質變了,不說完全取代打工人,至少足以完成很多白領的大部分工作了。
據華西證券研報,ChatGPT目前至少能幫人類做寫代碼、繪畫、寫新聞、寫相聲、提供家裝設計和人生規劃建議與信息分類等49件事,涉及到多個行業和學習工作的方方面面。
2月13日,知名互聯網大佬、獵豹移動(原金山網絡)CEO傅盛興奮發帖稱:“被ChatGPT給驚到了,因為它居然猜出了我家狗狗叫3萬的原因,圖靈測試肯定能通過了,關鍵是這才剛開始……”
也就是說,理解常識和理解語義這兩個對于機器語言最難的點,ChatGPT都做到了,人類獨有的常識理解被AI機器人掌握,聽上去確實像科幻電影照進了現實,但這一切,都只是開始;
被ChatGPT震驚的大佬絕不僅傅盛一個,據媒體報道,2020年的一次大會上,百度創始人李彥宏就準確預判了類ChatGPT產品的爆發:
“技術積累到這兒了,數據的積累也到這兒了,計算能力的積累也到這兒了,正好這三者在這個時點具備了爆發的能力,AI技術的進一步成熟,可以運用于很多領域,大幅提升效率,并改變人們的生活方式”。
微軟創始人比爾蓋茨直言“ChatGPT出現的重大歷史意義,不亞于PC和互聯網的誕生”!
于是我們看到微軟火線入局OpenAI,成了當下ChatGPT的最大受利者,讓谷歌和蘋果都開始寢食難安,而在大洋彼岸的東方圣土,一場類ChatGPT的AI技術變革正在盛大拉開帷幕。
目前,百度布局的ChatGPT產品“文心一言”(英文名“ERNIE Bot”)預計3月份推出,阿里達摩院布局的ChatGPT也在緊張內測中,華為計算產品線相關負責人亦表示,公司在2020年就開始在與ChatGPT相關的大模型領域有布局,科大訊飛在去年還曾獲得包括OpenBookQA、常識推理挑戰賽QASC等在內的總共12項認知智能領域的權威評測第一名……
這么多巨頭都有在類ChatGPT領域縱深布局,足以說明,相較之于空泛的元宇宙,更接地氣更顯成果的ChatGPT才是AI賽道最大的風口,沒有之一!
盡管前途一片光明,但也不能忽視過程中所付出的巨大代價,我們的科技互聯網巨頭們要推出一個完成度接近于ChatGPT的產品,首先就要算一筆經濟賬:
據《華為爾見聞》報道,按國盛證券的分析模型推測,類ChatGPT的大模型訓練一次就要燒掉200萬-1200萬美元,僅每日的電費消耗就高達4.7萬美元;
據《36氪財經》報道,ChatGPT一次運算的成本高達450萬美元,《財富》曾報道稱2022年,OpenAI公司凈虧損高達5.45億美元,如若不是背后大股東微軟源源不斷的輸血支撐,OpenAI的ChatGPT早黃了。
據《深網》透路,小冰CEO李笛曾直言“小冰框架當前所支撐的對話交互量,一天就達到14個人類一輩子的對話交互量,若使用ChatGPT的方法,每天成本將高達3億元,一年成本超過1000億”
……
暫且不說“血汗工廠”廉價雇傭數據標注工的問題,先回歸商業本質,持續的巨額資金投入亦難平ChatGPT的無底洞,回報遙遙無期、沉沒成本甚至遠高于雇傭人類,這真的值嗎?
參考資料:
信源綜合每日經濟新聞、快科技、鞭牛士、鳳凰網財經、36氪財經、景聯文數據標注等,部分圖源網