聲明:本文來自微信公眾號“新智元”,作者:新智元,編輯:KingHZ 喬楊,授權站長之家轉(zhuǎn)載發(fā)布。
清華校友團隊最新成果發(fā)現(xiàn):寫作、咨詢、編程等相關自由職業(yè)最終可能被AI取代,而且更關鍵的是,AI能力一旦超過某個「拐點」,對就業(yè)市場的沖擊將一發(fā)不可收拾。
自2022年11月30日發(fā)布以來,ChatGPT的月活躍用戶數(shù)量已經(jīng)達到大約1億人,創(chuàng)造了最快增長的消費類應用紀錄。
雖然AI極大地提高了人們的工作效率。但隨著對不同領域的滲透,促使人們重新審視「技術取代」的問題。
最新研究則揭示了「拐點」的存在:一旦AI取代效應占主導地位,它將無法逆轉(zhuǎn)。
具體而言,作者在理論上,提出了AI進步對自由職業(yè)者影響的「拐點」:在AI能力超越拐點之前,自由職業(yè)者始終從AI的進步中受益;但在AI能力跨越拐點之后,隨著AI的進步,自由職業(yè)者都會變得更加不利。
文章引起了網(wǎng)友對就業(yè)市場的擔心:
以往的企業(yè)高管或AI專家,更多在理論上,預測AI的智能水平可以取代人類從事哪些工作。
這次研究不僅提出了一般就業(yè)市場的「拐點猜想」,而且還用數(shù)據(jù)證明了:在不同的在線勞動力市場(online labor markets,OLMs)中,寫作、咨詢、編程相關崗位更多體現(xiàn)的是取代效應,運營、創(chuàng)意更多體現(xiàn)的生產(chǎn)力效應。前者表現(xiàn)為工作機會和收入將逐漸減少,而后者卻完全相反。
研究的主要亮點如下:
對在線勞動平臺,翻譯和網(wǎng)頁開發(fā)的實證研究,證實了AI的取代效應和生產(chǎn)力效應。
利用Cournot競爭模型,在適當假設下得到了「拐點猜想」:隨著AI能力的不斷提升,崗位數(shù)量和報酬水平會先升高(也就是生產(chǎn)力效應);但一旦超過某個閾值后,崗位數(shù)量和報酬水平會不可逆轉(zhuǎn)的下滑(也就是替代效應)。
根據(jù)「拐點猜想」,分析了在線勞動平臺上其他崗位,再次證明了AI的能力一旦超過拐點,則會出現(xiàn)不可逆轉(zhuǎn)的替代效應。
結果表明在寫作、咨詢、編程、運營和創(chuàng)意等相關崗位,AI的取代效應依次減弱。
該研究發(fā)表在2025年第58屆夏威夷系統(tǒng)科學年會上,作者來自新加坡國立大學、羅切斯特大學和清華大學。值得一提的是,他們?nèi)际乔迦A校友。
論文地址:https://scholarspace.manoa.hawaii.edu/server/api/core/bitstreams/4f39375d-59c2-4c4a-b394-f3eed7858c80/content
爭議焦點
這一爭議的核心在于:信息技術(IT)能夠?qū)⒃S多任務自動化,從而提升人類勞動的生產(chǎn)力,但也可能導致勞動力被技術所取代。
這兩種對立的效應稱為取代效應和生產(chǎn)力效應。
這兩股相反的力量相互競爭,共同決定技術如何最終影響勞動力市場。
在以往的相關文獻中,技術本身通常被當作黑箱處理,作為生產(chǎn)函數(shù)中的一個因素與人類勞動一起作用于經(jīng)濟。然而,這種宏觀視角的做法忽視了具體技術的影響,側重于任意自動化技術的長期效果。
然而,考慮到當前AI技術的飛速發(fā)展,了解AI對勞動市場的影響顯得尤為重要,尤其是對在線勞動市場(OLM)的影響。
與較為穩(wěn)定的全職工作不同,自由職業(yè)工作更加容易受到市場變化的影響。作者預計,AI創(chuàng)新對工作市場的影響將首先在自由職業(yè)市場上顯現(xiàn)。
主要內(nèi)容
文章直接回答了一個問題:為什么相同的AI創(chuàng)新,在不同類型的工作中會產(chǎn)生完全相反的效果?
為了解決這一問題,作者收集了跨多個職業(yè)的個人級數(shù)據(jù),并提出了「拐點假設」來解釋實證發(fā)現(xiàn),從而為未來的實證研究和理論分析提供了新的視角。
具體而言,作者從頗受歡迎的在線勞動平臺收集了數(shù)據(jù)。通過采用雙重差分(Difference-in-Difference, DiD)設計,發(fā)現(xiàn)在線勞動力市場中自由職業(yè)者受ChatGPT的影響,呈現(xiàn)兩種不同情況:
1)翻譯與本地化OLM的取代效應,表現(xiàn)為工作機會和收入的減少;
2)網(wǎng)頁開發(fā)OLM的生產(chǎn)力效應,表現(xiàn)為工作機會和收入的增加。
為了理解AI對自由職業(yè)者產(chǎn)生不同影響的原因,作者建立了Cournot競爭模型。
在競爭模型中,AI因為取代效應降低了市場潛力,但生產(chǎn)力效應降低了邊際成本。
盡管是個簡化模型,但它暗示每個職業(yè)都有一個拐點。
在AI達到某一職業(yè)的拐點之前,人類勞動能夠從AI性能的進步中獲益,體驗到的是生產(chǎn)力效應。然而,一旦AI超越拐點,進一步提升AI性能,將對人類勞動產(chǎn)生負面影響,展現(xiàn)出取代效應。
為了更全面地描繪AI的影響,還進行了額外的實證分析,展示AI如何影響不同類別的市場。這些估算結果進一步揭示了AI對自由職業(yè)者可能帶來的兩種不同情境。
此外,作者還考慮了ChatGPT4.0的發(fā)布帶來新的影響,并評估比較了ChatGPT3.5和4.0的區(qū)別。實證結果揭示了這兩次AI升級的三種模式:1)兩種取代效應;2)從生產(chǎn)力效應過渡到取代效應;3)兩種生產(chǎn)力效應。
值得注意的是,我們還沒有從取代效應主導的模式過渡到生產(chǎn)力效應主導的模式,這與拐點假設相一致,表明一旦取代效應占主導地位,它將無法逆轉(zhuǎn)。
實證背景
職業(yè)選擇
作者將ChatGPT的發(fā)布視作一個外部沖擊。ChatGPT于2022年11月30日發(fā)布,并對多種任務產(chǎn)生了顯著影響。它是第一個獲得主流認可的GenAI工具,因此成為研究AI沖擊的理想對象。
在自由職業(yè)平臺中,作者重點關注了兩個受AI影響較大的工作市場,即翻譯與本地化和網(wǎng)頁開發(fā),這兩個領域的LLM在執(zhí)行相關任務時表現(xiàn)出了出色的能力。
首先,LLM在實際環(huán)境中完成各種翻譯任務的能力已經(jīng)得到驗證。
研究人員和從業(yè)者已表明,ChatGPT與流行的翻譯工具(如Google Translate和DeepL)不相上下,并且能生成上下文相關的內(nèi)容。ChatGPT在某些語言考試中的表現(xiàn)甚至優(yōu)于人類。
因此,作者選擇了翻譯與本地化OLM作為研究AI影響的一個重點。
其次,近期研究發(fā)現(xiàn),使用GitHub C o pilot時,網(wǎng)頁開發(fā)人員實現(xiàn)HTTP網(wǎng)頁的速度可以提升55.8%。
網(wǎng)頁開發(fā)工作涉及多種任務,要求具備全面的技能,如編程能力、系統(tǒng)規(guī)劃和設計專長。
雖然ChatGPT不能完全獨立完成所有任務,但在調(diào)試代碼和識別功能等方面,它已能夠為人類程序員提供支持。因此,作者選擇了網(wǎng)頁開發(fā)OLM作為分析的另一個重點。
最后,作者選擇了建筑設計OLM作為對照組,因為已有研究表明這是ChatGPT影響最小的行業(yè)之一。
將ChatGPT集成到像3D Max等建筑設計軟件,仍處于概念階段,AI還不能獨立實施實際項目。因此,建筑設計OLM中的自由職業(yè)者可以作為一個良好的對照組。
此外,作者通過利用Felten等提出的AI職業(yè)暴露指數(shù)(AIOE)和谷歌搜索量指數(shù)(SVI),評估了ChatGPT對這三個市場的影響程度。
首先,作者將三個市場與AIOE指數(shù)進行映射,將每個市場與AIOE數(shù)據(jù)庫中最相關的職業(yè)關聯(lián)起來,并計算出平均AIOE指數(shù),如圖1所示。
其次,作者通過共同搜索ChatGPT和特定市場名稱,獲得了Google的搜索量指數(shù)(search volume index,SVI),并繪制了圖2中的每周時間趨勢。
結果表明,建筑設計OLM受到ChatGPT影響較小,而網(wǎng)頁開發(fā)OLM和翻譯與本地化OLM受到了更顯著的影響,這支持了作者選擇受影響市場和對照市場進行進一步分析。
數(shù)據(jù)與變量
作者通過定位平臺提供的相關「專業(yè)」分類,識別了上述三種在線勞動力市場中的工人。
由于平臺的數(shù)據(jù)檢索限制,作者獲得了來自建筑設計OLM的6743名工作者、翻譯與本地化OLM的7582名工作者和網(wǎng)頁開發(fā)OLM的1.5萬名工作者的個人資料和工作歷史。
隨后,剔除了在2022年11月1日之前未接受任何工作的非活躍工作者,并按月將數(shù)據(jù)聚合到個人層面。
在文中,作者將與主要勞動市場相關的工作定義為「核心工作」,而將其他工作定義為「非核心工作」。通過關鍵詞搜索,作者確定了自由職業(yè)者的核心工作。隨后,基于工作者在給定月份接受的核心工作來構建度量,而非基于已完成的工作。
為了考慮ChatGPT發(fā)布前的潛在影響和假期效應,作者排除了2022年11月和12月的數(shù)據(jù)。因此,研究的時間框架涵蓋了沖擊發(fā)生前的六個月和沖擊發(fā)生后的十個月,時間跨度為2022年5月1日至2023年10月31日。
表1提供了主要分析中關鍵變量的定義和描述性統(tǒng)計數(shù)據(jù)。
職場「雙城記」
識別策略
為了考察AI對自由職業(yè)者的影響,作者使用了以下固定效應雙重差分法(DiD)模型進行識別。
為了確保被處理組和控制組的工人可比,作者還使用了傾向得分匹配(PSM)方法,通過考慮工作者的經(jīng)驗、接受的核心工作總數(shù)、工資(即核心工作的平均價格和小時費率)以及工作質(zhì)量(即核心工作的平均評分)來改善樣本平衡。
所有這些變量只考慮了ChatGPT發(fā)布前的工作記錄。
作者采用了1:1最近鄰匹配策略,并排除了落在公共支持公共區(qū)域之外的觀察值。
翻譯與本地化在線市場
第一次分析考察了ChatGPT對翻譯人員的影響,并將建筑設計OLM的工人作為控制組。
總體而言,論文發(fā)現(xiàn),與建筑設計OLM相比,ChatGPT對翻譯與本地化OLM產(chǎn)生了顯著的替代效應。
在ChatGPT發(fā)布后,工作者們接受的核心工作數(shù)量的絕對數(shù)顯著下降了9.0%,在相對意義上接受的核心工作數(shù)量也有所減少;從核心工作中獲得的收入也減少了29.7%。
這些結果表明,ChatGPT具備了足夠的語言理解能力,能夠處理翻譯任務,從而對該領域的從業(yè)者產(chǎn)生了替代效應。
網(wǎng)頁開發(fā)在線市場
作者的第二次分析考察了ChatGPT對網(wǎng)頁開發(fā)人員的影響,同樣將建筑設計OLM的工作者作為控制組。
與建筑設計OLM相比,ChatGPT發(fā)布后,網(wǎng)頁開發(fā)人員的交易量平均顯著增加了6.4%。在相對交易量方面也存在類似情況。
此外,ChatGPT的發(fā)布顯著提高了網(wǎng)頁開發(fā)人員的月收入,增加了66.5%。
這些結果表明,ChatGPT不太可能自動化網(wǎng)頁開發(fā)的過程,而是作為助手來提高了網(wǎng)頁開發(fā)人員的生產(chǎn)力。
可能是因為網(wǎng)頁開發(fā)工作需要多方面的知識和精心的規(guī)劃,而ChatGPT從互聯(lián)網(wǎng)文本中學習,難以成為合格的網(wǎng)頁開發(fā)人員,從而對網(wǎng)頁開發(fā)人員產(chǎn)生了生產(chǎn)力效應。
拐點猜想
AI與職業(yè)的局部轉(zhuǎn)折點
為了探討為什么AI的進步對不同職業(yè)市場中的工人產(chǎn)生不同的影響,作者構建了一個微觀模型來分析AI在作者實證背景中的作用。
考慮一個Cournot競爭模型,其中有n個工人,每個工人都以相同的邊際成本提供相同的服務。
這個模型包含三個基本概念。
首先,職業(yè)代表市場中的一種工作類別,在本研究的背景下通常被稱為OLM(職業(yè)勞動市場)。其次,工作是發(fā)布在自由職業(yè)平臺上的具體項目或任務。最后,任務是成功完成工作所需的最小認知單元。該模型基于由多個任務組成的工作。
假設邊際成本為(1?a)c,其中c>0,a∈[0,1]。作者將a解釋為在提供服務過程中,AI能夠成功完成任務的百分比。因此,c表示工人在沒有使用任何AI幫助的情況下的邊際成本。
服務的市場需求由以下公式確定:
其中p為價格,qi為工人i提供的服務數(shù)量,S(a)表示市場潛力。S(a)隨著a的增加而遞減。
對于那些AI技術更為熟練的潛在雇主,AI可以更可靠且更能勝任他們發(fā)布的主要工作,這使得他們更傾向于用AI替代人工勞動。
隨著AI的改進,即a的增加,更多潛在的雇主會進入這一類別,從而減少市場潛力。此外,S(a)可能是凹函數(shù)的,因為技術的采用通常隨著技術的成熟而加速。
有幾種可能的機制。
首先,隨著AI表現(xiàn)的提高,更多的雇主將使用它,這會產(chǎn)生更多的口碑推薦,從而促進更多的采用。
其次,由于更多雇主使用AI,會產(chǎn)生積極的外部效應,因為AI的使用傳播了專業(yè)知識和最佳實踐。
第三,創(chuàng)新型企業(yè)將開發(fā)專門的軟件來幫助特定職業(yè)使用AI,因為隨著AI變得越來越強大,它能夠幫助完成這一類工作。作者對技術假設進行了約束:|S′(0)|<c和|S'(1)|>c,以避免出現(xiàn)不相關的情況。
工人的目標是獲取最大利潤:
最后的Nash均衡(Nash equilibrium)狀態(tài)下的價格、利潤和收入為
附加一些對S(a)函數(shù)的技術性假設,最后作者的得到了「拐點猜想」:
簡而言之,在AI的能力比較低時,a小于「拐點」,相關崗位數(shù)量和利潤會隨著AI能力的增加而增加;但當AI的能力足夠大時,a大于「拐點」,AI能力越強,相關崗位的數(shù)量、收益、利潤越少,被AI消滅的崗位數(shù)量越多。而且一旦超越拐點,替代效應將無法逆轉(zhuǎn)。
其他崗位分析
利用其他市場的交易數(shù)據(jù),論文研究了AI在不同職業(yè)勞動市場(OLM)中的異質(zhì)性影響。
在主分析中包含的職位類別之外,作者為每個額外的類別選擇了一個特定的職業(yè)勞動市場,并采用與主分析相同的方法進行研究。
不同模型的結果(見表6)揭示了AI的兩種不同效應,表明不同職業(yè)有不同的拐點。
此外,作者進一步考慮了2023年3月14日發(fā)布的ChatGPT4.0作為AI的第二次升級,并估算了ChatGPT3.5和4.0對上述十一種職業(yè)勞動市場(OLM)的影響。
以下是用于估算的固定效應雙差分(DiD)模型。
根據(jù)「拐點猜想」,只有三種可能的結果:
1)持續(xù)保持生產(chǎn)力效應:AI在兩次升級后仍低于拐點。
2)從生產(chǎn)力效應轉(zhuǎn)變?yōu)槿〈?AI在第一次升級后沒有達到拐點,但在第二次升級后超過了拐點。
3)持續(xù)保持取代效應:AI在第一次升級后超過拐點,并在第二次升級后繼續(xù)超過拐點。
表7中呈現(xiàn)的結果證實了這三種結果同時存在,而且沒有任何市場經(jīng)歷能從取代效應轉(zhuǎn)變?yōu)樯a(chǎn)力效應。
這一發(fā)現(xiàn)表明,一旦AI越過了某項工作的拐點,隨著進一步升級,AI不可能恢復到拐點以下。
具體結論與建議
與寫作相關的OLM(例如,專業(yè)與商業(yè)寫作)特別容易受到取代效應的影響。
與咨詢相關的OLM(例如,國際法與移民法)通常為客戶提供專門的建議以支持其決策,隨著ChatGPT能力和知識庫的擴展,這些領域可能越來越面臨取代效應。
與編程相關的OLM(例如,網(wǎng)頁開發(fā)),在這些領域,ChatGPT表現(xiàn)良好,目前正經(jīng)歷生產(chǎn)力的提升。然而,ChatGPT有可能取代程序員,并最終導致未來的取代效應。
相比之下,與運營相關的OLM(例如,項目管理)和創(chuàng)意相關的OLM(例如,攝影)需要大量的人際互動、專門知識或創(chuàng)造性思維,而ChatGPT在這些方面的能力較弱。因此,這些市場可能會繼續(xù)經(jīng)歷顯著的生產(chǎn)力提升。
與以往在宏觀層面進行AI與勞動關系的研究相比,新模型是在微觀層面上進行的,結合了大語言模型的內(nèi)在特性和工作特征。這些發(fā)現(xiàn)對未來工作具有重要的實踐意義。
從工作者的角度來看,這項研究突出了AI的雙重作用。一方面觀察到某些市場的衰退,促使個人重新考慮職業(yè)道路。與此同時,鼓勵從業(yè)者與AI合作,提升生產(chǎn)力,并在繁榮的市場中抓住機會。
平臺方面,也建議進行戰(zhàn)略性資源重新配置,如創(chuàng)建基于AI的新型工作市場。在快速發(fā)展的數(shù)字經(jīng)濟中,這些調(diào)整將有助于平臺保持競爭優(yōu)勢。
(舉報)