你所不知道的AI
歐洲殖民主義遺毒+全球化結構的不平等
【全面剖析:新興產業背後不為人知的勞動真相】
◆
如果人工智慧被理解為一台擷取機器,那麼我們就是原料。
◆內容簡介
對娜歐米・克萊恩(Naomi Klein)和妮可・柏勒斯(Nicole Perlroth)的讀者來說,這本書揭露了人工智慧如何剝削人類勞動力的神話,也為更公平的數位未來提出有力論據。
矽谷給我們灌輸了這樣的錯覺,即人工智慧是一種無摩擦科技,將為人類帶來財富與繁榮。但在這個光鮮亮麗的外表下,隱藏著一個殘酷的現實,全球數百萬勞動人口往往在惡劣條件下辛勤工作,人工智慧才得以實現。這個剝削性系統是由一個錯綜複雜的網絡維繫著,這本書對這個網絡進行了急需且精彩的調查,揭示了人工智慧不為人知的真相。
以十多年來數百次的訪談與數千小時的實地調查為基礎,《血汗AI》描繪了刻意被隱藏的工人生活,以及決定其未來的權力結構。這本書讓人工智慧剝削的對象表達他們的心聲,這些被剝削者包括出色的作家與藝術家,以及許許多多資料標註員、內容審核員與倉庫工人等,書中呈現出他們危險、低薪的勞動,如何與性別、種族與殖民剝削的悠久歷史產生關聯。
人工智慧是一台擷取機器,它倚靠人類的集體努力與智慧,持續不斷地處理著益形龐大的資料集,讓它的演算法得以運轉。這本書是戰鬥的號令,詳細說明我們需要做些什麼,才能爭取一個更公正的數位未來。
◆
{AI生產線上活生生的勞工故事}
每詢問ChatGPT一次,就會耗費大量的資源及難以估算的勞動力。
1. 人工智慧資料標註工作是全球勞動市場的一部分,工作可以隨時轉移到世界上的任何地方。工作者必須跨國組織起來,捍衛自己的利益。
2. 人工智慧驅動的工作管理系統來勢洶洶。
3. 人工智慧將把權力集中到更少數人手中,並改變工人與老闆之間的關係。
4. 人工智慧並不同於核武或未來的滅絕事件——它帶來的風險是真實存在的。
5. 如果人工智慧被理解為一台擷取機器,那麼我們就是原料。
◆名人推薦
伊格言/小說家
何榮幸/《報導者》創辦人兼執行長
李欣穎/財團法人開放文化基金會執行長
林佳和/國立政治大學法學院副教授
阿潑/文字工作者
張烽益/台灣勞動與社會政策研究協會執行長
陳良基/前科技部部長
陳鳳馨/資深媒體人、News98《財經起床號》主持人
程世嘉/iKala共同創辦人暨執行長
黃柏勳/當代藝術家
詹慶齡/資深主播、《名人書房》主持人
劉奕酉/鉑澈行銷顧問策略長
蘇經天/52 Club會長、LinkingPros創辦人
顧玉玲/社運工作者、北藝大文跨所副教授
人性推薦
◆各界佳評
這是一本需要細究的龐大作品,我被作者扎實的田野資料與敘事手法折服,這些勞動流程的細緻記錄、拉高視野的結構分析,值得用力推薦!
──顧玉玲,社運工作者、北藝大文跨所副教授
我們正進入全面歌頌與擁抱AI降臨的新時代,也正進入全面監控來牟利而不自知的商業模式,我們正迎來股市AI概念股超漲、獲利滿滿的時刻,但也同時迎來AI產業末端的數位人工勞動在遙遠不知名角落被剝削的隱藏事實。
──張烽益,台灣勞動與社會政策研究協會執行長
本書從豐富的案例與歷史脈絡出發,在AI年代迎面而來的此刻,創作者應掌握自己的核心理念,讓AI成為延伸創意的翅膀。這場科技洪流將為人類文明帶來新的轉變,讓我們以全新的視角看待未來。
──黃柏勳,當代藝術家
根據這份駭人聽聞的揭露,人工智慧有賴於對藝術家、資料標註員與工程師等的剝削……這些殘酷的現實生活故事,讀起來就像一則一則的反烏托邦寓言。
——《出版者週刊》星級書評
默登、格雷厄姆與坎特……深入探討了一些最受矚目的科技發展,讓公眾意識到人工智慧的重要議題、其殖民根源與剝削傾向,社會應該盡早進行相關討論與辯論……發人深省且及時。
——《科克斯書評》
《血汗AI》可能是目前人工智慧出版熱潮中最重要的一本書。它照亮了這場「革命」最黑暗的角落,揭露了巨型伺服器背後巨大的人力成本,以及剝削和濫用人類精神的勞役農場。我呼籲所有使用、利用人工智慧的人,都要讀這本書。
——史蒂芬・弗萊(Stephen Fry),英國演員、導演、作家
我原本對推動人工智慧發展的人類剝削與企業貪婪所構成的複雜黑暗世界一無所知。……如果你和從前的我一樣,認為網際網路是一種「免費午餐」,那麼你一定要閱讀這本精彩且重要的好書。
——布萊恩・伊諾(Brian Eno),英國前衛音樂工作者、視覺藝術家
這本新書說明了,維持人工智慧運行,不僅讓我們面臨迫在眉睫的能源危機,人工智慧存在的背後,還有一個全球血汗工廠……內容豐富且有趣。
——美國政治網誌Daily Kos
作者簡介:
詹姆斯・默登(James Muldoon)、馬克・葛雷厄姆(Mark Graham)與卡倫・坎特(Callum Cant)為「公平工作」(Fairwork)計畫的同事。這個計畫的宗旨是凸顯新興科技在工作場域最理想與最糟糕的使用狀況。
詹姆斯‧默登(James Muldoon)
艾塞克斯大學商學院管理學系副教授、牛津網際網路研究所研究員、「自治」智庫數位研究主持人。主要研究人工智慧及數位平台等現代科技,如何創造公眾價值與公眾利益。
馬克‧格雷厄姆(Mark Graham)
牛津網際網路研究所網路地理學教授、牛津地理與環境學院研究顧問、南非開普敦大學非洲資訊科技與國家發展中心研究員、柏林社會科學中心訪問學者。亦擔任公平工作計畫的主任。一直以來,研究大眾連結度在過去二十年對全球勞工的意義。
卡倫‧坎特(Callum Cant)
艾塞克斯大學商學院資深講師,主要研究工作、科技、二十一世紀危機。為《新國際主義》(New Internationalist)、Vice新聞撰稿,亦擔任專收勞工相關文章的期刊《底層日誌》(Notes from Below)編輯。
譯者簡介:
林潔盈
臺灣大學動物學學士,英國倫敦大學學院博物館學碩士。現為專職譯者,譯有《直立猿與牠的奇葩家人》、《馴果記》、《日本博物》、《愛為何使生物滅絕》等。
章節試閱
【內文試閱一】
第一章 標註員
當安妮塔開始步行兩小時進城時,外面天色還暗著。她用了簡單的早餐,喝點茶、吃點粥,就在早上五點左右離家。安妮塔和母親、姊姊、三個孩子住在烏干達北部最大城古盧郊區的一個小村莊。她家外面是布滿車轍的泥土路,沒有公車經過,因此不想步行的通勤者會招來摩托計程車。搭一趟車去辦公室要價兩美元,來回車資超出安妮塔所能負擔的範圍,因此她每天為了省一趟車錢,只得步行上班,直到結束一整天的資料標註工作、精疲力竭了,才搭摩托車回家。
她家有兩間傳統小屋(在當地稱為otlum),是多年前建造的圓形單間住宅,由土牆和茅草屋頂構成,不過如今全家人都睡在一間有鐵皮浪板屋頂的現代方形建築裡。這間新屋子是兩年前蓋的,當時安妮塔存夠了錢,能夠分兩期購買磚塊建造。她家院子中央有一株巨大的芒果樹,六月雨季過後便會結出豐碩的果實。芒果樹周圍種植了一排排的蔬菜,棕櫚樹與其他茂盛的植被則生長在距離建築物較遠的地方。她上工時,孩子就在家裡玩耍,有時也幫忙阿姨和家裡雇用的工人做些家事。他們的雞就放養在自家周圍,在肥沃的紅土上活動,時不時溜進鄰居的院子。
今日的古盧誕生於烏干達內戰。一九九六年,一場最終長達二十年的衝突已經爆發十年,烏干達政府以暴力驅逐了阿喬利地區西部(古盧周邊地區)的居民。這座城鎮迅速成為該地區人道工作的中心,收容超過十三萬國內流民。他們會流離失所,都是為了躲避約瑟夫.科尼(Joseph Kony)領導的叛亂分子「聖靈抵抗軍」與烏干達軍隊對人權的侵犯。古盧的人口幾乎在一夜之間增加了四倍。這種急遽增長讓該地區從分散的田園住家和貿易中心,成為人口密集的貧民窟。許多新來的居民失去他們擁有的不動產,無法返回家鄉,便在這裡建造起臨時的傳統土牆茅草屋,尋求謀生之道。
新來的居民大都為貧窮的年輕人,由於沒有自己的土地,不得不完全融入現金經濟。鎮上有職缺的工作是人道組織的警衛、助理、翻譯與清潔工,但移工人數遠超過職缺的數量,導致大規模失業與非正規勞動市場的擴張。找不到正式工作的移工只能勉強維持生計,往往接受低薪且條件惡劣的臨時工作。
那是一段艱難的時期。時至今日,戰爭留下的疤痕仍難以磨滅,許多人仍然因為衝突而蒙受精神創傷。大約三分之一的年輕人沒有接受任何形式的教育,也沒有就業,城內絕大多數的住房都達不到烏干達政府規定的基本住房標準。
安妮塔走過當地的一座市場,婦女們忙著整理她們的蔬菜攤,將茄子、洋蔥、秋葵、木薯等根莖類攤在布上,並鋪開坐墊。幾乎每個街角都有一群摩托計程車司機,年輕男子坐在摩托車上,等待生意上門。她經過古盧大學時,太陽開始在她身後升起。她曾在那所大學攻讀企管學士;目前的雇主剛開設資料標註中心時,她也曾在一個貨櫃為他們工作。當時,也就是五年前,公司規模還很小;之後幾年內,公司規模快速成長,不便再使用大學臨時搭建的辦公地點,於是搬進了城內。
安妮塔目前在一棟暗灰色的混凝土建築裡工作。建築物蓋完了三層樓,第四層尚未完工,只有部分獨立牆面與預留的窗格,因為業主在施工期間耗盡了資金。建築物周圍有一道圍欄,上面安裝了兩種不同的帶刺鐵絲網。一名保全站在門口,用一條繩子做成的臨時吊帶背著一把步槍。入口兩側可以看到斑駁的公司商標。這是一家大型資料標註公司的在地交付中心,該公司的總部位於舊金山,在東非各地擁有多個交付中心。
安妮塔接近建築物時,她的壓力就開始增加。她拿出身分證,隨著從城市各區湧來的工人隊伍穿過入口。她刷卡進入門禁管制區,在食堂裡找到幾個朋友。工作從早上八點開始,步調非常緊湊。工人有兩次正式休息時間,早上二十分鐘、午餐四十分鐘,但休息時間多半花在上廁所和在員工餐廳排隊。工人的時間受到嚴密監控,幾乎沒有機會和同事閒聊敘舊。今天的早茶時間是她唯一的社交機會,而一天當中的其餘時間,就是在生產車間不斷重複點擊、點擊、點擊的動作。
這裡的中庭裝飾仿照矽谷風格。沙發點綴著明亮的原色,螢幕上默默播放著MTV。入口對面懸掛公司創辦人的裱框海報,牆上是公司的使命宣言與價值觀:公司致力於「結合獨創性與人工智慧,以加速人類發展」,並相信「毅力」、「誠信」、「把事情做好」和「人性」。
(未完)
【內文試閱二】
第四章 藝術家
蘿拉永遠不會忘記她第一次意識到這件事的那瞬間。她的音響工程師朋友打電話給她,詢問她向一家人工智慧公司出售個人聲音版權的經歷。起初,她以為朋友弄錯了。蘿拉是專業配音員,但從未與人工智慧公司合作。她完成戲劇學校的課程後便投入配音工作,此後她的作品出現在廣告、卡通、電腦遊戲與有聲書中,同時她也參與劇場與電視的演出與劇本寫作。這些是近二十年辛苦累積的經驗。
她問朋友是在哪個網站上找到她的聲音,是否能將連結傳給她。過沒多久,她打開網站,看到一個名叫克蘿伊的亞洲女性頭像。廣告上說,克蘿伊擁有中性的愛爾蘭口音,非常適合用於有聲書。蘿拉點擊了圖像,聽到自己的聲音:「您好,親愛的,我名叫克蘿伊。我的聲音柔和親切,可以為有聲書與教育影片錄製配音,也適合用於軟性銷售。您需要的任何配音,我都能勝任。」這個聲音比蘿拉的聲音低沉一些,相當像機械人,但絕對是她的聲音。蘿拉感到震驚且難以置信。她不知道這家公司是做什麼的,也不知道它如何複製出她的聲音。無論他們怎麼做到,蘿拉意識到她現在在和一個合成版的自己競爭工作。
蘿拉花了一點時間才理解這一切。這家公司是怎麼記錄下她的聲音,還能加以複製?她諮詢了一位媒體律師朋友,也對這家公司做了一些研究。她知道,根據歐盟法律,聲音本身不受版權保護,但她可以對該公司使用她的聲音提出異議,並主張表演權。她的朋友表示,她的權利取決於公司所在地,而這就是事情變得詭異之處。該公司沒有在網站上列出公司地址,甚至沒有表明其總部位於哪個國家。蘿拉透過電子郵件向該公司提了一些無關緊要的問題,表示她需要公司地址。她得到的回覆是:他們不會透露地址,也無法進一步提供協助。
蘿拉氣壞了。難道什麼都做不了嗎?像她這樣的配音員,對於公司竊取他們的聲音並建立數位複製品的行為,毫無抵抗力,這會讓他們無法經營下去。這完全是竊盜行為。她的聲音在未經她同意的狀況下被盜用,拿來創造一個機器人怪物,其價格僅為人類配音員的十分之一。這就好像有人複製了她,然後製造一個恍如科學怪人一般沒有靈魂的雙胞胎。
經過一番調查,蘿拉發現了問題的根源。幾年前,她接過一間大型科技公司的案子,那份冗長的合約中,有一些她沒多注意的條款,簡單來說,該公司「永久」擁有她的聲音權。事實證明,這家科技公司隨後將錄製成果出售給第三方人工智慧公司,而該公司在法律上有權製作合成複製品。在簽訂合約之際,她幾乎沒有意識到這種可能性。這類規定演員必須永遠出售權利的合約條款明顯不公平,但高薪工作不好找,許多在找工作的配音員被迫簽署擺在他們面前的任何條款。個人工作者在面臨疫情等困境時,無法對跨國公司採取強硬態度。
蘿拉與律師討論了她的問題,但似乎束手無策。科技公司或人工智慧公司的行為可能很不道德,但並不違法。這種感覺就如同法律還沒跟上科技的發展,她所在的整個產業現在更容易受到剝削。許多預算不充裕的公司將開始使用人工智慧複製品,成本只是配音員的一小部分。數百萬人將面臨失去工作與聲音表演者身分的風險。這項技術仍然遠遠達不到專業配音員的水準,但對許多人來說,這並不重要。
當蘿拉再次聽克蘿伊說話,她不禁感到,在轉換過程中,有些重要的東西遺失了。真實人聲具備一些特質,能讓人產生連結。人講話時,會在關鍵時刻運用特定的語調和語氣來喚起情感與意義,這是人工智慧難以複製的。當這個世界充滿這些呆滯且了無生氣的創作品,她的產業和社會又會怎麼樣呢?她作為配音員的日子已經屈指可數了嗎?這項技術最終真能達到和真實人聲毫無差別的程度嗎?只有時間才能證明一切。目前,蘿拉不得不接受,業界又多了一個競爭對手。
(未完)
【內文試閱一】
第一章 標註員
當安妮塔開始步行兩小時進城時,外面天色還暗著。她用了簡單的早餐,喝點茶、吃點粥,就在早上五點左右離家。安妮塔和母親、姊姊、三個孩子住在烏干達北部最大城古盧郊區的一個小村莊。她家外面是布滿車轍的泥土路,沒有公車經過,因此不想步行的通勤者會招來摩托計程車。搭一趟車去辦公室要價兩美元,來回車資超出安妮塔所能負擔的範圍,因此她每天為了省一趟車錢,只得步行上班,直到結束一整天的資料標註工作、精疲力竭了,才搭摩托車回家。
她家有兩間傳統小屋(在當地稱為otlum),是多年前建...
作者序
前言 擷取資訊的機器
梅西伸長脖子,深吸了一口氣,然後在電腦上載入另一項任務,讓人焦慮的圖像與影片接二連三地出現在螢幕上。梅西是Meta公司在肯亞奈洛比一間委外辦公室的內容審核員,在她十小時的輪班工作中,每五十五秒便需處理一個「標籤」。這段影片記錄了一場致命的車禍。有使用者將事故過程拍攝下來並上傳臉書,隨後因觸犯Meta針對暴力與寫實內容的準則而被檢舉。梅西的工作是確認這段影片是否違規。當鏡頭逐漸拉近事故現場,梅西仔細看了這段影片。在畫面突然對焦時,梅西認出其中一張臉:受害者是她的祖父。
梅西猛地把椅子往後一推,邊哭邊跑向出口,路過一排排目光關切的同事。走出辦公室後,她開始打電話給親戚。接到電話的人都驚愕不已,因為這個令人悲痛的消息還沒傳出去。她的主管試圖安慰她,卻也不忘提醒她,若想達成當天的工作目標,就必須回到辦公桌前。主管告知,由於這起事件,梅西明天可以請假休息,但主管也強調,既然她已經在上班,完成輪班仍是最佳選擇。
螢幕上出現了一些新的標籤:又是梅西的祖父,同一件事故一次又一次出現在螢幕上。這裡不僅有其他人分享同一段影片,還有不同角度拍攝的新版本。從事故車輛的照片,到死者的照片,再到事故場景的描述。梅西開始辨認出所有的細節了—就在幾個小時前,日落時分,她所居住的社區,一條她走過無數次的熟悉街道。這一起意外造成了四人死亡。這次輪班似乎沒有盡頭。
某家公司在肯亞與烏干達經營三間資料標註與內容審核中心,我們前往採訪了數十名和梅西一樣的工作人員。內容審核員的主要任務是手動搜尋社群媒體的貼文,刪除惡意內容,並標記出違反公司政策的情形。資料標註員負責給資料貼上相關標籤,以便讓電腦演算法使用。這兩類工作都是「資料工作」,它們涉及不同類型的幕後勞動,促成了我們的數位生活。儘管梅西的故事令人深感沮喪,卻絕非個案。一名為了這份工作從奈及利亞移民過去的資料工作者表示,這類工作其實非常吃力,「你的身體勞累,精神疲乏,好比行屍走肉。」輪班時間長,員工在速度與準確性都必須達到嚴格的績效目標。梅西工作時,需要高度集中注意力;內容審核員在工作時不能分心,因為他們必須根據嚴格的標準正確標記影片。審核員需要仔細檢查每一段影片,找出Meta政策所定義的嚴重違規行為。舉例來說,相形於單純的霸凌與騷擾,暴力和煽動的違規程度更嚴重,因此,僅僅是辨別出單一違規行為並不夠,審核員還得觀察整件事情的發展,以避免事態惡化。
「最讓人焦慮的不只是暴力,」另一名審核員向我們透露:「還有那些露骨不雅且令人不適的內容。」這名審核員指出,他們「幾乎每天」都會目睹有關自殺、虐待與強姦的內容,「做這份工作,你會把不正常的事都正常化了。」在這些內容審核中心,工作人員不斷受到暴力寫實圖像與影片的轟炸,完全沒有時間去消化所目睹的一切。每位員工每天需要處理五百到一千個標籤。許多人表示,這份工作徹底改變了他們的感受,在他們的生命中留下了難以磨滅的印記,其後果可能是毀滅性的。一位被公司解雇的前審核員表示:「我們大多數人都經歷了心理創傷,有些人甚至曾經試圖自殺──有些人與配偶分開,無法挽回婚姻。」
另一位審核員說:「公司政策比工作本身更讓人耗費心神。」在我們造訪的一間內容審核中心,工作人員在看完一段斬首影片之後,哭得全身發抖。然而,管理階層告訴他們,在週間某個時段,他們有三十分鐘的休息時間去見「健康顧問」,但所謂的健康顧問其實只是一位沒有接受過正規心理學訓練的同事。由於觀看的內容難以忍受而離開座位的工作人員,被告知違反公司政策,因為他們忘了在電腦上輸入正確的代碼,表示自己處於「閒置」狀態或「去洗手間」,而這意味著他們的生產率分數可能因此降低。類似的情況層出不窮:「我在辦公室裡崩潰了」、「我陷入了嚴重的憂鬱症」、「我不得不去醫院」、「他們不關心我們的健康」。工作人員告訴我,管理階層會監控員工的就醫紀錄,以驗證員工請病假的正當性,但這種監控並不代表他們希望員工康復,或是真心關切員工的心理健康。
在這家公司,工作保障微乎其微,我們採訪的大多數工作人員都是簽署為期一到三個月的滾續合約,一旦客戶的工作完成,合約就可能中止。工作人員在一棟昏暗的廠房裡工作,每排座位可多達百人,這棟建築位於奈洛比郊區的一片龐大商業園區。他們的雇主是Meta公司的客戶,總部位於舊金山,是著名的業務流程外包公司,在東非設有服務執行中心,專門將不安全與低收入的工作分配給當地員工。許多工作人員就跟梅西一樣,過去曾住在附近的基貝拉貧民窟(非洲最大的城市貧民窟),該公司以幫助弱勢工人進入正規就業的前提聘請他們。然而現實情況是,這些工作人員當中有許多人因為害怕失去工作,選擇不向管理階層提出質疑。工作人員表示,抱怨的人被要求保持沉默,也被提醒隨時可能面臨被替換的風險。
與我們交談的許多審核員都是肯亞人,但也有來自非洲其他國家的移民,進入這間業務流程外包公司,協助Meta審核其他非洲語言的內容。部分員工談到走在街上被認出是外國人的經歷,讓他們覺得自己更容易受到肯亞警察的騷擾與虐待。然而,他們面臨的危險並不僅限於警察騷擾。一位女性受訪者指出,一些非洲鄰國「解放陣線」的成員會找到Meta審核員的姓名與照片,語帶威脅地將這些資訊發布到網路上,因為他們不同意某些審核的結果。這讓審核員感到恐懼,於是帶著這些圖像去公司,試圖尋求協助。該公司表示,將考慮加強廠房設備的保全工作;除此之外,公司對員工的安全問題無能為力,員工應該自己「注意安全」。
我們大多數人都希望,永遠不要經歷梅西和她的同事所忍受的不人道工作條件。然而,這類資料工作是由世界各地、數以百萬計的工人,在不同環境與地點中進行的。在這個中心,部分工作條件在我們實地考察後發生了變化,這一點我們將在第八章進一步討論。大型企業如Meta,往往有好幾個外包的審核服務供應商,這些供應商會爭取最有利可圖的合約。對於我們日常使用的產品與服務,從社群媒體應用程式到聊天機器人和新的自動化技術等,這些資料工作對其運作至關重要。這些資料工作是這些產品與服務存在的先決條件;如果不是內容審核員持續在後台掃描貼文,社群網絡瞬間就會充斥暴力與露骨的內容。如果沒有資料標註員創建資料集,來教導人工智慧區分交通號誌與交通標誌,自動駕駛汽車就無法合法上路。如果沒有訓練機器學習演算法的工人,ChatGPT這類的人工智慧工具就不可能誕生。我們可以廣義地將人工智慧理解為一種運用機器處理資料,以生成決策、預測與建議等輸出結果的技術。從電子郵件中的自動填寫功能,到無人機戰爭中應用的目標武器系統,都屬於人工智慧的範疇。事實上,所謂的人工智慧比較像是一個行銷概念,或是一個總稱,可以涵蓋許多非常不同的科技,其中包括電腦視覺、模式識別與自然語言處理(即日常口語與文本的處理)。這個相對模糊的概念,既能喚起後人類智慧的奇蹟,也預示著人工智慧引發滅絕事件的危險。在公共辯論中,人工智慧代表許多不同的概念:對某些人來說,人工智慧代表經濟成長、科學成就與先進的能力,不過對另一些人來說,人工智慧代表自動化導致的失業、有偏見的決策與技術傳教。多年來,人工智慧的含義持續演變,它不斷地被重新定義,以捕捉最新的技術發展浪潮。
最近,人工智慧的發展集中在支援聊天機器人的系統,也就是所謂的大型語言模型(largelanguage models,簡稱LLMs)。這些大型語言模型的訓練倚賴龐大的文本資料集,而這些資料集通常抓取自網際網路。大型語言模型如ChatGPT之所以被稱為「大型」,一方面是因為它們的資料集規模驚人,通常達到數千億吉位元組,另一方面也是因為訓練這些語言模型所需的參數數量極其龐大,例如ChatGPT-4大約使用了一兆七千六百億個參數。這些參數是驅動系統性能的變量,在訓練過程中可以進行微調,以確定模型如何識別資料中的模式,這將直接影響模型在處理新資料時的表現。
如今,我們正身處於炒作週期之中,各家公司競相將人工智慧工具整合到各種產品中,徹底改變從物流到製造和醫療保健的一切。人工智慧技術的應用範圍極廣,包括診斷疾病、設計更有效率的供應鏈,以及貨物運輸的自動化。二○二三年,全球人工智慧市場的價值已超過兩千億美元,預計每年增長二○%,到二○三○年達到將近兩兆美元。人工智慧的發展往往伴隨著隱祕且不透明的特性;目前,全球有多少工人參與這個產業並沒有確切的數字,但可以肯定的是,這個數字以百萬計,而且若按目前的趨勢繼續發展,參與人工智慧相關工作的人數將會急遽增加。
透過使用人工智慧產品,我們實際上直接進入了這些分散全球各地的工人的生活。無論我們感受如何,我們都已經彼此相連。正如品嘗一杯咖啡,意味著消費者參與了從咖啡豆到咖啡杯的全球生產網絡一般,當我們使用搜尋引擎、聊天機器人,甚至像智慧機器人吸塵器這樣的簡單產品時,我們啟動了跨越地球各個角落的工人、組織與消費者之間的全球資料流與國際資本流動。然而,許多科技公司卻竭盡全力隱藏其產品的實際製造過程。這些公司描繪的願景是光鮮亮麗的自主機器,一種能在大量資料中邊搜索、邊學習的電腦,而不是現實中那些報酬微薄、辛苦勞作、既受電腦訓練又被電腦管理的工人。我們作為消費者、行動主義者與公民所採取的行動,可以對這些工人的工作環境產生真正的影響,幫助他們爭取合理的工作條件。這些工人處於科技變革的最前端,但人工智慧支援的監控與生產力工具正在不斷逼近,即使是那些自認不會受到這種工作生活侵擾的人,也無法幸免。我們採取行動的第一步,是要瞭解人工智慧如何產生,以及它運作的不同系統。這讓我們瞭解到,人工智慧如何將權力、財富與塑造未來的能力集中在少數人手中。
本書講述的故事,不僅關於那些透過勞動讓人工智慧成為現實的人,還牽涉到在獲取資本、網絡建立與工作機會等方面,維持全球不平等的權力系統。書中揭露了隱形勞動力如何為人工智慧做出貢獻,以及權力者經常刻意掩蓋這項重要工作的方式。本書依據對資料標註員、內容審核員、機器學習演算法工程師、人工智慧倫理學家、倉庫工人、勞工組織者與業界人士等兩百多個專訪,揭露人工智慧生產過程的隱藏世界,以及這個世界裡被忽略的數位工作者的故事。這些工作人員的職位各異,包括在惡劣環境下工作、缺乏最低就業保障、工作極度不穩定的低收入資料標註員,乃至全球科技公司總部內享有高薪待遇的機器學習演算法工程師。藉由追蹤連接這些人工智慧生產網絡的資金流向,我們得以逐步揭開人工智慧運作的深遠歷史,並且揭露至今仍在塑造人工智慧的殖民主義傳統。
本書的每一章都借鑑了十多年的研究經驗,引導讀者深入探索工人為人工智慧奉獻的不同場景。在接下來的篇幅中,我們將介紹七個在這一過程中扮演關鍵角色的人物。這些都是我們在研究過程採訪的真實人物,每個故事都真實存在,但在某些情況下,我們會採取謹慎的措施刻意隱藏他們的身分,有時也會略過某些訪談內容。這七個角色分別是「標註員」、「工程師」、「技術員」、「藝術家」、「操作員」、「投資人」與「組織者」。藉由展示他們的工作流程、社會背景與日常生活,每一章都讓讀者一窺人工智慧生產中的人性因素及其對工人的影響。在這些角色中,我們將認識一名烏干達資料標註員,她被困在一份枯燥乏味的工作當中,面對有限的機會,她感到無處可逃。我們將見到一名愛爾蘭配音演員,她發現自己的聲音在她不知情的情況下,被機器學習演算法合成,而且這個機器合成的聲音最終可能會取代她的工作。我們也會瞭解一位肯亞政治活動家的故事,他與工人同事一起組織起來,努力改變只為了服務數位經濟中權貴階層的不公正制度。總體的敘事揭露了這七個角色的工作如何相互關聯,以及其中一個角色的行為如何對其他人的生活產生巨大影響。
本書呈現的視野無疑是片面且不完整的;要用一本書完整涵蓋人工智慧產生的每一個面向,或是人工智慧的不同使用方式,是不可能做到的。例如,關於為人工智慧提供動力的工人,書中沒有用一整章的篇幅介紹那些為特定科技產品挖掘關鍵礦物的礦工,或是在世界各地的工廠組裝這些產品的工人(他們往往面臨十分惡劣的工作環境)。許多其他角色都能成為本書描述的對象,但是我們試圖提供一系列簡明的介紹,來呈現人工智慧的不同視角,以超越矽谷的狹隘視野。由此,這本書將引導我們踏上旅程,前往肯亞、烏干達、愛爾蘭、冰島、英國與美國。
(未完)
前言 擷取資訊的機器
梅西伸長脖子,深吸了一口氣,然後在電腦上載入另一項任務,讓人焦慮的圖像與影片接二連三地出現在螢幕上。梅西是Meta公司在肯亞奈洛比一間委外辦公室的內容審核員,在她十小時的輪班工作中,每五十五秒便需處理一個「標籤」。這段影片記錄了一場致命的車禍。有使用者將事故過程拍攝下來並上傳臉書,隨後因觸犯Meta針對暴力與寫實內容的準則而被檢舉。梅西的工作是確認這段影片是否違規。當鏡頭逐漸拉近事故現場,梅西仔細看了這段影片。在畫面突然對焦時,梅西認出其中一張臉:受害者是她的祖父。
梅西猛地...
目錄
前言 擷取資訊的機器
第一章 標註員
人工智慧資料標註中心的內部/循環圈裡的人類/全球勞動市場
第二章 工程師
ChatGPT不是你的智慧型朋友/聊天機器人會搶走你的工作嗎?/演算法審判日/設計造成的偏見
第三章 技術員
冰與火國度的資料流/人工智慧的動脈/基礎建設的力量/谷歌會喝掉我家用的水嗎?
第四章 藝術家
人工智慧軍備競賽/沒有藝術家的藝術/創造力測試/為什麼我們不會看到計算機版的卡拉瓦喬?/新事物的詛咒
第五章 操作員
認識亞馬遜的擷取機器SCOT/你未來的老闆可能是一台機器/罷工
第六章 投資人
AI淘金熱/加州創投資本的形成/沒有民主的技術/十六街與使命
第七章 組織者
資料工作者可以組織工會嗎?/人工智慧生產網絡中的技術工人組織/全球工作者運動
第八章 重新布線
步驟一:發展工人的力量/步驟二:追究公司責任/步驟三:政府干預/步驟四:勞工合作社/步驟五:拆解擷取機器,創造未來
結論
謝辭
註釋
前言 擷取資訊的機器
第一章 標註員
人工智慧資料標註中心的內部/循環圈裡的人類/全球勞動市場
第二章 工程師
ChatGPT不是你的智慧型朋友/聊天機器人會搶走你的工作嗎?/演算法審判日/設計造成的偏見
第三章 技術員
冰與火國度的資料流/人工智慧的動脈/基礎建設的力量/谷歌會喝掉我家用的水嗎?
第四章 藝術家
人工智慧軍備競賽/沒有藝術家的藝術/創造力測試/為什麼我們不會看到計算機版的卡拉瓦喬?/新事物的詛咒
第五章 操作員
認識亞馬遜的擷取機器SCOT/你未來的老闆可能是一台機器/罷工
第六章 投資人
AI淘...