亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

人民的AI為人民:印度公司反擊剝削,為貧困數(shù)據(jù)工人“分紅”

2023-08-01

人工智能背后的數(shù)據(jù)工人只得到很少的回報,常常受中間公司的剝削,甚至遭遇身心傷害。印度初創(chuàng)公司Karya想要解決這個問題:提高工資標(biāo)準(zhǔn),并讓工人獲得數(shù)據(jù)版權(quán)帶來的“分紅”。

·盡管Karya目前在擴(kuò)展規(guī)模和維持愿景上仍存挑戰(zhàn),但這一實踐為數(shù)據(jù)產(chǎn)業(yè)提供了新的可能性和借鑒。

 

數(shù)據(jù)工作者在建設(shè)人工智能大語言模型的語料庫方面發(fā)揮著關(guān)鍵作用,但他們的勞動卻常常得不到公平對待,而這種不公平現(xiàn)象在全球數(shù)據(jù)產(chǎn)業(yè)并不罕見。面對這一現(xiàn)狀,印度初創(chuàng)企業(yè)Karya試圖找到一種切實可行的新模式——提高工資標(biāo)準(zhǔn),并讓工人獲得數(shù)據(jù)版權(quán)帶來的“分紅”。

Karya公司的首席執(zhí)行官曼努·喬普拉(Manu Chopra)表示,Karya公司的愿景是通過數(shù)據(jù)工作幫助印度農(nóng)民擺脫貧困。他認(rèn)為,合理的報酬不僅提高了數(shù)據(jù)質(zhì)量,也能夠幫助社會邊緣群體,讓更多人受益于人工智能技術(shù)的發(fā)展,美國《時代》雜志7月27日發(fā)表封面文章“人民的AI為人民”,對Karya公司的故事進(jìn)行了報道,并表示盡管Karya目前在擴(kuò)展規(guī)模和維持愿景上仍存挑戰(zhàn),但這一實踐為數(shù)據(jù)產(chǎn)業(yè)提供了新的可能性和借鑒。

 

人工智能背后的工人

印度南部卡納塔克邦的阿拉哈利村,在一棵椰子樹的陰影下,錢德里卡(Chandrika)一邊滑動屏幕,一邊連續(xù)點擊幾個音頻進(jìn)行剪輯,每次輕觸,她用母語說話的聲音就從手機(jī)里傳出。

在使用這個應(yīng)用之前,30歲的錢德里卡的銀行賬戶中只有184盧比(2.25美元)。但是在4月下旬的連續(xù)幾天,她只需工作約6個小時,就收到了2570盧比(31.30美元)的報酬。這個數(shù)額大致相當(dāng)于她在一所離家很遠(yuǎn)的學(xué)校擔(dān)任教師,抵扣通勤的三趟公交車費用之后一個月的收入。

與錢德里卡的日常工作不同,這個應(yīng)用程序不會讓她等到月底才能收到款項,幾個小時后錢就會進(jìn)她的銀行賬戶。僅僅通過用母語卡納達(dá)語朗讀文本——這種語言主要由分布在印度中部和南部的6000萬人使用,她就用這款應(yīng)用賺到了每小時大約5美元的工資,幾乎是印度最低工資的20倍。而且,幾天后,她還會收到更多的錢——只要音頻剪輯被驗證為準(zhǔn)確,她就會得到50%的獎金。

正是因為AI的蓬勃發(fā)展,錢德里卡的語音才能換來這么高的收益。目前,像ChatGPT這樣的先進(jìn)AI工具在英語等語言中表現(xiàn)最佳,因為這些語言的文本和音頻數(shù)據(jù)在網(wǎng)絡(luò)上非常豐富。然而,對于卡納達(dá)語這樣的語言來說,情況就差得多,盡管這種語言被千萬人使用,但在互聯(lián)網(wǎng)上卻很少見,例如,維基百科上有600萬篇英文文章,但只有3萬篇卡納達(dá)語文章。在這些“資源較少”的語言中,人工智能即使能夠運(yùn)行,也可能存在偏見——比如經(jīng)常認(rèn)為醫(yī)生是男性,護(hù)士是女性,并且可能難以理解當(dāng)?shù)氐姆窖?。要?chuàng)建一個有效的英語人工智能,只需從已經(jīng)積累的數(shù)據(jù)中收集就足夠了。但對于像卡納達(dá)語這樣的語言,需要尋找更多的數(shù)據(jù)。

這就導(dǎo)致了,對以一些世界上最貧困人民所使用的語言為基礎(chǔ)的數(shù)據(jù)集的巨大需求。需求的一部分來自尋求構(gòu)建AI工具的科技公司,另一大部分來自學(xué)術(shù)界和政府,特別是在擁有14億人口、22種官方語言和至少780種土著語言的印度,英語和印地語長期以來占據(jù)著重要地位。這種需求的上升意味著數(shù)以億計的印度人突然掌握了一種稀缺且有價值的資產(chǎn):他們的母語。

數(shù)據(jù)工作在印度并非新事物。20世紀(jì)末,印度在將呼叫中心和服裝工廠轉(zhuǎn)變?yōu)樯a(chǎn)力引擎方面作出了巨大貢獻(xiàn),并在21世紀(jì)默默地將同樣的事情應(yīng)用于數(shù)據(jù)工作。和之前一樣,這個行業(yè)再次被一些中間公司所主導(dǎo),他們支付接近法定最低工資的工資,同時以高額利潤向外國客戶出售數(shù)據(jù)。預(yù)計到2030年,全球價值超過20億美元的AI數(shù)據(jù)行業(yè)將增至170億美元。然而,這些錢很少流向印度、肯尼亞和菲律賓的數(shù)據(jù)工作者。

創(chuàng)造一個更公平的模式

在阿拉哈利和奇盧卡瓦迪相鄰的村莊,Karya公司正在測試一種新模式。錢德里卡就在Karya公司工作,該公司成立于2021年,總部位于班加羅爾,自稱為“世界上第一個道德數(shù)據(jù)公司”。與競爭對手一樣,它以市場價向大型科技公司和其他客戶出售數(shù)據(jù)。但Karya沒有把大部分收入留作利潤,而是用來支付成本,剩下的部分則用于幫助印度農(nóng)村的貧困人群。Karya與當(dāng)?shù)胤钦M織合作,確保最貧困的人群以及歷史上被邊緣化的社區(qū)首先獲得就業(yè)機(jī)會。除了每小時5美元的最低工資,Karya還讓工人在工作中實際擁有所創(chuàng)造數(shù)據(jù)的所有權(quán),因此每當(dāng)數(shù)據(jù)再次銷售時,工人們除了過去的工資外還將獲得收益。這是行業(yè)內(nèi)其他地方都沒有的模式。

“現(xiàn)有的工資體系是市場的失敗?!?7歲的Karya首席執(zhí)行官喬普拉告訴《時代》,“我們決定成為一家非營利組織,因為從根本上說,你無法在市場中解決市場的失敗?!?/p>

Karya告訴工人:這不是一份長久的工作,而是一種快速增加收入的方式,讓你能夠繼續(xù)做其他事情。工人通過該應(yīng)用程序可以獲得的最高收入為1500美元,大致相當(dāng)于印度的年平均收入。Karya表示,已向全國范圍內(nèi)約3萬名印度農(nóng)村居民支付了6500萬盧比(近80萬美元)的工資。到2030年,喬普拉希望能夠觸及1億人口?!叭绻龅煤?,我真誠地認(rèn)為這是數(shù)百萬人迅速擺脫貧困的最快途徑?!彼f。喬普拉出生于貧困家庭,曾因為獲得斯坦福獎學(xué)金改變?nèi)松壽E,“這絕對是一個社會項目。財富就是力量。我們希望將財富重新分配給那些被遺落的社區(qū)?!?/p>

喬普拉不是第一個發(fā)現(xiàn)人工智能數(shù)據(jù)工作能幫助世界最貧困人口,并對其潛力贊不絕口的科技公司創(chuàng)始人。Sama是一家外包公司,曾經(jīng)負(fù)責(zé)過OpenAI的ChatGPT和Meta的Facebook的數(shù)據(jù)處理合同,它也把自己宣傳為科技公司幫助全球人民擺脫貧困的一種“道德”方式。但是根據(jù)此前的報道,為ChatGPT工作的肯尼亞工人表示,他們接觸到的訓(xùn)練數(shù)據(jù)讓他們受到創(chuàng)傷,而其中一些人每小時收入不到2美元。Sama還為Facebook進(jìn)行類似的內(nèi)容審查工作,其中一名參與該項目的工作者說,他在為改善工作條件發(fā)起運(yùn)動時被解雇。Sama公司的創(chuàng)始人在2018年被BBC(英國廣播公司)問及低工資問題時辯稱,支付更高的工資可能會破壞當(dāng)?shù)亟?jīng)濟(jì),弊大于利。很多數(shù)據(jù)工作者不滿Sama公司這種說法,他們認(rèn)為這只是靠數(shù)據(jù)工作者賺取大筆利潤的公司的一種方便的借口。

第一次聽說Karya時,《時代》記者立刻產(chǎn)生了懷疑。Sama也是作為一個專注于消除貧困的非營利組織開始的,但后來轉(zhuǎn)型為營利性企業(yè)。Karya真的能成為一個更包容和道德的人工智能行業(yè)模式嗎?即使可以,它能擴(kuò)展嗎?有一點是清楚的:在這些問題上,印度可能是最好的試驗場所。印度是移動數(shù)據(jù)價格最便宜的國家之一,即使是貧困的農(nóng)民也常常擁有智能手機(jī)和銀行賬戶。還有潛在的好處:根據(jù)世界銀行的數(shù)據(jù),即使在疫情之前,印度約有1.4億人每天生活費不到2.15美元。對于那些人來說,喬普拉所說的巨額現(xiàn)金注入可能會改變他們的生活。

數(shù)據(jù)質(zhì)量和生活收入的“雙贏”

在距離繁忙的科技大都市班加羅爾70英里的地方,在奇魯卡瓦迪村一座低矮的混凝土建筑內(nèi),當(dāng)?shù)剞r(nóng)業(yè)合作社的總部聚集了十幾名男女,他們都是在過去一周內(nèi)開始為Karya工作的人。

瘦弱的21歲年輕人卡納卡拉杰(Kanakaraj)在附近的一所大學(xué)學(xué)習(xí),為了支付書本和交通費用,偶爾在周圍的田地里做臨時工。一天的工作可以賺到350盧比(約4美元),但由于氣候變化,當(dāng)?shù)氐南募颈韧8友谉?,這種體力勞動變得更加難以忍受。在附近城市的工廠工作可以帶來稍微高一點的工資,但意味著每天乘坐不可靠和價格昂貴的公交車上下班,離開他習(xí)慣的生活環(huán)境,住在城市的宿舍里。

在Karya,卡納卡拉杰一個小時的收入比他在田里一天的收入還要多。“工作很好?!彼f,“而且很輕松?!眴唐绽f,這是村民的典型說法?!八麄兒芨吲d我們支付給他們很多錢?!彼f,但更重要的是,“這不是辛苦的工作。這不是體力勞動?!碑?dāng)卡納卡拉杰看到第一筆工資進(jìn)入銀行賬戶時,他感到很驚訝?!拔覀儽或_了很多錢。”他向記者解釋,村民常常收到利用他們絕望心理的短信,承諾將他們的存款增加10倍。當(dāng)有人第一次告訴他Karya時,他以為這是一個類似的騙局。

由于儲蓄很少,當(dāng)?shù)厝私?jīng)常不得不貸款支付緊急費用。這些掠奪性機(jī)構(gòu)往往對這些貸款收取高利率,導(dǎo)致一些村民陷入債務(wù)循環(huán)。例如,錢德里卡利用她在Karya的工資幫助家人償還一筆巨額醫(yī)療貸款,這筆貸款是她25歲的妹妹治病時產(chǎn)生的。其他Karya工人也面臨類似的情況。25歲的阿賈伊·庫馬爾(Ajay Kumar)陷入了為治療母親嚴(yán)重背部傷病而產(chǎn)生的醫(yī)療債務(wù)中。38歲的希瓦納(Shivanna N.)在小時候因燃放鞭炮而失去了右手。盡管他沒有債務(wù),但殘疾意味著他很難謀生。

 

這些村民正在參與Karya在卡納塔克邦推出的一個新項目,該項目是為一家印度醫(yī)療非政府組織進(jìn)行的,該組織正在尋求關(guān)于結(jié)核病的語音數(shù)據(jù),結(jié)核病每年導(dǎo)致約20萬印度人死亡。這些語音錄音,收集了卡納達(dá)語的10種不同方言,將幫助訓(xùn)練一個人工智能語音模型,以理解當(dāng)?shù)厝说姆谓Y(jié)核問題,并回答旨在減少疾病傳播的信息。當(dāng)這個應(yīng)用完成時,它希望能夠讓不識字的人更容易獲得可靠的信息,而不用讓肺結(jié)核患者尋求幫助時承擔(dān)經(jīng)常遭受的污名。這些錄音還將作為卡納達(dá)語數(shù)據(jù)集的一部分,在Karya的平臺上轉(zhuǎn)售給許多AI公司。這些公司對訓(xùn)練數(shù)據(jù)的內(nèi)容不太在意,而是更關(guān)注它對語言整體結(jié)構(gòu)的編碼。每次轉(zhuǎn)售,100%的收入都將分配給參與數(shù)據(jù)集的Karya工人,并按照他們投入的時間比例分配。

雖然規(guī)模較小,但Karya已經(jīng)擁有一系列知名客戶,包括微軟公司、麻省理工學(xué)院和斯坦福大學(xué)。今年2月,該公司為比爾與梅琳達(dá)·蓋茨基金會開展了一個新項目,旨在為10億印度人口使用的5種語言(馬拉地語、泰盧固語、印地語、孟加拉語和馬拉雅拉姆語)構(gòu)建語音數(shù)據(jù)集,最終目標(biāo)是建立一個可以用母語和方言回答印度農(nóng)民關(guān)于醫(yī)療保健、農(nóng)業(yè)、衛(wèi)生、銀行和職業(yè)發(fā)展等問題的聊天機(jī)器人。這項技術(shù)可以被視為致力于消除貧困的ChatGPT,有助于傳播改善印度人生活質(zhì)量的知識。

“我認(rèn)為應(yīng)該有一個世界,語言不再是使用技術(shù)的障礙,這樣每個人都能使用技術(shù),無論他們說什么語言?!蔽④浹芯恐行牡恼Z言學(xué)家和首席研究員卡利卡·巴利(Kalika Bali)說。她與蓋茨基金會合作進(jìn)行該項目,并擔(dān)任Karya監(jiān)督委員會的無薪酬成員。Karya相對較高的工資“滲透到數(shù)據(jù)的質(zhì)量上”,巴利說,“這將立即提高系統(tǒng)輸出的準(zhǔn)確性?!彼f她通常從Karya那里得到的數(shù)據(jù)錯誤率不到1%,這在構(gòu)建AI模型時幾乎從未發(fā)生過。

特殊的公司結(jié)構(gòu)

喬普拉說,最初他和他的團(tuán)隊向任何人開放應(yīng)用程序,結(jié)果發(fā)現(xiàn)最早的100個注冊用戶都是占主導(dǎo)地位的高種姓男性。這一經(jīng)歷讓他認(rèn)識到“知識是通過權(quán)力渠道傳遞的”。為了接觸到最貧困的社區(qū),以及邊緣化的種姓、性別和宗教,他很早就意識到必須與在農(nóng)村地區(qū)有基層影響力的非營利組織合作。這些組織可以代表Karya按照收入和多樣性的要求分發(fā)訪問碼?!八麄冎缹τ谡l來說,這筆錢是錦上添花,對于誰來說,這筆錢是改變命運(yùn)的?!彼f,這個過程也確保了工人最終生成的數(shù)據(jù)有更強(qiáng)多樣性,這有助于減少AI偏見。

“我們需要的是讓更多人意識到,大多數(shù)數(shù)據(jù)公司是不道德的?!彼f,“而且有一種道德的方式?!睘榱俗屵@個應(yīng)用發(fā)揮出他認(rèn)為能夠發(fā)揮的影響力,他需要贏得更多的客戶——說服更多的科技公司、政府和學(xué)術(shù)機(jī)構(gòu)從Karya獲取他們的AI訓(xùn)練數(shù)據(jù)。

但在追求新客戶的過程中,即使是自詡為“有道德”的企業(yè),最終也可能妥協(xié)。那么,什么能阻止Karya陷入與Sama公司同樣的境地呢?喬普拉說,答案的一部分在于Karya的公司結(jié)構(gòu)。Karya在美國注冊為非營利組織,控制著印度的兩個實體:一個非營利組織和一個營利組織。這個營利組織在法律上有義務(wù)將它賺取的任何利潤(在支付工人之后)捐贈給非營利組織,后者再將它們用于再投資。他說,這種安排的好處在于,消除了他或聯(lián)合創(chuàng)始人為了有利可圖的合同而犧牲工人工資或福利的任何動機(jī)。目前,這是一個有效的模式,但如果慈善資金枯竭,這個模式可能會崩潰。

奇魯卡瓦迪和阿拉哈利村的村民對人工智能的了解有限。喬普拉表示,向工人們解釋他們正在做什么時可能存在挑戰(zhàn),最成功的方法是告訴工人們他們正在“教計算機(jī)說卡納達(dá)語”。那里沒有人知道ChatGPT,但村民們知道谷歌助手,他們稱之為“OK Google”。35歲的失業(yè)父親思達(dá)拉久(Siddaraju L.)表示,他不知道什么是人工智能,但如果計算機(jī)能說他的語言,他會感到驕傲?!拔覍ξ业哪刚Z像對我的父母一樣尊敬?!?/p>

人們希望,通過Karya等項目的努力,印度語言的人工智能項目能夠從英語人工智能的錯誤中吸取教訓(xùn),并從一個更可靠和無偏見的起點開始?!爸钡讲痪们?,英語的語音識別引擎甚至都不能理解我的英語口音?!蔽④浹芯恐行牡恼Z音研究員巴利談到她的口音時說,“如果人工智能技術(shù)不滿足它們的受眾,那么這些技術(shù)的存在有什么意義呢?”

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com