程序員最喜歡的問答網(wǎng)站,為ChatGPT開啟了“奶媽”
Stack Overflow,由于致力于技術(shù)問答和社區(qū)運營,一個類似知乎、Reddit的老牌網(wǎng)站在全球程序員圈中備受青睞。
但是自ChatGPT問世以來,這個網(wǎng)站的瀏覽量和搜索量都在短時間內(nèi)急劇下降,許多程序員開始放棄使用。
為留住用戶,Stack 首先,Overflow封殺了ChatGPT,然后推出了自研AIGC產(chǎn)品,但是接連不斷的“自救”仍然無法阻止流量的大幅下降。
令人吃驚的是,Stack 本周一,Overflow突然宣布與OpenAI簽訂協(xié)議,并為其提供數(shù)據(jù)。
有趣的是,Stack Overflow不僅與OpenAI合作,還購買了谷歌Gemini模型的豐富數(shù)據(jù)。
AI阻擋不了程序員最大的問答網(wǎng)站
在程序員圈里,Stack Overflow的地位有多高?
簡而言之,作為一個老牌的問答網(wǎng)站,Stack Overflow已成立16年,最高每月瀏覽2億臺主機。
無論是一線廠商的技術(shù)巨頭,還是剛?cè)腴T的計算機新手,只要提出編程問題,總會有網(wǎng)友沖鋒在前,提供想法,甚至直接給出最優(yōu)解答。
正是因為數(shù)據(jù)龐大,Stack 雖然Overflow的名氣不如Reddit,但它也是圈內(nèi)人必備的網(wǎng)站。
但是在ChatGPT問世之后,事情開始朝著衰落的方向發(fā)展。
在 ChatGPT上線后,很快就有網(wǎng)友發(fā)現(xiàn)其優(yōu)秀的代碼生成能力,所以“ChatGPT可以替代Google、Stack Overflow”這句話引起了許多程序員的注意。
但令人意想不到的是,僅僅上線5天之后,Stack Overflow反手, ChatGPT 給封殺了。
這是因為ChatGPT產(chǎn)生的代碼錯誤太離譜了,所以Stack Overflow宣布,所有這些產(chǎn)生垃圾答案的帳戶都將被關(guān)閉。
有趣的是,Stack Overflow團隊發(fā)現(xiàn),很多用來訓(xùn)練AI模型數(shù)據(jù)的人實際上來自Stack。 Overflow。
假如讓AI機器人產(chǎn)生垃圾回答,那不就等于搬起石頭砸自己的腳嗎?
雖然Stack Overflow的表態(tài)非常明確,很多程序員都能理解,但是ChatGPT的感覺真的很香。!
最終,面對AI的強勢攻擊,Stack Overflow的流量也越來越差,到2023年6月,訪問量幾乎減半。
為緩解頹勢,Stack Overflow 這是一系列措施的開始。
首先,七月份,技術(shù)團隊利用自己5800萬個問題和答案的數(shù)據(jù)庫,制作了一個名為“答案”的數(shù)據(jù)庫「OverflowAI」的AI 工具,它的功能主要集中在編程上,但是沒有引起太多的波瀾。
十月份,企業(yè)CEO宣布解雇約28%的員工,通過減少營銷預(yù)算,為此, 持續(xù)輸血的AI工具。
然而,由于OverflowAI仍處于初級測試階段,OverflowAI可以做的只是拖延Stack,因為它面臨著強大而不斷進化的ChatGPT。 Overflow衰落的速度。
銷售數(shù)據(jù),好香
當面臨ChatGPT威脅時,Stack Overflow最初選擇使用“防御”的姿勢。
然而,眾所周知,這些公開的互聯(lián)網(wǎng)數(shù)據(jù)已經(jīng)被OpenAI等科技公司用“爬蟲”等手段搜索過了,他們不僅要面對客戶的流失,還要面對數(shù)據(jù)的流失。
但畢竟每天的瀏覽量都在那里,Stack Overflow手里拿著大量高質(zhì)量的數(shù)據(jù),倒也成了一種可交易的資源。
自從《紐約時報》帶頭起訴OpenAI以來,越來越多的新聞媒體和門戶網(wǎng)絡(luò)參與了OpenAI的征求。
當面臨版權(quán)問題時,科技公司只能為培訓(xùn)數(shù)據(jù)支付費用,并承諾不使用個人數(shù)據(jù)。。
Reddit、Youtube、ShutterStock、Photobucket等網(wǎng)站都是數(shù)據(jù)交易的受益者,擁有大量高質(zhì)量的培訓(xùn)資料,科技巨頭們花錢也不吝嗇。
相比之下,Stack Overflow的數(shù)據(jù)同樣出色,甚至比Reddit這樣的綜合網(wǎng)站更專業(yè)。
因此,Stack Overflow CEO也開始學(xué)會向各大科技公司推銷自己的數(shù)據(jù),其中包括Google。 Gemini 模型。
或許正是看到了科技公司對高質(zhì)量數(shù)據(jù)的渴望,讓高層選拔的態(tài)度發(fā)生了360度的巨大變化。既然用戶回不來了,至少他們可以在口袋里賺錢。。
值得注意的是,Stack 當時Overflow強調(diào),這個協(xié)議并不是唯一的,這意味著任何科技公司都可以購買相同的數(shù)據(jù),剩下的就看哪個培訓(xùn)得更好了。
據(jù)報道稱,Stack Overflow 技術(shù)內(nèi)容將和 OpenAI 的 GPT-4 通過OverflowAPI瀏覽等模型,未來開發(fā)者可以直接通過OverflowAPI瀏覽。 OpenAI可以獲得可靠且經(jīng)過驗證的數(shù)據(jù),并且可以幫助他們快速找到解決復(fù)雜問題的方法。
還有Stack Overflow 還可以從開發(fā)社區(qū)收集反饋,保證 AI 不斷改進開發(fā)工具。
簡而言之,Stack Overflow和 OpenAI進行了技術(shù)和數(shù)據(jù)的交換,前者提高了AI能力,后者獲得了可靠的數(shù)據(jù),兩者都取得了雙贏。
據(jù)報道,預(yù)計本次合作將帶來第一組集成功能和能力, 2024 今年上半年發(fā)布,這也說明雙方的合作實際上已經(jīng)持續(xù)了很長時間。
隱私還是個大問題?
目前,越來越多的社區(qū)網(wǎng)站開始參與AI培訓(xùn),包括百度貼吧的“弱智吧”,在一項研究中表現(xiàn)出極佳的數(shù)據(jù)培訓(xùn)效果,一度沖上熱搜。
對傳統(tǒng)內(nèi)容網(wǎng)站的瀏覽量持續(xù)下降,高質(zhì)量的數(shù)據(jù)的確是一個可以長期進行的“副業(yè)”。
另外,AI雖然很香,但并非沒有缺陷。
從Stack開始 Overflow開始轉(zhuǎn)向AI開發(fā)能力后,開發(fā)者社區(qū)的一些成員反對這一變化,他們擔(dān)心人工智能產(chǎn)生的信息的有效性和數(shù)據(jù)隱私。
還有專家指出,AI會導(dǎo)致更多的錯誤代碼被推入代碼庫,甚至?xí)糯螽斍败浖椖恐械穆┒春桶踩珕栴}。
但是對“饑渴”的AI企業(yè)來說,不斷膨脹的數(shù)據(jù)消耗問題已經(jīng)足夠令人頭痛。
而且網(wǎng)站的幫助,正好可以為自己分擔(dān)一些風(fēng)險。。
本文來源于微信微信官方賬號“鎂客網(wǎng)”(ID:im2maker),作者:MKWjh,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com