開源企業(yè)哭CEO,閉源11人賺2億美元,這家AI企業(yè)舍命轉(zhuǎn)向了CEO。
許多專業(yè)的AI繪畫愛好者一直在等待Stable Diffusion 3發(fā)布,從年前期待到年后,現(xiàn)在看來,很有可能等不到開源安裝包。
5月份,Stability AI 宣布推出 Stable Artisan,宣布希望能讓更廣泛的受眾使用。 Stability AI 的 Developer Platform API 功能。
許多人對這個產(chǎn)品感到困惑,這個產(chǎn)品是什么?根據(jù)官方消息,Stable Artisan 它具有Stability AI 高級型號,例如 Stable Diffusion 3、Stable Video 和 Stable Image Core,使用者可直接接受 Discord 建立高質(zhì)量的媒體。
去Discord什么? 不是單獨的本地安裝程序嗎?不得不說,開源賺錢太難了。4月,Stability在Stability上 AI 在CEO都要辭職的背景下,企業(yè)舍命要從開源到閉源,也是情有可原的。
畢竟依靠Discorddey,看看閉源AI繪畫軟件Midjourney。 社區(qū)付費使用,預(yù)計2023年營收將達到2億美元,但是團隊只有11人,簡直就是躺著數(shù)錢。
Discord 與MJ相比,中SD有什么特別之處?
Stability AI終于走上了midjourney的道路,在Discord上搭建了一個頻道,收取了生圖/生圖/圖片放大/背景刪除等功能。支持的圖像和視頻模型包括Stabley Diffusion 3、Stable Video 和Diffusion和Stable Image Core。
單擊鏈接即可進入官方Discord服務(wù)器:https://discord.com/invite/stablediffusion
第一,使用文生圖。進入discord服務(wù)器后,進入ARTISAN頻道,任意選擇一個:
然后在輸入框中輸入“/dream”,會顯示沒有權(quán)限,點擊https://stability.ai/stable-artisan#choose-stable-artisan-Plan鏈接,注冊帳號后填寫信用卡信息和地址,可免費試用三天,三天后開始收費。
Stable初期 與Midjourney相比,Diffusion最大的區(qū)別就是“詳細”,可以調(diào)整各種參數(shù),使用起來比較復(fù)雜,適合專業(yè)人士使用?,F(xiàn)在,這些參數(shù)也被移動到Discord上,輸入框中會提示用戶輸入以下五種參數(shù):
negative從上到下分別是- prompt(負(fù)面提示)、seed(種籽值)、aspect(寬高比)、model(模型)、image(照片張數(shù))
讓我們看看圖片的效果如何:
Stable Artisan還有兩個特殊技能:
草圖:粗糙的手繪草圖通過精確的控制升級為詳細的導(dǎo)出。對于非草圖圖像,允許使用圖像中的輪廓線和邊緣對最終外觀進行詳細處理。
結(jié)構(gòu):通過維護輸入圖像的結(jié)構(gòu)來生成圖像,對于高級內(nèi)容創(chuàng)建方案(例如,再次創(chuàng)建場景或從模型中渲染角色)尤為有用。
Stable升級核心架構(gòu) Diffusion
Stability AI官方表示,與SDXL相比,SD3的亮點在于其遵循字體和提示的能力,這在人類偏好的評價中得到了突出的體現(xiàn)。為了實現(xiàn)這一目標(biāo),SD3選擇了一種新型多模態(tài)擴散變換器。(MMDiT)結(jié)構(gòu),這種結(jié)構(gòu)改進了圖像和表達的權(quán)重分離處理,從而顯著提高了模型的文本理解和拼寫能力。
SDXL升級到MMDiT架構(gòu),使SD3在理解和執(zhí)行客戶文本提醒時更加準(zhǔn)確,生成的圖像更符合客戶的期望。
簡單來講,Stable 在生成文字時,diffusion會更加智能。事實上也是如此,上圖中的“”CROZ-080-Develops“特別清楚,寫作沒有錯誤,如果使用Midjourney或Dalle,可能會得到一堆亂碼。
除生圖外,還有許多其它功能。比如擴大分辨率,
外擴:
刪除背景:
功能比Midjourney豐富得多。然而,在生成視頻方面,還有很長的路要走。因為采用了擴散模式,AI并沒有真正理解物理規(guī)律,所以視頻中的貓變形嚴(yán)重...
未來是開源還是閉源?
經(jīng)歷了總裁離職、核心團隊解散的困境,Stability AI仍然堅持,SD3論文發(fā)布后,SD3API再次發(fā)布,Discord版本上線。
一個月前,百度董事長李彥宏的內(nèi)部演講透露,開源大模型潑了很多冷水。他說大模型開源意義不大,閉源模型在能力上會繼續(xù)領(lǐng)先。
在內(nèi)部演講中,他給出的理由是,有商業(yè)模式的閉源模式可以聚集人力和資金。中國和美國最強的基礎(chǔ)模式是閉源模式,最好的小模式是大模式降維模式,閉源在成本和效率上有優(yōu)勢。同等能力的閉源模式推理成本低,響應(yīng)速度快。
另外一個原因是模型開源和Linux等傳統(tǒng)軟件開源、Android不一樣。“雖然開源模型Llama也鼓勵大家提供各種數(shù)據(jù)和代碼,但實際上最重要的開發(fā)者是Meta,而不是真正大家一起開發(fā)的產(chǎn)品。”
李彥宏的演講并非沒有道理,目前,開源模型面臨的最大挑戰(zhàn)是商業(yè)化。過去Stable Diffusion 3 與此同時,外媒也傳出了發(fā)布時間。 Stability AI 旗下圖像生成應(yīng)用企業(yè) Clipdrop 收購消息。
總部位于巴黎 Clipdrop 創(chuàng)立于 2020 年 7 月亮,使用開源 AI 模型用戶可以生成和編輯照片。在 2023 年 3 每月出售未披露的金額 Stability AI 以前,它已經(jīng)從那里走了 Air Street Capital 收集種子投資。當(dāng)時,Clipdrop 這意味著它擁有超越 1500 萬用戶。但是僅僅一年后,Stability AI 把它賣給美國寫作助理初創(chuàng)公司 Jasper。
有些人評論說,Stable Diffusion 3 發(fā)布就是為了掩蓋這個消息。還有許多。 AI 創(chuàng)業(yè)公司一樣,Stability AI 面臨的困境在于它以驚人的速度燒錢,但是沒有明確的盈利方式。
去年年底,該公司也傳出了這個消息 CEO 有可能被投資者趕下臺的消息,公司本身也可能在尋找賣身。在這種背景下,Stability AI 迫切需要提高投資者的信心,Discord版本上線收費也許是為了解決燃眉之急。
本文來自微信公眾號“AI鯨選社”(ID:aijingxuanshe),作者:鯨哥,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com