亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

有道上線翻譯大模型,CEO 稱已經(jīng)趕超 ChatGPT

商界觀察
2023-08-01

ChatGPT 出現(xiàn)之后,網(wǎng)易有道公司內(nèi)部大吵了一架。

 

吵架的話題導火索是,有道翻譯這款產(chǎn)品的下一步該如何走。這款產(chǎn)品在 2008 年上線,是網(wǎng)易自主研發(fā)的,也是國內(nèi)首家統(tǒng)計機器翻譯線上引擎。

 

經(jīng)過 15 年的技術(shù)迭代,有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)在行業(yè)內(nèi)占據(jù)優(yōu)勢地位。第三方平臺的數(shù)據(jù)顯示,到目前為止,有道詞典月活用戶已經(jīng)超過 1 億,是國內(nèi)詞典翻譯市場的第一名。

 

通常而言,做翻譯相關(guān)產(chǎn)品,業(yè)內(nèi)的共識追求是,它能不能替代人工翻譯。一定程度上,現(xiàn)有的翻譯產(chǎn)品,已經(jīng)實現(xiàn)了這一目標。

 

目標實現(xiàn)了,然后呢?這之后,應該怎么辦?換句話說,一項技術(shù)一旦超越了傳統(tǒng)能力,甚至超過人類智力表現(xiàn)之后,最大的改變應該是什么?

 

網(wǎng)易有道 CEO 周楓想明白了,前沿技術(shù)已經(jīng)在更新,翻譯再這樣做下去不行,必須要迭代。他想用大模型的方式,重新思考翻譯這款產(chǎn)品的邏輯。

 

最大的改變,應該是讓翻譯產(chǎn)品的使用量大幅上升,就像福特做出了 ModelT 這款改寫全球汽車產(chǎn)業(yè)發(fā)展的汽車。ModelT 的價格讓普通人都負擔得起,汽車變成所有人都可以用,這個時候,技術(shù)就真的改變世界了。

 

周楓告訴鈦媒體 APP,這些爭吵在注重技術(shù)的網(wǎng)易有道屬于常態(tài),他們內(nèi)部也經(jīng)常做這樣的事情。

 

他認為,技術(shù)團隊時常需要轉(zhuǎn)換腦筋。于是,他把翻譯團隊這幫老同事再度聚集起來,讓大家學習大語言模型的能力,試圖把翻譯這款產(chǎn)品在新的模型上跑起來。

 

大約過了四五個月之后,團隊評測后發(fā)現(xiàn),這些工作是有效的,現(xiàn)有模型的性能和最后翻譯的質(zhì)量,已經(jīng)超過之前用的模型了。

 

但投入 " 燒錢 " 的大模型,對于尚處于盈利階段掙扎的網(wǎng)易公司來說,是否劃算?公司研發(fā)和訓練大模型的成本投入,又是否感到吃力?

 

今年第一季度,網(wǎng)易有道業(yè)績產(chǎn)生波動。財報數(shù)據(jù)顯示,一季度,網(wǎng)易有道凈收入為 11.6 億元人民幣,同比減少 3.1%;凈虧損 2.1 億元,同比增加 101.9%,繼上個季度利潤轉(zhuǎn)正后再次由盈轉(zhuǎn)虧;并且,有道一直引以為傲的硬件業(yè)務(wù)收入也下滑 16%。

 

" 做公司永遠是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會管理好。" 周楓對鈦媒體 APP 表示。

 

他稱,現(xiàn)在做大模型效率還比較高,一方面是公司之前有一定的基礎(chǔ),另一方面,有道 Transformer 的優(yōu)化很強,很早的時候,他們就能把 Transformer 裝到小設(shè)備里面。

 

并且,大模型的邊際成本非常低,復制模型不需要太多額外的成本。雖然有道的近百人的 AI 團隊,人數(shù)也不少,但總體上,不需要增加額外的特別大的投入。

 

在網(wǎng)易有道首席科學家段亦濤看來,很多技術(shù)和資源都是一脈相承的。他告訴鈦媒體 APP,有道做大模型的過程,是在之前團隊框架進行的,并沒有額外的組建團隊來做。

 

從 2016 年開始,有道協(xié)同構(gòu)建 AI 基礎(chǔ)能力,同步組建語言、視覺、聲音等團隊,積累了有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、計算機視覺、智能語音 AI 技術(shù)、高性能計算 ( HPC)四個底層技術(shù)能力。

 

2017 年,有道就看上了主流技術(shù) Transformer,將 AI 能力統(tǒng)一在大模型之下,重視在端側(cè)的落地應用。2019 年,有道詞典筆 2 代的產(chǎn)品中,首次搭載離線 Transformer NMT。2022 年,有道詞典筆 P5 中搭載了自研的離線 ASR,已升級為 Transformer 技術(shù)。

 

用大模型做翻譯產(chǎn)品,周楓公開表示,在內(nèi)部的測試中,在中英互譯的方向上,已經(jīng)超越 ChatGPT 的翻譯能力,也超過了谷歌翻譯的水準。

 

不過,基于大模型的翻譯產(chǎn)品,一個非?,F(xiàn)實的問題是,它的成本較之前是有所提升的。周楓對鈦媒體 APP 透露,內(nèi)部經(jīng)過測算,用大模型做翻譯,因為計算量非常大,查詢一次的成本,要比之前的模型貴近 20 倍,而有道的翻譯產(chǎn)品,現(xiàn)在每天大約要承接幾億次的查詢量。

 

雖然讓大模型翻譯大量被使用是周楓的目標,但他也發(fā)現(xiàn),大模型的確是燒錢,尤其是在最開始的時候,會有一些成本上的困難。他們目前需要資金,因為確實現(xiàn)有的東西,不滿足他們對產(chǎn)品的要求。

 

這樣的投入吃緊的現(xiàn)實,也可能改變翻譯這類產(chǎn)品的商業(yè)模式。不同于以往翻譯產(chǎn)品的流量轉(zhuǎn)化廣告變現(xiàn)的邏輯,周楓告訴鈦媒體 APP,對大模型翻譯來說,付費會員制是目前比較合理的方案。

 

不過,大模型也已經(jīng)引來教育界的 " 封殺 "。美國多所公立學校已經(jīng)禁用了 ChatGPT, 多家科學期刊也禁止將 ChatGPT 列為論文 " 合著者 "。

 

周楓也反對學生在學習的過程中用大模型 " 抄答案 " 的行為,在應用端體現(xiàn)為 " 家長管控 " 功能,可以管控識別答案,給出講解,而不是直接給出最后的答案。

 

不用去把大模型去神圣化。周楓說,我們應當對大模型里面的產(chǎn)品和技術(shù)創(chuàng)新做到具體案例具體分析,不能認為大模型是一切事物的通途,更值得研究的是,在豐富的應用場景。應用和場景是整個變革的過程中,大家應該及早去抓的。因為抓得越早,后邊能抓到的東西越多。

 

不只是網(wǎng)易有道,教育界也有一些公司對大模型的積極擁抱。今年 5 月,學而思正在研發(fā)數(shù)學大模型 MathGPT 的消息引發(fā)行業(yè)熱議。

 

彼時,學而思方面對鈦媒體 APP 表示,MathGPT 以數(shù)學領(lǐng)域的解題和講題算法為核心,目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級應用。

 

今年 7 月初,學而思一次發(fā)布會上透露可能該月底會有相關(guān)成果的對外展示。不過,截至目前,他們還沒有相關(guān)進展對外披露。

 

這背后或許是相對于其他領(lǐng)域,數(shù)學大模型難度頗高。

 

數(shù)學大模型要解決的三個難題在于,第一,題目要解對,現(xiàn)在 GPT 結(jié)果經(jīng)常出現(xiàn)錯誤;第二,解題步驟要穩(wěn)定、清晰,現(xiàn)在 GPT 的解題步驟每次都不一樣,而且生成內(nèi)容經(jīng)常很冗余;第三,解題要講得有趣、個性化,現(xiàn)在 GPT 的解釋過于 " 學術(shù) " 和機械,對孩子的學習體驗很不友好。

 

周楓則認為,數(shù)學大模型是大家都想投入的方向,但只是給數(shù)學大模型 " 投喂 " 再多的內(nèi)容,都不適用于數(shù)學領(lǐng)域,它背后涉及的是一些數(shù)學原理性的問題,現(xiàn)在的大模型還不具備這樣的能力,但這仍是一個值得研究的方向。

 

鈦媒體 APP 了解到,新東方、作業(yè)幫等教培巨頭內(nèi)部,也已經(jīng)把目光盯緊大模型,但目前暫未有公開落地的成果。

 

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com