瞄準大模型賦能法律行業(yè)新機會,「語炎智能」推出法律行業(yè)垂直模型
法律和金融被認為是 AI 技術落地應用的兩大理想垂直領域。
一方面,領域積累的高質量數據規(guī)模夠大,足以訓練專業(yè)的 AI 模型;另一方面,領域企業(yè)客戶通常涉及大量語言交互、文本處理等勞動密集的,但又需專業(yè)知識支撐的業(yè)務流程。而這些流程又是價值創(chuàng)造的關鍵環(huán)節(jié),如前端咨詢、重要材料審核。因此,這些企業(yè)在特定場景中采用 AI 技術降本增效需求旺盛,同時付費意愿強。
過去幾年里,以 AI+ 法律為例,涌現出百智誠遠、法狗狗、冪律智能等一眾旨在基于人工智能技術,提升法務人員工作效率、降低消費者法律咨詢門檻的創(chuàng)業(yè)公司。而在當前大語言模型掀起的又一次 AI 技術發(fā)展浪潮中,法律行業(yè)再次成為新技術應用落地的首選垂直領域之一。
基于 GPT 面向律所提供模型定制服務,打造法律 AI 產品的初創(chuàng)公司「Harvey」已獲由 OpenAI Startup Fund 領投的首輪 500 萬美元融資,以及紅杉領投,OpenAI Startup Fund 再次跟投的 2100 萬美元 A 輪融資。
放眼國內,百智誠遠、冪律智能等已陸續(xù)開始基于大模型推出新的產品、服務,同時,新進入者也趁勢而起。36 氪最近接觸到的上海語炎智能科技有限公司(以下簡稱:語炎智能),也是 AI+ 法律的新入局者。
語炎智能成立于 2023 年 2 月,由「上海元語信息科技有限公司」和「安可覓(武漢)智能科技有限公司」合資組建,并與隆安律師事務所等法律行業(yè)伙伴建立了戰(zhàn)略合作關系。
語炎智能定位于法律行業(yè)垂直模型層,聚焦家事法和勞動法兩個細分領域?,F階段,公司主要基于自身開發(fā)的微調模型,面向律師事務所等專業(yè)客戶,以及非專業(yè)企業(yè)客戶提供模型運用以及專屬模型開發(fā)、訓練,以及專屬知識庫搭建等工程服務。
目前,語炎智能已經推出百億參數模型,并于 5 月 15 號、16 號邀請了數百位法律專業(yè)人士進行測試,同時開啟了面向 C 端用戶的內測工作。語炎智能總經理劉迎暉,當前,公司已收到了來自數家律所、大型企業(yè)客戶的專屬知識庫搭建和模型定開需求,并已開始推進與部分客戶的合作流程。
關于入局契機,劉迎暉告訴 36 氪:" 我們是一個多元團隊,兩家股東公司一直在 AI 領域探索,有深度學習、NLP 等方面的技術沉淀,戰(zhàn)略合作團隊有法律行業(yè) know-how 和專業(yè)數據等資源。在大模型取得突破性進展后,大家一拍即合。股東公司希望有機會能嘗試把過往經驗,尤其是算法方面的積累,應用到新的領域,做新的探索。而合作伙伴也希望激活行業(yè)資源價值。"
語炎智能總經理劉迎暉,本科畢業(yè)于浙江大學,碩士研究生畢業(yè)于上海交通大學,曾任職于中軟、IBM(上海),具有多年算法和軟件開發(fā)經驗;CTO Revive,本科畢業(yè)于北京大學,博士畢業(yè)于德國慕尼黑工業(yè)大學,有豐富的模型、算法及深度學習技術研究經驗;COO Peter 畢業(yè)于英國斯旺西大學,有多年律所和大型企業(yè)法律執(zhí)業(yè)和法務高管從業(yè)經歷。
作為新入局者,需要找準市場切入口。談及選定家事法和勞動法兩個細分領域的原因,劉迎暉介紹:" 一是 C 端用戶需求較強,B 端市場增長空間夠大。同時,相較于公司法等,婚姻、繼承和勞動法場景更豐富,方便公司后續(xù)及時調頭或更加聚焦;二是相較于合同法等,這兩個領域強制規(guī)定更多,訓練難度更低、模型效果更好;三是源頭數據可獲得性較高,數據質量和規(guī)模能得到保障。"
然而,上述三方面因素在為語炎智能帶來市場進入機會的同時,也提出了產品服務差異化的挑戰(zhàn)。如何爭奪存量市場,或者開拓增量市場,是語炎智能需要關注的重點。
劉迎暉表示,法律服務行業(yè)的產業(yè)鏈條夠長,足夠容納大量市場玩家,給了語炎智能錨定細分領域深挖場景的機會。她告訴 36 氪:" 準確性是法律行業(yè)的生命線,和其他對模型效果有較高要求的專業(yè)領域一樣,高質量數據、工程化技術能力和經驗都很重要。盡管數據可獲得性高,但仍需要做細致的數據清洗、挑選和指令學習數據標注工作。同時,模型微調本身是一項工程化技術,而法律的語言環(huán)境更加復雜,沒有捷徑可走,需要在既有能力的基礎上進一步積累經驗。我們在這兩方面做了大量努力。"
盡管大模型更讓新一代 AI 應用更智能,但要用于法律這樣的嚴肅行業(yè),還需要解決一系列難題,尤其是對模型準確性的保障。就在近期,美國還上演了律師使用 ChatGPT 錯誤援引虛假案例打官司的鬧劇。
劉迎暉也坦言:" 盡管目前從測試反饋來看,我們的模型表現超出了預期,但公司未來確實還需在提升長文本可控度和模型準確性這兩個方面持續(xù)探索。現階段,如果企業(yè)客戶對數據安全和模型準確性有較高要求,我們也支持以 embedding 的方式,將大模型能力與企業(yè)知識庫相鏈接。另外,我們認為隨著數據規(guī)模的上升和對模型的不斷優(yōu)化,準確性會進一步提升。"
目前,語炎智能的模型還在迭代完善中,主要以開放 API 接口的方式交付,尚不支持私有化部署。劉迎暉表示,實現數據飛輪后,會拓展此類交付模式,并探索新的業(yè)務模式,例如針對特定場景開發(fā)具體 AI 法律應用。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com