循環智能榮獲2022中國AI金雁獎“技術創新大獎”,千循零樣本AI平臺首次亮相
近日,由中國電子商會人工智能委員會主辦的2023北京人工智能峰會暨第三屆AI金雁獎頒獎典禮在北京盛大舉行。循環智能(Recurrent AI)憑借在AI大模型技術上的創新、積累和應用,經過專家評審團的層層評比和篩選后獲得了“2022人工智能技術創新大獎”,循環智能聯合創始人楊植麟博士也被評選為“2022 AI領軍人物”。

中國AI金雁獎是由來自人工智能領域從技術研發到市場營銷和創投基金、從國家院士到企業高管和知名投資人等不同背景的專家和機構組成的評審團,從多維度的觀察與剖析,多面向的評估與考核,經過初審、復審到終審,層層評比、層層篩選出在AI技術和商業領域有著突破性重要貢獻的單位和個人,致力于不斷為中國人工智能科技領域發掘出優秀的“頭雁”。
循環智能自主研發千億參數預訓練NLP大模型“盤古”,是業內首個千億參數的中文大模型,擁有1100億密集參數,經過40TB的海量數據訓練而成。同時也通過多任務prompt等技術延伸出10億參數、性能更好的落地版本,極大地加速了AI的商業應用效率和泛化能力,提升NLP模型生產效率10-1000倍。“盤古”大模型刷新了世界中文CLUE榜單三項記錄,并獲得了2021世界人工智能大會“SAIL之星”榮譽。應用層面,循環智能提供基于“AI+銷售科技”的解決方案,目前已賦能超100萬一線人員,日均處理上億次對話,在各行各業積累了豐富的銷售增長實踐、銷售分析模型和最佳溝通素材,累計生產了10000+面向各行業業務流程的AI數據模型。本次評選,循環智能憑借AI大模型技術創新、大量業務實踐贏得了評審團的認可,獲得“2022人工智能技術創新大獎”和“2022 AI領軍人物”兩項大獎。

頒獎典禮上,循環智能聯合創始人兼CTO張宇韜博士作為獲獎企業的代表,受邀發表了《AI大模型在企業服務場景下的實踐與探索》的主題演講,與現場領導、評審團、行業專家、媒體和100多位企業代表分享了AI大模型在企業落地的主要挑戰、循環智能“千循零樣本平臺”多模型策略和應用場景,以及在大模型在企業應用場景的最新探索與實踐。
以下是演講內容的回顧:
以ChatGPT為代表的大模型應用開啟了通用人工智能的新范式,其中最關鍵的技術創新是基于人類反饋數據的系統進行模型訓練,從而提升了理解人類想法的準確性。
但企業在使用AI大模型時也面臨著三大挑戰,這些挑戰也體現了GPT模型的局限性。
挑戰一:事實性錯誤。事實性錯誤(即看似正確,但與事實不符),是GPT模型的原理帶來的。GPT的模型優化目標是在有限的訓練數據上泛化出無限的能力,當問題超過模型知識范圍時,會開始自我創造。事實性錯誤的挑戰,雖然在現有的技術路線下無法百分之百解決,但可以通過兩種路徑來“減弱”其影響。第一種是提升模型的知識范圍,當模型的知識范圍越大時,事實性錯誤也就會越少。第二種是通過更好地讓模型對齊人類的需求和價值觀,盡可能以合適的方式拒絕回答超出范圍的問題,從而減少事實性錯誤造成的影響。
挑戰二:難融入企業私域數據。像ChatGPT這樣的通用AI系統,其能力上限是公域存量數據的范圍,因為企業內部大量的信息、知識、數據均無法被公域模型覆蓋。因此,企業內的垂直業務需求是無法被公域模型準確理解的。而企業內的垂直業務需求是與業務流程強相關的,往往需要結合內部數據作為上下文,才能準確理解。例如,客戶質量分析場景,企業客戶如果直接使用類似 ChatGPT 的通用AI系統,輸入客戶信息和對話內容,來判定客戶是否屬于優質客戶,那么得到的結果往往不理想。主要原因是,通用AI系統并不清楚企業內部對于優質客戶的定義,而且不同企業對于優質客戶的定義很大程度上是不同的。
挑戰三:規模化應用成本高。當前,百億參數的模型輸出(推理)速度大概可以做到每個GPU每秒生成 20 個字左右(30token)。在實時文本交互(在線客服、問答)場景,一個GPU支持3-5個并發客戶,那么100萬“日活躍用戶”,對應的峰值并發約10000,需要 2000-3000個GPU,成本過于高昂。在實時語音交互場景(電話溝通、語音通話、視頻通話)場景,在單個GPU單并發情況下,文本生成的句末延遲約1到3秒,疊加TTS(文本轉語音)的延遲,基本無法支撐需求。
過去幾年,循環智能在大模型訓練和應用實踐中有非常多的技術積累,為解決這些難題打下了良好的基礎:首先,積累了大量行業文本和語音數據,中文文本數據超過40TB,真實語音對話數據超過 400 萬小時;其次,具備超大規模預訓練模型的工程化經驗,主導開發和落地了首個千億參數的中文語言大模型“盤古”,具備豐富的數據采集、清洗和標注經驗。主導開發了面向認知的“悟道·文匯”超大規模預訓練模型;第三,精通場景化的多任務指令微調,在銀行、保險、證券、地產、汽車、零售等行業有豐富的業務實踐。

今年,循環智能也將推出自研的“千循零樣本AI平臺”。“千循零樣本AI平臺”采用了多模型組合的策略,包括10億參數的盤古NLU(自然語言理解)模型,主要服務語義理解的場景,和面向更復雜的文本生成類任務、參數規模更大的“千循-M”和“千循-XL”模型等。同時,為了使模型更好地適配企業需求,“千循零樣本平臺”提供多種“微調”方案,包括 P-tuning、Instruction tuning、LoRA等,可以更好地融入企業的專有知識庫數據。
“千循零樣本AI平臺”在底層提供AI大模型的高質量文本理解能力、邏輯推理能力和文本生成能力。基于這些能力,在企業需要對外交互的營銷場景、服務場景,以及內部的知識培訓和內容運營場景,提供多種創新應用,幫助不同場景的不同角色員工提升產能和工作效率。
在智能化內容運營與生產場景,“千循零樣本AI平臺”提供“話術質量的分析&挖掘與優化建議、文案自動化生成與撰寫、以及基于知識庫的智能問答能力。
在客戶畫像與需求的智能分析場景,“千循零樣本AI平臺”提供基于對話內容自動識別客戶畫像與需求、基于對話內容總結客戶所有興趣點&評價和提問以及自然語言輸入信息,快速進行客戶描摹能力。
在智能化業務分析與決策推薦場景,“千循零樣本AI平臺”提供“基于對話全文生成業務策略的能力”,在房產和汽車銷售場景,可以給出靠譜的商機跟進建議。還提供“基于對話內容評判服務效果”的能力,可以幫助企業了解客戶對售后服務是否滿意,以及滿意的地方和不滿意的地方分別是什么。之前企業主要是通過問卷來收集客戶滿意度,填寫問卷的人數占比很少,現在可以做全量的滿意度分析。