TableAgent:首個國產可私有部署的企業級Code Interpreter
TableAgent公測地址:https://tableagent.DataCanvas.com
數字化時代,數據分析的重要性猶如空氣般無處不在。商業數據分析是數字化管理、智能決策的基礎,同時數據分析又是一個專業性極強的工作,描述性分析、診斷性分析、預測性分析,會讓大多數只會用Excel的人望而生畏。九章云極DataCanvas公司自主研發的TableAgent數據分析智能體讓大模型對個人生產力的賦能,從寫紀要、做總結上升到新的臺階,只要會提問,就能成為一個高級的數據分析師,洞察數據奧秘。
2023年7月9日OpenAI發布了震撼全球的Code Interpreter插件,一時間人人都是數據分析師從夢想照進現實。其實早在6月28日九章云極DataCanvas公司就已經率先對外發布了TableGPT,如今Code Interpreter更名為Advanced Data Analysis,而TableGPT也帶著一系列的重大升級以TableAgent為名重裝上陣,面向社會開放公測。
TableAgent是在DataCanvas Alaya九章元識大模型基礎上開發的能夠實現私有化部署的企業級數據分析的智能體,有非常強大的意圖理解能力、分析建模能力和洞察力。TableAgent在充分的理解用戶意圖后,自主的利用統計科學、機器學習、因果推斷等高級建模技術從數據中挖掘價值,進而提供分析觀點和指導行動的深刻見解。
● 會話式數據分析,所需即所得
● 私有化部署,數據安全
● 支持企業級數據分析,大規模、高性能
● 支持領域微調,專業化
● 透明化過程,審計監督
人人都是數據分析師
TableAgent 本次升級的一大亮點是可以為企業提供私有化部署。Code Interpreter對國內眾多企業用戶的最大障礙是企業數據因為安全性、合規等種種原因,不能傳輸到線上的共有服務平臺。TableAgent為企業提供私有化部署,系統部署在企業內部,數據不外流,從根本上解決了安全合規的問題,同時TableAgent也可以滿足企業級數據的大規模、高性能分析的要求,這也是Code Interpreter目前的短板。
數據分析不同于對話、摘要、寫作這一類的語言任務,他需要理解數據、理解用戶的分析需求,需要能夠自動的寫代碼、調試代碼、運行代碼,還要理解代碼運行生成的數據結果進而從中獲得對數據的深刻洞察。
尤其是代碼生成任務,與一般的寫作任務不同,寫作可以容忍出現錯別字,不會導致內容生成失敗,但代碼生成任務即便只是變量名錯一個字符,都會導致整體無法運行,任務失敗。因此基于代碼生成來實現開放式數據分析對模型能力是極大的挑戰。
我們看到目前做數據分析的大模型應用多數是基于固定指標體系或者是對現有分析系統接口的調用,這種技術路線的不需要生成代碼,但開放性不足,用戶的分析需求受限于現有指標體系的設計和分析系統的能力。TableAgent選擇了難度更高的代碼生成路線,創造性的提出專家模型組的方法來解決這些難題。
融合創新應用的新成果
九章云極DataCanvas公司自主研發的Alaya九章元識大模型是TableAgent背后的關鍵技術支撐。在Alaya基礎大模型之上微調的Alaya-ZeroX模型組,通過一系列擅長不同能力的模型組合完成復雜的分析任務。不同參數規模的模型同時滿足了對生成質量和推理性能的要求。
本次TableAgent發布帶來的另外一個重要能力是專業化微調,不同行業不同企業在數據分析上有專業的語言背景和分析模型的獨特需求,通用的分析工具很難滿足專業化的要求,對此TableAgent為能夠企業提供專業化微調。
TableAgent為此配套設計了T+(Table Family)系統,能夠高效的實現定制化的微調工作,同時系統具有自我迭代的能力,系統性的體系支撐更高效的實現數據分析各個環節的升級,讓用戶在無感知的情況下即可獲得不斷升級的數據分析體驗。
DataCanvas Table Family (T+)
● TableAgent:數據分析智能體
● TableBench:數據分析能力評測基準
● TableTuning:數據分析LM微調
● TableInstruct:數據分析指令集
● TableLive:自迭代引擎
● Alaya-ZeroX:數據分析GPT模型組
● DeepTables & YLearn:結構化數據深度學習、因果學習工具包
DataCanvas Table Family (T+) Conceptual Framework
TableAgent未來將進一步融合非結構化數據的分析能力,并與公司自研的DingoDB多模向量數據庫、DataCanvas Alaya九章元識大模型聯合創新。未來,將在復雜分析任務、自動化、人機交互、智能體協同等方面進一步升級。
作者:楊健