澳鵬中國:預計2029年將跨入年營收10億人民幣大關
在AI與大模型數據服務這條賽道上,澳鵬Appen位于Everest Group 2024 AI/ML數據標注解決方案Peak Matrix領導者象限第一。2019年,澳鵬(中國)正式成立了,作為獨立于澳鵬Appen全球而在中國市場"白手起家"的澳鵬(中國),5年來闖過了中國AI數據"江湖",實現了在中國市場遙遙領先。
從 2020 年到 2023 年,5年來澳鵬的復合營收增長率是 90+%以上,2023年澳鵬(中國)實現了近2.5億人民幣營收,剛剛發布的2024年上半年實現了1.83億人民幣(2540萬美元)營收,遠超業界頭部友商。預計2024年將實現3.5~4億人民幣營收,YOY 的收入增長率 50%~60%以上,2029年將跨入年營收10億人民幣大關。澳鵬Appen全球高級副總裁、大中華及北亞區總經理田小鵬博士表示:“過去5年澳鵬(中國)的成功,可以總結為五大因素:順勢而為、創新為要、資源多樣化、洞察客戶需求、員工滿意與數據合規。
所謂AI數據,即經過人工或機器方式標注過的數據。澳鵬Appen全球高級副總裁、大中華及北亞區總經理田小鵬博士表示,澳鵬(中國)在近五年經歷了三大AI浪潮,同時收獲了AI數據在三個維度的爆發式裂變增長紅利:即從深度學習和機器學習浪潮、到自動駕駛浪潮、再到大模型的"滔天巨浪";相應帶來AI數據在數據規模、數據質量和數據復雜度等三個維度的裂變增長。
整體而言,經過了2019年到2024年的飛速發展,從深度學習/機器學習的精品式小模型訓練,到自動駕駛的規模化模型訓練和高頻次迭代,再到"百大"大模型和生成式 AI的規模化生產,引發了AI數據在規模、質量和復雜度三個維度的同時爆發式裂變,這對于AI數據服務商來說,既是機遇更是挑戰。
技術能力是傳統數據標注服務商長期缺失的核心能力。隨著AI數據在三個維度的爆發式裂變,單純依靠手工方式進行數據標注已經遠遠不能滿足需求,更無法持續降低數據標注項目的成本、提高數據標注的質量、加快數據的有效流轉。
在全球市場,2019年的時候也僅有包括澳鵬Appen在內的少數頂級AI數據標注服務商投資了自有的數據標注工程平臺。在2019年澳鵬(中國)成立的時候,當時除了從IBM等世界一流IT公司出來的幾位核心主創人員以及澳鵬Appen全球對中國團隊的初始投資外,可以說"一窮二白"。
與其它全球公司的中國分公司不同,由于數據行業的高度安全合規要求,澳鵬(中國)必須要獨立自主地在中國市場重建所有的資源、系統和流程。擯棄了"拿來主義",擺在澳鵬(中國)創始團隊面前的就是一張白紙,而團隊決定對技術進行"押注"式投入:目前公司有60余名全職資深研發技術工程師,其中一半專門聚焦于公司的技術平臺產品研發;另一半專門聚焦于和客戶在平臺數據接收和驗收的無縫對接。2023年,澳鵬(中國)投資近5000萬元用于技術和系統建設,包括對澳鵬MatrixGo企業級高精度數據標注平臺和大模型智能開發平臺的開發和增強。
今天的澳鵬(中國)有兩大拳頭產品:MatrixGo企業級高精度數據標注平臺和大模型智能開發平臺,并用這兩大平臺扛住了AI數據三維度裂變的"滾滾洪流"。澳鵬MatrixGo平臺和大模型智能開發平臺完全由澳鵬(中國)團隊在本地研發,擁有全部的知識產權和產品主導能力。
目前,澳鵬(中國)對MatrixGo平臺和大模型智能開發平臺每年迭代近百次,相當于每周都有產品更新,國內本地客戶的 AI 數據需求能夠快速反應到產品設計和開發中。同時澳鵬自主研發的預標注通用模型和交互式算法在數據標注任務中能產生25%至10倍以上的效率提升。
澳鵬大模型智能開發平臺是澳鵬(中國)在2023年全新開發的一個新技術工程平臺。針對大模型場景,澳鵬(中國)研發了專業的多模態數據標注工具、多輪對話數據標注工具、思維鏈數據標注工具、工具調用數據標注工具、知識庫數據標注工具等多種專業標注工具,支持RLHF、RLAIF、SFT等多種高質量數據的生產;該平臺對數據集管理、模型評估進行了針對性設計,通過A/B測試、紅藍對抗、排序打分等對大模型質量進行評估和分析;該平臺還集成了算力資源的調度和對接,可以進行算法的微調和部署,一站式完成大模型數據開發。
大模型智能開發平臺的快速上線讓澳鵬(中國)迅速抓住了大模型商機。2023年,澳鵬(中國)在中國、日本和韓國共拓展了82家新客戶,其中8家客戶帶來了20個大模型項目。2023年全年,澳鵬(中國)大模型業務營收接近3300萬,2024上半年更直逼5000萬,呈爆發式增長態勢。
澳鵬Appen全球高級副總裁、大中華及北亞區總經理田小鵬博士表示,正是依托澳鵬MatrixGO平臺和大模型智能開發平臺兩大平臺的技術能力,讓澳鵬(中國)在眾多數據項目中脫穎而出,也是獲得頭部客戶青睞的重要原因。
在自主創新方面,澳鵬(中國)目前累計申請的專利數達到24項(其中20個專利申請處于已遞交狀態);軟著登記共計62項,其中56項已獲證。澳鵬(中國)與很多高校和科研院所在計算機視覺、多模態算法、大模型等領域進行了項目合作,也與許多院校在人工智能訓練師、人工智能數據標注產業培養等方面深入合作。
正是因為堅持對核心技術進行布局,澳鵬(中國)成功入選艾瑞咨詢的《2024年中國AI基礎數據服務研究報告》,并作為行業標桿之一被列入AI基礎數據服務廠商案例。而在2024世界人工智能大會(WAIC2024)期間,澳鵬(中國)入選了億歐的2024 AI產業鏈圖譜,并被評選為2024中國AI企業商業落地基礎設施服務商Top20等。