踐行“科技向善”,澳鵬中國躬身入局AI數據江湖引領行業有序競爭
在AI與大模型數據服務這條賽道上,澳鵬Appen位于Everest Group 2024 AI/ML數據標注解決方案Peak Matrix領導者象限第一。從 2020 年到 2023 年,5年來澳鵬的復合營收增長率是 90+%以上,2023年澳鵬(中國)實現了近2.5億人民幣營收,剛剛發布的2024年上半年實現了1.83億人民幣(2540萬美元)營收,遠超業界頭部友商。預計2024年將實現3.5~4億人民幣營收,YOY 的收入增長率 50%~60%以上,2029年將跨入年營收10億人民幣大關。
作為獨立于澳鵬Appen全球而在中國市場"白手起家"的,5年來澳鵬(中國)闖過了中國AI數據"江湖",實現了在中國市場遙遙領先。澳鵬Appen全球高級副總裁、大中華及北亞區總經理田小鵬博士表示:“過去5年澳鵬(中國)的成功,可以總結為五大因素:順勢而為、創新為要、資源多樣化、洞察客戶需求、員工滿意與數據合規。
所謂AI數據,即經過人工或機器方式標注過的數據。澳鵬Appen全球高級副總裁、大中華及北亞區總經理田小鵬博士表示,澳鵬(中國)在近五年經歷了三大AI浪潮,同時收獲了AI數據在三個維度的爆發式裂變增長紅利:即從深度學習和機器學習浪潮、到自動駕駛浪潮、再到大模型的"滔天巨浪";相應帶來AI數據在數據規模、數據質量和數據復雜度等三個維度的裂變增長。
整體而言,經過了2019年到2024年的飛速發展,從深度學習/機器學習的精品式小模型訓練,到自動駕駛的規模化模型訓練和高頻次迭代,再到"百大"大模型和生成式 AI的規模化生產,引發了AI數據在規模、質量和復雜度三個維度的同時爆發式裂變,這對于AI數據服務商來說,既是機遇更是挑戰。
技術能力是傳統數據標注服務商長期缺失的核心能力。隨著AI數據在三個維度的爆發式裂變,單純依靠手工方式進行數據標注已經遠遠不能滿足需求,更無法持續降低數據標注項目的成本、提高數據標注的質量、加快數據的有效流轉。
在全球市場,2019年的時候也僅有包括澳鵬Appen在內的少數頂級AI數據標注服務商投資了自有的數據標注工程平臺。在2019年澳鵬(中國)成立的時候,當時除了從IBM等世界一流IT公司出來的幾位核心主創人員以及澳鵬Appen全球對中國團隊的初始投資外,可以說"一窮二白"。
與其它全球公司的中國分公司不同,由于數據行業的高度安全合規要求,澳鵬(中國)必須要獨立自主地在中國市場重建所有的資源、系統和流程。擯棄了"拿來主義",擺在澳鵬(中國)創始團隊面前的就是一張白紙,而團隊決定對技術進行"押注"式投入:目前公司有60余名全職資深研發技術工程師,其中一半專門聚焦于公司的技術平臺產品研發;另一半專門聚焦于和客戶在平臺數據接收和驗收的無縫對接。2023年,澳鵬(中國)投資近5000萬元用于技術和系統建設,包括對澳鵬MatrixGo企業級高精度數據標注平臺和大模型智能開發平臺的開發和增強。
今天的澳鵬(中國)有兩大拳頭產品:MatrixGo企業級高精度數據標注平臺和大模型智能開發平臺,并用這兩大平臺扛住了AI數據三維度裂變的"滾滾洪流"。澳鵬MatrixGo平臺和大模型智能開發平臺完全由澳鵬(中國)團隊在本地研發,擁有全部的知識產權和產品主導能力。
整個AI數據標注行業在過去5年經歷了全面重塑。2019年的數據標注市場,仍處于野蠻生長狀態,主要以勞動力密集型企業為主,其競爭優勢主要體現在低價格和傳統渠道,不少企業在四五線城市建立了低成本的數據標注基地。當時的數據標注員幾乎零門檻,整個行業良莠不齊,惡意競爭、低價競爭等種種亂象叢生,可以用"江湖"一詞來形容當時的市場狀態。
2019年澳鵬(中國)成立的時候,當時已經成立23年、上市4年的澳鵬Appen全球擁有百萬眾包資源,支持235+種語言和方言,具備成熟的眾包人力資源體系和項目管理能力。但對于2019年僅有不到10個人的澳鵬(中國)初創團隊來說,這些來自頂級IT公司的專業精英人才,卻要面對當時AI數據標注服務市場的各種亂象。
針對處于初級階段的中國AI數據標注市場,澳鵬(中國)投入了大量時間和精力進行眾包資源的招募、培訓、流程建設和管理,特別是在二線城市創造性地建立了自營數據服務交付基地,通過自有專職人員+眾包資源的方式,適配了中國數據標注行業的初級階段。
所謂自營數據服務交付基地,即在無錫、大連、重慶等地租用辦公樓,招聘專職數據標注服務員工入駐辦公,同時為項目提供安全封閉的項目辦公空間,供團隊與客戶共同完成高保密性的項目。而在項目管理方面,面對數據標注項目節奏快、數據需求量不穩定、數據規則不斷變化等挑戰,澳鵬(中國)從多個維度提升項目管理能力,保障對客戶項目交付的穩定性。
在澳鵬(中國)創業的5年中,經歷了中國AI數據標注行業從初期亂象走向規范化發展之路,在這期間還經歷了三年疫情這樣百年未遇的公共事件,這些都是澳鵬(中國)創業團隊在創業之初都始料未及的挑戰。
例如,有的客戶在項目進行過程中或項目結束就破產了,或因各種原因出現賴賬,導致無法收回上百萬的項目款或者打折結算,而與此同時很多眾包人員的工作已經在進行中或完成了,澳鵬(中國)團隊經過慎重考慮選擇自行墊款結算所有眾包人員和BPO商的項目款,因為對于很多地方上的眾包和 BPO人員來說,項目款是維持生計的重要來源,特別在疫情期間甚至是唯一生計來源。
從"科技向善"的公司理念出發,澳鵬(中國)并沒有因為AI數據"江湖"的亂象而放棄原則,而是知行合一地實踐了這一理念,杜絕各種"踩紅線"行為,為整個行業樹立科技向善的標桿,引領AI數據標注行業走出無序和不良競爭亂象,走向更加光明的未來。
澳鵬(中國)非常重視AI數據服務項目的安全和隱私保護,不僅在中國的各個自營基地均已獲得ISO 27001、27701、9001、14001、45001、ISO 37301等安全及管理領域國際認證,還與客戶、眾包資源等100%簽訂NDA協議。此外,根據項目對數據的安全級別、隱私安全等要求,澳鵬(中國)為客戶定制專屬項目室,包括安全屋、網絡專線、信息安全管控等,特殊項目要求員工在進入項目前還需要上交手機。正是因為澳鵬(中國)不遺余力地建設數據安全與隱私保護,才在市場競爭中獲得了頭部客戶的青睞。