澳鵬中國(guó)將繼續(xù)開(kāi)拓大模型和中國(guó)企業(yè)出海兩大市場(chǎng)
所謂AI數(shù)據(jù),即經(jīng)過(guò)人工或機(jī)器方式標(biāo)注過(guò)的數(shù)據(jù)。澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,澳鵬(中國(guó))在近五年經(jīng)歷了三大AI浪潮,同時(shí)收獲了AI數(shù)據(jù)在三個(gè)維度的爆發(fā)式裂變?cè)鲩L(zhǎng)紅利:即從深度學(xué)習(xí)和機(jī)器學(xué)習(xí)浪潮、到自動(dòng)駕駛浪潮、再到大模型的"滔天巨浪";相應(yīng)帶來(lái)AI數(shù)據(jù)在數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量和數(shù)據(jù)復(fù)雜度等三個(gè)維度的裂變?cè)鲩L(zhǎng)。
整體而言,經(jīng)過(guò)了2019年到2024年的飛速發(fā)展,從深度學(xué)習(xí)/機(jī)器學(xué)習(xí)的精品式小模型訓(xùn)練,到自動(dòng)駕駛的規(guī)模化模型訓(xùn)練和高頻次迭代,再到"百大"大模型和生成式 AI的規(guī)模化生產(chǎn),引發(fā)了AI數(shù)據(jù)在規(guī)模、質(zhì)量和復(fù)雜度三個(gè)維度的同時(shí)爆發(fā)式裂變,這對(duì)于AI數(shù)據(jù)服務(wù)商來(lái)說(shuō),既是機(jī)遇更是挑戰(zhàn)。
技術(shù)能力是傳統(tǒng)數(shù)據(jù)標(biāo)注服務(wù)商長(zhǎng)期缺失的核心能力。隨著AI數(shù)據(jù)在三個(gè)維度的爆發(fā)式裂變,單純依靠手工方式進(jìn)行數(shù)據(jù)標(biāo)注已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足需求,更無(wú)法持續(xù)降低數(shù)據(jù)標(biāo)注項(xiàng)目的成本、提高數(shù)據(jù)標(biāo)注的質(zhì)量、加快數(shù)據(jù)的有效流轉(zhuǎn)。
在全球市場(chǎng),2019年的時(shí)候也僅有包括澳鵬Appen在內(nèi)的少數(shù)頂級(jí)AI數(shù)據(jù)標(biāo)注服務(wù)商投資了自有的數(shù)據(jù)標(biāo)注工程平臺(tái)。在2019年澳鵬(中國(guó))成立的時(shí)候,當(dāng)時(shí)除了從IBM等世界一流IT公司出來(lái)的幾位核心主創(chuàng)人員以及澳鵬Appen全球?qū)χ袊?guó)團(tuán)隊(duì)的初始投資外,可以說(shuō)"一窮二白"。
與其它全球公司的中國(guó)分公司不同,由于數(shù)據(jù)行業(yè)的高度安全合規(guī)要求,澳鵬(中國(guó))必須要獨(dú)立自主地在中國(guó)市場(chǎng)重建所有的資源、系統(tǒng)和流程。擯棄了"拿來(lái)主義",擺在澳鵬(中國(guó))創(chuàng)始團(tuán)隊(duì)面前的就是一張白紙,而團(tuán)隊(duì)決定對(duì)技術(shù)進(jìn)行"押注"式投入:目前公司有60余名全職資深研發(fā)技術(shù)工程師,其中一半專門聚焦于公司的技術(shù)平臺(tái)產(chǎn)品研發(fā);另一半專門聚焦于和客戶在平臺(tái)數(shù)據(jù)接收和驗(yàn)收的無(wú)縫對(duì)接。2023年,澳鵬(中國(guó))投資近5000萬(wàn)元用于技術(shù)和系統(tǒng)建設(shè),包括對(duì)澳鵬MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)和大模型智能開(kāi)發(fā)平臺(tái)的開(kāi)發(fā)和增強(qiáng)。
今天的澳鵬(中國(guó))有兩大拳頭產(chǎn)品:MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)和大模型智能開(kāi)發(fā)平臺(tái),并用這兩大平臺(tái)扛住了AI數(shù)據(jù)三維度裂變的"滾滾洪流"。澳鵬MatrixGo平臺(tái)和大模型智能開(kāi)發(fā)平臺(tái)完全由澳鵬(中國(guó))團(tuán)隊(duì)在本地研發(fā),擁有全部的知識(shí)產(chǎn)權(quán)和產(chǎn)品主導(dǎo)能力。
澳鵬大模型智能開(kāi)發(fā)平臺(tái)是澳鵬(中國(guó))在2023年全新開(kāi)發(fā)的一個(gè)新技術(shù)工程平臺(tái)。針對(duì)大模型場(chǎng)景,澳鵬(中國(guó))研發(fā)了專業(yè)的多模態(tài)數(shù)據(jù)標(biāo)注工具、多輪對(duì)話數(shù)據(jù)標(biāo)注工具、思維鏈數(shù)據(jù)標(biāo)注工具、工具調(diào)用數(shù)據(jù)標(biāo)注工具、知識(shí)庫(kù)數(shù)據(jù)標(biāo)注工具等多種專業(yè)標(biāo)注工具,支持RLHF、RLAIF、SFT等多種高質(zhì)量數(shù)據(jù)的生產(chǎn);該平臺(tái)對(duì)數(shù)據(jù)集管理、模型評(píng)估進(jìn)行了針對(duì)性設(shè)計(jì),通過(guò)A/B測(cè)試、紅藍(lán)對(duì)抗、排序打分等對(duì)大模型質(zhì)量進(jìn)行評(píng)估和分析;該平臺(tái)還集成了算力資源的調(diào)度和對(duì)接,可以進(jìn)行算法的微調(diào)和部署,一站式完成大模型數(shù)據(jù)開(kāi)發(fā)。
大模型智能開(kāi)發(fā)平臺(tái)的快速上線讓澳鵬(中國(guó))迅速抓住了大模型商機(jī)。2023年,澳鵬(中國(guó))在中國(guó)、日本和韓國(guó)共拓展了82家新客戶,其中8家客戶帶來(lái)了20個(gè)大模型項(xiàng)目。2023年全年,澳鵬(中國(guó))大模型業(yè)務(wù)營(yíng)收接近3300萬(wàn),2024上半年更直逼5000萬(wàn),呈爆發(fā)式增長(zhǎng)態(tài)勢(shì)。
針對(duì)處于初級(jí)階段的中國(guó)AI數(shù)據(jù)標(biāo)注市場(chǎng),澳鵬(中國(guó))投入了大量時(shí)間和精力進(jìn)行眾包資源的招募、培訓(xùn)、流程建設(shè)和管理,特別是在二線城市創(chuàng)造性地建立了自營(yíng)數(shù)據(jù)服務(wù)交付基地,通過(guò)自有專職人員+眾包資源的方式,適配了中國(guó)數(shù)據(jù)標(biāo)注行業(yè)的初級(jí)階段。
所謂自營(yíng)數(shù)據(jù)服務(wù)交付基地,即在無(wú)錫、大連、重慶等地租用辦公樓,招聘專職數(shù)據(jù)標(biāo)注服務(wù)員工入駐辦公,同時(shí)為項(xiàng)目提供安全封閉的項(xiàng)目辦公空間,供團(tuán)隊(duì)與客戶共同完成高保密性的項(xiàng)目。而在項(xiàng)目管理方面,面對(duì)數(shù)據(jù)標(biāo)注項(xiàng)目節(jié)奏快、數(shù)據(jù)需求量不穩(wěn)定、數(shù)據(jù)規(guī)則不斷變化等挑戰(zhàn),澳鵬(中國(guó))從多個(gè)維度提升項(xiàng)目管理能力,保障對(duì)客戶項(xiàng)目交付的穩(wěn)定性。
在過(guò)去5年中,出現(xiàn)了大量不確定性的事件,包括全球疫情和中美科技競(jìng)爭(zhēng),但也幸運(yùn)地趕上了自動(dòng)駕駛和大模型浪潮以及由此引發(fā)的AI數(shù)據(jù)三維度爆發(fā)式裂變。由于澳鵬(中國(guó))堅(jiān)持以科技創(chuàng)新立身,堅(jiān)定投入自有技術(shù)平臺(tái),依靠更高效率、更高質(zhì)量、更高安全性的技術(shù)平臺(tái)和人力資源優(yōu)勢(shì),在市場(chǎng)中站穩(wěn)了腳跟。
過(guò)去5年澳鵬(中國(guó))的成功,可以總結(jié)為五大因素:順勢(shì)而為、創(chuàng)新為要、資源多樣化、洞察客戶需求、員工滿意與數(shù)據(jù)合規(guī)。
目前,澳鵬(中國(guó))客戶主要分布在互聯(lián)網(wǎng)/電商企業(yè)、算法科技公司、自動(dòng)駕駛等行業(yè),客戶包括國(guó)內(nèi)前十大汽車公司、前十大互聯(lián)網(wǎng)公司和前四大移動(dòng)互聯(lián)網(wǎng)公司等。鑒于AI數(shù)據(jù)與AI模型越來(lái)越密不可分,澳鵬(中國(guó))為頭部客戶配置了專屬的客戶經(jīng)理,從而深入理解客戶業(yè)務(wù),并根據(jù)客戶業(yè)務(wù)發(fā)展,提前準(zhǔn)備相應(yīng)的資源和能力,靈活及時(shí)滿足客戶需求。
例如,在服務(wù)某中國(guó)頭部社交媒體海外實(shí)體公司的過(guò)程中,雙方在大模型文本生成和多模態(tài)數(shù)據(jù)處理等領(lǐng)域展開(kāi)了深入合作。澳鵬(中國(guó))在東南亞地區(qū)建立了多個(gè)大模型標(biāo)注的基地,招募了當(dāng)?shù)貎?yōu)秀的本科、碩士畢業(yè)生以及部分垂直領(lǐng)域的專家。借助海外專業(yè)且穩(wěn)定的人力資源以及澳鵬豐富的管理經(jīng)驗(yàn),為該客戶實(shí)現(xiàn)了大模型高精度+高一致率的標(biāo)注結(jié)果。目前該客戶大模型的業(yè)務(wù)量已經(jīng)躋身澳鵬(中國(guó))前三,成為重要的業(yè)務(wù)支柱。
在下一個(gè)5年到來(lái)之際,澳鵬(中國(guó))又站在了一個(gè)新的起點(diǎn)。
首先,澳鵬(中國(guó))將持續(xù)投入兩大平臺(tái)的研發(fā),不斷提高產(chǎn)品力,從而提升產(chǎn)品在整個(gè)營(yíng)收中的占比。在數(shù)據(jù)標(biāo)注服務(wù)外,客戶對(duì)于數(shù)據(jù)處理平臺(tái)、數(shù)據(jù)處理工具和數(shù)據(jù)處理算法有大量需求。為此,澳鵬(中國(guó))投入產(chǎn)品研發(fā),打造可商業(yè)化的數(shù)據(jù)標(biāo)注平臺(tái)、多模態(tài)數(shù)據(jù)標(biāo)注工具、成品數(shù)據(jù)庫(kù)產(chǎn)品以及覆蓋數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)脫敏、數(shù)據(jù)挖掘等不同階段的自動(dòng)化算法產(chǎn)品,為客戶提供全面的產(chǎn)品矩陣。
其次,澳鵬(中國(guó))將繼續(xù)開(kāi)拓大模型和中國(guó)企業(yè)出海兩大市場(chǎng)。在大模型市場(chǎng),科技企業(yè)對(duì)于AI/LLM的研發(fā)投入巨大,迫切需要具有的高質(zhì)量訓(xùn)練數(shù)據(jù)交付能力的公司,幫助更好、更快地處理模型訓(xùn)練數(shù)據(jù),而澳鵬(中國(guó))已經(jīng)構(gòu)建了強(qiáng)大的競(jìng)爭(zhēng)力。
在中國(guó)企業(yè)出海市場(chǎng),企業(yè)出海首先面對(duì)的就是語(yǔ)言和全球資源的挑戰(zhàn),澳鵬在全球170多個(gè)國(guó)家擁有290多種語(yǔ)言的資源,同時(shí)在菲律賓、越南、美國(guó)等地區(qū)擁有大型交付中心,這是澳鵬在行業(yè)內(nèi)獨(dú)一無(wú)二的優(yōu)勢(shì),可以很好地支持國(guó)內(nèi)企業(yè)出海拓展海外市場(chǎng)業(yè)務(wù)。
針對(duì)AI技術(shù)深入行業(yè)應(yīng)用帶來(lái)的長(zhǎng)期需求,包括代碼、醫(yī)療、教育、金融、工業(yè)、汽車等行業(yè),澳鵬(中國(guó))已經(jīng)儲(chǔ)備了超過(guò)1500人的高學(xué)歷專業(yè)人士,而且還在無(wú)錫、大連、重慶等多地的交付基地同時(shí)招聘招募專業(yè)人員,從而打造全國(guó)性的專業(yè)資源能力池。
艾瑞咨詢預(yù)計(jì)到2028年,中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模將達(dá)170億元,未來(lái)五年的復(fù)合增長(zhǎng)率為30.4%。澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,有信心在5年后實(shí)現(xiàn)12億人民幣的年?duì)I收,以至少27.8%+的高速?gòu)?fù)合增長(zhǎng)率,成為中國(guó)及亞洲區(qū)AI數(shù)據(jù)專業(yè)服務(wù)行業(yè)的領(lǐng)軍服務(wù)商。
其中,產(chǎn)品和服務(wù)兩條線更均衡發(fā)展,產(chǎn)品項(xiàng)目的占比將從2024年的4%至少提升到2029年的12%;進(jìn)一步加速開(kāi)拓亞洲市場(chǎng),占比將從 2024年10%至少提升到2029年15%,澳鵬中國(guó)5 年后將完成亞洲、歐洲、非洲、中東、南美、北美等地所有AI數(shù)據(jù)服務(wù)的全覆蓋。
目前,在AI與大模型數(shù)據(jù)服務(wù)這條賽道上,澳鵬Appen位于Everest Group 2024 AI/ML數(shù)據(jù)標(biāo)注解決方案Peak Matrix領(lǐng)導(dǎo)者象限第一。作為獨(dú)立于澳鵬Appen全球而在中國(guó)市場(chǎng)"白手起家"的澳鵬(中國(guó)),5年來(lái)闖過(guò)了中國(guó)AI數(shù)據(jù)"江湖",實(shí)現(xiàn)了在中國(guó)市場(chǎng)遙遙領(lǐng)先。
從 2020 年到 2023 年,5年來(lái)澳鵬的復(fù)合營(yíng)收增長(zhǎng)率是 90+%以上,2023年澳鵬(中國(guó))實(shí)現(xiàn)了近2.5億人民幣營(yíng)收,剛剛發(fā)布的2024年上半年實(shí)現(xiàn)了1.83億人民幣(2540萬(wàn)美元)營(yíng)收,遠(yuǎn)超業(yè)界頭部友商。預(yù)計(jì)2024年將實(shí)現(xiàn)3.5~4億人民幣營(yíng)收,YOY 的收入增長(zhǎng)率 50%~60%以上,2029年將跨入年?duì)I收10億人民幣大關(guān)。