"押注"技術(shù)平臺產(chǎn)品,澳鵬中國加速打造核心競爭力
2019年,澳鵬(中國)正式成立了,作為獨(dú)立于澳鵬Appen全球而在中國市場"白手起家"的澳鵬(中國),5年來闖過了中國AI數(shù)據(jù)"江湖",實(shí)現(xiàn)了在中國市場遙遙領(lǐng)先。
從 2020 年到 2023 年,5年來澳鵬的復(fù)合營收增長率是 90+%以上,2023年澳鵬(中國)實(shí)現(xiàn)了近2.5億人民幣營收,剛剛發(fā)布的2024年上半年實(shí)現(xiàn)了1.83億人民幣(2540萬美元)營收,遠(yuǎn)超業(yè)界頭部友商。預(yù)計(jì)2024年將實(shí)現(xiàn)3.5~4億人民幣營收,YOY 的收入增長率 50%~60%以上,2029年將跨入年?duì)I收10億人民幣大關(guān)。澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示:“過去5年澳鵬(中國)的成功,可以總結(jié)為五大因素:順勢而為、創(chuàng)新為要、資源多樣化、洞察客戶需求、員工滿意與數(shù)據(jù)合規(guī)。
所謂AI數(shù)據(jù),即經(jīng)過人工或機(jī)器方式標(biāo)注過的數(shù)據(jù)。澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,澳鵬(中國)在近五年經(jīng)歷了三大AI浪潮,同時收獲了AI數(shù)據(jù)在三個維度的爆發(fā)式裂變增長紅利:即從深度學(xué)習(xí)和機(jī)器學(xué)習(xí)浪潮、到自動駕駛浪潮、再到大模型的"滔天巨浪";相應(yīng)帶來AI數(shù)據(jù)在數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量和數(shù)據(jù)復(fù)雜度等三個維度的裂變增長。
整體而言,經(jīng)過了2019年到2024年的飛速發(fā)展,從深度學(xué)習(xí)/機(jī)器學(xué)習(xí)的精品式小模型訓(xùn)練,到自動駕駛的規(guī)?;P陀?xùn)練和高頻次迭代,再到"百大"大模型和生成式 AI的規(guī)?;a(chǎn),引發(fā)了AI數(shù)據(jù)在規(guī)模、質(zhì)量和復(fù)雜度三個維度的同時爆發(fā)式裂變,這對于AI數(shù)據(jù)服務(wù)商來說,既是機(jī)遇更是挑戰(zhàn)。
技術(shù)能力是傳統(tǒng)數(shù)據(jù)標(biāo)注服務(wù)商長期缺失的核心能力。隨著AI數(shù)據(jù)在三個維度的爆發(fā)式裂變,單純依靠手工方式進(jìn)行數(shù)據(jù)標(biāo)注已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足需求,更無法持續(xù)降低數(shù)據(jù)標(biāo)注項(xiàng)目的成本、提高數(shù)據(jù)標(biāo)注的質(zhì)量、加快數(shù)據(jù)的有效流轉(zhuǎn)。
在全球市場,2019年的時候也僅有包括澳鵬Appen在內(nèi)的少數(shù)頂級AI數(shù)據(jù)標(biāo)注服務(wù)商投資了自有的數(shù)據(jù)標(biāo)注工程平臺。在2019年澳鵬(中國)成立的時候,當(dāng)時除了從IBM等世界一流IT公司出來的幾位核心主創(chuàng)人員以及澳鵬Appen全球?qū)χ袊鴪F(tuán)隊(duì)的初始投資外,可以說"一窮二白"。
與其它全球公司的中國分公司不同,由于數(shù)據(jù)行業(yè)的高度安全合規(guī)要求,澳鵬(中國)必須要獨(dú)立自主地在中國市場重建所有的資源、系統(tǒng)和流程。擯棄了"拿來主義",擺在澳鵬(中國)創(chuàng)始團(tuán)隊(duì)面前的就是一張白紙,而團(tuán)隊(duì)決定對技術(shù)進(jìn)行"押注"式投入:目前公司有60余名全職資深研發(fā)技術(shù)工程師,其中一半專門聚焦于公司的技術(shù)平臺產(chǎn)品研發(fā);另一半專門聚焦于和客戶在平臺數(shù)據(jù)接收和驗(yàn)收的無縫對接。2023年,澳鵬(中國)投資近5000萬元用于技術(shù)和系統(tǒng)建設(shè),包括對澳鵬MatrixGo企業(yè)級高精度數(shù)據(jù)標(biāo)注平臺和大模型智能開發(fā)平臺的開發(fā)和增強(qiáng)。
今天的澳鵬(中國)有兩大拳頭產(chǎn)品:MatrixGo企業(yè)級高精度數(shù)據(jù)標(biāo)注平臺和大模型智能開發(fā)平臺,并用這兩大平臺扛住了AI數(shù)據(jù)三維度裂變的"滾滾洪流"。澳鵬MatrixGo平臺和大模型智能開發(fā)平臺完全由澳鵬(中國)團(tuán)隊(duì)在本地研發(fā),擁有全部的知識產(chǎn)權(quán)和產(chǎn)品主導(dǎo)能力。
目前,澳鵬(中國)對MatrixGo平臺和大模型智能開發(fā)平臺每年迭代近百次,相當(dāng)于每周都有產(chǎn)品更新,國內(nèi)本地客戶的 AI 數(shù)據(jù)需求能夠快速反應(yīng)到產(chǎn)品設(shè)計(jì)和開發(fā)中。同時澳鵬自主研發(fā)的預(yù)標(biāo)注通用模型和交互式算法在數(shù)據(jù)標(biāo)注任務(wù)中能產(chǎn)生25%至10倍以上的效率提升。
澳鵬大模型智能開發(fā)平臺是澳鵬(中國)在2023年全新開發(fā)的一個新技術(shù)工程平臺。針對大模型場景,澳鵬(中國)研發(fā)了專業(yè)的多模態(tài)數(shù)據(jù)標(biāo)注工具、多輪對話數(shù)據(jù)標(biāo)注工具、思維鏈數(shù)據(jù)標(biāo)注工具、工具調(diào)用數(shù)據(jù)標(biāo)注工具、知識庫數(shù)據(jù)標(biāo)注工具等多種專業(yè)標(biāo)注工具,支持RLHF、RLAIF、SFT等多種高質(zhì)量數(shù)據(jù)的生產(chǎn);該平臺對數(shù)據(jù)集管理、模型評估進(jìn)行了針對性設(shè)計(jì),通過A/B測試、紅藍(lán)對抗、排序打分等對大模型質(zhì)量進(jìn)行評估和分析;該平臺還集成了算力資源的調(diào)度和對接,可以進(jìn)行算法的微調(diào)和部署,一站式完成大模型數(shù)據(jù)開發(fā)。
大模型智能開發(fā)平臺的快速上線讓澳鵬(中國)迅速抓住了大模型商機(jī)。2023年,澳鵬(中國)在中國、日本和韓國共拓展了82家新客戶,其中8家客戶帶來了20個大模型項(xiàng)目。2023年全年,澳鵬(中國)大模型業(yè)務(wù)營收接近3300萬,2024上半年更直逼5000萬,呈爆發(fā)式增長態(tài)勢。
整個AI數(shù)據(jù)標(biāo)注行業(yè)在過去5年經(jīng)歷了全面重塑。2019年的數(shù)據(jù)標(biāo)注市場,仍處于野蠻生長狀態(tài),主要以勞動力密集型企業(yè)為主,其競爭優(yōu)勢主要體現(xiàn)在低價(jià)格和傳統(tǒng)渠道,不少企業(yè)在四五線城市建立了低成本的數(shù)據(jù)標(biāo)注基地。當(dāng)時的數(shù)據(jù)標(biāo)注員幾乎零門檻,整個行業(yè)良莠不齊,惡意競爭、低價(jià)競爭等種種亂象叢生,可以用"江湖"一詞來形容當(dāng)時的市場狀態(tài)。
2019年澳鵬(中國)成立的時候,當(dāng)時已經(jīng)成立23年、上市4年的澳鵬Appen全球擁有百萬眾包資源,支持235+種語言和方言,具備成熟的眾包人力資源體系和項(xiàng)目管理能力。但對于2019年僅有不到10個人的澳鵬(中國)初創(chuàng)團(tuán)隊(duì)來說,這些來自頂級IT公司的專業(yè)精英人才,卻要面對當(dāng)時AI數(shù)據(jù)標(biāo)注服務(wù)市場的各種亂象。
針對處于初級階段的中國AI數(shù)據(jù)標(biāo)注市場,澳鵬(中國)投入了大量時間和精力進(jìn)行眾包資源的招募、培訓(xùn)、流程建設(shè)和管理,特別是在二線城市創(chuàng)造性地建立了自營數(shù)據(jù)服務(wù)交付基地,通過自有專職人員+眾包資源的方式,適配了中國數(shù)據(jù)標(biāo)注行業(yè)的初級階段。
澳鵬(中國)非常重視AI數(shù)據(jù)服務(wù)項(xiàng)目的安全和隱私保護(hù),不僅在中國的各個自營基地均已獲得ISO 27001、27701、9001、14001、45001、ISO 37301等安全及管理領(lǐng)域國際認(rèn)證,還與客戶、眾包資源等100%簽訂NDA協(xié)議。此外,根據(jù)項(xiàng)目對數(shù)據(jù)的安全級別、隱私安全等要求,澳鵬(中國)為客戶定制專屬項(xiàng)目室,包括安全屋、網(wǎng)絡(luò)專線、信息安全管控等,特殊項(xiàng)目要求員工在進(jìn)入項(xiàng)目前還需要上交手機(jī)。正是因?yàn)榘涅i(中國)不遺余力地建設(shè)數(shù)據(jù)安全與隱私保護(hù),才在市場競爭中獲得了頭部客戶的青睞。
在澳鵬(中國)創(chuàng)業(yè)的5年中,經(jīng)歷了中國AI數(shù)據(jù)標(biāo)注行業(yè)從初期亂象走向規(guī)范化發(fā)展之路,在這期間還經(jīng)歷了三年疫情這樣百年未遇的公共事件,這些都是澳鵬(中國)創(chuàng)業(yè)團(tuán)隊(duì)在創(chuàng)業(yè)之初都始料未及的挑戰(zhàn)。從"科技向善"的公司理念出發(fā),澳鵬(中國)并沒有因?yàn)锳I數(shù)據(jù)"江湖"的亂象而放棄原則,而是知行合一地實(shí)踐了這一理念,杜絕各種"踩紅線"行為,為整個行業(yè)樹立科技向善的標(biāo)桿,引領(lǐng)AI數(shù)據(jù)標(biāo)注行業(yè)走出無序和不良競爭亂象,走向更加光明的未來。