StarRocks Summit Asia 2024 圓滿落幕,湖倉一體再進化!
12 月 7 日,StarRocks Summit Asia 2024 于北京圓滿落幕。本次峰會以"Lakehouse Is All You Need"為主題,匯聚行業領袖和技術專家,共同探討 Data+AI 的創新與行業實踐。
技術引領,構筑湖倉新范式
StarRocks TSC Member,鏡舟科技 CTO 張友東
StarRocks TSC Member,鏡舟科技 CTO 張友東以“Lakehouse Is All You Need”為題開場演講,深入解讀 Lakehouse 的演進趨勢以及 StarRocks 在 Lakehouse方向的技術深耕與創新。
“StarRocks 社區正以前所未有的速度發展,” 張友東展示了一組數據:“在過去三年里,我們在 GitHub 上獲得超過 9300 顆 star,活躍貢獻者超過 400 人,超過 450+ 市值 10 億美金以上的企業在生產環境使用 StarRocks,各行業對 StarRocks 的認可與期待與日俱增。”
StarRocks 用戶及貢獻者致謝
他詳細介紹了 StarRocks 在多個技術方向上的突破:
StarRocks 通過創新的向量化執行引擎和智能查詢優化技術,將分析性能提升至行業領先水平,同時,在 3.X 版本中實現了對數據湖的原生支持,使得企業可以在不遷移數據的情況下進行高效分析。
此外,StarRocks 在半結構化、非結構化數據分析方面取得顯著進展。Flat JSON 兼顧半結構化數據分析的靈活性與查詢性能,性能提升達到數十倍;文本檢索、向量檢索使得 RAG 應用構建過程簡單高效,更好地支撐 AI 應用場景。
“Lakehouse 是未來所有數據分析的基礎”,張友東強調,Lakehouse 是一種新的架構范式,結合數據湖和數據倉庫的優勢,提供統一的數據存儲,并基于一份數據同時支持企業 BI 和 AI 的應用場景,實現 One data,all analytics 的業務價值。
通過與 Apache Iceberg、Apache Paimon、Apache Hive 等開放數據湖的深度集成,StarRocks 正在構建完善的數據湖生態,為用戶提供極速統一的湖倉分析體驗。
商業突破:以終為始的商業選擇
鏡舟科技 CEO 孫文現
鏡舟科技 CEO 孫文現以《鏡舟數據庫與 Lakehouse:面向全球,挖掘商業增長新潛力》為題,分享了這兩年來的商業化心路歷程。
在商業化道路上,鏡舟科技堅持“為客戶創造更大的業務成功”的理念,付費客戶數已突破 120 家,鏡舟科技的 ARR(年經常性收入)連續三年翻倍增長,NRR(凈留存率)保持在 130%。2024 年新增中信銀行、民生銀行、廣發證券等多家重量級客戶,充分證明了鏡舟數據庫在企業級市場的競爭力。
談到增長背后的戰略,孫文現闡述了一個商業上的轉變:即以終為始的商業選擇,以構建一家能夠長期經營的商業化公司為目標,打造能夠滿足致勝場景、帶來商業化價值的產品。
孫文現也分享了鏡舟的奮斗目標:“以商業成功為伴,面向星辰大海,打造一份長久奮斗的事業。”
生態共融,與行業攜手共進
Apache Iceberg PMC member 顧宇飛
Apache Iceberg PMC member 顧宇飛帶來了《The Evolving Landscape of Iceberg REST Catalog》的精彩分享。“開放的生態系統是推動技術創新的關鍵。”顧宇飛表示,REST Catalog 的演進為數據湖提供了更靈活、更高效的訪問機制。StarRocks 對 Iceberg 的原生支持,不僅提升了查詢性能,更為企業構建現代化數據架構提供了堅實基礎。
阿里云計算平臺開源 OLAP 負責人范振(辰繁)
“StarRocks 是最適合 Paimon 湖格式的 Lakehouse 開源引擎。”阿里云計算平臺開源 OLAP 負責人范振(辰繁)介紹,“在阿里集團的數據湖倉實踐分享中,StarRocks 展現了卓越的查詢性能和系統穩定性,在與 Paimon 的協同場景中,我們實現了流批一體的數據處理能力,分析性能有 13 倍提升。目前,這一解決方案已在阿里集團內部廣泛應用,也正通過阿里云向更多企業客戶提供服務。”
應用實踐,讓價值落地
微眾銀行大數據工程師,StarRocks 平臺負責人林俊鋒
客戶代表、微眾銀行大數據工程師,StarRocks 平臺負責人林俊鋒分享了其數字化轉型實踐。“在用戶畫像、人群圈選等大數據量分析場景中,StarRocks 展現出卓越性能,查詢速率相比原有 Trino 方案提升 235%。”林俊鋒介紹,“目前 StarRocks 已支持行內 5 個以上部門的 10 多個應用場景,結合自研的 Exchangis 數據交換平臺,實現了跨集群數據互通、靈活的權限管理等特性。”
騰訊音樂專家工程師,業務運維中心總監曹鳳龍
騰訊音樂集團(TME)專家工程師,業務運維中心總監曹鳳龍詳細闡述了其數據倉庫的演進歷程。“從 2018 年的 Druid 到如今的 StarRocks,StarRocks 的存算分離架構為我們帶來了顯著收益:組件更精簡、維護更便捷,數據存儲成本降低 50%,同時支持智能的冷熱數據管理。”
在具體業務場景中,通過存儲桶打散、表結構優化、物化視圖等技術手段,大表查詢響應時間從 30.97 秒降至 0.08 秒,查詢秒級響應率達到 99%。目前,StarRocks 集群支撐著 QQ 音樂、全民 K 歌等多個音樂平臺的數據分析需求。
未來可期
全天共 30 余個演講議題,匯聚了 7 大行業,包括小紅書、騰訊游戲、Shopee、愛奇藝、得物、杭銀消費金融、理想汽車、唯品會、微信、西南證券等多家標桿企業。這些企業用自身實踐說明,StarRocks 正在通過技術創新推動各行業數字化轉型,在降本增效的同時,為企業創造新的業務價值。
通過與合作伙伴和用戶的深度互動,StarRocks 社區正在構建一個更開放、更繁榮的數據技術生態。隨著數字化轉型深入推進,StarRocks 將繼續發揮技術引領作用,助力更多企業實現數據價值最大化。
隨著峰會落幕,StarRocks 在湖倉技術領域的愿景更加清晰:以開放、創新的技術理念,攜手合作伙伴共建現代化數據分析生態,為企業數字化轉型提供強有力的支撐。正如張友東在演講結束時所說:“Lakehouse 不僅是技術演進的方向,更是釋放數據價值的關鍵,Lakehouse is ALL you need,StarRocks will power your lakehouse!”