国产AV激情无码久久,精品国产YW在线观看,亚洲国产欧美日韩欧美2018,中文字幕一区二区三区在线不卡

Greenplum 重回閉源?國(guó)產(chǎn)開(kāi)源數(shù)倉(cāng) CloudberryDB 助力企業(yè)平滑遷移

2024-06-21 15:05   來(lái)源: 大眾時(shí)報(bào)網(wǎng)

      近期,知名開(kāi)源數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目 Greenplum 的 GitHub 倉(cāng)庫(kù)被突然歸檔,并將訪問(wèn)權(quán)限修改為只讀,引發(fā)了數(shù)據(jù)庫(kù)社區(qū)的極大關(guān)注。

      值得關(guān)注的是,去年國(guó)內(nèi)云原生數(shù)據(jù)倉(cāng)庫(kù)廠商酷克數(shù)據(jù)研發(fā)并開(kāi)源了 CloudberryDB 數(shù)倉(cāng)產(chǎn)品。作為 Greenplum 的衍生版,CloudberryDB 不僅能夠?qū)崿F(xiàn)對(duì) Greenplum 原生級(jí)兼容和無(wú)縫遷移,更在功能、性能和安全性方面進(jìn)行了全面的升級(jí)。


      01 Greenplum 重回閉源?源碼歸檔引發(fā)業(yè)界猜測(cè)

      Greenplum 基于 Postgres 并采用大規(guī)模并行處理架構(gòu)(MPP "Massively Parallel Processing",大規(guī)模并行處理)打造的分布式數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),支持對(duì)PB 級(jí)別數(shù)據(jù)量提供強(qiáng)大和快速分析能力。

      Greenplum 的歷史可以追溯到 2003 年,它在 2006 年推出了基于 PostgreSQL 的 MPP 數(shù)據(jù)庫(kù)。2010 年被 EMC 收購(gòu),隨后在 2013 年 EMC、VMware 和 GE 共同成立了 Pivotal 公司,Greenplum 數(shù)據(jù)庫(kù)也被整合進(jìn) Pivotal 的技術(shù)棧中。2015 年,隨著 Dell 收購(gòu) EMC,Pivotal 決定將 Greenplum 開(kāi)源。2018 年 Pivotal 上市,但在一年半后被 VMware 收購(gòu)并退市。2021 年底,Dell 決定拆分 VMware,而到了 2023 年底,VMware 被博通收購(gòu)。

      幾經(jīng)轉(zhuǎn)手之后,Greenplum 的商業(yè)發(fā)展也不盡如人意。博通收購(gòu) VMware 后,Greenplum 的全球交付團(tuán)隊(duì)遭到裁員,商業(yè)化團(tuán)隊(duì)退出中國(guó)市場(chǎng)。近期 Greenplum 更是將源代碼倉(cāng)庫(kù)歸檔,且訪問(wèn)權(quán)限修改為僅支持「只讀」,項(xiàng)目全部過(guò)往 Issue、Pull Request 等記錄已經(jīng)消失、中文網(wǎng)站也已經(jīng)不可訪問(wèn)、Slack 交流社群也遭關(guān)閉。

https://github.com/greenplum-db/gpdb


Greenplum 源代碼倉(cāng)庫(kù)的訪問(wèn)權(quán)限修改為了“只讀”,同時(shí)還清空了原有的 branch、tag、pr、issue 等信息。


Greenplum 中國(guó)官網(wǎng)無(wú)法訪問(wèn)

      歸檔意味著什么?是否閉源?有不少人猜測(cè),Greenplum 的商業(yè)化進(jìn)展遇困,博通為了簡(jiǎn)化產(chǎn)品線,來(lái)集中資源發(fā)展其他核心業(yè)務(wù)。又或者是博通先將 Greenplum 閉源,整合內(nèi)部資源,尋求開(kāi)源與商業(yè)化之間平衡策略。但究竟結(jié)果如何?目前還不得而知。這無(wú)疑讓人對(duì) Greenplum 用戶和社區(qū)參與者的未來(lái)感到擔(dān)憂。

      作為世界上第一個(gè)開(kāi)源的大規(guī)模并行數(shù)據(jù)庫(kù),Greenplum 有著深厚影響力的開(kāi)源社區(qū),充分影響著其他后來(lái)同類(lèi)產(chǎn)品的發(fā)展。然而,隨著數(shù)據(jù)源愈發(fā)多樣、各種業(yè)務(wù)場(chǎng)景對(duì)數(shù)據(jù)的分析處理能力要求愈發(fā)復(fù)雜,這對(duì)傳統(tǒng)的分析系統(tǒng)發(fā)起了挑戰(zhàn)。來(lái)自開(kāi)源基金會(huì)及各服務(wù)廠商面對(duì)新需求新挑戰(zhàn)推出了很多有競(jìng)爭(zhēng)力的開(kāi)源項(xiàng)目和商業(yè)化服務(wù)。

      在萬(wàn)馬馳騁的時(shí)代,Greenplum 能夠有所應(yīng)對(duì)但還不夠。Greenplum 原維護(hù)團(tuán)隊(duì)可以通過(guò)自研和借力 PostgreSQL 生態(tài)擴(kuò)展來(lái)支持相關(guān)方向需求,但社區(qū)版的功能迭代與 bug 修復(fù)的速度已經(jīng)慢了下來(lái),很多場(chǎng)景所需的先進(jìn)功能僅存在于商業(yè)公司推出的企業(yè)版本,社區(qū)用戶獲取困難。

      當(dāng)前用戶格外關(guān)注數(shù)據(jù)庫(kù)系統(tǒng)性能和安全特性,Greenplum 社區(qū)版在此投入資源也不多。Greenplum 在 PostgreSQL 內(nèi)核升級(jí)方面非常緩慢,許多來(lái)自 PostgreSQL 上游的先進(jìn)特性與功能無(wú)法快速推送給社區(qū)用戶。經(jīng)過(guò)多年推動(dòng) Greenplum 才將內(nèi)核升級(jí)到 PostgreSQL 12 ,但 PostgreSQL 官方將于 2024 年 11 月停止維護(hù)這一版本。

      近年來(lái) Greenplum 在新功能推出、更新步伐上多是小修小補(bǔ),尤其在數(shù)據(jù)庫(kù)性能方面并沒(méi)有明顯的改進(jìn),與其他涌現(xiàn)出來(lái)的新生代開(kāi)源項(xiàng)目競(jìng)爭(zhēng)缺乏競(jìng)爭(zhēng)力。


      02 接棒再出發(fā),CloudberryDB 為開(kāi)源注入新活力

      過(guò)去幾年 Greenplum 的公司和團(tuán)隊(duì)始終處于動(dòng)蕩之中,直接或間接導(dǎo)致版本進(jìn)展緩慢、創(chuàng)新不足、技術(shù)支持有限等現(xiàn)狀。為了響應(yīng)用戶需求,推動(dòng)開(kāi)源生態(tài),國(guó)內(nèi)云數(shù)倉(cāng)廠商酷克數(shù)據(jù)(HashData)基于 PostgreSQL 與 Greenplum 研發(fā)了面向 AI 和分析場(chǎng)景打造的新一代數(shù)據(jù)庫(kù) CloudBerry Database (以下簡(jiǎn)稱(chēng)“CloudberryDB”),并于去年正式開(kāi)源。

      CloudberryDB 助力企業(yè)靈活應(yīng)對(duì)數(shù)據(jù)新挑戰(zhàn)

      酷克數(shù)據(jù)成立于 2016 年,是國(guó)內(nèi)最早專(zhuān)注于云原生數(shù)倉(cāng)研發(fā)推廣的軟件企業(yè),公司旗艦級(jí)產(chǎn)品 HashData Enterprise 已深度服務(wù)于金融、電信運(yùn)營(yíng)商、政務(wù)、能源以及互聯(lián)網(wǎng)等多個(gè)行業(yè)的頭部企業(yè),其中最大客戶規(guī)模已超過(guò) 30000 個(gè)節(jié)點(diǎn)。

      憑借原廠之外最大的 Greenplum 原始開(kāi)發(fā)者團(tuán)隊(duì),酷克數(shù)據(jù)獲得了業(yè)內(nèi)領(lǐng)先的技術(shù)儲(chǔ)備和實(shí)踐能力。

      基于 MPP 數(shù)據(jù)庫(kù)的深度理解、國(guó)內(nèi)大客戶的服務(wù)實(shí)踐經(jīng)驗(yàn),以及創(chuàng)始團(tuán)隊(duì)的長(zhǎng)期開(kāi)源社區(qū)參與,酷克數(shù)據(jù)研發(fā)并開(kāi)源了 CloudberryDB 數(shù)倉(cāng)產(chǎn)品。

      作為 Greenplum 的衍生版,CloudberryDB 與 Greenplum 保持原生兼容,并能實(shí)現(xiàn)無(wú)縫遷移,具備更新的內(nèi)核和更豐富的功能。CloudberryDB 支持豐富的數(shù)據(jù)類(lèi)型和數(shù)倉(cāng)/AI 混合負(fù)載,可開(kāi)展 SQL 分析、機(jī)器學(xué)習(xí)、全文檢索、HTAP 等任務(wù),通過(guò)數(shù)據(jù)存儲(chǔ)加密、聯(lián)合身份驗(yàn)證等技術(shù)手段,幫助企業(yè)更方便地自建高效穩(wěn)定的數(shù)據(jù)底座。

      CloudberryDB 既能滿足單機(jī)本地快捷部署,也能通過(guò)插件自由擴(kuò)展為云原生架構(gòu),具備高彈性、高并發(fā)、湖倉(cāng)一體化、擴(kuò)縮容靈活等優(yōu)勢(shì)。SQL 引擎基于并行處理(MPP)架構(gòu),支持多計(jì)算集群部署,具備強(qiáng)大的并行計(jì)算能力,可以輕松支持高并發(fā),有效隔離混合工作負(fù)載。

      在部署方式上,CloudberryDB 采用 100%純軟方案,支持裸金屬、虛擬機(jī)、容器化等多種部署方式,企業(yè)開(kāi)發(fā)人員可以使用 R、Python、Perl、Java、 pgsql 等語(yǔ)言編寫(xiě)用戶自定義函數(shù)(UDF),面向多計(jì)算集群部署,實(shí)現(xiàn)專(zhuān)屬的業(yè)務(wù)需求。

CloudberryDB架構(gòu)與靈活部署形態(tài)

      此外,CloudberryDB 還全面集成 PstgresQL 14.4,支持 ANSI SQL 2011,內(nèi)置豐富的庫(kù)內(nèi)分析模塊,具備強(qiáng)大的 SQL 分析功能,滿足企業(yè)進(jìn)行海量數(shù)據(jù)的復(fù)雜分析需求:

      ·支持 Multi-range 、JSON、JSONB、XML 等多種類(lèi)型,并提供了相關(guān)操作、函數(shù)支持。

      ·支持 UPSERT,增加 INSERT ... ON CONFLICT 語(yǔ)法,在發(fā)生約束沖突時(shí)可以轉(zhuǎn)換成 UPDATE 語(yǔ)義,對(duì)于數(shù)據(jù)導(dǎo)入友好。

      ·增加新語(yǔ)法方便數(shù)據(jù)更新:UPDATE tab SET (col1, col2, ...) = (SELECT col1, col2, ...)。

      ·支持范圍、列表、哈希等類(lèi)型的分區(qū),支持多層分區(qū)嵌套,支持分區(qū)管理操作。

      ·支持 BTree、Bitmap、Hash、GIN、 BRIN、GiST 等多種類(lèi)型的索引。

      ·支持物化視圖,支持復(fù)雜查詢,如:CTE、遞歸查詢。

      ·postgres_fdw 支持聚集下推, 減少傳輸數(shù)據(jù)量。

      ·允許窗口函數(shù)執(zhí)行增量排序。

      ·支持 just-in-time (JIT) 編譯。

      ·支持創(chuàng)建覆蓋索引。

      ·引入 PostGIS 插件,實(shí)現(xiàn)了對(duì)空間數(shù)據(jù)類(lèi)型、空間索引和空間函數(shù)的支持。

      ·基于 CBO 優(yōu)化器,CloudberryDB 支持基于代價(jià)模型的聚集下推能力,能夠有效減少 Join 運(yùn)算的數(shù)據(jù)量,大幅提升性能。

      ·改進(jìn)了 CBO 優(yōu)化器,以生成更智能高效的查詢計(jì)劃,適應(yīng)云和混合負(fù)載環(huán)境。

      ·支持基于代價(jià)的聚集下推,減少 Join 數(shù)據(jù)量并提升性能。

      ·利用 Runtime filter 技術(shù)進(jìn)一步加速 Join 運(yùn)算。

      ……

      CloudberryDB 研發(fā)了新型行列混存技術(shù),在保證寫(xiě)入效率的情況下,利用查詢時(shí)跳塊過(guò)濾和預(yù)計(jì)算,大幅提升查詢性能。CloudberryDB 還利用向量化對(duì)算子進(jìn)行了針對(duì)性的細(xì)致優(yōu)化,帶來(lái)了數(shù)量級(jí)的效率提升收益。

      為確保企業(yè)數(shù)據(jù)的安全,CloudberryDB 采用了統(tǒng)一認(rèn)證、按需授權(quán)、安全存儲(chǔ)、動(dòng)態(tài)脫敏等方式,構(gòu)建了多層級(jí)安全體系。

      在生態(tài)方面,CloudberryDB 完美兼容第三方產(chǎn)品,與主流 BI 工具、挖掘預(yù)測(cè)工具、ETL 工具、J2EE/.NET 應(yīng)用程序以及其他數(shù)據(jù)源/計(jì)算引擎均有良好連通。

CloudberryDB產(chǎn)品兼容生態(tài)

      CloudberryDB 內(nèi)置了分布式并行向量數(shù)據(jù)存儲(chǔ)、索引及檢索功能,企業(yè)可以通過(guò)酷克數(shù)據(jù)自研的 AI 開(kāi)發(fā)工具箱 HashML,將本地的文本、圖像等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成向量表示,構(gòu)建分布式大規(guī)模多模態(tài)向量知識(shí)庫(kù),讓 AI 應(yīng)用開(kāi)發(fā)變得更加簡(jiǎn)單便捷。

      持續(xù)構(gòu)建開(kāi)放、友好、中立的開(kāi)源社區(qū)

      站在巨人的肩膀上,借助 Greenplum、PostgreSQL 等偉大開(kāi)源項(xiàng)目的堅(jiān)實(shí)基礎(chǔ),CloudberryDB 才能不斷創(chuàng)新,力求為廣大開(kāi)發(fā)者和用戶帶來(lái)更加卓越的產(chǎn)品體驗(yàn),這也是 CloudberryDB 研發(fā)初衷。

      在許可協(xié)議上,CloudberryDB 采用了寬松的 Apache License V2.0 協(xié)議,期望賦予社區(qū)成員更大的自由度和靈活性,并鼓勵(lì)社區(qū)成員自由使用、輕松復(fù)制、按需修改,或者將 CloudberryDB 重新分發(fā)或融入自身的商業(yè)產(chǎn)品與服務(wù)中。

      CloudberryDB 秉持國(guó)際標(biāo)準(zhǔn)、高點(diǎn)定位、全球視野的運(yùn)營(yíng)理念,致力于構(gòu)建一個(gè)開(kāi)放包容、友好互助、中立公正的社區(qū)環(huán)境,讓每一位社區(qū)成員都能在這里找到歸屬感,共同為 CloudberryDB 的進(jìn)步貢獻(xiàn)力量。

      我們有理由相信,通過(guò)集思廣益、群策群力,CloudberryDB 社區(qū)將在未來(lái)綻放出更多光彩。


責(zé)任編輯:劉明德
分享到:
0
【慎重聲明】凡本站未注明來(lái)源為"大眾時(shí)報(bào)網(wǎng)"的所有作品,均轉(zhuǎn)載、編譯或摘編自其它媒體,轉(zhuǎn)載、編譯或摘編的目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如因作品內(nèi)容、版權(quán)和其他問(wèn)題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?0日內(nèi)進(jìn)行!
網(wǎng)站地圖 關(guān)于我們 免責(zé)聲明 投訴建議 sitemap

未經(jīng)許可任何人不得復(fù)制和鏡像,如有發(fā)現(xiàn)追究法律責(zé)任 粵ICP備2020138440號(hào)

<tfoot id="mjdss"><nobr id="mjdss"></nobr></tfoot>
    1. <ruby id="mjdss"><div id="mjdss"></div></ruby>
      <tr id="mjdss"></tr>