燧原科技宣布升級企業戰略 -- 全面打造AIGC時代的基礎設施
燧原科技宣布升級企業戰略:以全棧軟硬件和集群產品為數字底座,結合MaaS (Model as a Service) 的業務模式,全面打造人工智能技術生成內容 (AIGC) 時代的基礎設施。
一、燧原大模型技術與產品深耕已久
燧原科技自創業之初就瞄準云端訓練產品市場,以突破高難度訓練芯片為目標,2019年推出的第一代產品云燧T10/T11是國內第一款具備FP32高精度算力的訓練產品。其創新的片間高速互聯,以及軟件棧聚焦優化數據并行與模型并行等大規模集群的訓練能力,奠定了今天燧原的訓練產品在國內大規模集群訓練場景的領先優勢。
基于云燧T11的冷板式液冷方案,燧原科技為之江實驗室構建了超千卡規模AI液冷集群,以賦能文本到視頻生成的場景為目標,成功支持了GPT-2、源1.0及實驗室自研蛋白質結構預測等多個超大規模巨量模型的高效訓練。液冷智算集群也順應國家的綠色低碳環保的要求,PUE經實測最低可降至1.08。
歷經五年的產品迭代和優化,燧原科技現已擁有從硬件、軟件到系統的全棧解決方案,結合云燧訓練和推理產品在行業落地打磨的實踐經驗,可為客戶提供豐富多樣的人工智能系統軟硬件產品,全方位降低AI算力中心部署和應用成本。
二、厚積薄發,燧原科技發力
在大模型標桿項目落地經驗指引下,以大幅縮短大模型開發與應用周期為目標,針對大模型場景下的算力需求特性,燧原科技現已針對大模型場景形成從硬件、軟件、系統方案的全棧技術,全面支持大模型生產,包括但不僅限于:
大模型現有生態接入:支持PyTorch、TensorFlow、PaddlePaddle、OneFlow、Megatron-LM、FairScale等主流AI框架和分布式加速庫,支持GPT-2、源1.0、悟道2.0、CPM等主流AIGC大模型的Pretrain和Finetune。
大模型極致性能提供:采用自主研發的GCU-LARE技術和ECCL分布式通信技術,提升大模型訓練多機多卡高速互聯的性能,支持數據并行、模型并行、流水線并行和混合并行等并行加速功能,支持Activation Checkpointing、ZeRO優化器、CPU offload、AMP(自動混合精度)等算力和顯存優化方法,可快速高效地進行大模型訓練。
大模型訓練TCO優化:從大模型應用端到端、技術全棧角度,燧原科技提供一體化大規模AI算力集群方案 -- 云燧智算機(CloudBlazer POD),方案采用一體化設計,是專為人工智能場景下計算、存儲、網絡、軟硬協同設計的標準化產品,以"全局優異"為目標,大幅降低建設滿足大模型場景需求的AI算力基礎設施的總擁有成本 (TCO)。
大模型業務高性價比推理加速:憑借云端推理產品云燧i20通過互聯網社交應用服務上億規模用戶的成功經驗,同時與廣泛的落地場景進行打磨,燧原的推理產品在支持Stable Diffusion、GPT-2、T5等AIGC大模型推理上具備高性價比,加速AIGC相關下游場景的商業落地。
燧原科技大模型全棧技術
燧原科技創始人、COO張亞林表示:"人工智能技術的發展正在步入一個全新的階段,AIGC內容生成類模型以及所生產的內容生動反映了人工智能從感知、認知進階到生產,也正在重構互聯網商業模式,催生數字經濟新突破。在以ChatGPT和Stable Diffusion為代表的AIGC技術浪潮下,燧原科技憑借在大模型訓練及推理的產品技術優勢,結合MaaS的業務模式,構建AIGC時代的基礎設施底座。"
關于燧原科技
燧原科技專注人工智能領域云端算力產品,致力為人工智能產業發展交付普惠的基礎設施解決方案,提供原始創新、全棧自研、具備完全自主知識產權的通用人工智能訓練和推理產品。憑借其高算力、高能效比以及靈活編程能力,可廣泛應用于互聯網、金融、交通、能源及新基建等多個行業和場景。
燧原科技攜手業內標準組織,秉承開源開放的宗旨,與產業伙伴一起促進人工智能產業發展。