三優生物 1分鐘了解系列|如何判斷蛋白制備難度之糖基化位點篇
引言
在科學研究以及制藥研發領域,常常需要制備一些蛋白。而在進行蛋白制備之前,需要開展一系列分析工作,以便選擇適宜的制備方案,進而提高制備的成功率。蛋白分析通常要從蛋白的種屬、類型、結構以及理化和生化性質等方面著手。目前,對于蛋白制備難度的評判尚無確切標準。為此,我們從Uniprot數據庫中提取了7種哺乳動物(Human、Mouse、Rat、Rabbit、Bovine、Pig、Sumatran orangutan)的56547個蛋白的數據,在氨基酸水平上,對氨基酸個數、糖基化位點等信息進行了分析,旨在給科學家在判斷蛋白制備難度時提供參考。
我們經過對這些數據進行分析處理后,將符合“氨基酸個數小于等于100或大于等于1000;糖基化位點數大于等于4或百分比大于等于1.0%”任一性質的蛋白判定為制備難度高的蛋白。具體分析如下:
氨基酸個數
我們統計了56547個蛋白,合計氨基酸總個數為29793248,平均每個蛋白的氨基酸個數為527。
氨基酸個數分布見圖1,氨基酸蛋白個數區間及百分比見表1。
▲ 圖1. 氨基酸個數分布圖
▼ 表1. 氨基酸蛋白個數區間及百分比
糖基化位點&占比
據統計,無糖基化位點蛋白數占比為78.50%,含0-3個糖基化位點蛋白數占比92.97%,95.30%的蛋白糖基化位點占比位于0-1.0%區間。
糖基化位點數分布見圖2,糖基化位點百分比分布見圖3,糖基化位點百分比數據見表2。
▲ 圖2. 糖基化位點分布圖
▲ 圖3. 糖基化位點百分比分布圖
▼ 表2. 糖基化位點百分比
小結
通過對Uniprot上7種哺乳動物的56547個蛋白進行數據分析獲得:
· 蛋白的氨基酸個數:每個蛋白平均氨基酸個數為527,86.22%的蛋白氨基酸個數位于101-1000區間;
· 糖基化位點數:無糖基化位點蛋白數占比為78.50%,0-3個糖基化位點蛋白數占比92.97%;
· 糖基化位點數百分比:95.30%的蛋白糖基化位點占比位于0-1.0%區間。
綜合以上數據及分析,我們將符合以下任一性質的蛋白判定為制備難度高的蛋白:
注:由于蛋白的多樣性及其他多方面因素的影響,以上判斷條件僅為概率上分析,不是必然結果,僅供參考。
關于三優生物
三優生物成立于2015年,是一家國際領先的專注于創新生物藥研發和服務的高新技術企業;公司致力于實現“讓天下沒有難做的創新生物藥”的使命;公司建立了“差異化CRO、整合型CDO、協同型CPO、特色CRS”于一體的4C綜合業務體系。
公司建立了設施設備先進齊全的創新生物藥一體化研發實驗室;公司發展起了一支以碩士和博士為主的專業團隊;公司打造了居于行業領軍水平的“超萬億、一體化、智能化”三大創新藥研發技術平臺;公司建立了以十萬億噬菌體展示分子庫為代表的,涵蓋原材料制備、分子發現、分子優化、體內外藥效、細胞株構建、上下游工藝、臨床前研發及產業化開發等的50多個技術子平臺。
公司的業務網絡已擴展至中美歐等世界各地,公司在波士頓、費城、圣地亞哥和倫敦等地設有業務網點;公司已和全球1000多家制藥公司、藥物研發機構、診斷試劑產品公司建立了友好的業務合作關系。公司已獲得國家高新技術企業、專精特新、ISO9001質量管理體系、GB/T知識產權管理體系等認證。