SARS-CoV-2 ORF1ab蛋白
読み:さーず-ころなういるす-つー-すぱいく-たんぱく
外語:SARS-CoV-2 ORF1ab protein: open reading frame 1ab protein
SARS-CoV-2(武漢肺炎ウイルス)が持つ蛋白の一つで、最大のもの。
概要
SARS-CoV-2が持つゲノム全体の71.2%がORF1abという遺伝子である。
これは本来なら別々の蛋白質であるORF1aとORF1bが融合したもので、7096アミノ酸にもなる。こうなる理由は後述するが、その理由によってORF1abはそのままでは機能しない。
結果としてこのORF1abは機能しない蛋白質なので本来ならこれは致死的な突然変異であるが、蛋白質分解酵素で切断されると機能する蛋白質になるためウイルスは奇跡的に生存できている。
蛋白質分解酵素で切断されることにより16種類の機能する蛋白質となり、この中にRNA複製に関与するRNA依存性RNAポリメラーゼ(nsp12)や、RNA複製時のエラーを構成する酵素(nsp14)といったものが含まれている。
特徴
ヌクレオチド13,468
ORF1abは非常に特徴的なゲノム配列である。通常、3ヌクレオチド=1アミノ酸となるトリプレット暗号であるので遺伝子の長さは3で割り切れる。しかしORF1abは3で割り切れない。これはヌクレオチド13,468が2回使用されるからである。
mRNAの配列によって、「滑りやすい配列」とされるXXXYYYZ構造のヘプタヌクレオチドがある。SARS-CoV-2のゲノムの場合、UUUAAACという構造が該当し、ヌクレオチド13,468で滑る。このため13451から見て、本来なら
13451 GCA[A] CAA[Q] UCG[S] UUU[F] UUA[L] AAC[N] GGG[G] UUU[F] GCG[A] GUG[V] UAA[終止]
と翻訳され、終止コドンで止まってここで無事にORF1aという蛋白質ができるべきところ、リボソームがスリップを起こしてヌクレオチド13,468が2回翻訳されるため、以降1ヌクレオチドずつずれたフレームシフト突然変異を起こし、結果として7,096アミノ酸の蛋白質を作る。
13451 GCA[A] CAA[Q] UCG[S] UUU[F] UUA[L] AAC[N] CGG[R] GUU[V] UGC[C] GGU[G] GUA[V] AGU[S] GCA[A]…
nsp1〜16
機能しないORF1abが、ウイルス由来の「メインプロテアーゼ」「パパイン様(よう)プロテアーゼ」およびヒトが持つ分解酵素によって、これが十数種類の断片に切断される。これが、新しいウイルスを形づくる蛋白質や増殖に必要な機能を果たす酵素として機能する。
蛋白質分解酵素で分解されると、概ね16個の蛋白質nsp1〜16が生成される。
- nsp1
- nsp2
- nsp3 ‐ パパイン様プロテイナーゼ蛋白質
- nsp4
- nsp5 ‐ 3C様プロテイナーゼ
- nsp6
- nsp7
- nsp8
- nsp9
- nsp10
- nsp11
- nsp12 ‐ RNA依存性RNAポリメラーゼ(RdRp)
- nsp13
- nsp14 ‐ ヘリカーゼ(HEL)
- nsp15 ‐ エンドRNAse
- nsp16 ‐ 2'-O-リボース-メチルトランスフェラーゼ
アミノ酸配列
終止コドンを含む266..13468,13468..21555の範囲(遺伝子長21,288、アミノ酸長7,096)から作られる、遺伝子ORF1abのアミノ酸配列は次の通りである。これは支那の武漢市で検出されたオリジナルのSARS-CoV-2(いわゆる武漢株、Wuhan-Hu-1)のもので、他の株は概ねどこかが変異している。末端の終止コドンは略し、実際の7,095アミノ酸長を記す。
フレームシフト突然変異が発生しているヌクレオチド13,468に対応するアミノ酸を強調している。
ORIGIN
1 MESLVPGFNE KTHVQLSLPV LQVRDVLVRG FGDSVEEVLS EARQHLKDGT CGLVEVEKGV
61 LPQLEQPYVF IKRSDARTAP HGHVMVELVA ELEGIQYGRS GETLGVLVPH VGEIPVAYRK
121 VLLRKNGNKG AGGHSYGADL KSFDLGDELG TDPYEDFQEN WNTKHSSGVT RELMRELNGG
181 AYTRYVDNNF CGPDGYPLEC IKDLLARAGK ASCTLSEQLD FIDTKRGVYC CREHEHEIAW
241 YTERSEKSYE LQTPFEIKLA KKFDTFNGEC PNFVFPLNSI IKTIQPRVEK KKLDGFMGRI
301 RSVYPVASPN ECNQMCLSTL MKCDHCGETS WQTGDFVKAT CEFCGTENLT KEGATTCGYL
361 PQNAVVKIYC PACHNSEVGP EHSLAEYHNE SGLKTILRKG GRTIAFGGCV FSYVGCHNKC
421 AYWVPRASAN IGCNHTGVVG EGSEGLNDNL LEILQKEKVN INIVGDFKLN EEIAIILASF
481 SASTSAFVET VKGLDYKAFK QIVESCGNFK VTKGKAKKGA WNIGEQKSIL SPLYAFASEA
541 ARVVRSIFSR TLETAQNSVR VLQKAAITIL DGISQYSLRL IDAMMFTSDL ATNNLVVMAY
601 ITGGVVQLTS QWLTNIFGTV YEKLKPVLDW LEEKFKEGVE FLRDGWEIVK FISTCACEIV
661 GGQIVTCAKE IKESVQTFFK LVNKFLALCA DSIIIGGAKL KALNLGETFV THSKGLYRKC
721 VKSREETGLL MPLKAPKEII FLEGETLPTE VLTEEVVLKT GDLQPLEQPT SEAVEAPLVG
781 TPVCINGLML LEIKDTEKYC ALAPNMMVTN NTFTLKGGAP TKVTFGDDTV IEVQGYKSVN
841 ITFELDERID KVLNEKCSAY TVELGTEVNE FACVVADAVI KTLQPVSELL TPLGIDLDEW
901 SMATYYLFDE SGEFKLASHM YCSFYPPDED EEEGDCEEEE FEPSTQYEYG TEDDYQGKPL
961 EFGATSAALQ PEEEQEEDWL DDDSQQTVGQ QDGSEDNQTT TIQTIVEVQP QLEMELTPVV
1021 QTIEVNSFSG YLKLTDNVYI KNADIVEEAK KVKPTVVVNA ANVYLKHGGG VAGALNKATN
1081 NAMQVESDDY IATNGPLKVG GSCVLSGHNL AKHCLHVVGP NVNKGEDIQL LKSAYENFNQ
1141 HEVLLAPLLS AGIFGADPIH SLRVCVDTVR TNVYLAVFDK NLYDKLVSSF LEMKSEKQVE
1201 QKIAEIPKEE VKPFITESKP SVEQRKQDDK KIKACVEEVT TTLEETKFLT ENLLLYIDIN
1261 GNLHPDSATL VSDIDITFLK KDAPYIVGDV VQEGVLTAVV IPTKKAGGTT EMLAKALRKV
1321 PTDNYITTYP GQGLNGYTVE EAKTVLKKCK SAFYILPSII SNEKQEILGT VSWNLREMLA
1381 HAEETRKLMP VCVETKAIVS TIQRKYKGIK IQEGVVDYGA RFYFYTSKTT VASLINTLND
1441 LNETLVTMPL GYVTHGLNLE EAARYMRSLK VPATVSVSSP DAVTAYNGYL TSSSKTPEEH
1501 FIETISLAGS YKDWSYSGQS TQLGIEFLKR GDKSVYYTSN PTTFHLDGEV ITFDNLKTLL
1561 SLREVRTIKV FTTVDNINLH TQVVDMSMTY GQQFGPTYLD GADVTKIKPH NSHEGKTFYV
1621 LPNDDTLRVE AFEYYHTTDP SFLGRYMSAL NHTKKWKYPQ VNGLTSIKWA DNNCYLATAL
1681 LTLQQIELKF NPPALQDAYY RARAGEAANF CALILAYCNK TVGELGDVRE TMSYLFQHAN
1741 LDSCKRVLNV VCKTCGQQQT TLKGVEAVMY MGTLSYEQFK KGVQIPCTCG KQATKYLVQQ
1801 ESPFVMMSAP PAQYELKHGT FTCASEYTGN YQCGHYKHIT SKETLYCIDG ALLTKSSEYK
1861 GPITDVFYKE NSYTTTIKPV TYKLDGVVCT EIDPKLDNYY KKDNSYFTEQ PIDLVPNQPY
1921 PNASFDNFKF VCDNIKFADD LNQLTGYKKP ASRELKVTFF PDLNGDVVAI DYKHYTPSFK
1981 KGAKLLHKPI VWHVNNATNK ATYKPNTWCI RCLWSTKPVE TSNSFDVLKS EDAQGMDNLA
2041 CEDLKPVSEE VVENPTIQKD VLECNVKTTE VVGDIILKPA NNSLKITEEV GHTDLMAAYV
2101 DNSSLTIKKP NELSRVLGLK TLATHGLAAV NSVPWDTIAN YAKPFLNKVV STTTNIVTRC
2161 LNRVCTNYMP YFFTLLLQLC TFTRSTNSRI KASMPTTIAK NTVKSVGKFC LEASFNYLKS
2221 PNFSKLINII IWFLLLSVCL GSLIYSTAAL GVLMSNLGMP SYCTGYREGY LNSTNVTIAT
2281 YCTGSIPCSV CLSGLDSLDT YPSLETIQIT ISSFKWDLTA FGLVAEWFLA YILFTRFFYV
2341 LGLAAIMQLF FSYFAVHFIS NSWLMWLIIN LVQMAPISAM VRMYIFFASF YYVWKSYVHV
2401 VDGCNSSTCM MCYKRNRATR VECTTIVNGV RRSFYVYANG GKGFCKLHNW NCVNCDTFCA
2461 GSTFISDEVA RDLSLQFKRP INPTDQSSYI VDSVTVKNGS IHLYFDKAGQ KTYERHSLSH
2521 FVNLDNLRAN NTKGSLPINV IVFDGKSKCE ESSAKSASVY YSQLMCQPIL LLDQALVSDV
2581 GDSAEVAVKM FDAYVNTFSS TFNVPMEKLK TLVATAEAEL AKNVSLDNVL STFISAARQG
2641 FVDSDVETKD VVECLKLSHQ SDIEVTGDSC NNYMLTYNKV ENMTPRDLGA CIDCSARHIN
2701 AQVAKSHNIA LIWNVKDFMS LSEQLRKQIR SAAKKNNLPF KLTCATTRQV VNVVTTKIAL
2761 KGGKIVNNWL KQLIKVTLVF LFVAAIFYLI TPVHVMSKHT DFSSEIIGYK AIDGGVTRDI
2821 ASTDTCFANK HADFDTWFSQ RGGSYTNDKA CPLIAAVITR EVGFVVPGLP GTILRTTNGD
2881 FLHFLPRVFS AVGNICYTPS KLIEYTDFAT SACVLAAECT IFKDASGKPV PYCYDTNVLE
2941 GSVAYESLRP DTRYVLMDGS IIQFPNTYLE GSVRVVTTFD SEYCRHGTCE RSEAGVCVST
3001 SGRWVLNNDY YRSLPGVFCG VDAVNLLTNM FTPLIQPIGA LDISASIVAG GIVAIVVTCL
3061 AYYFMRFRRA FGEYSHVVAF NTLLFLMSFT VLCLTPVYSF LPGVYSVIYL YLTFYLTNDV
3121 SFLAHIQWMV MFTPLVPFWI TIAYIICIST KHFYWFFSNY LKRRVVFNGV SFSTFEEAAL
3181 CTFLLNKEMY LKLRSDVLLP LTQYNRYLAL YNKYKYFSGA MDTTSYREAA CCHLAKALND
3241 FSNSGSDVLY QPPQTSITSA VLQSGFRKMA FPSGKVEGCM VQVTCGTTTL NGLWLDDVVY
3301 CPRHVICTSE DMLNPNYEDL LIRKSNHNFL VQAGNVQLRV IGHSMQNCVL KLKVDTANPK
3361 TPKYKFVRIQ PGQTFSVLAC YNGSPSGVYQ CAMRPNFTIK GSFLNGSCGS VGFNIDYDCV
3421 SFCYMHHMEL PTGVHAGTDL EGNFYGPFVD RQTAQAAGTD TTITVNVLAW LYAAVINGDR
3481 WFLNRFTTTL NDFNLVAMKY NYEPLTQDHV DILGPLSAQT GIAVLDMCAS LKELLQNGMN
3541 GRTILGSALL EDEFTPFDVV RQCSGVTFQS AVKRTIKGTH HWLLLTILTS LLVLVQSTQW
3601 SLFFFLYENA FLPFAMGIIA MSAFAMMFVK HKHAFLCLFL LPSLATVAYF NMVYMPASWV
3661 MRIMTWLDMV DTSLSGFKLK DCVMYASAVV LLILMTARTV YDDGARRVWT LMNVLTLVYK
3721 VYYGNALDQA ISMWALIISV TSNYSGVVTT VMFLARGIVF MCVEYCPIFF ITGNTLQCIM
3781 LVYCFLGYFC TCYFGLFCLL NRYFRLTLGV YDYLVSTQEF RYMNSQGLLP PKNSIDAFKL
3841 NIKLLGVGGK PCIKVATVQS KMSDVKCTSV VLLSVLQQLR VESSSKLWAQ CVQLHNDILL
3901 AKDTTEAFEK MVSLLSVLLS MQGAVDINKL CEEMLDNRAT LQAIASEFSS LPSYAAFATA
3961 QEAYEQAVAN GDSEVVLKKL KKSLNVAKSE FDRDAAMQRK LEKMADQAMT QMYKQARSED
4021 KRAKVTSAMQ TMLFTMLRKL DNDALNNIIN NARDGCVPLN IIPLTTAAKL MVVIPDYNTY
4081 KNTCDGTTFT YASALWEIQQ VVDADSKIVQ LSEISMDNSP NLAWPLIVTA LRANSAVKLQ
4141 NNELSPVALR QMSCAAGTTQ TACTDDNALA YYNTTKGGRF VLALLSDLQD LKWARFPKSD
4201 GTGTIYTELE PPCRFVTDTP KGPKVKYLYF IKGLNNLNRG MVLGSLAATV RLQAGNATEV
4261 PANSTVLSFC AFAVDAAKAY KDYLASGGQP ITNCVKMLCT HTGTGQAITV TPEANMDQES
4321 FGGASCCLYC RCHIDHPNPK GFCDLKGKYV QIPTTCANDP VGFTLKNTVC TVCGMWKGYG
4381 CSCDQLREPM LQSADAQSFL NRVCGVSAAR LTPCGTGTST DVVYRAFDIY NDKVAGFAKF
4441 LKTNCCRFQE KDEDDNLIDS YFVVKRHTFS NYQHEETIYN LLKDCPAVAK HDFFKFRIDG
4501 DMVPHISRQR LTKYTMADLV YALRHFDEGN CDTLKEILVT YNCCDDDYFN KKDWYDFVEN
4561 PDILRVYANL GERVRQALLK TVQFCDAMRN AGIVGVLTLD NQDLNGNWYD FGDFIQTTPG
4621 SGVPVVDSYY SLLMPILTLT RALTAESHVD TDLTKPYIKW DLLKYDFTEE RLKLFDRYFK
4681 YWDQTYHPNC VNCLDDRCIL HCANFNVLFS TVFPPTSFGP LVRKIFVDGV PFVVSTGYHF
4741 RELGVVHNQD VNLHSSRLSF KELLVYAADP AMHAASGNLL LDKRTTCFSV AALTNNVAFQ
4801 TVKPGNFNKD FYDFAVSKGF FKEGSSVELK HFFFAQDGNA AISDYDYYRY NLPTMCDIRQ
4861 LLFVVEVVDK YFDCYDGGCI NANQVIVNNL DKSAGFPFNK WGKARLYYDS MSYEDQDALF
4921 AYTKRNVIPT ITQMNLKYAI SAKNRARTVA GVSICSTMTN RQFHQKLLKS IAATRGATVV
4981 IGTSKFYGGW HNMLKTVYSD VENPHLMGWD YPKCDRAMPN MLRIMASLVL ARKHTTCCSL
5041 SHRFYRLANE CAQVLSEMVM CGGSLYVKPG GTSSGDATTA YANSVFNICQ AVTANVNALL
5101 STDGNKIADK YVRNLQHRLY ECLYRNRDVD TDFVNEFYAY LRKHFSMMIL SDDAVVCFNS
5161 TYASQGLVAS IKNFKSVLYY QNNVFMSEAK CWTETDLTKG PHEFCSQHTM LVKQGDDYVY
5221 LPYPDPSRIL GAGCFVDDIV KTDGTLMIER FVSLAIDAYP LTKHPNQEYA DVFHLYLQYI
5281 RKLHDELTGH MLDMYSVMLT NDNTSRYWEP EFYEAMYTPH TVLQAVGACV LCNSQTSLRC
5341 GACIRRPFLC CKCCYDHVIS TSHKLVLSVN PYVCNAPGCD VTDVTQLYLG GMSYYCKSHK
5401 PPISFPLCAN GQVFGLYKNT CVGSDNVTDF NAIATCDWTN AGDYILANTC TERLKLFAAE
5461 TLKATEETFK LSYGIATVRE VLSDRELHLS WEVGKPRPPL NRNYVFTGYR VTKNSKVQIG
5521 EYTFEKGDYG DAVVYRGTTT YKLNVGDYFV LTSHTVMPLS APTLVPQEHY VRITGLYPTL
5581 NISDEFSSNV ANYQKVGMQK YSTLQGPPGT GKSHFAIGLA LYYPSARIVY TACSHAAVDA
5641 LCEKALKYLP IDKCSRIIPA RARVECFDKF KVNSTLEQYV FCTVNALPET TADIVVFDEI
5701 SMATNYDLSV VNARLRAKHY VYIGDPAQLP APRTLLTKGT LEPEYFNSVC RLMKTIGPDM
5761 FLGTCRRCPA EIVDTVSALV YDNKLKAHKD KSAQCFKMFY KGVITHDVSS AINRPQIGVV
5821 REFLTRNPAW RKAVFISPYN SQNAVASKIL GLPTQTVDSS QGSEYDYVIF TQTTETAHSC
5881 NVNRFNVAIT RAKVGILCIM SDRDLYDKLQ FTSLEIPRRN VATLQAENVT GLFKDCSKVI
5941 TGLHPTQAPT HLSVDTKFKT EGLCVDIPGI PKDMTYRRLI SMMGFKMNYQ VNGYPNMFIT
6001 REEAIRHVRA WIGFDVEGCH ATREAVGTNL PLQLGFSTGV NLVAVPTGYV DTPNNTDFSR
6061 VSAKPPPGDQ FKHLIPLMYK GLPWNVVRIK IVQMLSDTLK NLSDRVVFVL WAHGFELTSM
6121 KYFVKIGPER TCCLCDRRAT CFSTASDTYA CWHHSIGFDY VYNPFMIDVQ QWGFTGNLQS
6181 NHDLYCQVHG NAHVASCDAI MTRCLAVHEC FVKRVDWTIE YPIIGDELKI NAACRKVQHM
6241 VVKAALLADK FPVLHDIGNP KAIKCVPQAD VEWKFYDAQP CSDKAYKIEE LFYSYATHSD
6301 KFTDGVCLFW NCNVDRYPAN SIVCRFDTRV LSNLNLPGCD GGSLYVNKHA FHTPAFDKSA
6361 FVNLKQLPFF YYSDSPCESH GKQVVSDIDY VPLKSATCIT RCNLGGAVCR HHANEYRLYL
6421 DAYNMMISAG FSLWVYKQFD TYNLWNTFTR LQSLENVAFN VVNKGHFDGQ QGEVPVSIIN
6481 NTVYTKVDGV DVELFENKTT LPVNVAFELW AKRNIKPVPE VKILNNLGVD IAANTVIWDY
6541 KRDAPAHIST IGVCSMTDIA KKPTETICAP LTVFFDGRVD GQVDLFRNAR NGVLITEGSV
6601 KGLQPSVGPK QASLNGVTLI GEAVKTQFNY YKKVDGVVQQ LPETYFTQSR NLQEFKPRSQ
6661 MEIDFLELAM DEFIERYKLE GYAFEHIVYG DFSHSQLGGL HLLIGLAKRF KESPFELEDF
6721 IPMDSTVKNY FITDAQTGSS KCVCSVIDLL LDDFVEIIKS QDLSVVSKVV KVTIDYTEIS
6781 FMLWCKDGHV ETFYPKLQSS QAWQPGVAMP NLYKMQRMLL EKCDLQNYGD SATLPKGIMM
6841 NVAKYTQLCQ YLNTLTLAVP YNMRVIHFGA GSDKGVAPGT AVLRQWLPTG TLLVDSDLND
6901 FVSDADSTLI GDCATVHTAN KWDLIISDMY DPKTKNVTKE NDSKEGFFTY ICGFIQQKLA
6961 LGGSVAIKIT EHSWNADLYK LMGHFAWWTA FVTNVNASSS EAFLIGCNYL GKPREQIDGY
7021 VMHANYIFWR NTNPIQLSSY SLFDMSKFPL KLRGTAVMSL KEGQINDMIL SLLSKGRLII
7081 RENNRVVISS DVLVNN
再検索