SARS-CoV-2

読み:さーず・ころなういるす・つー
外語:SARS-CoV-2: SARS coronavirus 2 英語
品詞:名詞

武漢肺炎ウイルス感染症(WHO名はCOVID-19)を引き起こす病原体であるウイルスの国際ウイルス分類委員会(ICTV)名。別名「武漢肺炎ウイルス」。今のところ正式な和名はないが、そのまま解釈すれば「SARSコロナウイルス2」である。

目次

分類

国際ウイルス分類委員会(ICTV)の2019(令和元)年分類による。

  • レルム: リボウィリア Riboviria
  • 界: オルトルナウイルス界 Orthornavirae
  • 門: ピスウイルス門 Pisuviricota
  • 綱: ピソニウイルス綱 Pisoniviricetes
  • 目: ニドウイルス目 Nidovirales
  • 亜目; コルニドウイルス亜科 Cornidovirineae
  • 科: コロナウイルス科 Coronaviridae
  • 亜科: オルトコロナウイルス亜科 Orthocoronavirinae
  • 属: ベータコロナウイルス属 Betacoronavirus
  • 亜属: サルベコウイルス亜属 Sarbecovirus
  • 種: SARS関連コロナウイルス SARSr-CoV
  • 株: SARSコロナウイルス-2 SARS-CoV-2

ゲノム

  • ゲノムサイズ: 29,903 bp(塩基対) ※変異株では変化する可能性がある

発見

2019(令和元)年12月に支那の湖北省武漢市で最初の症例が確認されて以降、感染者の移動によって世界中に蔓延した。

分類と系統

ゲノムとして1本鎖RNA +鎖を持っている。古い分類では綱の階層が最上位で「第4網(1本鎖RNA +鎖)」とされていたが、ICTVの最新の分類では綱の上に門→界→レルムという階層構造を用意して現在に至る。

国際ウイルス分類委員会(ICTV)は、かつて支那から蔓延しはじめたSARS病原体がSARS-CoVと呼ばれるため、その第2型として「SARS-CoV-2」としている。ただし、これはSARSコロナウイルスの直接の子孫ではない。

自然宿主

このウイルスの自然宿主は分かっていないが、恐らくはコウモリ、特にキクガシラコウモリであろうと推察されている。

これは、既知のほぼ全てのコロナウイルスはコウモリが由来することが分かっているためであるほか、キクガシラコウモリから近縁のウイルスが検出されているためである。

潜伏期

感染後の潜伏期は2〜14日とされている。

治療薬

2020(令和2)年11月時点で、特効薬と言えるような治療薬は完成していない。

上述したウイルス学者・閻麗夢は、トランプ大統領も予防のため服用していた抗マラリア剤「ヒドロキシクロロキン」が極めて有効であり、中国共産党幹部たちも服用していると暴露している。

ただしこの薬は副作用が強く、また実際に武漢肺炎ウイルス感染症に応用すべく海外で臨床試験が実施されたものの試験中に複数の死亡例が確認されるなどした。安全性への懸念および実際の治療効果の有効性などが疑われ、これは治療薬候補からは外されている。

ワクチン

2021(令和3)年時点で、SARS-CoV-2感染症用のワクチンは様々なものが作られ使われているが、中でもmRNAワクチンが非常に高い効果を発揮している。

mRNAワクチンは、これまでワクチンとして人への使用が承認されたことがない新たな方法であるが長い研究結果に裏打ちされたもので、従来型のワクチンに取って代わる可能性を秘めている。

強毒化という特異性

一般的に、ウイルス感染症は伝播性を上げて弱毒化していく。これは弱毒株に感染した人は動くことができ感染を広げられるのに対し、強毒株は逆に動けなくなるからである。

しかしSARS-CoV-2の場合、潜伏期間が長く、なおかつ発症前にもウイルスを撒き散らすためその常識が当てはまらない。このために、伝播性を上げつつ、なおかつ少しずつ強毒化している。

変異が進むにつれ、初期症状は鼻水などが増えて味覚・嗅覚障害が減っており、風邪に近くなっている。これをもってこの病気を「ただの風邪」などと喧伝する者がいるが、これは明確な誤りである。特徴的な初期症状が減ったことで診断が難しくなる一方で、重症化する確率は従来より高まっている。

初期症状と重症化は全く関係がなく、これは非常に危険な傾向である。

基本的な構造

コロナウウイスの基本的な特徴を有しており、大ざっぱに、球状に皮となる脂質二重膜(エンベロープ)がある。

この表面(外側)にS蛋白、M蛋白、E蛋白が生えていて、内部にはN蛋白およびウイルスの遺伝子である一本鎖RNAゲノムがある。

発生源

発生源は、支那の湖北省武漢市にある、中国共産党の軍事施設である武漢ウイルス研究所である。

このウイルス研究所がこのウイルスを保有し研究対象としていた目的は定かではないが、ここからウイルスが漏れ、そして近くにあった海産物卸売市場で蔓延し発覚した。

ウイルスや疾患の正式名称はまだ固定されていないが、アメリカではChina Wuhan Virusまたは単にWuhan Virus、つまり「武漢ウイルス」と呼んでおり、この呼称が定着しているらしい。実際にトランプ大統領やマイク・ポンペオ国務長官などは、The Wuhan Virus(武漢ウイルス)や、the China Virus(支那ウイルス)の名を用いている。

その後、様々な変異株が登場し人類を苦しめるが、最初に武漢で発見されたもの(オリジナル)を「Wuhan-Hu-1」と呼びリファレンスとし、それ以外はここから遺伝子のどのアミノ酸が変わったかで表現される。

人工ウイルス説

このウイルスが中国共産党によって「人工的に作られたもの」という説もある。人工的に作られたものであることや生成方法などは、アメリカに亡命した、山東省出身で香港大学のウイルス学者・閻麗夢(えん れいむ、イェン・リーモン; Li-Meng Yan)博士と共著者3人の名前で論文が発表されている。

「人工説」自体は眉唾物の話で、一つの可能性として排除すべきではないが現時点ではまだ未確定である。なぜなら、全ゲノム配列は既に確定しているが、このウイルスのゲノム配列に特段おかしな点は見つからず、コウモリ、特にキクガシラコウモリが持つコロナウイルスに近縁のものが見つかっている。

またこのウイルスは元々人への感染が最適化されていたようには見えず、研究所から漏洩し、これが人への感染を繰り返すうちにスパイク蛋白質の変異などによって感染力を最適化させていったように見受けられる。

以上から、中国共産党が兵器にする目的でウイルスを研究しており、しかしまだ開発途上のものが漏れた、と考えるのが自然である。いずれにせよ支那の研究所から漏れ出したことは疑いようがなく、アメリカ合衆国政府ほか各国政府はこれを認めていて発生源は中国共産党であるとして名指しをしている。

深まるその由来について、一説では元々このウイルスはカナダ国立微生物学研究所(National Microbiology Laboratory)にあった、という仮説もある。ここの学者だった支那人の女 邱香果と、その支那人の夫 成克定ら支那人スパイによって支那の北京市に2019(平成31)年3月31日に密輸出され、これが武漢ウイルス研究所に運ばれたとされている。こうして支那に渡ったウイルスが、やがて漏洩し世界に蔓延した、とするものである。

三分類

米疾病対策センター(CDC)は、変異株について、次の三種類に分類している。

  • VOI ‐ 注目すべき変異株(感染しやすさに影響する遺伝子変異、クラスター発生が実際に確認されたものなど)
  • VOC ‐ 懸念される変異株(感染率が従来型より高い、重症化しやすいなどの特徴が確認されたものなど)
  • VOHC ‐ 甚大な被害が想定される変異株(ワクチンや治療薬などの有効性が著しく低い、などの特徴が確認されたもの)

これを著している時点で、VOIとVOCには指定があるが、VOHCに指定された変異型は存在しない。

変異株の名称

変異株は多数あるため、Pango系統での分類で呼ばれる。このうち、特に蔓延したものは最初に発生または流行が確認された地域名で呼ばれる。

ただし、中国共産党の下部組織であるWHO(世界保健機関)は責任逃れのためにこの病気に中国共産党を絡めたくないため、地名を出すのは差別などと意味不明な理由を付けて地名を付けないようにした(これは前回のSARSの時も同様)。

そこで思い付きで、蔓延した変異株はα、β、γ、…などととギリシャ文字を付けて呼ぶことにした。しかしただの思い付きでしかなかったため、後でWHOにとっても困る重大な問題があることが分かってしまった。

ギリシャ文字はαβγδεζηθικλμνξοπρστυφχψωと並んでいる。そしてαβγδεζηθικλμまで進み、ミューμ(mu)株の次はニューν(nu)株だが、英語のnewと近いという理由で飛ばされることになった。

これはともかく、その次のクサイξにも問題があった。ξは英語ではXiと書かれ、これはこの病気のそもそもの元凶である習近平(Xi Jinping)の習をピンインで書いた時とたまたま同じだった。WHOとしては、世界中にalphaさんやbetaさん、あるいはそういった社名が幾つあってどんな風評被害を受けようが気にもならない(実際、デルタ航空はデルタ株で甚大な風評被害を受けたとされる)が、習近平様の機嫌を損ねることだけはできないために、たった一人たまたま一致する人がいたというだけでξ(Xi)も飛ばされ、μ株の次はオミクロンο株になったのである。ちなみにオミクロン株ということで、日本でも例えば尾身さんを侮蔑するような者が現われ風評被害を受けることになった。

アミノ酸の変異

表現方法

RNAウイルスである武漢肺炎ウイルスは、増殖を繰り返すうちに遺伝子変異が蓄積し、これによって多くの変異を生じさせている。

変異については、ウイルスが細胞に侵入する際に使う「スパイク蛋白質」を構成しているアミノ酸配列のうちxxx番目のアミノ酸がXからYに変わった時、これを「XxxxY」と表現する。特殊なものを除きウイルスの蛋白質は20種類のアミノ酸からなり、このアミノ酸には英字1文字の記号が付けられているため、この記号を用いる。

特徴的な変異

感染力が強いなどで話題となる主な変異は次の通りである(アルファベット順)。

D614G

614番目のアミノ酸がD(​アスパラギン酸)からG(グリシン)に置換されたもの。

2020(令和2)年6月頃にヨーロッパで多く流行し、フランス、オランダ、スイスなどでは大部分を占めていた

E484K

484番目のアミノ酸がE(​グルタミン酸)からK(リシン)に置換されたもの。

「免疫逃避型変異」などとされており、従来株に感染した人にも感染するため、中和抗体の効果を減弱する可能性が懸念されている。

日本でも2021(令和3)年1月前後からE484K変異を有するB.1.1.316.1(R.1)系統株、B.1.316系統株(カナダ系統株)、B.1.1.4(イギリス系統株)などが確認されるようになった。

F490S

490番目のアミノ酸がF(フェニルアラニン)からS(セリン)に置換されたもの。

F490Sは南米のペルーやブラジルで発見され猛威を奮ったペルー型変異株の系統 B.1.1.1.37(C.37)(WHO名ラムダ(λ)株)に特徴的に見られる変異である。

B.1.1.1.37(C.37)は、他の19の変異に加えて、8つの変異(ORF1a遺伝子:Δ3675-3677、スパイク遺伝子:Δ246-252、G75V、T76I、L452Q、F490S、D614G、T859N)を特徴としている。

この変異株は少なくとも系統 B.1.617.2(WHO名デルタ株)と同程度の感染力があり、更にワクチン効果を弱めるとされている。

K417N

417番目のアミノ酸がK(リシン)からN(アスパラギン)に置換されたもの。

インド型変異株で、WHOがデルタ・プラスなどと呼ぶものもこれに含まれるが、以降に流行したイギリス系統株やB.1.351(南アフリカ型変異株、WHOがベータ株と呼ぶもの)にも見られる。

L452R

452番目のアミノ酸がL(ロイシン)からR(アルギニン)に置換されたもの。

L452Rは2021(令和3)年4月頃からインド国内で猛威を振るった系統 B.1.617.2(WHO名デルタ株)などに見られる変異である。

イギリス型変異株の一つで、WHOがアルファ株と呼ぶ系統 B.1.1.7.SARS-CoV-2 系統 B.1.1.7]]と比して感染力が強く、更にワクチンの効果を弱める可能性も指摘されている。

N501Y

501番目のアミノ酸がN(​アスパラギン)からY(チロシン)に置換されたもの。

感染力が強く、感染が拡大している変異株は概ねこの変異を持っている。2021(令和3)年5月頭頃の東京都内の感染者で約8割とされる。

変異株の呼称

地名

元々の株(野生株)すなわち武漢株(Wuhan-Hu-1)に対し、変異株は最初に発見された地名で分類する。

ただし、中国共産党の工作機関と化したWHOは、このウイルスおよびウイルス感染症に「武漢」という地名を入れないようにするため、変異株についても地名を避けてギリシャ文字で表現するなど、他の機関とは明らかに異なる異質の対応をしている。

Pango系統

Pango系統での分類は次の通り。変異株は無数にあるため、ここでは特徴的な変異株のみを併記する(原則アルファベット順、数字順)。

1字または2字でのPango系統の別名があるものは[]で併記する。

  • B.1
    • B.1.1 (主としてイギリス型変異株)
      • B.1.1.1 [C] ‐ イギリス系統株
      • B.1.1.4 ‐ E484K変異 (イギリス系統株)
      • B.1.1.7 ‐ N501Y変異 (アルファ(α)株)
      • B.1.1.28 [P] ‐ ブラジル系統株
        • B.1.1.28.1 [P.1] ‐ N501Y変異+E484K変異 (ガンマ(γ)株 ‐ ブラジル型変異株)
        • B.1.1.28.2 [P.2] ‐ ゼータ(ζ)株
        • B.1.1.28.3 [P.3] ‐ N501Y変異+E484K変異 (シータ(θ) ‐ フィリピン型変異株)
      • B.1.1.64 ‐ イギリス系統株 [軽症〜中等症]
      • B.1.1.82 ‐ イギリス系統株
      • B.1.1.101 ‐ インド系統株 [重症]
      • B.1.1.130 ‐ イギリス/スウェーデン系統株 [中等症]
      • B.1.1.155 ‐ イギリス系統株
      • B.1.1.214 ‐ 日本系統株(従来株) [重症]
      • B.1.1.220 ‐ イギリス系統株(B.1.1.44系譜の一部とされる) [軽症]
      • B.1.1.284 ‐ 日本系統株(従来株) [軽症]
      • B.1.1.316 [R] ‐ Q677H変異 (アメリカ系統株)
        • B.1.1.316.1 [R.1] ‐ E484K変異 (日本系統株)
      • B.1.1.529 [BA] ‐ オミクロン(ο)株
    • B.1.2
    • B.1.316 ‐ E484K変異 (カナダ系統株)
    • B.1.346 ‐ アメリカ系統株 [軽症]
    • B.1.351 ‐ N501Y変異+E484K変異 (ベータ(β) ‐ 南アフリカ型変異株)
    • B.1.427/B.1.429 ‐ L452R変異 (イプシロン(ε) ‐ カリフォルニア型変異株)
    • B.1.525 ‐ イータ(η)株
    • B.1.526 ‐ イオタ(ι)株
    • B.1.617 (インド型変異株)
    • B.1.621 ‐ ミュー(μ) ‐ コロンビア型変異株

Pango系統の別名

数字区切りは大変覚えにくいため、代表的な変異株には英字1〜2字での別名が与えられている。

  • C ‐ B.1.1.1
  • D ‐ B.1.1.25
  • E ‐ B.1.416
  • F ‐ B.1.36.17
  • G ‐ B.1.258.2
  • H ‐ B.1.1.67
  • I ‐ B.1.1.217 → S
  • J ‐ B.1.1.250
  • K ‐ B.1.1.277
  • L ‐ B.1.1.10
  • M ‐ B.1.1.294
  • N ‐ B.1.1.33
  • O
  • P ‐ B.1.1.28 (ガンマ(γ)株、ゼータ(ζ)株、シータ(θ)株)
  • Q ‐ B.1.1.7 (アルファ(α)株)
  • R ‐ B.1.1.316
  • S ‐ B.1.1.217 ←I
  • T
  • U ‐ B.1.177.60
  • V ‐ B.1.177.54
  • W ‐ B.1.177.53
  • X
  • Y ‐ B.1.177.52
  • Z ‐ B.1.177.50
  • AA ‐ B.1.177.15
  • AB ‐ B.1.160.16
  • AC ‐ B.1.1.405
  • AD ‐ B.1.1.315
  • AE ‐ B.1.1.306
  • AF ‐ B.1.1.305
  • AG ‐ B.1.1.297
  • AH ‐ B.1.1.241
  • AI
  • AJ ‐ B.1.1.240
  • AK ‐ B.1.1.232
  • AL ‐ B.1.1.231
  • AM ‐ B.1.1.216
  • AN ‐ B.1.1.200
  • AO
  • AP ‐ B.1.1.70
  • AQ ‐ B.1.1.39
  • AR
  • AS ‐ B.1.1.317
  • AT ‐ B.1.1.370
  • AU ‐ B.1.466.2
  • AV ‐ B.1.1.482
  • AW ‐ B.1.1.464
  • AX
  • AY ‐ B.1.617.2 (デルタ(δ)株)
  • AZ ‐ B.1.1.318
  • BA ‐ B.1.1.529 (オミクロン(ο)株)
  • BB ‐ B.1.621.1
  • BC ‐ B.1.1.529.1.1.1 (= BA.1.1.1)
  • BD
  • BE ‐ B.1.1.529.5.3.1 (= BA.5.3.1)
  • BF ‐ B.1.1.529.5.2.1 (= BA.5.2.1)

CDC分類

CDC分類で階層化した場合は次のようになる。CDC分類、Pango系統、WHOの呼称、一般的な呼称を以下に記す。

組換え体

武漢肺炎ウイルス(SARS-CoV-2)を含むRNAウイルスは、遺伝子組換え(二種類以上の同種または近縁ウイルス間で、遺伝子の一部が組換わったゲノムを有するウイルスが生成されること)が生じることが知られている。

異なる系統のウイルスが同時に宿主に感染することで生じると考えられるが、武漢肺炎ウイルスにも様々な組換え体と考えられるウイルスが検出されている。

  • XA ‐ B.1.1.7 と B.1.177、イギリス
  • XB ‐ B.1.634 と B.1.631、北米と中米
  • XC ‐ AY.29 と B.1.1.7、日本
  • XD ‐ デルタ株 と BA.1、フランス、デンマーク
  • XE ‐ BA.1 と BA.2、イギリス
  • XF ‐ デルタ株 と BA.1、イギリス
  • XG ‐ BA.1 と BA.2、デンマーク
  • XH ‐ BA.1 と BA.2、デンマーク
  • XI(欠番)
  • XJ ‐ BA.1 と BA.2、フィンランド
  • XK ‐ BA.1 と BA.2、ベルギー
  • XL ‐ BA.1 と BA.2、イギリス
  • XM ‐ BA.1.1 と BA.2、ヨーロッパ
  • XN ‐ BA.1 と BA.2、イギリス
  • XO(欠番)
  • XP ‐ BA.1.1 と BA.2、イギリス
  • XQ ‐ BA.1.1 と BA.2、イギリス
  • XR ‐ BA.1.1 と BA.2、イギリス
  • XS ‐ デルタ株 と BA.1.1、アメリカ
  • XT ‐ BA.1 と BA.2、南アフリカ
  • XU ‐ BA.1 と BA.2、インド
  • XV ‐ BA.1 と BA.2、デンマーク、イタリア
  • XW ‐ BA.1 と BA.2、アメリカ、ドイツ
  • XX(欠番)
  • XY ‐ BA.1 と BA.2、アメリカ
  • XZ ‐ BA.2 と BA.1、アメリカ
  • XAA ‐ BA.1 と BA.2、アメリカ
  • XAB ‐ BA.1 と BA.2、ドイツ

特に大流行したオミクロン株の二つの系統(BA.1、BA.2)の組換え体が多く報告されている。

コード

元々のSARS-CoV-2のゲノムは29,903塩基対からなり、このゲノムには10種類の遺伝子がコードされている。掲示のアミノ酸長は終止コドンの数1を含むものとする。

遺伝子開始終了遺伝子長アミノ酸長
ORF1ab266..13468,13468..2155521,2887,096
S21563253843,8221,274
ORF3a2539326220828276
S262452647222876
S2652327191669223
ORF6272022738718662
ORF7a2739427759366122
ORF82789428259366122
N28274295331,260420
ORF10295582967411739

ウイルスの構造に関係する遺伝子として、S(スパイク)、E(エンベロープ)、M(メンブレン)、N(ヌクレオカプシド)の4種類が対応する。

オーバーラップ遺伝子として、ORF3aにORF3cとORF3b、NにORF9bとORF14の存在が示唆されている。

非翻訳領域は2つあり、5'末端側に265塩基対、3'末端側に229塩基対(ポリAテールを含む)がある。

なお、変異株についてはこれと変化しているものがある。

ORF1ab

ゲノム全体の71.2%がORF1abという遺伝子である。ORF1aとORF1bが融合したもので7096アミノ酸にもなる。こうなる理由は後述するが、その理由によってORF1abはそのままでは機能しない。これが蛋白質分解酵素で切断されることにより、16種類の機能する蛋白質となり、この中にRNA複製に関与するRNA依存性RNAポリメラーゼ(nsp12)や、RNA複製時のエラーを構成する酵素(nsp14)といったものが含まれている。

ORF1abは非常に特徴的なゲノム配列である。通常、3ヌクレオチド=1アミノ酸となるトリプレット暗号であるので遺伝子の長さは3で割り切れる。しかしORF1abは3で割り切れない。これはヌクレオチド13,468が2回使用されるからである。

mRNAの配列によって、「滑りやすい配列」とされるXXXYYYZ構造のヘプタヌクレオチドがある。SARS-CoV-2のゲノムの場合、UUUAAACという構造が該当し、ヌクレオチド13,468で滑る。このため13451から見て、本来なら

13451 GCA[A] CAA[Q] UCG[S] UUU[F] UUA[L] AAC[N] GGG[G] UUU[F] GCG[A] GUG[V] UAA[終止]

と翻訳され、終止コドンで止まってここで無事にORF1aという蛋白質ができるべきところ、リボソームがスリップを起こしてヌクレオチド13,468が2回翻訳されるため、以降1ヌクレオチドずつずれたフレームシフト突然変異を起こし、結果として7,096アミノ酸の蛋白質を作る。

13451 GCA[A] CAA[Q] UCG[S] UUU[F] UUA[L] AAC[N] CGG[R] GUU[V] UGC[C] GGU[G] GUA[V] AGU[S] GCA[A]…

全ゲノム配列

これは支那の武漢市で検出されたオリジナルのSARS-CoV-2(いわゆる武漢株、Wuhan-Hu-1)のものであり、他の株は概ねどこかが変異している。

SARS-CoV-2はRNAウイルスであるため、チミン(T)ではなくウラシル(U)が使われる。

フレームシフト突然変異が発生しているヌクレオチド13,468を強調している。

ORIGIN
    1 AUUAAAGGUU UAUACCUUCC CAGGUAACAA ACCAACCAAC UUUCGAUCUC UUGUAGAUCU
   61 GUUCUCUAAA CGAACUUUAA AAUCUGUGUG GCUGUCACUC GGCUGCAUGC UUAGUGCACU
  121 CACGCAGUAU AAUUAAUAAC UAAUUACUGU CGUUGACAGG ACACGAGUAA CUCGUCUAUC
  181 UUCUGCAGGC UGCUUACGGU UUCGUCCGUG UUGCAGCCGA UCAUCAGCAC AUCUAGGUUU
  241 CGUCCGGGUG UGACCGAAAG GUAAGAUGGA GAGCCUUGUC CCUGGUUUCA ACGAGAAAAC
  301 ACACGUCCAA CUCAGUUUGC CUGUUUUACA GGUUCGCGAC GUGCUCGUAC GUGGCUUUGG
  361 AGACUCCGUG GAGGAGGUCU UAUCAGAGGC ACGUCAACAU CUUAAAGAUG GCACUUGUGG
  421 CUUAGUAGAA GUUGAAAAAG GCGUUUUGCC UCAACUUGAA CAGCCCUAUG UGUUCAUCAA
  481 ACGUUCGGAU GCUCGAACUG CACCUCAUGG UCAUGUUAUG GUUGAGCUGG UAGCAGAACU
  541 CGAAGGCAUU CAGUACGGUC GUAGUGGUGA GACACUUGGU GUCCUUGUCC CUCAUGUGGG
  601 CGAAAUACCA GUGGCUUACC GCAAGGUUCU UCUUCGUAAG AACGGUAAUA AAGGAGCUGG
  661 UGGCCAUAGU UACGGCGCCG AUCUAAAGUC AUUUGACUUA GGCGACGAGC UUGGCACUGA
  721 UCCUUAUGAA GAUUUUCAAG AAAACUGGAA CACUAAACAU AGCAGUGGUG UUACCCGUGA
  781 ACUCAUGCGU GAGCUUAACG GAGGGGCAUA CACUCGCUAU GUCGAUAACA ACUUCUGUGG
  841 CCCUGAUGGC UACCCUCUUG AGUGCAUUAA AGACCUUCUA GCACGUGCUG GUAAAGCUUC
  901 AUGCACUUUG UCCGAACAAC UGGACUUUAU UGACACUAAG AGGGGUGUAU ACUGCUGCCG
  961 UGAACAUGAG CAUGAAAUUG CUUGGUACAC GGAACGUUCU GAAAAGAGCU AUGAAUUGCA
 1021 GACACCUUUU GAAAUUAAAU UGGCAAAGAA AUUUGACACC UUCAAUGGGG AAUGUCCAAA
 1081 UUUUGUAUUU CCCUUAAAUU CCAUAAUCAA GACUAUUCAA CCAAGGGUUG AAAAGAAAAA
 1141 GCUUGAUGGC UUUAUGGGUA GAAUUCGAUC UGUCUAUCCA GUUGCGUCAC CAAAUGAAUG
 1201 CAACCAAAUG UGCCUUUCAA CUCUCAUGAA GUGUGAUCAU UGUGGUGAAA CUUCAUGGCA
 1261 GACGGGCGAU UUUGUUAAAG CCACUUGCGA AUUUUGUGGC ACUGAGAAUU UGACUAAAGA
 1321 AGGUGCCACU ACUUGUGGUU ACUUACCCCA AAAUGCUGUU GUUAAAAUUU AUUGUCCAGC
 1381 AUGUCACAAU UCAGAAGUAG GACCUGAGCA UAGUCUUGCC GAAUACCAUA AUGAAUCUGG
 1441 CUUGAAAACC AUUCUUCGUA AGGGUGGUCG CACUAUUGCC UUUGGAGGCU GUGUGUUCUC
 1501 UUAUGUUGGU UGCCAUAACA AGUGUGCCUA UUGGGUUCCA CGUGCUAGCG CUAACAUAGG
 1561 UUGUAACCAU ACAGGUGUUG UUGGAGAAGG UUCCGAAGGU CUUAAUGACA ACCUUCUUGA
 1621 AAUACUCCAA AAAGAGAAAG UCAACAUCAA UAUUGUUGGU GACUUUAAAC UUAAUGAAGA
 1681 GAUCGCCAUU AUUUUGGCAU CUUUUUCUGC UUCCACAAGU GCUUUUGUGG AAACUGUGAA
 1741 AGGUUUGGAU UAUAAAGCAU UCAAACAAAU UGUUGAAUCC UGUGGUAAUU UUAAAGUUAC
 1801 AAAAGGAAAA GCUAAAAAAG GUGCCUGGAA UAUUGGUGAA CAGAAAUCAA UACUGAGUCC
 1861 UCUUUAUGCA UUUGCAUCAG AGGCUGCUCG UGUUGUACGA UCAAUUUUCU CCCGCACUCU
 1921 UGAAACUGCU CAAAAUUCUG UGCGUGUUUU ACAGAAGGCC GCUAUAACAA UACUAGAUGG
 1981 AAUUUCACAG UAUUCACUGA GACUCAUUGA UGCUAUGAUG UUCACAUCUG AUUUGGCUAC
 2041 UAACAAUCUA GUUGUAAUGG CCUACAUUAC AGGUGGUGUU GUUCAGUUGA CUUCGCAGUG
 2101 GCUAACUAAC AUCUUUGGCA CUGUUUAUGA AAAACUCAAA CCCGUCCUUG AUUGGCUUGA
 2161 AGAGAAGUUU AAGGAAGGUG UAGAGUUUCU UAGAGACGGU UGGGAAAUUG UUAAAUUUAU
 2221 CUCAACCUGU GCUUGUGAAA UUGUCGGUGG ACAAAUUGUC ACCUGUGCAA AGGAAAUUAA
 2281 GGAGAGUGUU CAGACAUUCU UUAAGCUUGU AAAUAAAUUU UUGGCUUUGU GUGCUGACUC
 2341 UAUCAUUAUU GGUGGAGCUA AACUUAAAGC CUUGAAUUUA GGUGAAACAU UUGUCACGCA
 2401 CUCAAAGGGA UUGUACAGAA AGUGUGUUAA AUCCAGAGAA GAAACUGGCC UACUCAUGCC
 2461 UCUAAAAGCC CCAAAAGAAA UUAUCUUCUU AGAGGGAGAA ACACUUCCCA CAGAAGUGUU
 2521 AACAGAGGAA GUUGUCUUGA AAACUGGUGA UUUACAACCA UUAGAACAAC CUACUAGUGA
 2581 AGCUGUUGAA GCUCCAUUGG UUGGUACACC AGUUUGUAUU AACGGGCUUA UGUUGCUCGA
 2641 AAUCAAAGAC ACAGAAAAGU ACUGUGCCCU UGCACCUAAU AUGAUGGUAA CAAACAAUAC
 2701 CUUCACACUC AAAGGCGGUG CACCAACAAA GGUUACUUUU GGUGAUGACA CUGUGAUAGA
 2761 AGUGCAAGGU UACAAGAGUG UGAAUAUCAC UUUUGAACUU GAUGAAAGGA UUGAUAAAGU
 2821 ACUUAAUGAG AAGUGCUCUG CCUAUACAGU UGAACUCGGU ACAGAAGUAA AUGAGUUCGC
 2881 CUGUGUUGUG GCAGAUGCUG UCAUAAAAAC UUUGCAACCA GUAUCUGAAU UACUUACACC
 2941 ACUGGGCAUU GAUUUAGAUG AGUGGAGUAU GGCUACAUAC UACUUAUUUG AUGAGUCUGG
 3001 UGAGUUUAAA UUGGCUUCAC AUAUGUAUUG UUCUUUCUAC CCUCCAGAUG AGGAUGAAGA
 3061 AGAAGGUGAU UGUGAAGAAG AAGAGUUUGA GCCAUCAACU CAAUAUGAGU AUGGUACUGA
 3121 AGAUGAUUAC CAAGGUAAAC CUUUGGAAUU UGGUGCCACU UCUGCUGCUC UUCAACCUGA
 3181 AGAAGAGCAA GAAGAAGAUU GGUUAGAUGA UGAUAGUCAA CAAACUGUUG GUCAACAAGA
 3241 CGGCAGUGAG GACAAUCAGA CAACUACUAU UCAAACAAUU GUUGAGGUUC AACCUCAAUU
 3301 AGAGAUGGAA CUUACACCAG UUGUUCAGAC UAUUGAAGUG AAUAGUUUUA GUGGUUAUUU
 3361 AAAACUUACU GACAAUGUAU ACAUUAAAAA UGCAGACAUU GUGGAAGAAG CUAAAAAGGU
 3421 AAAACCAACA GUGGUUGUUA AUGCAGCCAA UGUUUACCUU AAACAUGGAG GAGGUGUUGC
 3481 AGGAGCCUUA AAUAAGGCUA CUAACAAUGC CAUGCAAGUU GAAUCUGAUG AUUACAUAGC
 3541 UACUAAUGGA CCACUUAAAG UGGGUGGUAG UUGUGUUUUA AGCGGACACA AUCUUGCUAA
 3601 ACACUGUCUU CAUGUUGUCG GCCCAAAUGU UAACAAAGGU GAAGACAUUC AACUUCUUAA
 3661 GAGUGCUUAU GAAAAUUUUA AUCAGCACGA AGUUCUACUU GCACCAUUAU UAUCAGCUGG
 3721 UAUUUUUGGU GCUGACCCUA UACAUUCUUU AAGAGUUUGU GUAGAUACUG UUCGCACAAA
 3781 UGUCUACUUA GCUGUCUUUG AUAAAAAUCU CUAUGACAAA CUUGUUUCAA GCUUUUUGGA
 3841 AAUGAAGAGU GAAAAGCAAG UUGAACAAAA GAUCGCUGAG AUUCCUAAAG AGGAAGUUAA
 3901 GCCAUUUAUA ACUGAAAGUA AACCUUCAGU UGAACAGAGA AAACAAGAUG AUAAGAAAAU
 3961 CAAAGCUUGU GUUGAAGAAG UUACAACAAC UCUGGAAGAA ACUAAGUUCC UCACAGAAAA
 4021 CUUGUUACUU UAUAUUGACA UUAAUGGCAA UCUUCAUCCA GAUUCUGCCA CUCUUGUUAG
 4081 UGACAUUGAC AUCACUUUCU UAAAGAAAGA UGCUCCAUAU AUAGUGGGUG AUGUUGUUCA
 4141 AGAGGGUGUU UUAACUGCUG UGGUUAUACC UACUAAAAAG GCUGGUGGCA CUACUGAAAU
 4201 GCUAGCGAAA GCUUUGAGAA AAGUGCCAAC AGACAAUUAU AUAACCACUU ACCCGGGUCA
 4261 GGGUUUAAAU GGUUACACUG UAGAGGAGGC AAAGACAGUG CUUAAAAAGU GUAAAAGUGC
 4321 CUUUUACAUU CUACCAUCUA UUAUCUCUAA UGAGAAGCAA GAAAUUCUUG GAACUGUUUC
 4381 UUGGAAUUUG CGAGAAAUGC UUGCACAUGC AGAAGAAACA CGCAAAUUAA UGCCUGUCUG
 4441 UGUGGAAACU AAAGCCAUAG UUUCAACUAU ACAGCGUAAA UAUAAGGGUA UUAAAAUACA
 4501 AGAGGGUGUG GUUGAUUAUG GUGCUAGAUU UUACUUUUAC ACCAGUAAAA CAACUGUAGC
 4561 GUCACUUAUC AACACACUUA ACGAUCUAAA UGAAACUCUU GUUACAAUGC CACUUGGCUA
 4621 UGUAACACAU GGCUUAAAUU UGGAAGAAGC UGCUCGGUAU AUGAGAUCUC UCAAAGUGCC
 4681 AGCUACAGUU UCUGUUUCUU CACCUGAUGC UGUUACAGCG UAUAAUGGUU AUCUUACUUC
 4741 UUCUUCUAAA ACACCUGAAG AACAUUUUAU UGAAACCAUC UCACUUGCUG GUUCCUAUAA
 4801 AGAUUGGUCC UAUUCUGGAC AAUCUACACA ACUAGGUAUA GAAUUUCUUA AGAGAGGUGA
 4861 UAAAAGUGUA UAUUACACUA GUAAUCCUAC CACAUUCCAC CUAGAUGGUG AAGUUAUCAC
 4921 CUUUGACAAU CUUAAGACAC UUCUUUCUUU GAGAGAAGUG AGGACUAUUA AGGUGUUUAC
 4981 AACAGUAGAC AACAUUAACC UCCACACGCA AGUUGUGGAC AUGUCAAUGA CAUAUGGACA
 5041 ACAGUUUGGU CCAACUUAUU UGGAUGGAGC UGAUGUUACU AAAAUAAAAC CUCAUAAUUC
 5101 ACAUGAAGGU AAAACAUUUU AUGUUUUACC UAAUGAUGAC ACUCUACGUG UUGAGGCUUU
 5161 UGAGUACUAC CACACAACUG AUCCUAGUUU UCUGGGUAGG UACAUGUCAG CAUUAAAUCA
 5221 CACUAAAAAG UGGAAAUACC CACAAGUUAA UGGUUUAACU UCUAUUAAAU GGGCAGAUAA
 5281 CAACUGUUAU CUUGCCACUG CAUUGUUAAC ACUCCAACAA AUAGAGUUGA AGUUUAAUCC
 5341 ACCUGCUCUA CAAGAUGCUU AUUACAGAGC AAGGGCUGGU GAAGCUGCUA ACUUUUGUGC
 5401 ACUUAUCUUA GCCUACUGUA AUAAGACAGU AGGUGAGUUA GGUGAUGUUA GAGAAACAAU
 5461 GAGUUACUUG UUUCAACAUG CCAAUUUAGA UUCUUGCAAA AGAGUCUUGA ACGUGGUGUG
 5521 UAAAACUUGU GGACAACAGC AGACAACCCU UAAGGGUGUA GAAGCUGUUA UGUACAUGGG
 5581 CACACUUUCU UAUGAACAAU UUAAGAAAGG UGUUCAGAUA CCUUGUACGU GUGGUAAACA
 5641 AGCUACAAAA UAUCUAGUAC AACAGGAGUC ACCUUUUGUU AUGAUGUCAG CACCACCUGC
 5701 UCAGUAUGAA CUUAAGCAUG GUACAUUUAC UUGUGCUAGU GAGUACACUG GUAAUUACCA
 5761 GUGUGGUCAC UAUAAACAUA UAACUUCUAA AGAAACUUUG UAUUGCAUAG ACGGUGCUUU
 5821 ACUUACAAAG UCCUCAGAAU ACAAAGGUCC UAUUACGGAU GUUUUCUACA AAGAAAACAG
 5881 UUACACAACA ACCAUAAAAC CAGUUACUUA UAAAUUGGAU GGUGUUGUUU GUACAGAAAU
 5941 UGACCCUAAG UUGGACAAUU AUUAUAAGAA AGACAAUUCU UAUUUCACAG AGCAACCAAU
 6001 UGAUCUUGUA CCAAACCAAC CAUAUCCAAA CGCAAGCUUC GAUAAUUUUA AGUUUGUAUG
 6061 UGAUAAUAUC AAAUUUGCUG AUGAUUUAAA CCAGUUAACU GGUUAUAAGA AACCUGCUUC
 6121 AAGAGAGCUU AAAGUUACAU UUUUCCCUGA CUUAAAUGGU GAUGUGGUGG CUAUUGAUUA
 6181 UAAACACUAC ACACCCUCUU UUAAGAAAGG AGCUAAAUUG UUACAUAAAC CUAUUGUUUG
 6241 GCAUGUUAAC AAUGCAACUA AUAAAGCCAC GUAUAAACCA AAUACCUGGU GUAUACGUUG
 6301 UCUUUGGAGC ACAAAACCAG UUGAAACAUC AAAUUCGUUU GAUGUACUGA AGUCAGAGGA
 6361 CGCGCAGGGA AUGGAUAAUC UUGCCUGCGA AGAUCUAAAA CCAGUCUCUG AAGAAGUAGU
 6421 GGAAAAUCCU ACCAUACAGA AAGACGUUCU UGAGUGUAAU GUGAAAACUA CCGAAGUUGU
 6481 AGGAGACAUU AUACUUAAAC CAGCAAAUAA UAGUUUAAAA AUUACAGAAG AGGUUGGCCA
 6541 CACAGAUCUA AUGGCUGCUU AUGUAGACAA UUCUAGUCUU ACUAUUAAGA AACCUAAUGA
 6601 AUUAUCUAGA GUAUUAGGUU UGAAAACCCU UGCUACUCAU GGUUUAGCUG CUGUUAAUAG
 6661 UGUCCCUUGG GAUACUAUAG CUAAUUAUGC UAAGCCUUUU CUUAACAAAG UUGUUAGUAC
 6721 AACUACUAAC AUAGUUACAC GGUGUUUAAA CCGUGUUUGU ACUAAUUAUA UGCCUUAUUU
 6781 CUUUACUUUA UUGCUACAAU UGUGUACUUU UACUAGAAGU ACAAAUUCUA GAAUUAAAGC
 6841 AUCUAUGCCG ACUACUAUAG CAAAGAAUAC UGUUAAGAGU GUCGGUAAAU UUUGUCUAGA
 6901 GGCUUCAUUU AAUUAUUUGA AGUCACCUAA UUUUUCUAAA CUGAUAAAUA UUAUAAUUUG
 6961 GUUUUUACUA UUAAGUGUUU GCCUAGGUUC UUUAAUCUAC UCAACCGCUG CUUUAGGUGU
 7021 UUUAAUGUCU AAUUUAGGCA UGCCUUCUUA CUGUACUGGU UACAGAGAAG GCUAUUUGAA
 7081 CUCUACUAAU GUCACUAUUG CAACCUACUG UACUGGUUCU AUACCUUGUA GUGUUUGUCU
 7141 UAGUGGUUUA GAUUCUUUAG ACACCUAUCC UUCUUUAGAA ACUAUACAAA UUACCAUUUC
 7201 AUCUUUUAAA UGGGAUUUAA CUGCUUUUGG CUUAGUUGCA GAGUGGUUUU UGGCAUAUAU
 7261 UCUUUUCACU AGGUUUUUCU AUGUACUUGG AUUGGCUGCA AUCAUGCAAU UGUUUUUCAG
 7321 CUAUUUUGCA GUACAUUUUA UUAGUAAUUC UUGGCUUAUG UGGUUAAUAA UUAAUCUUGU
 7381 ACAAAUGGCC CCGAUUUCAG CUAUGGUUAG AAUGUACAUC UUCUUUGCAU CAUUUUAUUA
 7441 UGUAUGGAAA AGUUAUGUGC AUGUUGUAGA CGGUUGUAAU UCAUCAACUU GUAUGAUGUG
 7501 UUACAAACGU AAUAGAGCAA CAAGAGUCGA AUGUACAACU AUUGUUAAUG GUGUUAGAAG
 7561 GUCCUUUUAU GUCUAUGCUA AUGGAGGUAA AGGCUUUUGC AAACUACACA AUUGGAAUUG
 7621 UGUUAAUUGU GAUACAUUCU GUGCUGGUAG UACAUUUAUU AGUGAUGAAG UUGCGAGAGA
 7681 CUUGUCACUA CAGUUUAAAA GACCAAUAAA UCCUACUGAC CAGUCUUCUU ACAUCGUUGA
 7741 UAGUGUUACA GUGAAGAAUG GUUCCAUCCA UCUUUACUUU GAUAAAGCUG GUCAAAAGAC
 7801 UUAUGAAAGA CAUUCUCUCU CUCAUUUUGU UAACUUAGAC AACCUGAGAG CUAAUAACAC
 7861 UAAAGGUUCA UUGCCUAUUA AUGUUAUAGU UUUUGAUGGU AAAUCAAAAU GUGAAGAAUC
 7921 AUCUGCAAAA UCAGCGUCUG UUUACUACAG UCAGCUUAUG UGUCAACCUA UACUGUUACU
 7981 AGAUCAGGCA UUAGUGUCUG AUGUUGGUGA UAGUGCGGAA GUUGCAGUUA AAAUGUUUGA
 8041 UGCUUACGUU AAUACGUUUU CAUCAACUUU UAACGUACCA AUGGAAAAAC UCAAAACACU
 8101 AGUUGCAACU GCAGAAGCUG AACUUGCAAA GAAUGUGUCC UUAGACAAUG UCUUAUCUAC
 8161 UUUUAUUUCA GCAGCUCGGC AAGGGUUUGU UGAUUCAGAU GUAGAAACUA AAGAUGUUGU
 8221 UGAAUGUCUU AAAUUGUCAC AUCAAUCUGA CAUAGAAGUU ACUGGCGAUA GUUGUAAUAA
 8281 CUAUAUGCUC ACCUAUAACA AAGUUGAAAA CAUGACACCC CGUGACCUUG GUGCUUGUAU
 8341 UGACUGUAGU GCGCGUCAUA UUAAUGCGCA GGUAGCAAAA AGUCACAACA UUGCUUUGAU
 8401 AUGGAACGUU AAAGAUUUCA UGUCAUUGUC UGAACAACUA CGAAAACAAA UACGUAGUGC
 8461 UGCUAAAAAG AAUAACUUAC CUUUUAAGUU GACAUGUGCA ACUACUAGAC AAGUUGUUAA
 8521 UGUUGUAACA ACAAAGAUAG CACUUAAGGG UGGUAAAAUU GUUAAUAAUU GGUUGAAGCA
 8581 GUUAAUUAAA GUUACACUUG UGUUCCUUUU UGUUGCUGCU AUUUUCUAUU UAAUAACACC
 8641 UGUUCAUGUC AUGUCUAAAC AUACUGACUU UUCAAGUGAA AUCAUAGGAU ACAAGGCUAU
 8701 UGAUGGUGGU GUCACUCGUG ACAUAGCAUC UACAGAUACU UGUUUUGCUA ACAAACAUGC
 8761 UGAUUUUGAC ACAUGGUUUA GCCAGCGUGG UGGUAGUUAU ACUAAUGACA AAGCUUGCCC
 8821 AUUGAUUGCU GCAGUCAUAA CAAGAGAAGU GGGUUUUGUC GUGCCUGGUU UGCCUGGCAC
 8881 GAUAUUACGC ACAACUAAUG GUGACUUUUU GCAUUUCUUA CCUAGAGUUU UUAGUGCAGU
 8941 UGGUAACAUC UGUUACACAC CAUCAAAACU UAUAGAGUAC ACUGACUUUG CAACAUCAGC
 9001 UUGUGUUUUG GCUGCUGAAU GUACAAUUUU UAAAGAUGCU UCUGGUAAGC CAGUACCAUA
 9061 UUGUUAUGAU ACCAAUGUAC UAGAAGGUUC UGUUGCUUAU GAAAGUUUAC GCCCUGACAC
 9121 ACGUUAUGUG CUCAUGGAUG GCUCUAUUAU UCAAUUUCCU AACACCUACC UUGAAGGUUC
 9181 UGUUAGAGUG GUAACAACUU UUGAUUCUGA GUACUGUAGG CACGGCACUU GUGAAAGAUC
 9241 AGAAGCUGGU GUUUGUGUAU CUACUAGUGG UAGAUGGGUA CUUAACAAUG AUUAUUACAG
 9301 AUCUUUACCA GGAGUUUUCU GUGGUGUAGA UGCUGUAAAU UUACUUACUA AUAUGUUUAC
 9361 ACCACUAAUU CAACCUAUUG GUGCUUUGGA CAUAUCAGCA UCUAUAGUAG CUGGUGGUAU
 9421 UGUAGCUAUC GUAGUAACAU GCCUUGCCUA CUAUUUUAUG AGGUUUAGAA GAGCUUUUGG
 9481 UGAAUACAGU CAUGUAGUUG CCUUUAAUAC UUUACUAUUC CUUAUGUCAU UCACUGUACU
 9541 CUGUUUAACA CCAGUUUACU CAUUCUUACC UGGUGUUUAU UCUGUUAUUU ACUUGUACUU
 9601 GACAUUUUAU CUUACUAAUG AUGUUUCUUU UUUAGCACAU AUUCAGUGGA UGGUUAUGUU
 9661 CACACCUUUA GUACCUUUCU GGAUAACAAU UGCUUAUAUC AUUUGUAUUU CCACAAAGCA
 9721 UUUCUAUUGG UUCUUUAGUA AUUACCUAAA GAGACGUGUA GUCUUUAAUG GUGUUUCCUU
 9781 UAGUACUUUU GAAGAAGCUG CGCUGUGCAC CUUUUUGUUA AAUAAAGAAA UGUAUCUAAA
 9841 GUUGCGUAGU GAUGUGCUAU UACCUCUUAC GCAAUAUAAU AGAUACUUAG CUCUUUAUAA
 9901 UAAGUACAAG UAUUUUAGUG GAGCAAUGGA UACAACUAGC UACAGAGAAG CUGCUUGUUG
 9961 UCAUCUCGCA AAGGCUCUCA AUGACUUCAG UAACUCAGGU UCUGAUGUUC UUUACCAACC
10021 ACCACAAACC UCUAUCACCU CAGCUGUUUU GCAGAGUGGU UUUAGAAAAA UGGCAUUCCC
10081 AUCUGGUAAA GUUGAGGGUU GUAUGGUACA AGUAACUUGU GGUACAACUA CACUUAACGG
10141 UCUUUGGCUU GAUGACGUAG UUUACUGUCC AAGACAUGUG AUCUGCACCU CUGAAGACAU
10201 GCUUAACCCU AAUUAUGAAG AUUUACUCAU UCGUAAGUCU AAUCAUAAUU UCUUGGUACA
10261 GGCUGGUAAU GUUCAACUCA GGGUUAUUGG ACAUUCUAUG CAAAAUUGUG UACUUAAGCU
10321 UAAGGUUGAU ACAGCCAAUC CUAAGACACC UAAGUAUAAG UUUGUUCGCA UUCAACCAGG
10381 ACAGACUUUU UCAGUGUUAG CUUGUUACAA UGGUUCACCA UCUGGUGUUU ACCAAUGUGC
10441 UAUGAGGCCC AAUUUCACUA UUAAGGGUUC AUUCCUUAAU GGUUCAUGUG GUAGUGUUGG
10501 UUUUAACAUA GAUUAUGACU GUGUCUCUUU UUGUUACAUG CACCAUAUGG AAUUACCAAC
10561 UGGAGUUCAU GCUGGCACAG ACUUAGAAGG UAACUUUUAU GGACCUUUUG UUGACAGGCA
10621 AACAGCACAA GCAGCUGGUA CGGACACAAC UAUUACAGUU AAUGUUUUAG CUUGGUUGUA
10681 CGCUGCUGUU AUAAAUGGAG ACAGGUGGUU UCUCAAUCGA UUUACCACAA CUCUUAAUGA
10741 CUUUAACCUU GUGGCUAUGA AGUACAAUUA UGAACCUCUA ACACAAGACC AUGUUGACAU
10801 ACUAGGACCU CUUUCUGCUC AAACUGGAAU UGCCGUUUUA GAUAUGUGUG CUUCAUUAAA
10861 AGAAUUACUG CAAAAUGGUA UGAAUGGACG UACCAUAUUG GGUAGUGCUU UAUUAGAAGA
10921 UGAAUUUACA CCUUUUGAUG UUGUUAGACA AUGCUCAGGU GUUACUUUCC AAAGUGCAGU
10981 GAAAAGAACA AUCAAGGGUA CACACCACUG GUUGUUACUC ACAAUUUUGA CUUCACUUUU
11041 AGUUUUAGUC CAGAGUACUC AAUGGUCUUU GUUCUUUUUU UUGUAUGAAA AUGCCUUUUU
11101 ACCUUUUGCU AUGGGUAUUA UUGCUAUGUC UGCUUUUGCA AUGAUGUUUG UCAAACAUAA
11161 GCAUGCAUUU CUCUGUUUGU UUUUGUUACC UUCUCUUGCC ACUGUAGCUU AUUUUAAUAU
11221 GGUCUAUAUG CCUGCUAGUU GGGUGAUGCG UAUUAUGACA UGGUUGGAUA UGGUUGAUAC
11281 UAGUUUGUCU GGUUUUAAGC UAAAAGACUG UGUUAUGUAU GCAUCAGCUG UAGUGUUACU
11341 AAUCCUUAUG ACAGCAAGAA CUGUGUAUGA UGAUGGUGCU AGGAGAGUGU GGACACUUAU
11401 GAAUGUCUUG ACACUCGUUU AUAAAGUUUA UUAUGGUAAU GCUUUAGAUC AAGCCAUUUC
11461 CAUGUGGGCU CUUAUAAUCU CUGUUACUUC UAACUACUCA GGUGUAGUUA CAACUGUCAU
11521 GUUUUUGGCC AGAGGUAUUG UUUUUAUGUG UGUUGAGUAU UGCCCUAUUU UCUUCAUAAC
11581 UGGUAAUACA CUUCAGUGUA UAAUGCUAGU UUAUUGUUUC UUAGGCUAUU UUUGUACUUG
11641 UUACUUUGGC CUCUUUUGUU UACUCAACCG CUACUUUAGA CUGACUCUUG GUGUUUAUGA
11701 UUACUUAGUU UCUACACAGG AGUUUAGAUA UAUGAAUUCA CAGGGACUAC UCCCACCCAA
11761 GAAUAGCAUA GAUGCCUUCA AACUCAACAU UAAAUUGUUG GGUGUUGGUG GCAAACCUUG
11821 UAUCAAAGUA GCCACUGUAC AGUCUAAAAU GUCAGAUGUA AAGUGCACAU CAGUAGUCUU
11881 ACUCUCAGUU UUGCAACAAC UCAGAGUAGA AUCAUCAUCU AAAUUGUGGG CUCAAUGUGU
11941 CCAGUUACAC AAUGACAUUC UCUUAGCUAA AGAUACUACU GAAGCCUUUG AAAAAAUGGU
12001 UUCACUACUU UCUGUUUUGC UUUCCAUGCA GGGUGCUGUA GACAUAAACA AGCUUUGUGA
12061 AGAAAUGCUG GACAACAGGG CAACCUUACA AGCUAUAGCC UCAGAGUUUA GUUCCCUUCC
12121 AUCAUAUGCA GCUUUUGCUA CUGCUCAAGA AGCUUAUGAG CAGGCUGUUG CUAAUGGUGA
12181 UUCUGAAGUU GUUCUUAAAA AGUUGAAGAA GUCUUUGAAU GUGGCUAAAU CUGAAUUUGA
12241 CCGUGAUGCA GCCAUGCAAC GUAAGUUGGA AAAGAUGGCU GAUCAAGCUA UGACCCAAAU
12301 GUAUAAACAG GCUAGAUCUG AGGACAAGAG GGCAAAAGUU ACUAGUGCUA UGCAGACAAU
12361 GCUUUUCACU AUGCUUAGAA AGUUGGAUAA UGAUGCACUC AACAACAUUA UCAACAAUGC
12421 AAGAGAUGGU UGUGUUCCCU UGAACAUAAU ACCUCUUACA ACAGCAGCCA AACUAAUGGU
12481 UGUCAUACCA GACUAUAACA CAUAUAAAAA UACGUGUGAU GGUACAACAU UUACUUAUGC
12541 AUCAGCAUUG UGGGAAAUCC AACAGGUUGU AGAUGCAGAU AGUAAAAUUG UUCAACUUAG
12601 UGAAAUUAGU AUGGACAAUU CACCUAAUUU AGCAUGGCCU CUUAUUGUAA CAGCUUUAAG
12661 GGCCAAUUCU GCUGUCAAAU UACAGAAUAA UGAGCUUAGU CCUGUUGCAC UACGACAGAU
12721 GUCUUGUGCU GCCGGUACUA CACAAACUGC UUGCACUGAU GACAAUGCGU UAGCUUACUA
12781 CAACACAACA AAGGGAGGUA GGUUUGUACU UGCACUGUUA UCCGAUUUAC AGGAUUUGAA
12841 AUGGGCUAGA UUCCCUAAGA GUGAUGGAAC UGGUACUAUC UAUACAGAAC UGGAACCACC
12901 UUGUAGGUUU GUUACAGACA CACCUAAAGG UCCUAAAGUG AAGUAUUUAU ACUUUAUUAA
12961 AGGAUUAAAC AACCUAAAUA GAGGUAUGGU ACUUGGUAGU UUAGCUGCCA CAGUACGUCU
13021 ACAAGCUGGU AAUGCAACAG AAGUGCCUGC CAAUUCAACU GUAUUAUCUU UCUGUGCUUU
13081 UGCUGUAGAU GCUGCUAAAG CUUACAAAGA UUAUCUAGCU AGUGGGGGAC AACCAAUCAC
13141 UAAUUGUGUU AAGAUGUUGU GUACACACAC UGGUACUGGU CAGGCAAUAA CAGUUACACC
13201 GGAAGCCAAU AUGGAUCAAG AAUCCUUUGG UGGUGCAUCG UGUUGUCUGU ACUGCCGUUG
13261 CCACAUAGAU CAUCCAAAUC CUAAAGGAUU UUGUGACUUA AAAGGUAAGU AUGUACAAAU
13321 ACCUACAACU UGUGCUAAUG ACCCUGUGGG UUUUACACUU AAAAACACAG UCUGUACCGU
13381 CUGCGGUAUG UGGAAAGGUU AUGGCUGUAG UUGUGAUCAA CUCCGCGAAC CCAUGCUUCA
13441 GUCAGCUGAU GCACAAUCGU UUUUAAACGG GUUUGCGGUG UAAGUGCAGC CCGUCUUACA
13501 CCGUGCGGCA CAGGCACUAG UACUGAUGUC GUAUACAGGG CUUUUGACAU CUACAAUGAU
13561 AAAGUAGCUG GUUUUGCUAA AUUCCUAAAA ACUAAUUGUU GUCGCUUCCA AGAAAAGGAC
13621 GAAGAUGACA AUUUAAUUGA UUCUUACUUU GUAGUUAAGA GACACACUUU CUCUAACUAC
13681 CAACAUGAAG AAACAAUUUA UAAUUUACUU AAGGAUUGUC CAGCUGUUGC UAAACAUGAC
13741 UUCUUUAAGU UUAGAAUAGA CGGUGACAUG GUACCACAUA UAUCACGUCA ACGUCUUACU
13801 AAAUACACAA UGGCAGACCU CGUCUAUGCU UUAAGGCAUU UUGAUGAAGG UAAUUGUGAC
13861 ACAUUAAAAG AAAUACUUGU CACAUACAAU UGUUGUGAUG AUGAUUAUUU CAAUAAAAAG
13921 GACUGGUAUG AUUUUGUAGA AAACCCAGAU AUAUUACGCG UAUACGCCAA CUUAGGUGAA
13981 CGUGUACGCC AAGCUUUGUU AAAAACAGUA CAAUUCUGUG AUGCCAUGCG AAAUGCUGGU
14041 AUUGUUGGUG UACUGACAUU AGAUAAUCAA GAUCUCAAUG GUAACUGGUA UGAUUUCGGU
14101 GAUUUCAUAC AAACCACGCC AGGUAGUGGA GUUCCUGUUG UAGAUUCUUA UUAUUCAUUG
14161 UUAAUGCCUA UAUUAACCUU GACCAGGGCU UUAACUGCAG AGUCACAUGU UGACACUGAC
14221 UUAACAAAGC CUUACAUUAA GUGGGAUUUG UUAAAAUAUG ACUUCACGGA AGAGAGGUUA
14281 AAACUCUUUG ACCGUUAUUU UAAAUAUUGG GAUCAGACAU ACCACCCAAA UUGUGUUAAC
14341 UGUUUGGAUG ACAGAUGCAU UCUGCAUUGU GCAAACUUUA AUGUUUUAUU CUCUACAGUG
14401 UUCCCACCUA CAAGUUUUGG ACCACUAGUG AGAAAAAUAU UUGUUGAUGG UGUUCCAUUU
14461 GUAGUUUCAA CUGGAUACCA CUUCAGAGAG CUAGGUGUUG UACAUAAUCA GGAUGUAAAC
14521 UUACAUAGCU CUAGACUUAG UUUUAAGGAA UUACUUGUGU AUGCUGCUGA CCCUGCUAUG
14581 CACGCUGCUU CUGGUAAUCU AUUACUAGAU AAACGCACUA CGUGCUUUUC AGUAGCUGCA
14641 CUUACUAACA AUGUUGCUUU UCAAACUGUC AAACCCGGUA AUUUUAACAA AGACUUCUAU
14701 GACUUUGCUG UGUCUAAGGG UUUCUUUAAG GAAGGAAGUU CUGUUGAAUU AAAACACUUC
14761 UUCUUUGCUC AGGAUGGUAA UGCUGCUAUC AGCGAUUAUG ACUACUAUCG UUAUAAUCUA
14821 CCAACAAUGU GUGAUAUCAG ACAACUACUA UUUGUAGUUG AAGUUGUUGA UAAGUACUUU
14881 GAUUGUUACG AUGGUGGCUG UAUUAAUGCU AACCAAGUCA UCGUCAACAA CCUAGACAAA
14941 UCAGCUGGUU UUCCAUUUAA UAAAUGGGGU AAGGCUAGAC UUUAUUAUGA UUCAAUGAGU
15001 UAUGAGGAUC AAGAUGCACU UUUCGCAUAU ACAAAACGUA AUGUCAUCCC UACUAUAACU
15061 CAAAUGAAUC UUAAGUAUGC CAUUAGUGCA AAGAAUAGAG CUCGCACCGU AGCUGGUGUC
15121 UCUAUCUGUA GUACUAUGAC CAAUAGACAG UUUCAUCAAA AAUUAUUGAA AUCAAUAGCC
15181 GCCACUAGAG GAGCUACUGU AGUAAUUGGA ACAAGCAAAU UCUAUGGUGG UUGGCACAAC
15241 AUGUUAAAAA CUGUUUAUAG UGAUGUAGAA AACCCUCACC UUAUGGGUUG GGAUUAUCCU
15301 AAAUGUGAUA GAGCCAUGCC UAACAUGCUU AGAAUUAUGG CCUCACUUGU UCUUGCUCGC
15361 AAACAUACAA CGUGUUGUAG CUUGUCACAC CGUUUCUAUA GAUUAGCUAA UGAGUGUGCU
15421 CAAGUAUUGA GUGAAAUGGU CAUGUGUGGC GGUUCACUAU AUGUUAAACC AGGUGGAACC
15481 UCAUCAGGAG AUGCCACAAC UGCUUAUGCU AAUAGUGUUU UUAACAUUUG UCAAGCUGUC
15541 ACGGCCAAUG UUAAUGCACU UUUAUCUACU GAUGGUAACA AAAUUGCCGA UAAGUAUGUC
15601 CGCAAUUUAC AACACAGACU UUAUGAGUGU CUCUAUAGAA AUAGAGAUGU UGACACAGAC
15661 UUUGUGAAUG AGUUUUACGC AUAUUUGCGU AAACAUUUCU CAAUGAUGAU ACUCUCUGAC
15721 GAUGCUGUUG UGUGUUUCAA UAGCACUUAU GCAUCUCAAG GUCUAGUGGC UAGCAUAAAG
15781 AACUUUAAGU CAGUUCUUUA UUAUCAAAAC AAUGUUUUUA UGUCUGAAGC AAAAUGUUGG
15841 ACUGAGACUG ACCUUACUAA AGGACCUCAU GAAUUUUGCU CUCAACAUAC AAUGCUAGUU
15901 AAACAGGGUG AUGAUUAUGU GUACCUUCCU UACCCAGAUC CAUCAAGAAU CCUAGGGGCC
15961 GGCUGUUUUG UAGAUGAUAU CGUAAAAACA GAUGGUACAC UUAUGAUUGA ACGGUUCGUG
16021 UCUUUAGCUA UAGAUGCUUA CCCACUUACU AAACAUCCUA AUCAGGAGUA UGCUGAUGUC
16081 UUUCAUUUGU ACUUACAAUA CAUAAGAAAG CUACAUGAUG AGUUAACAGG ACACAUGUUA
16141 GACAUGUAUU CUGUUAUGCU UACUAAUGAU AACACUUCAA GGUAUUGGGA ACCUGAGUUU
16201 UAUGAGGCUA UGUACACACC GCAUACAGUC UUACAGGCUG UUGGGGCUUG UGUUCUUUGC
16261 AAUUCACAGA CUUCAUUAAG AUGUGGUGCU UGCAUACGUA GACCAUUCUU AUGUUGUAAA
16321 UGCUGUUACG ACCAUGUCAU AUCAACAUCA CAUAAAUUAG UCUUGUCUGU UAAUCCGUAU
16381 GUUUGCAAUG CUCCAGGUUG UGAUGUCACA GAUGUGACUC AACUUUACUU AGGAGGUAUG
16441 AGCUAUUAUU GUAAAUCACA UAAACCACCC AUUAGUUUUC CAUUGUGUGC UAAUGGACAA
16501 GUUUUUGGUU UAUAUAAAAA UACAUGUGUU GGUAGCGAUA AUGUUACUGA CUUUAAUGCA
16561 AUUGCAACAU GUGACUGGAC AAAUGCUGGU GAUUACAUUU UAGCUAACAC CUGUACUGAA
16621 AGACUCAAGC UUUUUGCAGC AGAAACGCUC AAAGCUACUG AGGAGACAUU UAAACUGUCU
16681 UAUGGUAUUG CUACUGUACG UGAAGUGCUG UCUGACAGAG AAUUACAUCU UUCAUGGGAA
16741 GUUGGUAAAC CUAGACCACC ACUUAACCGA AAUUAUGUCU UUACUGGUUA UCGUGUAACU
16801 AAAAACAGUA AAGUACAAAU AGGAGAGUAC ACCUUUGAAA AAGGUGACUA UGGUGAUGCU
16861 GUUGUUUACC GAGGUACAAC AACUUACAAA UUAAAUGUUG GUGAUUAUUU UGUGCUGACA
16921 UCACAUACAG UAAUGCCAUU AAGUGCACCU ACACUAGUGC CACAAGAGCA CUAUGUUAGA
16981 AUUACUGGCU UAUACCCAAC ACUCAAUAUC UCAGAUGAGU UUUCUAGCAA UGUUGCAAAU
17041 UAUCAAAAGG UUGGUAUGCA AAAGUAUUCU ACACUCCAGG GACCACCUGG UACUGGUAAG
17101 AGUCAUUUUG CUAUUGGCCU AGCUCUCUAC UACCCUUCUG CUCGCAUAGU GUAUACAGCU
17161 UGCUCUCAUG CCGCUGUUGA UGCACUAUGU GAGAAGGCAU UAAAAUAUUU GCCUAUAGAU
17221 AAAUGUAGUA GAAUUAUACC UGCACGUGCU CGUGUAGAGU GUUUUGAUAA AUUCAAAGUG
17281 AAUUCAACAU UAGAACAGUA UGUCUUUUGU ACUGUAAAUG CAUUGCCUGA GACGACAGCA
17341 GAUAUAGUUG UCUUUGAUGA AAUUUCAAUG GCCACAAAUU AUGAUUUGAG UGUUGUCAAU
17401 GCCAGAUUAC GUGCUAAGCA CUAUGUGUAC AUUGGCGACC CUGCUCAAUU ACCUGCACCA
17461 CGCACAUUGC UAACUAAGGG CACACUAGAA CCAGAAUAUU UCAAUUCAGU GUGUAGACUU
17521 AUGAAAACUA UAGGUCCAGA CAUGUUCCUC GGAACUUGUC GGCGUUGUCC UGCUGAAAUU
17581 GUUGACACUG UGAGUGCUUU GGUUUAUGAU AAUAAGCUUA AAGCACAUAA AGACAAAUCA
17641 GCUCAAUGCU UUAAAAUGUU UUAUAAGGGU GUUAUCACGC AUGAUGUUUC AUCUGCAAUU
17701 AACAGGCCAC AAAUAGGCGU GGUAAGAGAA UUCCUUACAC GUAACCCUGC UUGGAGAAAA
17761 GCUGUCUUUA UUUCACCUUA UAAUUCACAG AAUGCUGUAG CCUCAAAGAU UUUGGGACUA
17821 CCAACUCAAA CUGUUGAUUC AUCACAGGGC UCAGAAUAUG ACUAUGUCAU AUUCACUCAA
17881 ACCACUGAAA CAGCUCACUC UUGUAAUGUA AACAGAUUUA AUGUUGCUAU UACCAGAGCA
17941 AAAGUAGGCA UACUUUGCAU AAUGUCUGAU AGAGACCUUU AUGACAAGUU GCAAUUUACA
18001 AGUCUUGAAA UUCCACGUAG GAAUGUGGCA ACUUUACAAG CUGAAAAUGU AACAGGACUC
18061 UUUAAAGAUU GUAGUAAGGU AAUCACUGGG UUACAUCCUA CACAGGCACC UACACACCUC
18121 AGUGUUGACA CUAAAUUCAA AACUGAAGGU UUAUGUGUUG ACAUACCUGG CAUACCUAAG
18181 GACAUGACCU AUAGAAGACU CAUCUCUAUG AUGGGUUUUA AAAUGAAUUA UCAAGUUAAU
18241 GGUUACCCUA ACAUGUUUAU CACCCGCGAA GAAGCUAUAA GACAUGUACG UGCAUGGAUU
18301 GGCUUCGAUG UCGAGGGGUG UCAUGCUACU AGAGAAGCUG UUGGUACCAA UUUACCUUUA
18361 CAGCUAGGUU UUUCUACAGG UGUUAACCUA GUUGCUGUAC CUACAGGUUA UGUUGAUACA
18421 CCUAAUAAUA CAGAUUUUUC CAGAGUUAGU GCUAAACCAC CGCCUGGAGA UCAAUUUAAA
18481 CACCUCAUAC CACUUAUGUA CAAAGGACUU CCUUGGAAUG UAGUGCGUAU AAAGAUUGUA
18541 CAAAUGUUAA GUGACACACU UAAAAAUCUC UCUGACAGAG UCGUAUUUGU CUUAUGGGCA
18601 CAUGGCUUUG AGUUGACAUC UAUGAAGUAU UUUGUGAAAA UAGGACCUGA GCGCACCUGU
18661 UGUCUAUGUG AUAGACGUGC CACAUGCUUU UCCACUGCUU CAGACACUUA UGCCUGUUGG
18721 CAUCAUUCUA UUGGAUUUGA UUACGUCUAU AAUCCGUUUA UGAUUGAUGU UCAACAAUGG
18781 GGUUUUACAG GUAACCUACA AAGCAACCAU GAUCUGUAUU GUCAAGUCCA UGGUAAUGCA
18841 CAUGUAGCUA GUUGUGAUGC AAUCAUGACU AGGUGUCUAG CUGUCCACGA GUGCUUUGUU
18901 AAGCGUGUUG ACUGGACUAU UGAAUAUCCU AUAAUUGGUG AUGAACUGAA GAUUAAUGCG
18961 GCUUGUAGAA AGGUUCAACA CAUGGUUGUU AAAGCUGCAU UAUUAGCAGA CAAAUUCCCA
19021 GUUCUUCACG ACAUUGGUAA CCCUAAAGCU AUUAAGUGUG UACCUCAAGC UGAUGUAGAA
19081 UGGAAGUUCU AUGAUGCACA GCCUUGUAGU GACAAAGCUU AUAAAAUAGA AGAAUUAUUC
19141 UAUUCUUAUG CCACACAUUC UGACAAAUUC ACAGAUGGUG UAUGCCUAUU UUGGAAUUGC
19201 AAUGUCGAUA GAUAUCCUGC UAAUUCCAUU GUUUGUAGAU UUGACACUAG AGUGCUAUCU
19261 AACCUUAACU UGCCUGGUUG UGAUGGUGGC AGUUUGUAUG UAAAUAAACA UGCAUUCCAC
19321 ACACCAGCUU UUGAUAAAAG UGCUUUUGUU AAUUUAAAAC AAUUACCAUU UUUCUAUUAC
19381 UCUGACAGUC CAUGUGAGUC UCAUGGAAAA CAAGUAGUGU CAGAUAUAGA UUAUGUACCA
19441 CUAAAGUCUG CUACGUGUAU AACACGUUGC AAUUUAGGUG GUGCUGUCUG UAGACAUCAU
19501 GCUAAUGAGU ACAGAUUGUA UCUCGAUGCU UAUAACAUGA UGAUCUCAGC UGGCUUUAGC
19561 UUGUGGGUUU ACAAACAAUU UGAUACUUAU AACCUCUGGA ACACUUUUAC AAGACUUCAG
19621 AGUUUAGAAA AUGUGGCUUU UAAUGUUGUA AAUAAGGGAC ACUUUGAUGG ACAACAGGGU
19681 GAAGUACCAG UUUCUAUCAU UAAUAACACU GUUUACACAA AAGUUGAUGG UGUUGAUGUA
19741 GAAUUGUUUG AAAAUAAAAC AACAUUACCU GUUAAUGUAG CAUUUGAGCU UUGGGCUAAG
19801 CGCAACAUUA AACCAGUACC AGAGGUGAAA AUACUCAAUA AUUUGGGUGU GGACAUUGCU
19861 GCUAAUACUG UGAUCUGGGA CUACAAAAGA GAUGCUCCAG CACAUAUAUC UACUAUUGGU
19921 GUUUGUUCUA UGACUGACAU AGCCAAGAAA CCAACUGAAA CGAUUUGUGC ACCACUCACU
19981 GUCUUUUUUG AUGGUAGAGU UGAUGGUCAA GUAGACUUAU UUAGAAAUGC CCGUAAUGGU
20041 GUUCUUAUUA CAGAAGGUAG UGUUAAAGGU UUACAACCAU CUGUAGGUCC CAAACAAGCU
20101 AGUCUUAAUG GAGUCACAUU AAUUGGAGAA GCCGUAAAAA CACAGUUCAA UUAUUAUAAG
20161 AAAGUUGAUG GUGUUGUCCA ACAAUUACCU GAAACUUACU UUACUCAGAG UAGAAAUUUA
20221 CAAGAAUUUA AACCCAGGAG UCAAAUGGAA AUUGAUUUCU UAGAAUUAGC UAUGGAUGAA
20281 UUCAUUGAAC GGUAUAAAUU AGAAGGCUAU GCCUUCGAAC AUAUCGUUUA UGGAGAUUUU
20341 AGUCAUAGUC AGUUAGGUGG UUUACAUCUA CUGAUUGGAC UAGCUAAACG UUUUAAGGAA
20401 UCACCUUUUG AAUUAGAAGA UUUUAUUCCU AUGGACAGUA CAGUUAAAAA CUAUUUCAUA
20461 ACAGAUGCGC AAACAGGUUC AUCUAAGUGU GUGUGUUCUG UUAUUGAUUU AUUACUUGAU
20521 GAUUUUGUUG AAAUAAUAAA AUCCCAAGAU UUAUCUGUAG UUUCUAAGGU UGUCAAAGUG
20581 ACUAUUGACU AUACAGAAAU UUCAUUUAUG CUUUGGUGUA AAGAUGGCCA UGUAGAAACA
20641 UUUUACCCAA AAUUACAAUC UAGUCAAGCG UGGCAACCGG GUGUUGCUAU GCCUAAUCUU
20701 UACAAAAUGC AAAGAAUGCU AUUAGAAAAG UGUGACCUUC AAAAUUAUGG UGAUAGUGCA
20761 ACAUUACCUA AAGGCAUAAU GAUGAAUGUC GCAAAAUAUA CUCAACUGUG UCAAUAUUUA
20821 AACACAUUAA CAUUAGCUGU ACCCUAUAAU AUGAGAGUUA UACAUUUUGG UGCUGGUUCU
20881 GAUAAAGGAG UUGCACCAGG UACAGCUGUU UUAAGACAGU GGUUGCCUAC GGGUACGCUG
20941 CUUGUCGAUU CAGAUCUUAA UGACUUUGUC UCUGAUGCAG AUUCAACUUU GAUUGGUGAU
21001 UGUGCAACUG UACAUACAGC UAAUAAAUGG GAUCUCAUUA UUAGUGAUAU GUACGACCCU
21061 AAGACUAAAA AUGUUACAAA AGAAAAUGAC UCUAAAGAGG GUUUUUUCAC UUACAUUUGU
21121 GGGUUUAUAC AACAAAAGCU AGCUCUUGGA GGUUCCGUGG CUAUAAAGAU AACAGAACAU
21181 UCUUGGAAUG CUGAUCUUUA UAAGCUCAUG GGACACUUCG CAUGGUGGAC AGCCUUUGUU
21241 ACUAAUGUGA AUGCGUCAUC AUCUGAAGCA UUUUUAAUUG GAUGUAAUUA UCUUGGCAAA
21301 CCACGCGAAC AAAUAGAUGG UUAUGUCAUG CAUGCAAAUU ACAUAUUUUG GAGGAAUACA
21361 AAUCCAAUUC AGUUGUCUUC CUAUUCUUUA UUUGACAUGA GUAAAUUUCC CCUUAAAUUA
21421 AGGGGUACUG CUGUUAUGUC UUUAAAAGAA GGUCAAAUCA AUGAUAUGAU UUUAUCUCUU
21481 CUUAGUAAAG GUAGACUUAU AAUUAGAGAA AACAACAGAG UUGUUAUUUC UAGUGAUGUU
21541 CUUGUUAACA ACUAAACGAA CAAUGUUUGU UUUUCUUGUU UUAUUGCCAC UAGUCUCUAG
21601 UCAGUGUGUU AAUCUUACAA CCAGAACUCA AUUACCCCCU GCAUACACUA AUUCUUUCAC
21661 ACGUGGUGUU UAUUACCCUG ACAAAGUUUU CAGAUCCUCA GUUUUACAUU CAACUCAGGA
21721 CUUGUUCUUA CCUUUCUUUU CCAAUGUUAC UUGGUUCCAU GCUAUACAUG UCUCUGGGAC
21781 CAAUGGUACU AAGAGGUUUG AUAACCCUGU CCUACCAUUU AAUGAUGGUG UUUAUUUUGC
21841 UUCCACUGAG AAGUCUAACA UAAUAAGAGG CUGGAUUUUU GGUACUACUU UAGAUUCGAA
21901 GACCCAGUCC CUACUUAUUG UUAAUAACGC UACUAAUGUU GUUAUUAAAG UCUGUGAAUU
21961 UCAAUUUUGU AAUGAUCCAU UUUUGGGUGU UUAUUACCAC AAAAACAACA AAAGUUGGAU
22021 GGAAAGUGAG UUCAGAGUUU AUUCUAGUGC GAAUAAUUGC ACUUUUGAAU AUGUCUCUCA
22081 GCCUUUUCUU AUGGACCUUG AAGGAAAACA GGGUAAUUUC AAAAAUCUUA GGGAAUUUGU
22141 GUUUAAGAAU AUUGAUGGUU AUUUUAAAAU AUAUUCUAAG CACACGCCUA UUAAUUUAGU
22201 GCGUGAUCUC CCUCAGGGUU UUUCGGCUUU AGAACCAUUG GUAGAUUUGC CAAUAGGUAU
22261 UAACAUCACU AGGUUUCAAA CUUUACUUGC UUUACAUAGA AGUUAUUUGA CUCCUGGUGA
22321 UUCUUCUUCA GGUUGGACAG CUGGUGCUGC AGCUUAUUAU GUGGGUUAUC UUCAACCUAG
22381 GACUUUUCUA UUAAAAUAUA AUGAAAAUGG AACCAUUACA GAUGCUGUAG ACUGUGCACU
22441 UGACCCUCUC UCAGAAACAA AGUGUACGUU GAAAUCCUUC ACUGUAGAAA AAGGAAUCUA
22501 UCAAACUUCU AACUUUAGAG UCCAACCAAC AGAAUCUAUU GUUAGAUUUC CUAAUAUUAC
22561 AAACUUGUGC CCUUUUGGUG AAGUUUUUAA CGCCACCAGA UUUGCAUCUG UUUAUGCUUG
22621 GAACAGGAAG AGAAUCAGCA ACUGUGUUGC UGAUUAUUCU GUCCUAUAUA AUUCCGCAUC
22681 AUUUUCCACU UUUAAGUGUU AUGGAGUGUC UCCUACUAAA UUAAAUGAUC UCUGCUUUAC
22741 UAAUGUCUAU GCAGAUUCAU UUGUAAUUAG AGGUGAUGAA GUCAGACAAA UCGCUCCAGG
22801 GCAAACUGGA AAGAUUGCUG AUUAUAAUUA UAAAUUACCA GAUGAUUUUA CAGGCUGCGU
22861 UAUAGCUUGG AAUUCUAACA AUCUUGAUUC UAAGGUUGGU GGUAAUUAUA AUUACCUGUA
22921 UAGAUUGUUU AGGAAGUCUA AUCUCAAACC UUUUGAGAGA GAUAUUUCAA CUGAAAUCUA
22981 UCAGGCCGGU AGCACACCUU GUAAUGGUGU UGAAGGUUUU AAUUGUUACU UUCCUUUACA
23041 AUCAUAUGGU UUCCAACCCA CUAAUGGUGU UGGUUACCAA CCAUACAGAG UAGUAGUACU
23101 UUCUUUUGAA CUUCUACAUG CACCAGCAAC UGUUUGUGGA CCUAAAAAGU CUACUAAUUU
23161 GGUUAAAAAC AAAUGUGUCA AUUUCAACUU CAAUGGUUUA ACAGGCACAG GUGUUCUUAC
23221 UGAGUCUAAC AAAAAGUUUC UGCCUUUCCA ACAAUUUGGC AGAGACAUUG CUGACACUAC
23281 UGAUGCUGUC CGUGAUCCAC AGACACUUGA GAUUCUUGAC AUUACACCAU GUUCUUUUGG
23341 UGGUGUCAGU GUUAUAACAC CAGGAACAAA UACUUCUAAC CAGGUUGCUG UUCUUUAUCA
23401 GGAUGUUAAC UGCACAGAAG UCCCUGUUGC UAUUCAUGCA GAUCAACUUA CUCCUACUUG
23461 GCGUGUUUAU UCUACAGGUU CUAAUGUUUU UCAAACACGU GCAGGCUGUU UAAUAGGGGC
23521 UGAACAUGUC AACAACUCAU AUGAGUGUGA CAUACCCAUU GGUGCAGGUA UAUGCGCUAG
23581 UUAUCAGACU CAGACUAAUU CUCCUCGGCG GGCACGUAGU GUAGCUAGUC AAUCCAUCAU
23641 UGCCUACACU AUGUCACUUG GUGCAGAAAA UUCAGUUGCU UACUCUAAUA ACUCUAUUGC
23701 CAUACCCACA AAUUUUACUA UUAGUGUUAC CACAGAAAUU CUACCAGUGU CUAUGACCAA
23761 GACAUCAGUA GAUUGUACAA UGUACAUUUG UGGUGAUUCA ACUGAAUGCA GCAAUCUUUU
23821 GUUGCAAUAU GGCAGUUUUU GUACACAAUU AAACCGUGCU UUAACUGGAA UAGCUGUUGA
23881 ACAAGACAAA AACACCCAAG AAGUUUUUGC ACAAGUCAAA CAAAUUUACA AAACACCACC
23941 AAUUAAAGAU UUUGGUGGUU UUAAUUUUUC ACAAAUAUUA CCAGAUCCAU CAAAACCAAG
24001 CAAGAGGUCA UUUAUUGAAG AUCUACUUUU CAACAAAGUG ACACUUGCAG AUGCUGGCUU
24061 CAUCAAACAA UAUGGUGAUU GCCUUGGUGA UAUUGCUGCU AGAGACCUCA UUUGUGCACA
24121 AAAGUUUAAC GGCCUUACUG UUUUGCCACC UUUGCUCACA GAUGAAAUGA UUGCUCAAUA
24181 CACUUCUGCA CUGUUAGCGG GUACAAUCAC UUCUGGUUGG ACCUUUGGUG CAGGUGCUGC
24241 AUUACAAAUA CCAUUUGCUA UGCAAAUGGC UUAUAGGUUU AAUGGUAUUG GAGUUACACA
24301 GAAUGUUCUC UAUGAGAACC AAAAAUUGAU UGCCAACCAA UUUAAUAGUG CUAUUGGCAA
24361 AAUUCAAGAC UCACUUUCUU CCACAGCAAG UGCACUUGGA AAACUUCAAG AUGUGGUCAA
24421 CCAAAAUGCA CAAGCUUUAA ACACGCUUGU UAAACAACUU AGCUCCAAUU UUGGUGCAAU
24481 UUCAAGUGUU UUAAAUGAUA UCCUUUCACG UCUUGACAAA GUUGAGGCUG AAGUGCAAAU
24541 UGAUAGGUUG AUCACAGGCA GACUUCAAAG UUUGCAGACA UAUGUGACUC AACAAUUAAU
24601 UAGAGCUGCA GAAAUCAGAG CUUCUGCUAA UCUUGCUGCU ACUAAAAUGU CAGAGUGUGU
24661 ACUUGGACAA UCAAAAAGAG UUGAUUUUUG UGGAAAGGGC UAUCAUCUUA UGUCCUUCCC
24721 UCAGUCAGCA CCUCAUGGUG UAGUCUUCUU GCAUGUGACU UAUGUCCCUG CACAAGAAAA
24781 GAACUUCACA ACUGCUCCUG CCAUUUGUCA UGAUGGAAAA GCACACUUUC CUCGUGAAGG
24841 UGUCUUUGUU UCAAAUGGCA CACACUGGUU UGUAACACAA AGGAAUUUUU AUGAACCACA
24901 AAUCAUUACU ACAGACAACA CAUUUGUGUC UGGUAACUGU GAUGUUGUAA UAGGAAUUGU
24961 CAACAACACA GUUUAUGAUC CUUUGCAACC UGAAUUAGAC UCAUUCAAGG AGGAGUUAGA
25021 UAAAUAUUUU AAGAAUCAUA CAUCACCAGA UGUUGAUUUA GGUGACAUCU CUGGCAUUAA
25081 UGCUUCAGUU GUAAACAUUC AAAAAGAAAU UGACCGCCUC AAUGAGGUUG CCAAGAAUUU
25141 AAAUGAAUCU CUCAUCGAUC UCCAAGAACU UGGAAAGUAU GAGCAGUAUA UAAAAUGGCC
25201 AUGGUACAUU UGGCUAGGUU UUAUAGCUGG CUUGAUUGCC AUAGUAAUGG UGACAAUUAU
25261 GCUUUGCUGU AUGACCAGUU GCUGUAGUUG UCUCAAGGGC UGUUGUUCUU GUGGAUCCUG
25321 CUGCAAAUUU GAUGAAGACG ACUCUGAGCC AGUGCUCAAA GGAGUCAAAU UACAUUACAC
25381 AUAAACGAAC UUAUGGAUUU GUUUAUGAGA AUCUUCACAA UUGGAACUGU AACUUUGAAG
25441 CAAGGUGAAA UCAAGGAUGC UACUCCUUCA GAUUUUGUUC GCGCUACUGC AACGAUACCG
25501 AUACAAGCCU CACUCCCUUU CGGAUGGCUU AUUGUUGGCG UUGCACUUCU UGCUGUUUUU
25561 CAGAGCGCUU CCAAAAUCAU AACCCUCAAA AAGAGAUGGC AACUAGCACU CUCCAAGGGU
25621 GUUCACUUUG UUUGCAACUU GCUGUUGUUG UUUGUAACAG UUUACUCACA CCUUUUGCUC
25681 GUUGCUGCUG GCCUUGAAGC CCCUUUUCUC UAUCUUUAUG CUUUAGUCUA CUUCUUGCAG
25741 AGUAUAAACU UUGUAAGAAU AAUAAUGAGG CUUUGGCUUU GCUGGAAAUG CCGUUCCAAA
25801 AACCCAUUAC UUUAUGAUGC CAACUAUUUU CUUUGCUGGC AUACUAAUUG UUACGACUAU
25861 UGUAUACCUU ACAAUAGUGU AACUUCUUCA AUUGUCAUUA CUUCAGGUGA UGGCACAACA
25921 AGUCCUAUUU CUGAACAUGA CUACCAGAUU GGUGGUUAUA CUGAAAAAUG GGAAUCUGGA
25981 GUAAAAGACU GUGUUGUAUU ACACAGUUAC UUCACUUCAG ACUAUUACCA GCUGUACUCA
26041 ACUCAAUUGA GUACAGACAC UGGUGUUGAA CAUGUUACCU UCUUCAUCUA CAAUAAAAUU
26101 GUUGAUGAGC CUGAAGAACA UGUCCAAAUU CACACAAUCG ACGGUUCAUC CGGAGUUGUU
26161 AAUCCAGUAA UGGAACCAAU UUAUGAUGAA CCGACGACGA CUACUAGCGU GCCUUUGUAA
26221 GCACAAGCUG AUGAGUACGA ACUUAUGUAC UCAUUCGUUU CGGAAGAGAC AGGUACGUUA
26281 AUAGUUAAUA GCGUACUUCU UUUUCUUGCU UUCGUGGUAU UCUUGCUAGU UACACUAGCC
26341 AUCCUUACUG CGCUUCGAUU GUGUGCGUAC UGCUGCAAUA UUGUUAACGU GAGUCUUGUA
26401 AAACCUUCUU UUUACGUUUA CUCUCGUGUU AAAAAUCUGA AUUCUUCUAG AGUUCCUGAU
26461 CUUCUGGUCU AAACGAACUA AAUAUUAUAU UAGUUUUUCU GUUUGGAACU UUAAUUUUAG
26521 CCAUGGCAGA UUCCAACGGU ACUAUUACCG UUGAAGAGCU UAAAAAGCUC CUUGAACAAU
26581 GGAACCUAGU AAUAGGUUUC CUAUUCCUUA CAUGGAUUUG UCUUCUACAA UUUGCCUAUG
26641 CCAACAGGAA UAGGUUUUUG UAUAUAAUUA AGUUAAUUUU CCUCUGGCUG UUAUGGCCAG
26701 UAACUUUAGC UUGUUUUGUG CUUGCUGCUG UUUACAGAAU AAAUUGGAUC ACCGGUGGAA
26761 UUGCUAUCGC AAUGGCUUGU CUUGUAGGCU UGAUGUGGCU CAGCUACUUC AUUGCUUCUU
26821 UCAGACUGUU UGCGCGUACG CGUUCCAUGU GGUCAUUCAA UCCAGAAACU AACAUUCUUC
26881 UCAACGUGCC ACUCCAUGGC ACUAUUCUGA CCAGACCGCU UCUAGAAAGU GAACUCGUAA
26941 UCGGAGCUGU GAUCCUUCGU GGACAUCUUC GUAUUGCUGG ACACCAUCUA GGACGCUGUG
27001 ACAUCAAGGA CCUGCCUAAA GAAAUCACUG UUGCUACAUC ACGAACGCUU UCUUAUUACA
27061 AAUUGGGAGC UUCGCAGCGU GUAGCAGGUG ACUCAGGUUU UGCUGCAUAC AGUCGCUACA
27121 GGAUUGGCAA CUAUAAAUUA AACACAGACC AUUCCAGUAG CAGUGACAAU AUUGCUUUGC
27181 UUGUACAGUA AGUGACAACA GAUGUUUCAU CUCGUUGACU UUCAGGUUAC UAUAGCAGAG
27241 AUAUUACUAA UUAUUAUGAG GACUUUUAAA GUUUCCAUUU GGAAUCUUGA UUACAUCAUA
27301 AACCUCAUAA UUAAAAAUUU AUCUAAGUCA CUAACUGAGA AUAAAUAUUC UCAAUUAGAU
27361 GAAGAGCAAC CAAUGGAGAU UGAUUAAACG AACAUGAAAA UUAUUCUUUU CUUGGCACUG
27421 AUAACACUCG CUACUUGUGA GCUUUAUCAC UACCAAGAGU GUGUUAGAGG UACAACAGUA
27481 CUUUUAAAAG AACCUUGCUC UUCUGGAACA UACGAGGGCA AUUCACCAUU UCAUCCUCUA
27541 GCUGAUAACA AAUUUGCACU GACUUGCUUU AGCACUCAAU UUGCUUUUGC UUGUCCUGAC
27601 GGCGUAAAAC ACGUCUAUCA GUUACGUGCC AGAUCAGUUU CACCUAAACU GUUCAUCAGA
27661 CAAGAGGAAG UUCAAGAACU UUACUCUCCA AUUUUUCUUA UUGUUGCGGC AAUAGUGUUU
27721 AUAACACUUU GCUUCACACU CAAAAGAAAG ACAGAAUGAU UGAACUUUCA UUAAUUGACU
27781 UCUAUUUGUG CUUUUUAGCC UUUCUGCUAU UCCUUGUUUU AAUUAUGCUU AUUAUCUUUU
27841 GGUUCUCACU UGAACUGCAA GAUCAUAAUG AAACUUGUCA CGCCUAAACG AACAUGAAAU
27901 UUCUUGUUUU CUUAGGAAUC AUCACAACUG UAGCUGCAUU UCACCAAGAA UGUAGUUUAC
27961 AGUCAUGUAC UCAACAUCAA CCAUAUGUAG UUGAUGACCC GUGUCCUAUU CACUUCUAUU
28021 CUAAAUGGUA UAUUAGAGUA GGAGCUAGAA AAUCAGCACC UUUAAUUGAA UUGUGCGUGG
28081 AUGAGGCUGG UUCUAAAUCA CCCAUUCAGU ACAUCGAUAU CGGUAAUUAU ACAGUUUCCU
28141 GUUUACCUUU UACAAUUAAU UGCCAGGAAC CUAAAUUGGG UAGUCUUGUA GUGCGUUGUU
28201 CGUUCUAUGA AGACUUUUUA GAGUAUCAUG ACGUUCGUGU UGUUUUAGAU UUCAUCUAAA
28261 CGAACAAACU AAAAUGUCUG AUAAUGGACC CCAAAAUCAG CGAAAUGCAC CCCGCAUUAC
28321 GUUUGGUGGA CCCUCAGAUU CAACUGGCAG UAACCAGAAU GGAGAACGCA GUGGGGCGCG
28381 AUCAAAACAA CGUCGGCCCC AAGGUUUACC CAAUAAUACU GCGUCUUGGU UCACCGCUCU
28441 CACUCAACAU GGCAAGGAAG ACCUUAAAUU CCCUCGAGGA CAAGGCGUUC CAAUUAACAC
28501 CAAUAGCAGU CCAGAUGACC AAAUUGGCUA CUACCGAAGA GCUACCAGAC GAAUUCGUGG
28561 UGGUGACGGU AAAAUGAAAG AUCUCAGUCC AAGAUGGUAU UUCUACUACC UAGGAACUGG
28621 GCCAGAAGCU GGACUUCCCU AUGGUGCUAA CAAAGACGGC AUCAUAUGGG UUGCAACUGA
28681 GGGAGCCUUG AAUACACCAA AAGAUCACAU UGGCACCCGC AAUCCUGCUA ACAAUGCUGC
28741 AAUCGUGCUA CAACUUCCUC AAGGAACAAC AUUGCCAAAA GGCUUCUACG CAGAAGGGAG
28801 CAGAGGCGGC AGUCAAGCCU CUUCUCGUUC CUCAUCACGU AGUCGCAACA GUUCAAGAAA
28861 UUCAACUCCA GGCAGCAGUA GGGGAACUUC UCCUGCUAGA AUGGCUGGCA AUGGCGGUGA
28921 UGCUGCUCUU GCUUUGCUGC UGCUUGACAG AUUGAACCAG CUUGAGAGCA AAAUGUCUGG
28981 UAAAGGCCAA CAACAACAAG GCCAAACUGU CACUAAGAAA UCUGCUGCUG AGGCUUCUAA
29041 GAAGCCUCGG CAAAAACGUA CUGCCACUAA AGCAUACAAU GUAACACAAG CUUUCGGCAG
29101 ACGUGGUCCA GAACAAACCC AAGGAAAUUU UGGGGACCAG GAACUAAUCA GACAAGGAAC
29161 UGAUUACAAA CAUUGGCCGC AAAUUGCACA AUUUGCCCCC AGCGCUUCAG CGUUCUUCGG
29221 AAUGUCGCGC AUUGGCAUGG AAGUCACACC UUCGGGAACG UGGUUGACCU ACACAGGUGC
29281 CAUCAAAUUG GAUGACAAAG AUCCAAAUUU CAAAGAUCAA GUCAUUUUGC UGAAUAAGCA
29341 UAUUGACGCA UACAAAACAU UCCCACCAAC AGAGCCUAAA AAGGACAAAA AGAAGAAGGC
29401 UGAUGAAACU CAAGCCUUAC CGCAGAGACA GAAGAAACAG CAAACUGUGA CUCUUCUUCC
29461 UGCUGCAGAU UUGGAUGAUU UCUCCAAACA AUUGCAACAA UCCAUGAGCA GUGCUGACUC
29521 AACUCAGGCC UAAACUCAUG CAGACCACAC AAGGCAGAUG GGCUAUAUAA ACGUUUUCGC
29581 UUUUCCGUUU ACGAUAUAUA GUCUACUCUU GUGCAGAAUG AAUUCUCGUA ACUACAUAGC
29641 ACAAGUAGAU GUAGUUAACU UUAAUCUCAC AUAGCAAUCU UUAAUCAGUG UGUAACAUUA
29701 GGGAGGACUU GAAAGAGCCA CCACAUUUUC ACCGAGGCCA CGCGGAGUAC GAUCGAGUGU
29761 ACAGUGAACA AUGCUAGGGA GAGCUGCCUA UAUGGAAGAG CCCUAAUGUG UAAAAUUAAU
29821 UUUAGUAGUG CUAUCCCCAU GUGAUUUUAA UAGCUUCUUA GGAGAAUGAC AAAAAAAAAA
29881 AAAAAAAAAA AAAAAAAAAA AAA

蛋白のアミノ酸配列

このゲノムでコードされる各タンパク質については、それぞれの項目を参照のこと。

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club