Xtra etc

日記系雑記ブログ: 農業、データサイエンス、自然

ゲノムプロジェクト

この記事では、イロイヌナズナ、イネ、マメ科植物における、そのゲノム解読の成果について紹介します。

[目次]

 

シロイヌナズナゲノム解析

シロイヌナズナ(アラビドプシス) は、アブラナ科一年草。ペンペン草と呼ばれるなずなをもっと小さくしたような植物です。世代期間が 1 〜 2 ヶ月と短くて、栽培も簡単ですので、実験室内で多数の個体を扱うことができます。変異株が多くつくられていて、DNA の導入が簡単で形質転換体が得られやすいことから、遺伝解析に適しています。生物学的解析のモデル植物として、最も広く使われていることから、1996 年から国際共同プロジェクトとして、全塩基配列の解読を目指して研究が進められました。プロジェクト開始当初は2004 年の終了が目標でしたが、解析技術の進歩によって半分の期間ですみ、2000 年に全ゲノムの解読が完了しました。

シロイヌナズナの解読された塩基配列 (125 Mb) は高等植物の中で最も小さく、遺伝子が存在しない反復配列のみからなる領域を除く 115 Mb の塩基情報が非常に高い精度で明らかにされました。遺伝子の総数は26,000で、5 本の染色体に分けて収納されています。その結果、ゲノム上の二十数ヶ所で大規模な染色体重複が見られ、4000 以上の遺伝子が重複していることが判明しました。葉緑体ミトコンドリアのゲノムの一部が核ゲノムに挿入されていることから、細胞内でゲノム間の DNA のやりとりがあることが分かります。また、ラン藻の遺伝子と高い類似性を示す遺伝子が多数存在していることから、ラン藻の祖先が共生し葉緑体へと進化していく過程で、ラン藻の遺伝子から植物の核へ移行したことを示す証拠が得られました。遺伝子は4.5 kb に 1 個の割合で存在し、高等生物としては高い遺伝子密度です。そのほか、

  • ヒトの疾患遺伝子と似た構造を持った遺伝子を40個近く見出されましたが、植物での機能は不明
  • 200 以上の耐病性に関する遺伝子を発見

こういった成果は、イネやコムギなどの他の作物に対して、農業上有用な遺伝子の探索や新品種の育成に大きな貢献をしました。

イネゲノム解析

​イネゲノム研究は、日本の農林水産省が企画して、1991年から始まりました。当初は塩基配列の解析ではなく、DNA マーカーを染色体上に相対的に並べる遺伝地図の作成、人工染色体を並べた物理地図、様々な組織で発現している遺伝子の部分配列を取得す発現配列タグ (EST) 解析が行われました。1998年からは国際イネゲノム塩基配列解析プロジェクトによって全塩基配列の解読作業が開始されました。物理地図上に高精度に並べられた人工染色体を、発現遺伝子などを利用した DNA マーカーで作成した遺伝地図と比較して位置を決定し、それぞれ解析しました。解析は染色体ごとに分かれた人工染色体の解読によって進められ、参加各国は 12 本ある染色体の一部を分担しました。

結果、2004 年 12 月に約 3500 個すべての人工染色体の高精度な解読が完了しました。また、動原体及び末端部分の配列解析は解読困難と予想されていましたが、いくつかの染色体については解読が終了しました。イネの遺伝子の総数は 32,747 個で、このうちタンパク質をコードするものは 31,232 個、それ以外は各種 RNA の遺伝子などタンパク質をコードしないものでした。

​解読されたゲノム塩基配列GenBank/EMBL/DDBJ などの公的データベースに登録されていて、世界各国の研究者に公開されています。

これらの塩基配列から生物学的及び育種学的な情報を得る事は重要です。このような塩基配列の意味付けの作業をアノテーションと呼んでいます。この解析は、解析用のソフトウェアが多数開発されています。イネゲノム用にこれらを自動的に行う複数の解析プログラム、RiceGAAS が開発されました。

​世界中のイネ研究者やアノテーションの専門家によってイネの遺伝子を注釈付ける作業が進められ、この作業によって得られたイネゲノムの注釈情報はデータベースとして公開しています。

マメ科ゲノム解析

ミヤコグサ、タルウマゴヤシ、ダイズの3種類において、マメ科のモデル植物として全ゲノム解読が行われ、2010 年までに完了しました。ミヤコグサは日本の各地に自生している多年草です。ゲノムサイズが小さく(470 Mb)、世代時間も短いことから、マメ科のモデル植物として研究が進んでいます。ダイズでは 1.11 Gb と推定されるゲノム配列のうち約 85 %に 0.95 Gb の塩基情報が読まれました (2013 年現在)。アメリカによるダイズの EST 情報や理化学研究所植物科学研究センターを中心としたコンソーシアムによるダイズ成熟 mRNA の相補配列である完全長 cDNA 配列情報を活用して、46,430 個の遺伝子が同定されました。遺伝子の 73 %は他の被子植物と共通でした。ダイズの染色体は 2n = 40で、同じマメ亜科のミヤコグサ (2n=12) やタルウマゴヤシ (2n =16) に比べて染色体数が多い。ゲノム塩基配列の結果から、ダイズでは 5,900 万年前と 1,300 万年前 に全ゲノムの重複が生じ、遺伝子の多様化と欠損、染色体の再配列が起こったことが明らかになりました。