「ゲノム」と聞くと、どのようなイメージを 持つだろうか―。「DNA」「遺伝子」、それとも 「生命の設計図」など、物質的であったり概 念的であったり様々かと思われる。現状、ゲ ノム(genome)とは、「遺伝子(gene)」と 「『全て』を意味する接尾語(-ome)」を組み 合わせた造語であり、生命の形成・維持に必 要となる遺伝情報の総体と定義されている。
では、いつからゲノムが人々に認知される ようになったのか? 時を遡ること1869年、 スイスの生物学者であり医師でもあった JF・ミーシャーは、膿から多量にリンを含む 物質「ヌクレイン」を抽出することに成功し た。これが、今日で言う核酸(DNAとRNAの 総称)を初めて物質として捉えた歴史的瞬 間だった。その後、1953年にはワトソン&ク リックによってDNA二重らせん構造が提唱 され、ゲノム研究は急成長を遂げた。生命の 設計図がひも状のDNA配列だと分かれば、 あとはどのようにしてこの文字列を解読する ことができるのか、多くの研究者にとって興 味の矛先がそこへと必然的に向けられた。 そして1977年、ついにDNA配列を読むこと ができる手法が開発され、さらに1987年に は自動型DNAシーケンサーが登場した。これを機に、ヒトを始めとする様々な生物のゲ ノム解読プロジェクトが各国共同で推進さ れた。そして、ヒトゲノム解読の完了が宣言 された2003年以降、従来とは全く異なった 原理のDNAシーケンサー「次世代シーケン サー(NGS)」が登場する。
「NGS最大の特徴は、超並列かつ高速に DNA配列を読むことです。これまでのDNA シーケンサーでは1度に1本のDNA配列を 1,000文字ほど読める程度でしたが、NGS では1度に数億本ものDNA配列を、それぞれ 数百文字(機種によっては数万文字)単位で 読むことができるようになり、単にDNA配列 を解読するばかりではなく、遺伝子発現量 や空間中に存在する生物叢のプロファイリ ングなど、用途が格段に広がっています。そ のため、現在のゲノム研究者にとってNGSは 必要不可欠なツールとなり、加えて大量の データを扱わなければならなくなったため、 データサイエンスのスキルも必須となりまし た。つまりゲノム研究は、今や情報科学の一 端ともいえる分野だといえるでしょう」と、生 命・環境科学研究室の田中啓介先生は話す。
「一般的に、新聞の朝刊は50万文字で構 成されていると言われています。ゲノム情報 も、ATGCの4種の文字からなる文字列として認識することができますが、例えば、我々 ヒトのゲノムは30億文字で構成されており、新聞でいうと6,000部分に相当します。 毎日1部ずつ読んでも16年かかってしまう 計算となりますね」と田中先生。
「それだけ多くの文字列で構成されているゲノム情報は、まさに巨大なパズルであり、いかにこれを上手く読み解くか、そしてどのように活用できるかを探求していくことが、これからのゲノム研究を行う上で重要 な取り組みの1つなのです」
今後も日進月歩でゲノム解析技術は発展 していくと期待できる。もしかすると近い将 来、地球上すべての生き物のゲノム情報が解読される日が訪れるかもしれない。
「そうなれば、生命誕生と進化の解明や、 絶滅してしまった生物の復活など、わくわくする夢のような研究も到来してくるはずです」