yokaのblog

湖で微生物の研究してます

PacBioを使った16S系統分析

 次世代シーケンサーで環境中の細菌の組成を明らかにする方法として、16S rRNAのアンプリコンを使ったメタゲノム分析が一般的だ。今主流のilluminaや(消えつつあるけど)454を使った方法だと、シーケンサーのアウトプットのリード長がせいぜい500bpなので、どうしても16Sの全長(約1500bp)を見ることはできず、9つ存在する可変領域の1~3つ程度しかカバーできなくて、結果として系統分析の分解能も限られていた。

 最近出てきたPacBioシーケンサーは、これまでのシーケンサーと原理が異なるため、リードが長く、20,000bp程度まで読めるのが特徴だ。その強みを生かして、全ゲノムアッセンブリなどで成果をあげつつあるところだけど、これがいよいよ細菌の16S メタゲノムでも実用化されはじめたみたいだ。

 このchunlabという会社は、PacBioで読んだ16Sのデータの分析パイプラインを提供している。色々調べていると、PacBio社と共同で出した研究発表らしき資料も出てきた。

http://files.pacb.com/pdf/Analysis_of_Full_Length_Metagenomic_16S_Genes_by_SMRT_Sequencing.pdf

 ここで紹介されている方法では、16Sの2本鎖DNA1分子の両端をアダプターで結合して環状DNAを作り、それを長く読むことで、1回のリードで折り返して読む回数を増やして、コンセンサスの精度を上げるという方法を使っている(資料内左下の図)。16Sの長さに対して、リード長が有り余るくらいあるので、その分が精度の向上に使える、という考え方だ。

 詳しい結果は資料内のconclusionsにあるけど、この手法を使って、1ランあたり最大24,000個程度の配列を決定でき、OTU以下の細かい分解能で系統分析が可能になった、とある。これから価格が下がってくれば、確実に主流になってくる技術だと思う。

 で、僕みたいにこれからメタゲノムを始める人間こそ、最新技術から取り組む意義もチャンスもでかいと思うんだけど、なんせ予算が。ざっと調べた感じ、外注するとしたら、最低でも1ラン50万円からが今の相場っぽい。学振の年間の研究費の半額以上がふっとびます。さすがに使えません。やっぱり研究にはお金が必要ですね・・・