yokaのblog

湖で微生物の研究してます

琵琶湖の細菌・ウイルスのゲノムカタログ

 先日プレプリントを公開していた論文がEnvironmental Microbiology誌にてPublishされた

 データ量もかけた時間もこれまでの仕事を圧倒しており、今までで一番手がかかった論文だ。最初にこの研究の構想に至ったのがD1だった2015年の秋で、共著者の方々に声をかけて本格着手したのが2016年の3月、そこからここに至るまで、博士論文のメインの仕事と並行しながらずっと試行錯誤していて、結局3年半もの時間を使ってしまった。そういう背景もあって、自分の中ではこれは「裏博士論文」みたいな位置づけで、長い付き合いであったとともに「ようやく形になった」という安堵の気持ちが大きい。

本研究は一言でいえば、

琵琶湖水中に生息する細菌とそれに感染するウイルスのゲノムをメタゲノムで網羅的に決定し、その多様性を明らかにするとともに、生態系内で重要な機能を担うとみられるウイルスとホストを特定した

という内容だ。

 ショットガンメタゲノムの普及で、環境中の未培養の細菌・ウイルスのゲノム多様性が爆発的な勢いで明らかになりつつあるけれど、淡水環境での研究はまだ比較的少なく、特に僕が専門としている大型淡水湖の沖合や深水層においては、まだほとんど情報が無かった。本研究では琵琶湖沖で9か月・2水深にわたり、細菌(0.22~5 μm)とウイルス(<0.22 μm)の両サイズ画分からDNAサンプルを採集し、ショットガンメタゲノムシーケンスによる網羅的ゲノムアセンブルを行った。またメタゲノムのカバレッジを用いた各細菌・ウイルス系統の現存量動態の把握や、ゲノム情報に基づくウイルス-ホストペアの予測、コードされた遺伝子に基づく生態系内での機能予測も行った。さらに、他の湖や海洋のメタゲノムから得られたゲノムとの比較から、今回琵琶湖で見つかった細菌・ウイルス系統の多くが、水域環境に普遍的に生息するコスモポリタンな系統であることも示した。これらの情報を総合し、これまで見つかっていなかった優占的な淡水細菌に感染するウイルスを多数予測したほか、質・量・多様性といった観点から淡水生態系において中心的な機能を担うと見られるウイルスグループの存在も明らかにした。本研究は顕微鏡写真も実験結果も無い、完全にドライ解析のみの研究だ。なので、「現象/仮説を実験的に検証した」というよりは「膨大な情報を整理して仮説を炙り出した」というスタンスで、今後の研究のスタート地点になるという位置づけだ。

 今の論文の形になるには長い経緯があった。そもそも、細菌メタゲノムとウイルスメタゲノムは別々に進めていた研究で、先に着手した細菌のほうをまずpublishし、それを踏まえてウイルスの研究に着手するのが当初の計画だった。ところが、メタゲノムのデータを本格的に扱うのは初めてで、バイオインフォやゲノミクスの基礎から勉強しなければならなかったことや、これまで扱っていたアンプリコン解析等と比べてあまりにもデータが巨大で複雑なこともあって、思うように進まず苦しい日々が続いていた。そうこうしているうちに他の湖からの細菌メタゲノムの報告が増えてきて、新規性をアピールするうえでのハードルが上がりつつあった。一方で、後からスタートしたウイルスメタゲノムのほうのデータも出そろってきて、並行して解析を進めていたのだけど、これまたデータの巨大さと複雑さに手を焼いているところだった。そこで「どうせ時間がかかるのだから、じっくりと分析を深めて、細菌もウイルスも一緒にしてでかい論文として出そう」という考えになった。細菌とウイルスのサンプルは現場で同時に採集しているので、両者のゲノムを総合的に解析することで、「ウイルスとホストの関係性」にフォーカスした研究が可能になり、より生態学的で、新規性・インパクトの高い研究にすることができると考えた。

 このあたりですでに研究を始めてから2年近くが経っており、妥協せず納得いくまで解析を深めたいという思いの一方で、手戻りの嵐の中でなかなかアウトプットが出ないことを焦る苦しい日が続いた。それでも自分の納得いくまでデータを練り続けられたのは、「こだわり抜いて出した成果をちゃんと評価してくれる研究者が世界にいる」ということを、これまでの研究で自信をもって感じることができていたからだと思う。

 そうして少しずつ、自分の解析の腕や、研究の目の付け所にも自信が持てるようになってきて、論文になりそうな雰囲気が出てきた。で、いざ書き始めてみて次に困ったのが、情報量があまりに多すぎてとても1本の論文に収まらないということだった。本当は言いたいことが色々あるのを我慢しながら、とにかく文章を短くすることを意識して書いた初稿が1万語超え。ここから共著者と相談しながら情報を取捨選択し、「もうこれ以上煮詰まらない」と思っていた文章をさらに煮詰め、なんとか投稿可能な長さに仕上げた。どうしても削れない/捨てきれない情報はSupplementary Infomationに流し込んだ。結果的にSupplementaryだけで論文一本分くらいのボリュームになり、FigやらTableやらも合わせて30枚を超える大作になってしまった。

 論文を削りながら考えていたのが投稿先だ。自分がもし定職についていたなら、

自分の仕事を載せるのは(とりあえず読んでもらえる)中堅以上のレベルのジャーナルならどこでも良いから、あとは中身で判断し、引用で評価してくれ

というスタンスなのだけど、残念ながらまだ職探しをしないといけないので、少しでもインパクトのある雑誌を狙わなければならない。今回の仕事はこれまでで一番力を入れたし、一番クオリティも高いと思っていたので、これまでで一番良いジャーナルに載せたいと思っていた。かといってgenerality的にNatureやScienceを狙えるようなネタではないことは明らかだった。Nature Microbiologyからスタートするという考えもあったけど、論文のフォーマットが初稿と相性が悪かったことと、総合系の雑誌に載せてみたいという思いが強かった(あと、Natureブランドのやり方がなんとなく好きになれない)ことから、PNASを最初の投稿先にすることにした。

 PNASの厳しい投稿規定に合わせて論文の体裁を整え、本文だけでなく、長大なSupplementary textも全て英文校閲にチェックしてもらい(これだけで9万円近く支払った)、カバーレターも入念に準備して、3年間の苦労を思い起こして自信に変換し、気合ばっちりでPNASに投稿した。通るかどうかは分からないけど、このクオリティなら最低でもレビューには回るだろう、と思っていた。ドキドキしながら待っていると数日後の朝、時差の関係で夜中に届いていたメールに気づいて飛び起きた。嫌な予感しかしないメールを開くと、"The expert who served as editor concluded that although this work is interesting, it does not have the broad appeal needed for PNAS and is better suited for a more specialized journal. "という本当に原稿を読んでくれたのかも分からないコピペのような文章であっさりと希望を打ち砕かれた。世界は厳しい。

 次の投稿先としてはISMEを考えていた。微生物生態学ではトップジャーナルだけど、自分は一度ここに論文を掲載したことがあって、その時の仕事に比べれば、今回の仕事のほうが質・量ともにはるかに上回っているはずなので、(おこがましくも)「最低でもISMEには出せるネタだ」と考えていた。ISMEが本命(落としどころ)なのだとすれば、その前にもう一つくらいチャレンジしても良いかと思い、これまた一度掲載してみたいと思っていたtop tierのオープンアクセス誌に出してみることにした。eLifeやGenome Biologyなども見て回ったけど、ジャーナルの性格や、投稿作業の負担などを総合して、PLOS Biologyに投稿した。結果、一瞬でエディターリジェクト。後で知ったのだけど、人によっては、PNASよりもPLOS Biologyのほうが格上だという認識らしい。でもこれはダメモトチャレンジで、そんなに時間も使わなかったので、PNASの時ほど悔しくはなかった。

 で、本命のISMEに投稿することに。めんどくさいのが、ISMEはマテメソが先に来るフォーマットなので、論文を大幅に書き換えなければならないことだ。それでも、「ISMEに論文が出せるのなら大満足だ、そしてこの仕事なら必ず出せるはずだ」と信じて、クソめんどくさい改訂作業を頑張った。カバーレターも全面的に書き直し、自分の論文投稿史上、最大の自信をもってsubmitボタンをクリックした。数日後、投稿サイトにログインして進捗状況を見ると、"Under Review"との表示。少なくとも査読には回ったようだ。

 一安心し、ワクワクしながら返事を待つ日々・・・はそんなに長くなくて、なんと投稿から3週間後、昼食前の時間帯に、"Decision on ..." というメールが返ってきた。「えらく査読早いな!」とドキドキしながら開くと、まさかのリジェクト。しかも驚くべきは、査読にすら回っておらず、エディター判断でのリジェクトだったということだ。3週間も待ったのに!”Under Review”言うてたのに!そしてまたしてもお決まりのコピペのような文面で”the work did not focus on ecological questions or hypotheses that would be of interest to the journal’s broad readership”と書かれていた。本当に中身を分かる人が読んでくれたのだろうか?これには落胆を通り越して、理不尽を感じた。すかさず共著者とも相談し、昼食を食べるのも忘れてrebuttalのletterを書きはじめた。rebuttalを書くのは初めてだったけど、もう反論したい点が山ほどあったので、短いリジェクトメールに書かれていたコピペのような文言を一言一言取り上げて、具体的な反論と、この仕事の価値のアピールを、溢れる感情を排除しながら、慣れない異国の言語で最大限に客観的で丁寧な言葉づかいで、ほぼ丸一日かけてみっちり書き連ねた。letterを添付し「必要な改訂があればいくらでもするから、せめて再投稿のチャンスをもらえないか」とエディターにメール。で、2日後に返ってきたメールは"as you have found in the guide for authors, the journal does not have an appeal process, and the editorial decision is final." というこれまた全てコピペかのような冷たく短い文章。気迫を込めたrebuttalの内容には1語たりとも触れてくれてなかった。ろくに読んでもらえず、理由も教えてくれずに全否定され続けるのは辛い。

 心はボキボキだったけど、それでも次に行かなければいけない。もはや「就職に有利になるようなトップジャーナルに出したい」というモチベーションは無かったので、「論文の性格と合致し、この仕事をちゃんと評価してくれそうな雑誌」という基準で、Environmental Microbiologyに出すことに決めた。めんどくさいのが、再びマテメソを後ろに持ってこなければならなかったことだ。気が狂いそうになりながら、付加価値ゼロの改訂作業と、最高に使い勝手の悪い投稿システムと戦って、submit。これはさすがに行くだろう、と思いながらも、毎日ビクビクしながら進捗を確認し、数日後に今度こそ査読者に回ったことを確認し一安心。で、2か月後、出張ラッシュの最中、これまた時差の関係で夜中に来ていたメールに、朝ホテルのベッドで気づいて飛び起きる。メールが長い。中身を読んでもらっている。それだけで嬉しかった。専門的な査読者がちゃんと評価してくれて、建設的な指摘も色々ともらいつつ、総合判断はminor revision。出張ラッシュが一段落したところでreviseを返したところ、即日でアクセプト。これまでの苦労が嘘のように、最後はすんなりといった。「まともに読んでもらえるまで」が長い論文だった。

 査読コメントで嬉しかったのが、”I appreciate the authors’ hard work to obtain as much information as possible from this data”という言葉だ。やはり見てくれる人が世界にいる。納得いくまで時間をかけて分析を深めたことが間違いでなかったと確認出来て救われた。また、もう一人の査読者からは"The bioinformatic analyses appear to be state-of-the-art"という言葉をいただき、メタゲノムの解析経験が全くない状態から苦しんでここまでたどり着いた時間が報われたと思った。また今回は、共著者の西村さんが開発してくれた素晴らしいツール群がなければ、到底ここまでたどり着くことはできなかった。特に、ウイルスゲノムのプロテオミックツリーやアライメントをtblastxベースで計算・可視化してくれるViPTreeは、standalone版も完備されていて使い勝手がよく、環状ゲノムのアライメントがきれいに見えるように自動でゲノムを回転/反転してくれるなど、そのまま論文に使えるレベルの図も出力してくれる、素晴らしいツールだ。今回は、琵琶湖のウイルスゲノムと他の海洋/湖沼メタゲノムから集めたウイルスゲノム全てを含んだツリーとアライメントを盛り込んだSupplementary Treeのページも特別に準備してもらった。さらにアセンブルしたすべての細菌ゲノムはアノテーションしてデータベースに登録し、遺伝子単位でNCBIのnrやUniProtデータベース上で検索できるようにしたほか、アセンブルした全ウイルスゲノムとそのアノテーション情報もSupplementary Informationとして公開した。本研究では得られたデータの1%も解析しきれていないと思うし、まだまだデータを掘れば面白い情報が眠っているに違いない。そういった意味で、本研究を、論文の内容とは別に、「大水深淡水湖(琵琶湖)の沖合で採集した網羅的な細菌・ウイルスのゲノム/遺伝子カタログ」としても活用してほしいし、そういった形での引用も増えてくれるのではないかと期待している。

 さて、論文が掲載されて一段落した今になって改めて、「なぜPNASやISMEで門前払いを受けたのか」ということを考えてみると、やはり「課題ドリブンではない」という点が難しいところだったのかなと思う。僕の仕事は研究対象の性格上「まだ掘れば掘るほど新しいものが出てくるステージなので、まずは掘りまくって全体像を確認しよう」というスタンスのものが多い。なので「こういう未解決重要問題があるからこういうアプローチで取り組みました」というストーリーにはなっていないくて、そういう研究と比較するとどうしても第一印象として重要性やインパクトをアピールしにくい。このことは、これまでの論文でも、研究費の申請書などを書くときにも、常に悩んでいたことだったけど、改めて課題だなと感じた。もっと言い方や書き方を工夫して、同じ研究内容でも課題ドリブンな見せ方ができるようにしていかなければならないと思う。

  今後の展開としては、現在、本研究で得た知見・経験を横展開して国内外の複数の湖で同様の解析を進めつつあるので、それらの比較によって、琵琶湖で得られた結果を一般化したり、湖の細菌やウイルスの進化的な背景に迫るような研究に発展させていきたい。また、琵琶湖で12か月にわたって採集したメタトランスクリプトームサンプルのシーケンスを進めており、その結果から、今回得られた細菌・ウイルスゲノムの各遺伝子の発現プロファイルを明らかにし、生態系・物質循環内での機能や、未知の重要遺伝子の特定につながるような研究に発展させていく予定だ。

 ともあれ、これでその走りとなる仕事が一段落した。本当に長かった。協力してくれた全ての人と、予算と、環境に感謝したい。