yokaのblog

湖で微生物の研究してます

4年の試行錯誤とこだわりの成果

 学振ポスドクとしてやっていたメインの仕事の論文が出版された。つくばから毎月新幹線で琵琶湖に通って、船のトラブルに見舞われながらも、色々な人にサポートしてもらい、なんとか1年通しで調査をやりきった。全サンプルからDNAとRNAを一発でミスなく完璧に抽出できたのも、先進ゲノム支援に採択されてロングリードのメタゲノムに挑戦できたのも当初の予想以上だったし、何よりも、あと1年動きが遅かったらコロナに巻き込まれて研究が中断していただろうと思うと、本当に幸運に恵まれたし、完璧にきまった研究計画だったと思う。

 研究の内容はプレスリリースを出したのでそちらに譲るとして、改めて振り返ると、構想からは5年、研究を始めてからは4年と、かなりの時間を費やした研究になった。調査を始めたのが学位を取得してポスドクになった直後の2018年5月、1年のサンプルを採り終わったのが2019年の4月で、2019年11月までDNA/RNA同時抽出方法の開発で試行錯誤し(これは別論文としてまとめる予定)、得られたDNAをロングリードとショートリード解析に回して、シーケンスデータが出そろったのが2020年の8月。そこからロングリードのアセンブリとゲノム構築を進めるのだけど、初めて扱うロングリードメタゲノムで色々と試行錯誤を繰り返しつつ、京大への異動のバタバタもあって、ゲノム構築まで済んだのが2021年の3月、さらに詳細な解析に踏み込んで論文の骨子が固まったのが2021年の10月頃、その後冬休みに一気に論文を書き進めて、形になったのが2022年2月頃、そこから清書して、共著者とのやり取りも踏まえて最終版を投稿したのが2022年3月になる。

 こうやって列挙すると、それぞれのステップにかなりの時間がかかってしまっているけど、今振り返っても、これ以上のスピードで進めるのは難しかったなというくらいに頑張ってこれだった。特にポスドクから教員になってからは集中できる時間をまとまってとるのが難しくなって、アウトプットが滞っている現状に休日が楽しめなくなるくらい精神的に追い込まれていた。実際、今回の論文のほとんどが、休日や長期休暇を捧げて捻出した時間に一気に集中して書き進めた内容でできている。ので、頑張ったといえるし、これ以上の速度で進める(これ以上の犠牲を払う)のは無理だったと思う。で、ようやく1本出してみたけど、相変わらず「大学の先生はいつどうやって論文を書くものなのか」への答えは分からない。教員の仕事にも慣れてきて色々と見通しがつくようになってきたので、そのうち持続的な方法が見つかると信じたい。

 論文の投稿プロセスは、「自信作だったのになかなか読んでもらえず、やっと読んでもらえたと思ったらあっさり通った」という点で、前々作とほとんど同じ流れだった。まずは前々作同様、PNASに投稿。さすがに今回は査読には回るんじゃないかなー、くらいの自信だった。で、投稿してから1か月弱音沙汰がなかったので、てっきり査読に回ったと思って安心していたら、突然のエディターリジェクト。何がどこまで進んでいたのか全く分からないけど、毎度のことながら、お祈りメールはまともに読んでくれた形跡がない定型文。で、前回同様、固いと思っていたISMEJにもエディターリジェクトされ、Molecular Biology and Evolutionも、mBioも、読んですらもらえずリジェクト。で、どんどん自信が無くなって、「もうどこでもいいからとにかく一度読んでくれよ。読んだら分かるから」という気持ちでmBioからmSystemsにtransferしたら、ようやく査読に回してもらえることに。で、1か月ちょいで返ってきた査読コメントは前々回同様に絶賛系で"I really enjoyed reading this manuscript. It is well-written and clear..."という感じで、あとはちょっとだけ手直ししたらエディター判断で即日アクセプト。前々回同様、まともに読んでもらえるまでが長く、まともに読んでもらえさえすれば価値を分かってもらえる、という経験をした。

 これまでの自分の主著論文はほぼ全て、査読に回ってからはマイナーリビジョンですんなりアクセプトされていて、査読後にリジェクトされたことは一度もない。自分が書く論文は、文章構成も内容も図も時間をかけてしっかり煮詰めてから外に出している自負がある。それは、自分が査読者として他人の論文を読んでいても感じることで、自分の論文の原稿のクオリティは、査読に回る平均的な原稿のクオリティよりは高いだろうと自分では思っている。それが単なる自分の思い込みではないということを、実際に「読んでもらえさえすれば必ず評価される」という経験を何度もすることで実感できていて、自信になっている。

 なので自分にとっては論文は「エディターさえ通ればアクセプトされるもの」になっている。そして、前回の論文の記事でも書いた通り、エディターをパスできるかどうかは相性や運の要素が大きくて、自分の中の論文の評価と全く一致していないと感じている。自分は格の高い雑誌に掲載したいという執念はそんなにないので、別にそれでもよいのだけど、雑誌の格がまだ重要な意味を持っている中で、運や相性の要素がかなり大きいように感じられるのは理不尽だなとも思う。

 一方で、エディターをパスできる確率を高める努力の余地もまだあるのだろうと思う。だけど、それは自分のやりたいことではないとも思う。端的に言えば、「枝葉は捨ててワンメッセージに絞る」「個別具体的感を出さず、一般性の高さをアピる」といったことをすれば、エディター受けは良くなるだろう。例えば、今回の論文のタイトル「Long-Read-Resolved, Ecosystem-Wide Exploration of Nucleotide and Structural Microdiversity of Lake Bacterioplankton Genomes」についても「Viral infection is the major driver of bacterial genome microdiversification in the environment」みたいなタイトルにして、ウイルス要因に絞り込んで深い解析をする方向でも論文は書けただろうし、その方がエディター受けも良かっただろうと思う。それに"lake"という言葉は一気に研究対象を狭めるので、それだけで一気に読者を失いかねない、ある意味NGワードだと思う。でも自分は、琵琶湖に通い詰めて網羅的に調査や解析を行ったその全体像を示したかったし、湖を起点に微生物生態学の研究を展開していくというビジョンにこだわりがあったので、不利になることは承知で、自分がやったことに正直な書き方をすることにした。この辺は自分の不器用なところと言えばそれまでだけど、「別にエディターや雑誌のために論文を書いているわけではないぞ」というプライドもあっての判断なので、それを踏まえて、一応関係者が一通り目を通すであろうレベルの雑誌には載せられたので、あとは引用数で評価してほしいなという感想だ。

 先にも書いた通り、今回の研究ではサンプルからDNAとRNAを同時抽出していて、今回はDNAだけの結果の論文だ。試行錯誤したRNAもこれまた完璧なシーケンスデータが得られていて、これの解析と論文にも(また相当時間がかかりそうだけど)今後着手していく予定だ。今回の研究のキーワードである「高解像度」は、微生物生態学の今後のキーワードでもあるし、自分の研究の今後のキーワードでもあり、武器になりそうな気がしている。高解像度な手法を使うことで、色々と明らかになったこと以上に、面白い課題がたくさん炙り出されてきた。ちょうどこの研究のサンプリングを始めた4年前、

今は登り始めた目の前の道を登るしかない状況になっていて苦しいけど、この山を登り切って一段落着けば、データも知識もスキルも一通り揃って、かなり自由に周りを見渡せるようになっているはずだ。そうしたら、次は安易に目の前の山を登らず、じっくり時間をかけて、「本当に知りたいこと」「一番面白いと思う事」を見つけ出して、無限にある山から、本当に登るべき山を選ぶ作業をやりたい。

というようなことを書いていたけど、4年経って、少しずつその境地に近づいてきたと言えるようになった気がする。