yokaのblog

湖で微生物の研究してます

文章力は学校で教わらなかった

 ここ最近、申請書も論文も落とされまくっている。これまで割と順調に来ていただけに、なかなか精神的に堪える。何より、頑張って準備した書類が理由も教えられずに全否定されて無に帰する徒労感が辛い。世界は厳しい。まぁそれでも「60点でよい仕事で100点を狙おうと頑張ると時間の無駄だと怒られる」ことに不満を感じていた会社員時代に比べれば、「100点に近いと自負できる成果を出しても普通に蹴られる」今の状況のほうが自分にとっては幸せだと思える。落とされるのは悔しいし凹むのだけど、今の実力では届かない世界があることに燃えてきて楽しくなってしまう自分もいる。「失敗や悔しさから生み出される向上心」が幼い頃からの僕のモチベーションの源泉であり、今もそれは変わらないのだと思える。

 話は変わるけど、僕は小中学校の作文の授業が本当に嫌いだった。書きたいことベースではなく、「原稿用紙〇枚以上」とか「〇文字以上」みたいに分量ベースで文章を書くことが求められるからだ。「言いたいことがあまりなくても、要求された文字数や枚数を満たすために、余計な感想や感情を加えてわざと薄めて長い文章を書かなければならない」ということが意味不明で苦痛だった。加えて「起承転結を意識しなさい」とか「書き出しは会話文が良い」みたいな形式上の謎ルールもその根拠に納得ができなくて嫌だった。「言いたいことから書けばいいし、言うことが無ければ短い文章でいいじゃん」と思っていたけど、数々の作文の授業を乗り越えるうち、謎ルールを当たり前に使いこなして文章を作る能力が染みついてしまった。

 今、申請書や論文で落とされまくって、その失敗原因を探りながら反省していくうちに思うのは、小中学校で植え付けられたこの作文方法が大きな弊害になっているのではないかということだ。気を抜くと、不必要な前置きや回りくどい導入、自分の感想を織り交ぜた表現や、無用な強調語を無意識に使ってしまっている。そういう文章は長くて読みにくくて論理的ではなくて、科学的ではない。このことに気が付いて、小中学生時代の洗脳(と自分が思っているもの)を取り除いて文章を書くようにしたら、文章力(日・英とも)がメキメキ向上している実感が出てきた。文章力が上がると、推敲の回数が減り、書くスピードも速くなって時間的にも楽になる。何ならここ最近、申請書で落とされるたびに文章力が上がっていく実感があるので、書き直すことがちょっと楽しくなってしまっているくらいだ。

 自分の無能を教育のせいにしているだけなのかもしれないけど、僕はこの国の作文教育が、文章力の低い大人を量産し、社会を非効率にし、本人も苦しめている諸悪の根源だと思っている。「原稿用紙4枚に薄めて書く文章力」よりも「原稿用紙1枚に言いたいことを圧縮しきる文章力」を教えてほしかったと思う。

登った山からの景色は楽しまなければならない

難産だった琵琶湖の細菌・ウイルスメタゲノム論文をようやく投稿。同時にbioRxivでプレプリントを公開した。

僕は元々顕微鏡仕事から微生物生態学の世界に入ったので、この論文の研究を始めた頃はショットガンメタゲノムの原理もゲノミクスの基礎もほとんど理解できておらず、バイオインフォマティクスの基礎どころかlsとかcdといったlinuxの基本コマンドすら知らない状況だった。この仕事を形にするのにはかなりの時間がかかると覚悟していたけど、結局3年近くかかってしまった。まだ投稿しただけでここからが本当の戦いなのだけど、ひとまずプレプリントとして出せたことで、「似た内容の論文がライバルから出てくるのではないか」と毎日怯えながら論文のアラートに目を通す緊張感から一旦解放されたのはとても嬉しい。そして案の定、半月経たずして似たような研究のプレプリントが2本、海外から投稿された。

先の論文はチェコの共同研究者たちの研究なので、もともとお互いに手の内を知っていたし、そろそろ出てくるだろうなと思っていたのだけど、後の方は予想していなかったチームからだった。似たようなことをやっている研究室が世界にもう一つはあるはずなので、そこからの報告もそのうち出てくるのではないかと思う。今回の自分の研究の(数々の)大きな発見の一つに、淡水で世界的に優占する細菌系統「LD12」のファージゲノムを初めて報告した、というのがあったのだけど、上記のいずれの研究も「LD12のファージは本研究が最初に見つけた」ということを書いていた。プレプリントの段階で「どちらが先か」を議論してもしょうがないけど、中々形にできず苦しみ焦った毎日に意味があったことを確認できたという意味では、一番先を取れたのは自分にとって嬉しいことだ。一方で、それぞれの研究はもちろん完全に被っているわけではなくて、同じ対象(淡水ファージ)を研究しつつも、それぞれ違う切り口から分析をしており、互いを相補するような面白い結果が出ている。僕の研究は有酸素深水層からもサンプルを採集して細胞内外の両画分をシーケンスしたという点でユニークだし、後の2本も、大規模メタゲノムデータの横断的解析、1つのファージ系統の多様性と生態の深堀、という視点でユニークだ。なので、相手のプレプリントを読むのはとても楽しくて勉強になったし、ライバルが出てきて悔しいというより、似た研究をしている仲間が出てきて嬉しいという気持ちのほうが大きかった。今回の経験を通じて改めて、「自分にしかできない研究・視点」を持つことで、競争的な分野にあっても心の余裕をもち、健全・公正に他者の研究に接することができるようでありたい、と思った。

 さて、論文の査読結果を待ちながら、次に進まなければならない。先に書いたように「ショットガンメタゲノムの研究でアウトプットを出す」というゴールは、3年前の自分にとっては途方もなく高い山の上にあるように感じていた。特にこの1年弱は結果がなかなか出ないことに焦って頭がいっぱいだったので、脇見せず一気に頂上まで登り切った感がある。だから必死に登ったこの山の頂上から見える景色を、一旦立ち止まってじっくり眺めて、楽しむ時間を作りたいと思う。すぐに論文にできそうなデータも手元にたくさんあるのだけど、あまり焦らず、今のフレッシュな視点を持って、あれこれ論文を読んだり、データをいじってみたりして、自分の今後の研究のコアになるアイデアに繋がるような「遊び」の時間を意識的にもちたい。

ベクタ画像をワードに貼りつけてPDF出力する方法

昨日に引き続いて論文投稿作業の罠にハマってしまったので備忘で書く。

やりたかったことは

ベクタ形式の図をワードの原稿上に貼って、ベクタ形式のままPDFとして出力したい

という毎日世界中で死ぬほど発生してそうな作業だったのだけど、調べても驚くほど情報が出てこなくて、結局半日近く費やしてしまった。結論としては「本気でちゃんとやるならAdobe Acrobatを買え」ということになりそうなのだけど、何とか無料でこれを達成できないか、試行錯誤の末にたどり着いたのが以下の方法だ。

  1. 貼り付けたいベクタ画像をemfとして保存する。epsでもsvgでもなくてemf。
  2. emfをワードに貼り付ける
  3. ワードからprimoPDF経由で変換。このとき、画質の設定を「prepress」にする

これで、ベクタ画像がベクタ形式のまま出力されるので、どれだけ拡大してもギザギザにならない図が埋め込まれたPDF原稿が得られる。

 ちなみに、ワードにはpdf変換機能が標準装備(以下、ワード標準機能)されていて、「コピーを保存」からファイル形式「pdf」を選ぶことで使えるのだけど、これは以下の理由で使いにくい。

  • emfで貼っているのに、なぜかラスタ画像としてボロボロの画質でPDFに出力される図が多々出現する。
  • ならば最初から高画質のラスタ画像(tiffとか)に変換して貼っておいて、そこからPDFに変換してはどうかと思いやってみても、なぜか自動的に画質が下げられて出力される。「図の圧縮」オプションなど、あらゆる設定をいじってみたけど、ワード標準機能でラスタ画像を画質を下げずにPDFに出力する方法はなさそう。ちなみに同じことをprimoPDF(設定=prepress)でやってみると、元のラスタ画像から多少画質は下がるけど、ワード標準機能よりはマシな画質で出力される。
  • そもそもワード標準機能には文章だけ(画像無し)のワードを変換する時点で罠があって、保存するときに「オプション」の「アクセシビリティ用のドキュメント構造タグ」のチェックを外しておかないと、変換後のPDFで文字列の並びがうまく認識されなくて、パッと見はきれいに変換できているのに、文章を検索したりそこからコピペして別のファイルに貼りつけようとしたりすると、なぜか意味不明の文字列として認識されていてうまくいかない現象が起こる。このチェックをデフォルトで外す設定ができればいいのだけど、どうやらそれができないようで、毎回チェックを外したかを確認するアホな作業が発生する。

なので、最初からprimoPDFを使って変換したほうが面倒が無くて良い。ただそれでもいくつかまだ罠が残っていて、

  • primoPDFでもベクタとして認識されず、ラスタになってしまうemfがたまにある。しかもprimoPDFでベクタ認識されないemfが、ワード標準機能ではベクタ認識されるケースもある。ただし、ラスタになってしまっても、ワード標準機能でラスタにされる時ほど画質が悪くなるわけではなく、自分で高画質ラスタにして貼り付けるのとあまり変わら無さそうな画質になる。
  • ベクタとしてPDFに反映された図でも、(特に複雑な図では)若干見た目が変わっていたり、印刷したときにおかしなこと(変な塗りつぶしが発生する等)が起こることがある。フォントも若干怪しいことがある。なので、出力されたPDF上の図は隅々まで目を通して、変なことが起こってないか確認する必要がある。変なことが起こっていたら、ベクタで出力しようと頑張るよりかは、おとなしく高品質ラスタで貼ってprimoPDFでの変換による多少の画質低下を受け入れたほうがよさそう。
  • http...で始まる文字列(リンク先と文字列が一致する場合)を除き、ワード内に埋まっているハイパーリンクprimoPDFでは出力に反映できない。なので、ハイパーリンクを含むページだけワード標準機能で別にPDF出力しておいて、PDFsumとかで各ページを結合する等の作業が必要になる。

これでやっと投稿できた・・・

英文校閲の結果を逐一確認しながら元の原稿上で反映させる方法

 論文の英文校閲、これまでいくつかの業者をこれまで試してきたけど、今のところはTextcheckというところが料金と納期とクオリティのバランスがとれていて満足度が高い。ただ一つイケてないのが、納品されてくるワードファイルのフォーマットが変更されていて、書式やスタイル、図表の位置、フィールドコードなどのメタ情報が破壊されて返ってくることだ。特に自分は引用文献リストをMendeleyのワードプラグインで管理しているので、後々のリバイスで文献の登場順や投稿先が変わる可能性を考えると、フィールドコードの情報はどうしても残しておきたい。また、校正された英文が自分の意図した通りに解釈されておらず、違った方向に直されていることも多々あるので、校正された部分は結局一字一句チェックする必要がある。

つまりやりたいことは

英文校閲前のワードファイルのフォーマットを引き継ぎつつ、英文校閲による変更部分だけを逐一確認しながら確定させていきたい

ということになる。で、複数ファイルの情報をマージするワードの機能が使えるのだけど、この使い勝手がとても悪い。毎回同じことをやるのに手こずって時間を浪費しているので、その手順を備忘としてまとめておく。

  1. まず元の原稿のバックアップをとっておく(後述するように、上書きする形にしなければやりたいことが達成できない)。
  2. 元の原稿を開いて、「校閲」タブの「比較」から「比較」を選ぶ(「組み込み」は2か所以上で行われた変更をマージする機能なので今回の用途では使いにくい)
  3. 「元の文書」に元の原稿(今開いているファイル)を、「変更された文書」に英文校閲業者から納品されてきたワードファイルを選択する。
  4. 「比較の設定」は「挿入と削除」「移動」「文字種の変換」「空白文字」を選択(納品物の文字情報だけを変更に反映させるため。特に「書式設定」のチェックを外しておくことがポイント)
  5. 「変更の表示単位」は「単語レベル」に
  6. 「変更の表示対象」を「元の文書」に。ここが一番ややこしいのだけど、上記の「書式設定」のチェックを外したことで、変更後の文書のフォーマットとして、表示のベースになる文書のフォーマットが引き継がれることになる。今回は元の原稿のフォーマットを使いたいので「元の文書」を選択する。「新規文書」を選んでしまうとなぜか英文校閲後の文章の方のフォーマットが採用されてしまう(自分はここでハマって時間を浪費した)。
  7. 元の文章のフォーマット上に英文校閲後の情報が変更履歴として表示されている状態のものが表示される。この状態でいったん保存する。
  8. 変更履歴を逐一確認しながら確定させていく。反映させて良い変更は「承諾」、反映させたくない変更は「元に戻す」を押して確定する。
  9. ややこしいのが、上記の「書式設定」を外したことで採用されるのは元の文書のスタイルや行間等の情報だけで、フィールドコードやhttpリンク、図表の位置などは反映されていない点。なので、これらの情報については、上記の作業で「承諾」せずに「元に戻す」を押すことで元の文書のほうの情報を確定させる(この手作業は間違いが起こりそうなのでできるだけ回避したかったけど、今のところ良い方法が見つけ出せていない)。(追記)引用文献がフィールドコードではなくコンテンツコントロールで管理されている場合(Mendeley Citeなど)、この方法では引用リンクの情報が消えてしまう場合がある。その場合は、元のファイルを一旦違う雑誌の引用スタイルに変更して、引用部分において英文校閲前後のファイルでの重複が起こらないように設定((1)から(xxx et al.)"のように)してかさ作業することで、「コンテンツコントロールごと削除された」扱いになるので、「変更を元に戻す」操作により引用リンク情報を復活させることができる。
  10. 最後まで確定したら、ファイルを保存。
  11. で、一応は作業完了のはずなのだけど、今回自分が扱ったケースではなぜか(書式設定に含まれるはずの)文字サイズが英文校閲後のファイルの方を採用していて、文中で文字サイズが統一されていないという問題が残っていた。なので、全選択して文字サイズを統一。
  12. 一方で、英文校閲で修正してくれた書式変更(学名、遺伝子名やet al.をイタリックにするなど)はこの修正では反映されていない。上記4.のステップで今度は「書式設定」のみにチェックをすることで、元の原稿と校閲後原稿の書式設定の差を見ることができるのだけど、あまりにも変更箇所が多いので、不要な書式変更から必要な書式変更だけを探してくるのは難しい。ここも今のところは良い方法が見つかってなくて、最初からイタリックの修正などを指摘されないように気を付けて原稿を書くことくらいしか解決方法が思いつかない。

というわけで、色々めんどくさい。もっと楽にできる方法があれば誰か教えてほしい。

平成も琵琶湖もおしまい

 昨年の5月から毎月続けてきた琵琶湖の調査、12か月分のサンプルを採り終えて一段落。毎回つくばから滋賀まで往復するのは大変だったし、途中で船が使えなくなって予定が大きく狂うトラブルに遭いながらも、色々な人に助けてもらって何とかここまで来れた。ホッとしていると同時に、恵まれた環境に感謝している。

f:id:yokazaki:20190423233521j:plain

調査の内容としては、琵琶湖沖の表層・深層の水をフィルターで真核微生物(5~200 μm)、原核生物(0.2~5 μm)、ウイルス(<0.2 μm)の3画分に分けて採集するというものだけど、大変だったのは、DNAだけでなくRNAも採集するという点と、多少のロス・ミスがあっても(できればPCRフリーの)シーケンスライブラリ作成に耐えうるだけの十分なサンプル量を確保したいという点だった。つまり、採集したサンプルを即座かつ大量に、さらに3つのサイズ画分に分けて濾過し、瞬間凍結させる必要がある。昨年の5月に初めてこれをやったときは、バタバタで上手くいかないことだらけで「なんて大変なことに手を付けてしまったのか」と思ったけど、毎月試行錯誤しながらシステムを改良していって、秋ごろからは8枚のフィルターで同時に濾過できるようになり、フィルターの交換も最小限かつワンタッチ化して、10Lの湖水を2水深同時進行で1時間弱で濾過して凍結まで持っていけるまでになった。

f:id:yokazaki:20190423232315j:plain

↑船上濾過システムの最終形態

f:id:yokazaki:20190423232723j:plain

ドライアイスエタノールで瞬間凍結されるサンプル

さらに、ドライで得られた仮説をウェットで検証できるよう、同時に顕微鏡観察や細胞計数用の固定サンプルも採集して冷凍保存している。加えて、本当は栄養塩や溶存有機物などの化学データも取りたかったのだけど、何しろこの調査は全て一人でやっているので、さすがに手が回らなかったのは残念だ。一方で、この規模のサンプルを個人で採集できる機動力・コンパクトさこそがこの琵琶湖研究の強みであり、魅力だとも思う。サンプルもデータも思い通りに採って、全て独り占めできる。例えば規模の大きな海の研究だとこうはいかないだろう。まぁでもやっぱり一緒にやれる人がいてくれれば嬉しいのだけど・・・

f:id:yokazaki:20190423234617j:plain

さて、達成感を感じるにはまだ早くて、この後が大変だ。全ての画分からDNA/RNAを抽出・精製して、シーケンスまで無事に持っていかないといけない。特にメタトランスクリプトームは一昨年、結果を焦って実験したせいで失敗しているので、今回は丁寧にやっていきたい。

駆け出して2年目

 明日で博士号を取って今の場所に来てから1年、ポスドク2年目に突入する。この1年何をやっていたか・・・振り返ると、ひたすら学生時代に集めたデータを論文にする毎日だった。昨年の今の時点で、少なくとも論文3本分のデータが手元にあったのだけど、そのうち論文になったのは1本だけ。2本目は最も時間をかけてきた大作で、ようやく投稿に向けた最終段階の作業に入ってきている。といっても、まだ結構時間がかかりそうだ。データの量も質も、これまでに書いてきた論文とは桁違いすぎる。もともとこの論文を出すのには時間がかかるだろうと覚悟していたけど、ここまで大変だとは思っていなかった。そして、3本目の論文は、まだほとんど手つかずだ。というか実は去年、学会発表のネタにするために少しだけ分析を進めたのだけど、世の中の進歩があまりに早く、この半年少しの間に知見も技術もソフトも大きく進歩したので、ほとんどの分析はやり直しになる予定だ。技術の進歩が激しい業界に身を置くようになって、「中途半端に手を出して痛い目に遭う」ことの無いように気を付けなければいけないと思うようになった。

 そんな感じだったので、この1年、実験はDNA抽出くらいしかやっておらず、顕微鏡を覗いたのも1回か2回くらいしかなかったように思う。ほとんどの時間、パソコンの画面に向かって作業していて、微生物の研究をやっているのか、文字列(塩基配列)の研究をしているのか、良く分からない感じだった。

 ただそんな中でも、「1次データを集めて研究を差別化する」ことには必要性とこだわりを感じていて、つくばから毎月琵琶湖に通ってサンプルを集めたし、まだ行けていなかった国内の大水深淡水湖である支笏湖十和田湖の調査をすることもできた。やっぱり、野外調査は楽しいし、自分の研究の原点も野外で仕事ができることにあると思う。僕は常々、季節や天気の移り変わりを感じながら、何ならそれらに仕事の予定を左右されながら、ずっと外でやるような仕事ができれば楽しいだろうなと思っている。一日の天気や気温を知ることもなく、空調の効いた部屋で一日中パソコンに向かっているのがずっと続くとしたら耐えられない。だから、研究を引退したらキャンプ場とか釣り船とかを経営してみたいと思っている。

 一方で恐ろしいのが、野外調査をすればするほど、手に負えない量のデータがどんどん生み出されていくということだ。今の技術でも、1回の野外調査で得たサンプルを、思い切り深くシーケンスすれば、それだけで数年は色々な角度からそれを分析しながら論文を書き続けられるであろうだけのものが得られる。それなのに、サンプルは増える一方で、技術もますます進化して、データの質も量も恐ろしいことになってきている。実際、この1年の間で、先に挙げた論文3本分のデータの10倍を超える量のデータのシーケンスデータが新たに得られて未解析のままずっとハードディスクに眠っているし、さらにまだシーケンス出来ていないサンプルが次々と冷凍庫に溜まっていっている。一体これらのデータとサンプルを分析し終わるのは何年後になるのか、想像もつかない。すごい研究ができることだけは確信しているのだけど。

 こんな状況でこれ以上サンプルを溜めるわけにもいかないので、来年度からは湖の調査の計画も抑え気味にしていて、この1年以上にパソコンに向かっている時間が増えそうな気がしている。あまり嬉しいことではない。顕微鏡や、ウェット実験の仕事でもやりたいことはたくさんあって、試薬までそろえてあるものもあるのだけど、それらに手が付けられるのも一体いつになるのか分からない。税金(研究費)を使って準備までしたので、お蔵入りにしてはならぬぞという正義感が、頭の裏に残っていてじわじわとプレッシャーをかけてくる。

自分が今出来ることの中で、自分が今やりたいと思っていることの中で、自分が今やれば意味があると信じていることを選んでも、それを全てやろうとすると、絶対に人生が足りない

ということが、これまでになく確実な状況として自覚されている。お金があれば人と手分けをして取り組むこともできるのかもしれないけれど、今の自分にはそのような実力も魅力もない。だから、「やれば確実にうまくいくこと」であってもそのほとんどに手を付けることができない、という前提の上で、自分が残りの人生で書ける限られた論文の本数を、どのテーマにどれだけ割り当てるのか、ということを考えないといけなくなっている。そのためには、それぞれの論文を最高に面白くて重要で妥協のない最高傑作にすることはもちろん、自分が出していく一連の論文の流れが最終的に作り出す、「一人の研究者としてのストーリー」まで想像しながら考えないと、決断を下しきれないと思う。とはいえ、そんなものが最初から見えていたらそもそも研究する必要も面白さもない。分からないことだらけなのにどんどん新しいことが分かっていくこの世界の変化に素早く反応して、自分ができることを見極めながら軌道修正しつづけていく柔軟性が必要なのだと思う。当たり前のことを言っているだけなのだけど、この1年を振り返り、次の1年を想像しながら、改めて強く思い直したところだ。

医学部はかっこいい

東海大学の医学部で行われた「感染症診断と治療におけるゲノム解析」というシンポジウムに招待いただき、講演してきた。まだ駆け出しの身分にも関わらずそうそうたる先生方と同じ枠で招待してもらっただけで恐れ多いのに、これまでほとんど接点のなかった医学部の研究者らの前で「生態学方面からの最前線の話を是非してもらいたい」というリクエストだったので、かなり緊張した。

f:id:yokazaki:20190317230238j:plain

▲つくばから約120km、関東平野をほぼ横断して伊勢原駅につくと、会場のある病院が城のようにそびえ立っていた。

 発表はできるだけ手法や業界の動向に焦点を当てて、非生態学の分野の方々にも参考になる内容にしたつもりで、それなりに質問も頂いたので、何とか役目は果たすことができたかなとは思う。一方で自分が得たものも多くて、医学系の研究の現場の問題意識、手法や考え方の流行などの違いを、短時間の発表の中でも多々感じることができ、面白かった。何よりも、発表やその後の懇親会での会話の中で、「やっぱり医学の研究ってダイレクトに役に立っていてかっこいいな」ということを感じた。もっと言うと「それと比べて自分の研究は趣味みたいで申し訳ないな」という気持ちにもなった。自分と同じように微生物を対象にしていて、自分と同じような方法で微生物にアプローチしているのだけど、サンプルは研究室のすぐ横の病院で治療している患者さんから採取したもので、目の前の命に係わる問題と戦っている。もちろん自分がやっているような微生物の進化や生態に迫るような研究だって重要で、医学にとっても役に立つことがあるし、それができるのが理学の特権であり、魅力であり、役割であると思う。それでも、同じような研究方法を使っていながら、別世界の最先端に立つ人達のことを知ることができたのは、自分の立ち位置や可能性を相対的に見直すきっかけとして、また医学部の研究のかっこよさを知る機会として、良い経験だった。