植物生理生化学特論 第12回講義
遺伝子機能の包括解析
第12回の講義では、クロロフィル蛍光を用いたシアノバクテリアの遺伝子機能のゲノム単位での解析の試みについて解説しました。以下に寄せられたレポートとそれに対するコメントを載せておきます。
Q:講義では、遺伝子欠損個体の表現型から遺伝子の機能解析をする例が挙げられていた。シアノバクテリアなどの単細胞生物であれば、比較的容易に欠損個体の作出が可能であり、様々な欠損個体の表現型解析をみる網羅的な解析が可能である。対して、魚類、両生類、爬虫類、鳥類、哺乳類などの実験動物は遺伝子欠損個体の作出に手間がかかり、網羅的に解析を行おうとすると莫大な時間を要してしまうのが難点である。私は現在実験動物を用いてマイクロインジェクションによる遺伝子欠損個体の作出を試みているが、手技の獲得に約1年かかる上に成功率が非常に低く難航している。その点、シアノバクテリアなどの単細胞生物や、アグロバクテリウムで変異を導入できる植物などは、表現型解析にすぐ取り組むことが出来る点で有利である。とはいえ、ヒトの疾患を再現し表現型を評価したい場合などは実験動物による解析が不可欠であり、より成功率の高いゲノム編集ツールが求められると考える。今年には昆虫における簡便なゲノム編集法が発表されており(Y Shirai et al., Cell Rep Methods, 2022)、原理的には技術のない一般人でも欠損個体が作出できてしまうため倫理的に問題はあるが機能解析に大いに役立つツールである。遺伝子機能解析を思い通りに進めるためには、手技による差が生まれない手法を確立することがまず重要であると考えた。
A:内容は至極まともなのですが、やや評論的ですね。この講義のレポートとしては、もう少し科学的な論理を積み重ねるようなものが望まれます。
Q:変異体の蛍光挙動について、光化学系量比及びクロロフィルを調べることでグループに分けられることを学んだ。これにより、強光下において系Iが多いグループと強光下で系IIが少ないグループ、はずれのグループに分けることができる。このようなグループ分けは研究する上で非常に重要になると考えられる。特に、はずれのグループを考慮するか、考慮しないかで理論との差に影響が生じることが想定される。はずれのグループの変異体を蛍光データベースの検索で取得できるので、はずれグループを考慮しない、精度の高い研究を行うことができると考えられる。はずれグループを考慮しない状態で理論との差が可能な限り小さいように理論を定める必要があるが、はずれグループを考慮している方が理論との差が小さい場合は理論が間違っていることを示唆している。したがって、はずれグループを考慮しない状態での理論との比較が重要であると考える。また、各グループの挙動からその性質や及ぼす影響を特定することで、どの遺伝子がどのような影響に起因しているのかを特定することができると考える。そのためには、各グループの挙動から性質や影響を予め推定し、特定の遺伝子を抜いた場合に推定した性質や影響が取り除かれるのかを検証する必要があると考えられる。
A:表現にやや繰り返しが多いことと、「はずれグループ」をどのように考慮するかの具体的な記述がないため、全体を評価しにくいように思いました。
Q:遺伝子の網羅的な遺伝子の解析について研究の紹介も含めて講義を受けたが、三重染色などの場合、それぞれの情報が相互に異なるフォーマットを持つため統合できないという点に興味を持った。例えば細胞壁、核、アクチンに異なる染色を施し、それを解析すると3つのデータは別々に解析されるため、そのデータから統合的な考察が難しいことが予想される。これについて、データをそれぞれの情報を個々に取り出すのではなく、取得した画像データを1つのデータとして解析する方法で表現型を包括的に解析できるのではないかと考えた。多重染色では得られる画像データでは各観察器官が異なる色で染色されているため、これを利用して各器官を認識したうえで、表現型の違いを視覚的にとらえ、画像解析によって定量的に分類することで遺伝子の機能解析を網羅的に行えると考えた。また、この手法では機械学習のうち教師なし学習が想定されるが、この場合異なる対象生物であっても学習させる内容が変わるだけで分類は可能であることから、非常に簡便かつ幅広く遺伝子機能解析ができると考える。もちろんこの手法では遺伝子の機能を確実に決定することはできないが、網羅的に解析を行うという点で迅速さにその利点があると考える。
A:そうですね。今回の講義で紹介したデータベースを作成したのは、今から10年以上前の話で、そのころには、まだ機械学習の方法を生物学に適用することは一般的ではありませんでした。今だったら、もう少しいろいろ可能性が試せたかな、と思います。
Q:講義で、クロロフィルの蛍光挙動を利用して表現型を定量化し、遺伝子をカテゴライズするアイデアと手法を紹介されていた。同様に蛍光挙動の測定ではなく遺伝子発現解析で行うことで、また興味深い結果が得られるのではないかと考える。方法は蛍光挙動と同じで、変異体の遺伝子発現をDNAマイクロアレイで網羅的に解析し、全体の発現パターンを変異体同士や野生株とで比較する。発現レベルが変化する遺伝子は膨大な数に上ると考えられるが、その中で機能や役割などがよく調べられているものをピックアップし、機能・役割ごとにグループ分けしておくことで、『どのグループの』遺伝子の発現が『どのように』『どの程度』変化したか、という3次元ベクトルとして定量化し、比較することができると考える。
A:ここで提案された手法は、一種の共発現解析ですよね。そうであれば、すでに利用例がありますし、一部のデータはデータベースとして公開されています。ただ、最後のベクトル的な解析はなされていないかもしれませんが。
Q:遺伝子の機能解析方法として、機能既知の遺伝子と類似性のある配列を発見した場合には、そのホモロジーの機能を元に変異体の表現型解析を行うことが推奨されていた。講義で述べられていたようにホモロジーとしてタンパク質リン酸化酵素が挙げられていた場合には、リン酸化部位に変異を加えた変異体での表現型を観察すると考えられる。一方でこの表現型解析の前にin vitro(その場合では培養細胞)での解析をすべきであると考える。上記の例の場合では植物の培養細胞を用いてリン酸化を示す配列に変異を加え、リン酸化阻害を加えたWT(ポジコン)と共に比較することでリン酸化シグナルを確認する必要がある。
A:リン酸化酵素とホモロジーのあるタンパク質の機能を調べる際に、例えばin vitroでリン酸化能を調べることはできますが、そのリン酸化にどのような生物学的意味(例えば、あるホルモンを受容した際のシグナル伝達)を明らかにしようとしたときに、どの表現型を調べればよいのかわからない、というのが今回の講義の話の出発点なのです。
Q:シアノバクテリアの遺伝子の9割が体内時計の制御を受けていることから、遺伝子の9割が光合成に何らかの形で関わっているという推測があったが、遺伝子破壊株コレクションと全体のクロロフィル蛍光時系列データの単純偏差2乗和と頻度のグラフにおいて、野生株のデータのブレが大きく、野生株と有意に違いがあるといえるデータが半分くらいしかないということだった。プレカルチャーをもっと前から丁寧にそろえるとか、全ての変異株についてn数を増やすなどすれば改善されるかもしれない。しかし、より多くの種類の遺伝子破壊株について有意な表現型の差を示したいのであれば、低温など違う条件でのクロロフィル蛍光の時系列変化を計測して全く同じように解析すれば、通常の条件では表現型が出なかった遺伝子が表現型を示すことがあるのではないか。Synechocystisのクロロフィル蛍光を見ている限りパラメーターが増えることによる特殊性の増大もあまり問題にならないと考える。
A:違う環境条件でデータを取るというのは、一つの方向性なのですが、あとは、コストパフォーマンスの問題でしょうね。概日リズムが必要となる大きな要因は、光環境の変動に対して行う代謝の切り替えのはずですから、今回のように強光と弱光という、光条件を変えての測定で一番変化が見やすいと思われます。もちろん低温にした時に別の表現型が観察されるとは思いますが、そこで有意な差が出る割合は、現在の半分よりもおそらくさらに小さくなる可能性があります。
Q:今回の講義を視聴して、機械学習の手法を用いてクロロフィル蛍光の挙動をグループ分けすることで、より精度よく、かつ多くの遺伝子を、代謝系ごとにクラスタリングできるのではないかと考えた。Fluoromeを確認したところ、最終更新日が2011年であったため、この講義で示されたクラスタリングの手法は2011年以前に提案された手法である(1)。よって近年になって流行し出した機械学習の手法は、Fluoromeがつくられた頃には未検討の手法であり、かつクラスタリングに有効な手法なのではないかと考えた。(自分の知識が不足しているため、詳細には記述できないのだが)機械学習を用いたクラスタリングは、機械がグループ分けの「正解」を知らない状態であっても、データの特徴によるグループ分けが可能な「教師なし学習」であるため、今回のケースのようにグループ分けの基準が明確でない場合に有効かもしれない(2)。あるいは、機械学習には与えられた正解データを元に、データを分類する「教師あり学習」と呼称される手法もある。この手法を用いて、例えば、ある1つの代謝系に属する既知の遺伝子群について、変異株から得たクロロフィル蛍光のデータ群を機械に与えることで、未知の遺伝子が、その代謝系に属するか否かを識別できる可能性がある。具体的な手法としては、例えばクラスタリングに関してはPythonを用いることで時系列データをクラスタリングする手法がNHN テコラスのブログにて紹介されている(3)。クロロフィル蛍光の時系列データに関してもこの手法を応用したクラスタリングが可能かもしれない。ただし蛍光強度の「距離」の情報を捨てた方が、より正確にクラスタリングできたことを踏まえると、教師なし学習を試みる場合も、「距離」の情報を捨てる手法が必要であると考えられる。このため上記に提案したような教師あり学習を試みる方が今回のケースでは適しているのではないかと考えた。
参考文献
(1) Sonoike, K. et. al. Fluorome. Laboratory of Plant Physiology, Waseda University. (2011). http://www.photosynthesis.jp/fluorome/index.php. (2022年7月3日閲覧).
(2) NTT東日本アベ. 機械学習とは?3つの学習方法と利用例までを分かりやすく解説. NTT東日本. (2021). https://business.ntt-east.co.jp/content/cloudsolution/column-166.html. (2022年7月3日閲覧).
(3) Cho, H. Pythonで時系列データをクラスタリングする方法. NHNテコラス. (2017). https://techblog.nhn-techorus.com/archives/6452. (2022年7月3日閲覧).
A:その通りだと思います。僕も機械学習の専門家ではありませんが、特に教師ありの場合は、距離の情報を捨てる必要すらないのかもしれません。むしろ問題が生じるとしたら、n数でしょうね。クロロフィル蛍光は1800回くらい測定していますが、その程度だと、機械学習のデータとしては少ないように思います。
Q:今回は変異解析について学んだ。対象の遺伝子の作用を調べたいときは通常欠損させてΔ株を作製するが、その際にフェノタイプが変化しないことがある。この時欠損しても影響がない遺伝子であるととらえてしまうが、実際にはオペロンを組んでいた可能性、潰したプロモーターが正しくない場合がある。Synechococcus elongatus PCC7942は全ゲノムが読まれているほか、様々な遺伝子についてTSSが推定されている。自分の扱っているシアノバクテリアはこのようなTSS推定などが行われていないため、どのような方法で推定すべきかを考えた。5'-RACE法やプライマー伸長法などがまず上がってくるが、これらではプロモーターが隣接して複数あった場合などに見分けがつかない可能性がある。そのため厳密に推定したい場合はRNAseqで発現を見るほか5'の特定に特化したCapable seqなどを使用することで隣接したTSSやオペロンの特定を行うことができると考えた。しかしシアノバクテリアは概日時計を持つため、何時間目に採取したサンプルであるか、またLDサイクルなどの照度条件はどのように設定するかを吟味する必要がある。
A:その通りだとは思うのですが、「フェノタイプが変化しない」原因として、実は、フェノタイプが現れる条件で探していないからという理由が大きいのではないか、というのが今回の話の発端です。何のフェノタイプを調べればよいのかわからなければ、普通、生育速度と形態を見るぐらいしかありませんよね。そのあたりとつなげて議論できると面白いと思います。
Q:今回の講義において、光合成は代謝系の影響を受ける可能性があるということを学んだ。その中で、講義中の実験では遺伝子破壊株を作成する際に変異をランダムに加えるという手法であったため、目的の代謝系遺伝子を破壊した株を狙って作成することができないという点に少し不便さを感じた。そこで、遺伝子に手を加えるのではなく培地に手を加えてみるとよいのではないかと考えた。例えば硫黄代謝系が光合成に影響を与えるか調べる際は培地に含まれる硫黄原子を除いて実験を進めることで、硫黄代謝系の遺伝子を破壊した場合と同様の効果が得られるのではないかと考えた。このような手法を取ることにより、狙った代謝系が光合成へ影響を与えているか否かを確認することができると思われる。
A:必要な栄養素を培地から減らせば、必ず生育に影響が出るでしょうから、少なくとも間接的な影響が生育の変化を通して光合成に及ぶと思います。もちろんやってみないとわかりませんが、結局、すべての代謝系が光合成に影響を与えている、という結果になりそうな気がします。
Q:本講義では生物時計がバクテリア遺伝子発現の9割を支配しており、これは光合成が細胞内のあらゆる反応と相互作用しているからという理由が紹介されていた。しかし私は必ずしも光合成がその理由とは思わない。まず光合成を行わない動物も基本的に生物時計に従って活動や代謝が変動する。非生物的環境にも周期性があるため、生物体の代謝を効率的かつ恒常性を維持するためには環境と同調する必要がある。その中でも光環境変動はおよそ24時間周期と季節や地殻変動と比べてスパンが短くかつ安定している。また光合成に限らず体内における各遺伝子発現は大なり小なり相互作用しているため、結果的に光環境に同調して遺伝子発現を調節するのが適応度の観点から効率が良かったのだと考えられる。よって鶏が先か卵が先かではあるが、光環境に各遺伝子発現を支配させることは、光合成に限らず生物の代謝を効率化し適応度を上げるために必要だったと考える。
A:面白い議論だと思います。ただ、動物で概日リズムを持つことが適応的であったとしても、光合成生物の光合成が代謝の中心となっていることと矛盾はしませんよね。そのあたりの論理の進め方に、もう少し工夫の余地があるように思いました。
Q:遺伝子機能が表現型比較によって明らかになることについて疑問を持ったため、記述する。あるタンパク質を欠損させることで、ある現象が阻害されるとき、その阻害された度合いを野生型と比較することで、そのタンパク質と現象の関連性を明らかにするのが表現系比較である。しかし、実際そのタンパク質はある現象を引き起こす生理的な作用の内の1つを担っているに過ぎないため、現象自体のメカニズムが分かっていない場合、「あるタンパク質はある現象に関与している」止まりになってしまい、詳細にタンパク質間の相互作用などは分からない。よって、表現型比較による遺伝子機能解析では、タンパク質を欠損させることで阻害される現象のメカニズムが分かっている場合のみに有用であると考える。
A:おそらく、研究のゴールをどこに置くかによるのかもしれませんね。表現型比較で実験を終える場合は、ここで述べられているとおりかもしれませんが、実際には、表現型比較によって何が役者として働いているのかを決めていって、最終的にその現象にメカニズムを明らかにする場合が多いように思います。
Q:シアノバクテリアの生物時計の役割は昼夜の光環境の変動に応答することで、遺伝子の9割がこれの支配下にある。9割が支配下にあるということは、光合成が細胞内のあらゆる反応と相互作用していることを示唆していることを学んだ。昼夜の光環境の変動に応答するとは、例えば光合成の場合、日が昇る時間に合わせて光合成に関与する遺伝子の発現量をあらかじめ上昇させておく、あるいは日が沈む頃には徐々に光合成に関与する遺伝子の発現を落とす、といった調整のことだと考えた。ここで連続光条件で時計が止まってもシアノバクテリアが問題なく成長することは、時計が止まっていることを示しているのではなく、時計の環境応答の柔軟性を示しているのではないかと思った。岩崎先生によると概日リズムには、環境条件を一定にしても振動が24時間周期で維持される、光などの特定の外界刺激に応じてリズムの位相が変化する、様々な温度条件でも周期の長さが比較的安定しているという三つの特性が存在する。さらにこれを実現するために約24時間周期の基本振動を生み出す「振動体」、振動体に明暗サイクルなどの外界の環境変化の情報を伝え、時計を外環境に同調させる「入力系」、振動体によって生み出されたリズムを様々な生理活性リズムとして実現する「出力系」の三要素が必要だそうだ[i]。これに準ずると連続光条件にさらされているシアノバクテリアは、その振動体は24時間周期で維持されているが、光条件を適切に感知した入力系とその情報に基づいて代謝を続けた出力系の働きによって問題なく成長したのではないかと考えた。また遺伝子発現の調整を概日リズム(=光環境)に合わせて行なっているのであれば、連続光条件などこれまでのリズムの整った条件から外れた時に、遺伝子発現を落とさない、あげないといった、予測とは異なる実際の光環境をフィードバックし、再調整を行う機構が入力系・出力系のバックアップとして組み込まれていると考えた。
[i] 岩崎秀雄、「時を刻むシアノバクテリア」、季刊「生命誌」37号https://www.brh.co.jp/publication/journal/037/research_21
A:ここで述べられていることはこれでよいのですが、最初の部分が全体の流れとどうかかわっているのかがよくわかりませんでした。「日が沈む頃には徐々に光合成に関与する遺伝子の発現を落とす、といった調整」が必要であることが概日リズムの存在意義であるとした場合に、このことは最後の結論の「予測とは異なる実際の光環境をフィードバックし、再調整を行う機構が入力系・出力系のバックアップとして組み込まれている」と矛盾していて前者を否定しているのでしょうか。それとも、それぞれ独立に実現しうることなのでしょうか。
Q:クロロフィル蛍光データベース解析の映像内において、光化学系量比調節における単純な微分類似距離によるクラスタリングにおけるグループ分けの誤った結果の利用について考えた。前もって表現型に異常を発生させることが無いと知られているものでありながら、単純な微分類似距離でのクラスタリングではグループ分けされる決め手となった変異のデータを取り出した後、それを除いた上でのクラスタリングを光化学系量比調節とは異なる他の遺伝子のデータベースで行った場合のグループ分けの精度が変化するかを確認することによって、誤りだと思われたグループ分けの要因が、従来通り全く機能の面での影響得ない変異でありあらかじめ除外すべきものであったのか、あるいは実際には機能への影響がありながら従来の測定では影響がないかのように受け止められてしまっている変異である可能性があるのかを判断する材料にできるのではないかと考えた。
A:何より、300字を超す2番目の文は、やはり複数の文に分けた方が論旨をはっきりさせることができると思います。科学的な文章は簡明であることが重要です。
Q:本講義ではクロロフィル蛍光による表現型の遺伝子解析について学んだ。自身の研究ではヤドカリの左右非対称を生み出す遺伝子の解明が目的だが、その遺伝子をノックアウトすることで体の巻きが変化したことが確認できたとしても、内臓の配置の変化や、はさみの左右での筋肉量の変化があった場合、外部から確認できないため解剖する必要がある。この解剖の頻度を下げ、外部から簡単に確認できるようにScaleCUBIC試薬を用いた全組織の透明化および筋肉の蛍光識別による筋肉量の測定である。これにより解剖したために失われていた外部形態を残しつつ、内部構造の変化を観察することができると考えられる。
A:講義で紹介したのがゲノム単位での包括的な遺伝子機能解析であったことを考えると、レポート内容がややそぐわないように思います。また、内容についても、要は「解剖を避けるために透明化する」ということなので、やや深みに欠ける気がしました。