<研究に関すること>
大学院统合生命科学研究科 特任教授 坊农秀雅
罢别濒:082-424-4013&苍产蝉辫;
贰-尘补颈濒:产辞苍辞丑耻*丑颈谤辞蝉丑颈尘补-耻.补肠.箩辫
<広报?报道に関すること>
広报室
罢别濒:082-424-3749&苍产蝉辫;
贰-尘补颈濒:办辞丑辞*辞蹿蹿颈肠别.丑颈谤辞蝉丑颈尘补-耻.补肠.箩辫
(注: *は半角@に置き換えてください)
English website is here .
広岛大学大学院统合生命科学研究科の坊农秀雅特任教授は、理化学研究所生命医科学研究センターの粕川雄也チームリーダー、东京农工大学グローバルイノベーション研究院の坂本卓磨特任助教、天竺桂弘子教授と共同で、昆虫の遗伝子机能アノテーションのワークフロー(コンピュータによる一连のデータ解析の流れ)「贵补苍蹿濒辞飞4滨苍蝉别肠迟蝉」を开発しました。
原核生物ゲノムアノテーション(米国NIHのNCBI Prokaryotic Genome Annotation Pipeline)やヒトリシーケンスデータ解析(国立遺伝学研究所日本DNA データバンク(DDBJ)など生命科学塩基配列データ解析において、それぞれのデータ解析に応じたワークフローが広く使われています。
食品ロスからコオロギなどを育て新たなタンパク质を生み出す昆虫食が昨今话题になるなど、世界的な食粮难や有用物质生产のためのプラットフォームとして昆虫が注目されています。しかしながら、昆虫の持つ遗伝子の机能は研究の进んでいるヒトやマウスと比べて未知のものが多く、今后の研究が待たれているところです。
昆虫遗伝子研究を加速するため、本研究グループは2010年ごろからカイコガの研究のためにその机能アノテーションパイプライン(3)を构筑し、全ての遗伝子に対してその机能を予测してアノテーションする技术を开発してきました。今回、カイコガ以外の多くの昆虫种でも利用可能となるように、タンパク质をコードした遗伝子だけでなく、 非コード遗伝子も対象とし、その遗伝子発现情报をも机能アノテーションに利用する方法を取り込むことによって、昆虫に特化した机能アノテーションワークフローとして「贵补苍蹿濒辞飞4滨苍蝉别肠迟蝉」を开発しました。
今回开発した机能アノテーションワークフローによって、昆虫での有用物质生产をデザインするためのゲノム编集研究が加速することが期待されます。
本研究成果は、スイスの出版社Multidisciplinary Digital Publishing Institute (MDPI)のInsects誌に2022年6月27日に掲載されました。
ヒトやマウスではそのゲノム解読や理化学研究所が中心となって进めてきた贵础狈罢翱惭国际共同研究などによって遗伝子机能の研究が进んだ结果、それらのデータベースが整备され、それらを统合したデータ解析が可能となっています。しかし、非モデル生物である昆虫のゲノムやトランスクリプトームの塩基配列解読することが可能になったものの、この技术の利用はしばしば标的遗伝子や関连遗伝子の塩基配列の取得に限定され、他の利用可能な配列が十分に注釈されていないために、取得した配列の多くが未利用のままとなっています。
ゲノム编集技术によって、遗伝子の机能解析のための昆虫研究を加速させることが可能ですが、そのためにはゲノムにコードされたすべての遗伝子の机能を研究する必要があります。生物のゲノム解読が完了しても、その生物が持つすべての遗伝子の机能情报についての知识はまだ不完全なままなのが现状で、これまでの生物学的研究の成果から得られた遗伝子に対してのみ既存のデータベースに记録されているにすぎません。しかしながら、これらの情报はゲノム编集の标的遗伝子を决定する上で重要となってきています。これらの情报は、今后大量情报処理のためにコンピュータプログラムによって解析されることになるので、人间が読んだらわかる形式ではなく、コンピュータによって読み取り可能な形式であることが非常に重要となっています。
本研究では、昆虫の転写配列情报およびリファレンスゲノム配列?タンパク质配列データベースを利用した、基づく遗伝子机能アノテーションのためのワークフロー(コンピュータプログラムによる一连のデータ解析の流れ)を开発し、従来のタンパク质配列に翻訳できた遗伝子のみを対象とする方法を大幅に改善しました。また、搁狈础配列解読によって得られる配列情报を発现量データとしても利用することにより、得られた配列の频度情报から発现値データの特徴から、机能アノテーションする手法も开発しました。
开発したワークフローでは、トランスクリプトーム解析で得られたタンパク质配列だけでなく、同时に得られた非コード搁狈础(4)配列もアノテーションします。さらに、トランスクリプトーム解析で得られた発现レベルの情报を统合し、机能アノテーション情报として利用します。このワークフローを用いて、アマミナナフシとカイコガのトランスクリプトームから得られた配列に対して机能アノテーションを行ったところ、従来の研究よりも豊富な机能アノテーション情报を得ることができました。
开発したプログラム群はオープンソースソフトウェア(5)として骋颈迟贬耻产上で公开されています(丑迟迟辫蝉://驳颈迟丑耻产.肠辞尘/产辞苍辞丑耻/厂础蚕贰)。
本ワークフローで得られる机能アノテーション情报はゲノム编集を用いた昆虫学研究の可能性を大きく広げるものです。また、作成したワークフローの植物や菌类への対応を今后検讨する予定です。
図1 作成した遺伝子機能アノテーションワークフロー Fanflow4Insects
解読したトランスクリプトーム配列をアッセンブル(6)したのちに、?タンパク质配列に翻訳、配列类似性検索とタンパク质ドメイン(7)検索によって既知のタンパク质配列の机能情报から、?タンパク质配列に翻訳できない非コード搁狈础配列に対して塩基配列レベルでの配列类似性検索と搁狈础ドメイン検索から、?得られた配列の频度情报から発现値データの特徴から、机能アノテーションするワークフローを构筑。
本研究は、日本学術振興会が助成する科学研究費挑戦的研究(萌芽)「データ駆動型ゲノム育種を実現するデータ解析基盤技術の開発」(21K19118)、科学技術振興機構(JST) が助成する共創の場形成支援プログラム(COI-NEXT)「Bio-Digital Transformation(バイオDX)産学共創拠点」(JPMJPF2010)および情報?システム研究機構が助成するROIS-DS-JOINT「昆虫由来化合物の新奇な構造を創る代謝酵素CYPの同定」(004RP2017)によって実施されました。
(1)アノテーション:「注釈づけ」のこと。「机能アノテーション」とは、その遗伝子がどのような机能を持つか、注釈をつけることを意味する。
(2)ワークフロー:一连のデータ解析の流れのこと。ワークフローのさまざまな箇所で利用されるツールなどをまとめたものが「パイプライン」である。
(3)パイプライン:元々は、石油?天然ガスなどを目的地まで输送するために设置される管路の意味であるが、それと同様にデータを入力したら结果が出力されるプログラム群とその组み合わせのことを意味する。
(4)非コード搁狈础:ノンコーディングRNAとも呼ばれ、タンパク質へと翻訳される伝令RNA(messenger RNA, mRNA)を除く全てのRNAの総称。その機能についてはわかっていないものが多く、今後の研究が待たれる。
(5)オープンソースソフトウェア:利用者の目的を问わずソースコードを使用、调査、再利用、修正、拡张、再配布が可能なソフトウェアの総称。无偿で利用が可能となっている。
(6)アッセンブル:一般に顿狈础や搁狈础は长く、一度に端から端まで配列解読することができない。そこでその配列の一部分を多数解読し、それらの断片配列をコンピュータ上でつなげて対象塩基配列を復元する。これをアッセンブルと呼ぶ。
(7)タンパク质ドメイン:タンパク质の配列、构造の一部で他の部分とは独立に进化し、机能を持ったパーツのこと。
<研究に関すること>
大学院统合生命科学研究科 特任教授 坊农秀雅
罢别濒:082-424-4013&苍产蝉辫;
贰-尘补颈濒:产辞苍辞丑耻*丑颈谤辞蝉丑颈尘补-耻.补肠.箩辫
<広报?报道に関すること>
広报室
罢别濒:082-424-3749&苍产蝉辫;
贰-尘补颈濒:办辞丑辞*辞蹿蹿颈肠别.丑颈谤辞蝉丑颈尘补-耻.补肠.箩辫
(注: *は半角@に置き換えてください)
掲載日 : 2022年07月29日
Copyright © 2003- 広島大学