機械学習により、人間に感染する危険性のある動物ウイルスを予測する

機械学習により、人間に感染する危険性のある動物ウイルスを予測する生物学

科学者たちは、ウイルスのゲノムにコード化された情報のみを用いて、将来、どの動物ウイルスが人間に感染する可能性があるかを正確に予測できる新しい機械学習法を開発しました。

ヒトの新興感染症の多くは、他の動物種に由来する「人獣共通感染症」のウイルスによって引き起こされます。

しかし、動物に存在する何百万種類ものウイルスのうち、ヒトに感染する可能性のあるものはごくわずかです。

そのため、新たに発見されたウイルスのうち、どのウイルスを優先して早期に調査すべきか、さらにはアウトブレイクに備えるべきかを判断することは困難です。

今回、グラスゴー大学を中心とした研究者らは、PLOS Biology誌に掲載された新しい研究において、新たに発見されたウイルスや特性の乏しい動物ウイルスについて科学的に知られている唯一の情報であるウイルスのゲノム配列のみに基づいて、どのウイルスがヒトに感染する可能性があるかを予測する新しい機械学習手法を開発しました。

この新しいモデリング手法は、ウイルスのゲノム配列のみを用いて、どのウイルスがヒトに感染する可能性があるかを正確に予測し、リスクが低い、中程度、高い、非常に高いのいずれかにランク付けすることができます。

このモデルは、前回のSARSのヒトへの感染に関する予備知識がなくても、コロナパンデミックの原因ウイルスであるSARS-CoV-2や、動物に存在する最も近いウイルスの近縁種が、ヒトに感染するリスクが高いことを正確に予測することができました。

この結果に加えて、人獣共通感染症として知られている数百種類のウイルスを対象とした正式なテストを行った結果、このモデルは、科学的には全く新しいウイルスを含む、さまざまな種類のRNAおよびDNAウイルスに対して実用的な予測を行うことができました。

この新しいモデル化手法では、ウイルスがヒトに感染するかどうかは予測できますが、症状や伝染病・大流行の可能性などの観点から、ウイルスがどの程度危険なのか、また、いつヒトの集団に侵入するかは判断できません。

ヒトに感染できるかどうかは、流行を引き起こすための第一歩ですが、リザーバー1生物、土壌、有機物などの中で、病原体が維持され、感受性動物に対して伝播される状態になっている領域であり、自然界において存続するための本来の棲家を意味する。 病原巣とも呼ばれる。とヒトとの接触、ウイルスがヒトの間を伝播するかどうか、また、そのような「スピルオーバー2ある病原体がある種から他の種へと飛び移ること。感染」に対する私たちの対応など、その他の多くの要因が、流行やパンデミックのリスクを形成します。

研究者らは、この新しいモデル化手法が、ヒトへの感染の可能性が最も高い動物ウイルスに関する研究の優先順位を高めるのに役立つと考えています。

MRC-University of Glasgow Centre for Virus Researchの筆頭著者であるNardus Mollentze氏は、「野生動物を対象としたウイルス発見プログラムへの投資を求める声は、賛否両論あります。なぜなら、どのようなウイルスが存在するのかを知ることから、どのようにして大流行への備えをするのかが不明だからです。新たに発見されたウイルスがどのような能力を持っているのか、そしてそれにどのように対応するのかを知るためには、実験室と自然環境の両方で広範な特性評価を行う必要がありますが、この特性評価は現在、発見されるウイルスの数に追いついていません。ウイルスが発見された当初は、多くの場合、そのゲノム配列しかわかりません。そのため、ゲノム配列に含まれる情報を基にした正確な機械学習ツールを開発することで、どの動物ウイルスが最も高いリスクをもたらすのか、したがって最初に特性を調べて調査すべきなのかをよりよく理解することができます。しかし、このような予測は、まだ第一歩にすぎません。ウイルス発見への投資をパンデミック対策につなげるためには、よりスループット3一般に単位時間当たりの処理能力やデータ転送量のこと。の高いウイルスの特性解析手法と、これらの手法で得られた情報を最新のリスク予測に反映させることができるモデルの両方を開発する必要があります。」と述べています。

MRC-University of Glasgow Centre for Virus Researchおよびグラスゴー大学のInstitute of Biodiversity, Animal Health and Comparative Medicineの上級著者Daniel Streicker氏は、「人に感染する可能性が低い動物感染性ウイルスの膨大な多様性の中から、高リスクのウイルスを特定することは、干し草の中の針のような課題でした。ゲノムベースの新しい人獣共通感染症リスク評価は、この課題を解決するための一歩となります。また、ウイルスのリザーバー宿主や節足動物ベクターがウイルスゲノムから予測できることを示したこれまでの研究と合わせて、ゲノム配列だけで驚くほど多くの生態的洞察が可能であることを示しており、ウイルスが宿主に適応するための理解されていない方法の存在を示唆しています。さらに言えば、これらのモデルは遺伝子配列のみを使用しているため、ウイルスが発見された時点で適用することができ、どのウイルスが特別な注意を払うべきかを決定するための、迅速で低コストのトリアージシステムを構築することができます。」と述べています。

共同研究者である生物多様性・動物衛生・比較医学研究所のSimon Babayan氏は、次のように述べています。

「ヒトの新興感染症のほとんどは、他の動物種で発生した少数のウイルスが原因であるため、次のウイルスの流行をどこで探せばよいのかを知ることは、依然として大きな課題となっています。今回、私たちは、証拠に基づいたウイルスのサーベイランスと、ヒトに特異的に感染する可能性のあるウイルスの特性解析を、迅速かつ低コストで行うことができる方法を開発しました。」

Published by University of Glasgow. Mollentze N, Babayan SA, Streicker DG (2021) Identifying and prioritizing potential human-infecting viruses from their genome sequences. PLoS Biol 19(9): e3001390. doi.org/10.1371/journal.pbio.3001390
タイトルとURLをコピーしました