Method Article
ここでは、米国環境保護庁の配列アライメントを利用して種感受性を予測する(SeqAPASS)ツールの最新バージョンを利用するためのプロトコルを紹介します。このプロトコルは、タンパク質の保存を迅速に分析し、種全体の化学物質感受性のカスタマイズ可能で簡単に解釈可能な予測を提供するためのオンラインツールの適用を示しています。
米国環境保護庁の種感受性を予測するための配列調整(SeqAPASS)ツールは、研究者や規制当局が種全体の毒性情報を推定できるようにする、高速で無料で入手できるオンラインスクリーニングアプリケーションです。ヒト細胞、マウス、ラット、ゼブラフィッシュなどのモデル系の生物学的標的については、さまざまな化学物質の毒性データを利用できます。タンパク質ターゲット保全の評価を通じて、このツールは、そのようなモデルシステムから生成されたデータを、毒性データが不足している他の何千もの種に外挿し、相対的な固有の化学物質感受性の予測をもたらすために使用できます。ツールの最新リリース(バージョン2.0〜6.1)には、公開用のデータの迅速な合成、解釈、および使用とプレゼンテーション品質のグラフィックスを可能にする新機能が組み込まれています。
これらの機能の中には、カスタマイズ可能なデータ視覚化と、解釈を容易にするためにSeqAPASSデータを要約するように設計された包括的な要約レポートがあります。このホワイトペーパーでは、ジョブの送信、さまざまなレベルのタンパク質配列比較のナビゲート、および結果のデータの解釈と表示を通じてユーザーをガイドするプロトコルについて説明します。SeqAPASS v2.0-6.0 の新機能が強調表示されています。さらに、このツールを使用してトランスサイレチンとオピオイド受容体タンパク質の保存に焦点を当てた2つのユースケースについて説明します。最後に、SeqAPASSの長所と限界について説明し、ツールの適用性の範囲を定義し、種間外挿のさまざまなアプリケーションを強調します。
従来、毒物学の分野は、化学物質の安全性評価に必要なデータを提供するために、全動物試験の使用に大きく依存してきました。このような方法は、通常、コストとリソースを大量に消費します。しかし、現在使用されている化学物質の数が多く、新しい化学物質が急速に開発されているため、世界的には、より効率的な化学物質スクリーニング方法の必要性が認識されています1,2。この必要性とその結果としての動物実験からのパラダイムシフトは、ハイスループットスクリーニングアッセイ、ハイスループットトランスクリプトミクス、次世代シーケンシング、計算モデリングなど、多くの新しいアプローチ方法の開発につながり、これらは有望な代替試験戦略です3,4。
化学物質曝露によって潜在的に影響を受ける多様な種全体で化学物質の安全性を評価することは、従来の毒性試験だけでなく、新しいアプローチ方法でも永続的な課題でした。比較および予測毒物学の進歩は、異なる種の相対的な感受性を理解するためのフレームワークを提供し、計算方法の技術的進歩はこれらの方法の適用可能性を高め続けています。過去10年間、既存の遺伝子およびタンパク質配列データベースと特定の化学分子標的の知識を活用して、種間外挿の予測アプローチをサポートし、典型的なモデル生物を超えて化学物質の安全性評価を強化するいくつかの戦略が議論されてきました5,6,7,8。
科学を行動に移し、予測毒物学におけるこれらの基礎研究に基づいて構築し、化学試験の取り組みに優先順位を付け、意思決定をサポートするために、米国環境保護庁の種感受性を予測するための配列調整(SeqAPASS)ツールが作成されました。このツールは、絶えず拡大するタンパク質配列情報のパブリックリポジトリを使用して、種の多様性にわたる化学的感受性を予測する、公開された無料で利用可能なWebベースのアプリケーションです9。このツールは、特定の化学物質に対する種の相対的な固有感受性は、その化学物質の既知のタンパク質標的の保存を評価することによって決定できるという原則に基づいて、すべての種に対する既知の感受性を持つ種のタンパク質アミノ酸配列を既存のタンパク質配列データと迅速に比較します。この評価は、(1)一次アミノ酸配列、(2)機能ドメイン、(3)重要なアミノ酸残基の比較を含む3つのレベルの分析によって完了し、それぞれが化学タンパク質相互作用に関するより深い知識を必要とし、感受性予測における分類学的分解能を高めます。SeqAPASSの大きな強みは、目的の化学-タンパク質またはタンパク質-タンパク質相互作用に関して利用可能な情報の量に基づいて、ターゲットの保存に向けた証拠の行を追加することで、ユーザーが評価をカスタマイズして洗練できることです。
最初のバージョンは2016年にリリースされ、ユーザーは一次アミノ酸配列と機能ドメインを合理化して化学物質感受性を予測でき、最小限のデータ視覚化機能しか含まれていませんでした(表1)。個々のアミノ酸の違いは、化学-タンパク質相互作用における種間の違いの重要な決定要因であることが示されており、これは種の化学的感受性に影響を与える可能性があります10,11,12。したがって、直接的な化学的相互作用に重要な重要なアミノ酸を考慮するために、後続のバージョンが開発されました13。利害関係者とユーザーのフィードバックに応えて、このツールは毎年バージョンリリースされ、種間外挿の課題に対処するための研究者と規制コミュニティの両方のニーズを満たすように設計された追加の新機能が追加されています(表1)。2020年のSeqAPASSバージョン5.0のリリースにより、データの視覚化とデータ合成のオプション、外部リンク、要約テーブルとレポートのオプション、およびグラフィック機能を組み込んだユーザー中心の機能が導入されました。全体として、このバージョンの新しい属性と機能により、データ合成、外部データベース間の相互運用性、および種間感受性の予測のためのデータ解釈の容易さが向上しました。
1. はじめに
メモ: ここで紹介するプロトコルは、ツールの有用性と主要な機能に重点を置いています。方法、機能、およびコンポーネントの詳細な説明は、包括的なユーザーガイド(表1)のWebサイトにあります。
表 1: SeqAPASS ツールの進化 初期展開から SeqAPASS ツールに追加された機能と更新プログラムの一覧。略語:SeqAPASS =種全体の感受性を予測するための配列アラインメント。ECOTOX = ECOTOXicologyナレッジベース。 この表をダウンロードするには、ここをクリックしてください。
図1:SeqAPASS問題の定式化:分析を成功させるために必要な予備情報の概略図。略語:SeqAPASS =種全体の感受性を予測するための配列アラインメント。LBD = リガンド結合ドメイン。この図の拡大版を表示するには、ここをクリックしてください。
図 2: データベース間の SeqAPASS 相互運用性。 SeqAPASSに統合された外部ツール、データベース、およびリソースの概略図。略語:SeqAPASS =種全体の感受性を予測するための配列アラインメント。AOP =有害転帰経路;NCBI = 国立バイオテクノロジー情報センター;ECOTOX = ECOTOXicologyナレッジベース。 この図の拡大版を表示するには、ここをクリックしてください。
表 2: SeqAPASS ツールに統合されたリンク、リソース、およびツール。 SeqAPASSツールに活用されるさまざまなデータソース、リンク、およびリソースのリスト。略語: SeqAPASS = 種全体の感受性を予測するための配列アラインメント。 この表をダウンロードするには、ここをクリックしてください。
2. SeqAPASS クエリの開発と実行: レベル 1
注:レベル1解析では、クエリタンパク質の一次アミノ酸配列全体が、利用可能な配列情報を持つすべての種の一次アミノ酸配列と比較されます。このツールは、アルゴリズムを使用して公開されているデータをマイニング、収集、コンパイルし、種間でアミノ酸配列を迅速に調整および比較します。バックエンドは、国立バイオテクノロジー情報センター(NCBI)データベースからの情報を保存し、タンパク質基本ローカルアライメント検索ツール(BLASTp)54 および制約ベースのマルチプルアライメントツール(COBALT)55のスタンドアロンバージョンを戦略的に利用します。
3. SeqAPASS クエリの開発と実行: レベル 2
注:タンパク質配列全体が化学的相互作用に直接関与しているわけではないため、レベル2分析では、機能ドメインのアミノ酸配列のみを比較して、より低い分類ランク(クラス、オーダー、ファミリーなど)での感受性予測を行います。
4.データへのアクセスと理解:SeqAPASSレベル1およびレベル2
5. データ設定の操作: SeqAPASS レベル 1 およびレベル 2
注:レベル1とレベル2の両方の分析では、タンパク質の類似性が高いほど、化学物質がクエリ種/タンパク質と同様の方法でタンパク質と相互作用する可能性が高くなり、この分子標的を持つ化学物質の潜在的な影響を受けやすくなると想定されています。これらのデータは類似しているため、レベル1と2のデータを理解するための手順は、単一のプロトコルでまとめられています。
6. データの視覚化: シークアパス レベル 1 およびレベル 2
7. シークアパス解析の開発と実行: レベル 3
注:レベル3分析では、クエリタンパク質内のユーザーが同定したアミノ酸残基を評価し、種間でこれらの残基の保存を迅速に比較します。これらの残基が保存されている種は、テンプレート種/タンパク質と同様の方法で化学物質と相互作用する可能性が高いと考えられています。レベル3は個々のアミノ酸に焦点を当てているため、化学-タンパク質またはタンパク質-タンパク質相互作用に重要なアミノ酸残基の詳細な知識が利用可能な場合にのみ分析を実行できます。
8.同定された文献を使用して重要なアミノ酸残基を特定する
9. レベル 3 シーク APASS データの視覚化
注: 以前のレベルと同様に、プライマリレポートとフルレポートを使用できます。レベル1および2のデータと同じデータに加えて、プライマリレポートには、アミノ酸の位置、略語、およびテンプレート予測と同様のはい/いいえ(Y/N)の感受性が表示されます。同様に、完全なレポートには、アミノ酸側鎖の分類と分子量に関する情報が含まれています。
10. SeqAPASS結果の解釈:タンパク質保存のエビデンスライン
注: 解釈を容易にするために、このツールには、レベル間でデータを統合するように設計された 決定サマリー レポート (DS レポート) が含まれています。DSレポートには、ユーザーが選択した結果(データテーブルやビジュアライゼーションなど)が含まれており、複数の種の複数のレベルにわたる感受性予測を同時に迅速に評価できます。
SeqAPASSツールの適用を実証し、新機能を強調するために、タンパク質保存が種間で化学的感受性に違いがあること(ヒトトランスサイレチン)と違いがないこと(オピオイド受容体[MOR])μ予測する事例を表す2つのケーススタディについて説明します。これらの例の最初の例は、有害な結果経路(AOP、定義については表2を参照)の適用性のドメインを予測するためのタンパク質配列/構造の比較に対処し、 2 番目の例は、廃水に存在するオピオイドに対する種間感受性に関連する研究仮説の開発に焦点を当てています。これらのケーススタディで説明されている基本的なアプローチは、あらゆる化学物質に適用でき、意思決定と研究のためのこのツールの幅広い有用性を示しています。
甲状腺ホルモンは正常な成長と発達に不可欠です。それらは甲状腺で合成され、血流に分泌され、そこで分布タンパク質に結合し、体全体に循環します14,15,16,17,18。最近の研究では、ポリ塩化ビフェニル(PCB)、ポリ臭化ジフェニルエーテル(PBDE)、パーフルオロアルキルおよびポリフルオロアルキル物質(PFAS)などの環境汚染物質が、分布タンパク質トランスサイレチン(TTR)に競合的に結合し、正常な甲状腺プロセスを混乱させる可能性があることが示されています19,20,21,22,23,24,25.ヒト神経発達毒性(https://aopwiki.org/aops/152)につながるTTRへの競合的結合を記述するAOPが開発されました。このAOPがげっ歯類にも適用可能であるという証拠がありますが、他の分類群への適用性はまだ定義されていません。TTR結合化学物質は環境中に存在するため、このAOPの分類学的関連性を理解することが重要であり、SeqAPASS分析によって部分的に対処できる課題です。ツールの問題定式化戦略を使用して、分析の目的は次のように述べることができます:TTR結合化合物がヒトに有害な結果をもたらすという知識があれば、どの分類群が同様の感受性を共有すると予測されますか?
ヒトトランスサイレチンタンパク質は十分に特徴付けられており、ヒトTTR(hTTR)結合部位で結合することが知られているいくつかのよく研究されたリガンドがあり、SeqAPASS分析の最適な標的となっています8,9,13。ヒトトランスサイレチンのNCBIアクセッションP02766.1を使用して、デフォルト設定でレベル1分析を実施しました。レベル1分析の結果、類似度カットオフの割合は49%に設定され、哺乳類(哺乳類)、鳥類(Aves)、爬虫類(Testudine、Lepidosauria、Crocodylia)、両生類(両生類)、およびほとんどの魚種(アクチノプテリ、シーラカンティモルファ、クラディスタ、コンドリクテス)がこのカットオフを上回りました(図3)。したがって、これらの分類群のすべての種は、「Y」(すなわち、はい)の感受性予測をもたらし、hTTRと相互作用することが知られている化学物質の影響を受けやすい可能性があります(図3および補足ファイル1)。
機能ドメインのレベル2評価では、NCBI保存ドメインデータベースを使用して、残基27から147までのTTRサブユニットタンパク質の成熟鎖を含む保存ドメインとしてTR_THY(accession smart00095)を特定しました。NCBIで報告されているTTRのタンパク質配列には、現在の分析とは関係のない20アミノ酸のプレセグメントが含まれているため、成熟鎖に比較を集中させることで、種間でこのタンパク質の保存に向けた追加のより具体的な証拠が得られます。レベル2の評価から、58%の類似性カットオフが報告され、哺乳類、鳥類、爬虫類、両生類、およびほとんどの魚種が再びこのカットオフを上回りました(図4)。その結果、SeqAPASSは、これらの分類群の種に対する「Y」(すなわち、はい)の感受性予測を結論付け、hTTRタンパク質と相互作用する化学物質の影響を受けやすい可能性が高いことを示しています(図4 および 補足ファイル1)。全体として、レベル1およびレベル2の分析結果は、ほとんどの脊椎動物種がhTTRの保存を共有しており、このタンパク質と相互作用することが知られている化学物質の影響を受けやすい可能性が高いことを示唆しています。
図3:ヒトタンパク質に関連する利用可能な配列情報を含む分類群全体のトランスサイレチン保存のSeqAPASSレベル1分析。 タンパク質アミノ酸配列の類似度パーセントがY軸に表示され;分類グループはX軸に表示されます。白丸(○)はクエリシーケンスを示し、白丸(●)は分類グループ内で類似率が最も高い種を示します。プロット内では、各ボックスの上部と下部は75パーセンタイルと25パーセンタイルを表し、ひげは四分位範囲の1.5倍に広がり、平均値と中央値はボックス上の水平の黒い線で表されます。破線は、感受性予測のカットオフを示します。略語:TTR =トランスサイレチン;SeqAPASS = 種全体の感受性を予測するための配列アラインメント。この図の拡大版を表示するには、ここをクリックしてください。
図4:ヒトタンパク質LBDに関連する利用可能な配列情報を含む、分類群全体のトランスサイレチン受容体リガンド結合ドメイン保存のSeqAPASSレベル2分析。リガンド結合ドメインのアミノ酸配列の類似度がY軸に表示され;分類グループはX軸に表示されます。白丸(○)はクエリシーケンスを示し、白丸(●)は分類グループ内で類似率が最も高い種を示します。プロット内では、各ボックスの上部と下部は75パーセンタイルと25パーセンタイルを表し、ひげは四分位範囲の1.5倍に広がり、平均値と中央値はボックス上の水平の黒い線で表されます。破線は、感受性予測のカットオフを示します。略語:TTR =トランスサイレチン;SeqAPASS = 種全体の感受性を予測するための配列アラインメント。この図の拡大版を表示するには、ここをクリックしてください。
分子モデリングとタンパク質結晶構造解析研究の解析により、内因性リガンドである3,3′,5,5′-テトラヨード-L-チロニン(T4、PDB 2ROX)や、ペルフルオロオクタンスルホン酸塩(PFOS、PDB 5JIM)、テトラブロモビスフェノールA(TBBPA、PDB 5HJG)、ジエチルスチルベストロール(DES、PDB 1TZ8)との相互作用が予測されるTTRの結合領域からアミノ酸が同定されました19。21,22,26。アミノ酸残基Lys35、Ser137、Leu130、Ala128、Ala129、およびThr139はすべて、直接水素結合相互作用またはファンデルワールス相互作用のいずれかを介して、タンパク質-リガンド相互作用において重要な役割を果たしていることが同定されました。これらの6つのアミノ酸残基は、hTTRを鋳型配列として使用し、非相同、仮説、部分、および低品質の配列を除外した種全体のレベル3分析で評価されました(補足ファイル1)。TTRは脊椎動物種間でのみ保存されていることが以前に決定されたため、無脊椎動物種はこの分析から除外されました(図3および図4)。さらに、文献で報告されているアミノ酸の位置は、成熟hTTRタンパク質には存在しない20アミノ酸のプレセグメントを除外しているため、レベル3で提出された位置は、選択されたテンプレートタンパク質15への正確なアライメントを確保するために文献で報告されている位置から調整されていることに注意することが重要です15(補足ファイル1)。
TTRのレベル3分析では、294種の脊椎動物(哺乳類、鳥類、両生類、爬虫類、魚類)が整列のために選択されました。評価された種のうち、18は主要なアミノ酸の違いを示し、「N」(すなわち、いいえ)の感受性予測をもたらしました。興味深いことに、5種の海洋哺乳類は位置2(128A)でアミノ酸置換を示し、4種の魚は位置2(128A)または位置6(139T)のいずれかで置換を示しました(図5)。これらのアミノ酸は、TTRの結合チャネルにおけるタンパク質-リガンド相互作用において重要な役割を果たすため、これらのデータは、TTRリガンドがこれらの種で異なる相互作用をし、ヒトと比較して異なる化学的感受性をもたらす可能性があることを示唆しています。
図5:TTR化学結合に重要なアミノ酸残基の保存に関するSeqAPASSレベル3分析 。 (A)レベル3の要約表は、すべての分類群にわたって利用可能な配列データを持つ種の数、同様に感受性があると予測される種の数(Y)、および同様に感受性が低いと予測される種の数(N)を表示する。(B)レベル3ヒートマップは、ヒトトランスサイレチンTTRタンパク質に対して同様に感受性が低いと予測される選択された種を表示し、完全、部分、および非一致アミノ酸を示しています。略語:TTR =トランスサイレチン;SeqAPASS = 種全体の感受性を予測するための配列アラインメント。 この図の拡大版を表示するには、ここをクリックしてください。
利害関係者とユーザーのフィードバックに応えて、さまざまなアプリケーションの経験的データに接続する機能など、新機能が設計され、SeqAPASSツールに組み込まれました。このツールとECOTOXナレッジベース(表1)との相互運用性は、ECOTOXに存在するアクセッションのレベル1およびレベル2データテーブルに外部リンクを埋め込み、ツール内にECOTOXウィジェットを作成して、ECOTOXで最も関連性の高い毒性データに直接フィルタリングすることによって達成されました。リンクとウィジェットを通じて、ユーザーはECOTOXを迅速に照会し、SeqAPASS感受性予測を持つ種の対応する毒性データを収集できます。現在、SeqAPASS予測は、化学的ストレッサーと種を介してECOTOXに関連しています。ただし、毒性データはまだ特定の遺伝子/タンパク質にリンクされていないため、SeqAPASSの関心のある特定のエンドポイント/分子ターゲットに直接接続できます。化学的ストレッサーに基づいて予測を毒性データにリンクすることは理想的ではありませんが、データは特定の経路に固有ではない可能性があるため、結果をまとめるための接続を確立することが最初のステップです。SeqAPASS-ECOTOX統合の最初の反復として、現在のアプローチは、化学的ストレッサーと種の利用可能なすべての毒性データを幅広いレベルでユーザーに提供します。これらのデータは、SeqAPASS予測と組み合わせると、幅広いレベル(脊椎動物対無脊椎動物)でコンテキストを提供でき、AOPフレームワークのコンテキスト内で考慮できます。
TTRは、既存のAOP(AOP 152)が潜在的に関連するECOTOX毒性データを解釈するためのコンテキストを提供するため、この関係を調べるための良い事例を示しています。SeqAPASSレベル3で調べたリガンドから始めて、TTRリガンド結合ドメインと相互作用することが知られている4つの化学物質(ジエチルスチルベストロール[DES]、ペルフルオロヘキサン酸[PFHxA]、ペルフルオロオクタンスルホン酸[PFOS]、およびテトラブロモビスフェノールA[TBBPA])について、種全体の環境毒性データを収集しました19,21,23,24。.各化学物質について、ECOTOXは、カスタム検索パラメータ(補足ファイル1)を使用して、ケミカルアブストラクトサービス(CAS)番号によって水生および陸生データを照会しました。データは、関心のある種群(両生類、鳥類、魚類、無脊椎動物、哺乳類、爬虫類)にフィルタリングした。フィルタリングされたクエリ結果内で、研究の最小効果濃度と最大効果濃度の平均が計算され、平均効果濃度値を報告しなかったヒットの平均の近似値として実装されました(図6Aおよび補足ファイル1)。単一の化学物質のコンテキスト内で、データがANOVA検定の仮定を満たしていないため、異なる分類グループの平均効果濃度を比較するためにクラスカル-ウォリス検定が実施されました。次に、分類群が等しくないサンプルサイズで構成されていたため、すべての化学物質に対してダンの検定を使用して事後ペアワイズ比較テストを実施しました。水生と陸生の結果は、2つのタイプの曝露間のデータが直接比較できないため、別々に分析されました。ECOTOX内では、両生類、鳥類、無脊椎動物、魚類について、選択した化学物質の水生毒性データが利用可能でした(図6A)。選択した化学物質の陸生毒性データは、哺乳類とDESについてのみ入手可能でした(補足ファイル1)。
図6:SeqAPASSの結果と経験的データをリンク する。 (A)ヒトTTRタンパク質に結合することが知られている選択された化学物質のECOTOXicologyナレッジベースで利用可能なデータを使用した分類グループ全体の平均効果濃度。(B)各SeqAPASS分析に含まれる種の数は、ECOTOXデータが入手可能な種と重複しています。パネル A の x 軸に沿った括弧は、データが集計されたクエリ ヒットの数を示します。アスタリスクは、単一の化学物質の文脈における種群間で有意に異なる効果濃度のペアを示し(Dunn's Test, p < 0.05)、アスタリスクの数が多いほど有意水準が高いことを示す(*: p < 0.05; **: p < 0.01; ***: p < 0.001; ****: p < 0.0001)。各ボックス内の中心線は中央値を表し、ボックスのエッジは四分位範囲を示します。ひげは四分位範囲の1.5倍まで伸びます。その範囲外にある外れ値は、個別のポイントとして表示されます。略語:TTR =トランスサイレチン;SeqAPASS = 種全体の感受性を予測するための配列アラインメント;ECOTOX = ECOTOXicologyナレッジベース。 この図の拡大版を表示するには、ここをクリックしてください。
全体として、これらのデータは、評価された化学物質の生物活性が脊椎動物種では発生するが、無脊椎動物では発生しないことを示唆しています。ECOTOXには生物学的標的と経路情報がないため、これらの経験的データをTTRに直接リンクすることは不可能ですが、これらの結果は、無脊椎動物種が感受性を共有しないというSeqAPASS予測を支持しています。入手可能なデータを持つすべての脊椎動物種は、PFOSとTBBPAの両方に対する感受性を示しましたが、平均効果濃度は両生類よりも魚と鳥で有意に高かったです。これらのデータは、生物学的経路の違い(TTRを含む)に起因する可能性のある分類群間の感度の潜在的な違いを示唆しています。代謝や排泄などの他の変数も感度の違いに影響を与える可能性があることは注目に値します。PFHxAおよびPFOSについては、魚類は無脊椎動物および鳥類の両方よりも有意に感受性が高く、DESについては、両生類は無脊椎動物よりも有意に高い平均効果濃度を示した。繰り返しになりますが、これらのデータは、無脊椎動物が脊椎動物種と感受性を共有しないというSeqAPASS予測を裏付けています。このツールを使用して評価され、TTR配列データが入手可能なすべての種のうち、関心のある4つの化学物質に対応するECOTOXデータを持っていたのはごくわずかでした(図6B、補足表S1、および補足表S2)。頂端データを持たない種の場合、SeqAPASSの感受性予測は、近縁種が頂端データを持つ種と同様に振る舞う可能性があるという証拠を追加します。すべてのSeqAPASSおよびECOTOX分析のデータは、補足ファイル1で入手できます。
米国疾病予防管理センター(CDC)によると、2017年には、米国でオピオイドが過剰摂取による約47,600人の死亡に寄与し、その数は27増加し続けています。米国の廃水プラントは、米国環境保護庁の国家汚染物質排出排除システムによって全国的に規制されており、排出中のオピオイドやその他の医薬品のテストは必要ありません28。近年、地域のオピオイド使用をマッピングするためのツールとして廃水ベースの疫学を使用する努力がなされています。オピオイドモニタリングの取り組みにより、廃水では1.27 μg / L、地表水では0.7 μg / Lの濃度が検出されました29,30。魚に対するオピオイド曝露の影響を評価する最近の毒性研究では、中毒性行動の発達と免疫学的悪影響(感染率の上昇、免疫遺伝子のダウンレギュレーションなど)が報告されています31,32,33。全体として、これらの研究は、環境オピオイドへの悪影響の可能性があることを示唆しており、これらの化学物質が水生種にもたらすリスクを理解することの重要性を強調しています。環境中でこれらの化合物に遭遇する可能性のある種の範囲を考えると、SeqAPASSを使用して潜在的に影響を受けやすい種を特定することは、テストまたはモニタリングの取り組みの優先順位付けにとって重要な場合があります。
MORは、痛みの管理のための主要なオピオイド標的を構成し、ヒトにおけるアヘンアルカロイドの強力な鎮痛作用および中毒性の原因となっています34,35。この受容体はヒトの健康にとって重要であるため、MORリガンドはよく知られており、高品質のX線結晶構造解析研究が利用可能であるため、このターゲットはSeqAPASS分析に最適です8,9,13。ヒトμオピオイド受容体ACM90349.1のNCBIアクセッションを用いて、デフォルト設定を用いてレベル1分析を実施した。感受性カットオフはレベル1で55%に設定され、哺乳類(哺乳類)、鳥類(アベス)、爬虫類(テストディン、レピドサウリア、クロコディリア)、両生類(両生類)、およびほとんどの魚種(アクチノプテリ、シーラカンティモルファ、クラディスタ、コンドリクテス)の類似性はこのカットオフを上回っています。したがって、これらの分類群の種は「Y」(すなわちはい)の感受性予測をもたらし、それらがヒトMORと相互作用することが知られている化学物質の影響を受けやすい可能性が高いことを示しています(図7および補足ファイル1)。NCBI保存ドメインデータベースを用いて、推定リガンド結合部位を含む133から411までのMORタンパク質の7つのヘリックスすべてを含む機能ドメインとして7tmA_Mu_opioid_R同定された(アクセッションcd15090)。レベル1と比較して、レベル2の結果は、哺乳類、鳥類、爬虫類、両生類、およびほとんどの魚種がこのカットオフより上で見つかった88%の類似性の高い感受性カットオフを特定し、はいの「Y」の感受性予測をもたらしました(図8)。全体として、レベル1およびレベル2の分析結果は、ほとんどの脊椎動物種がMORの保存を共有し、ヒトMORと相互作用することが知られている化学物質の影響を受けやすい可能性が高いことを示唆しています。
図7:ヒトタンパク質に関連する利用可能な配列情報を含む分類群全体のμオピオイド受容体保存のSeqAPASSレベル1分析。 タンパク質アミノ酸配列の類似度パーセントがY軸に表示され;分類グループはX軸に表示されます。白丸(○)はクエリシーケンスを示し、白丸(●)は分類グループ内で類似率が最も高い種を示します。プロット内では、各ボックスの上部と下部は75パーセンタイルと25パーセンタイルを表し、ひげは四分位範囲の1.5倍まで伸び、平均値と中央値はボックス上の水平の黒い線で表されます。破線は、感受性予測のカットオフを示します。略語:MOR =ミューオピオイド受容体;SeqAPASS = 種全体の感受性を予測するための配列アラインメント。 この図の拡大版を表示するには、ここをクリックしてください。
図8:ヒトタンパク質のドメインに対するμオピオイド受容体リガンド結合ドメイン保存のSeqAPASSレベル2分析。 リガンド結合ドメインのアミノ酸配列の類似度がY軸に表示され;分類グループはX軸に表示されます。白丸(○)はクエリシーケンスを示し、白丸(●)は分類グループ内で類似率が最も高い種を示します。プロット内では、各ボックスの上部と下部は75パーセンタイルと25パーセンタイルを表し、ひげは四分位範囲の1.5倍まで伸び、平均値と中央値はボックス上の水平の黒い線で表されます。破線は、感受性予測のカットオフを示します。略語:MOR =ミューオピオイド受容体;SeqAPASS = 種全体の感受性を予測するための配列アラインメント。 この図の拡大版を表示するには、ここをクリックしてください。
分子モデリングとタンパク質結晶構造解析研究の解析により、既知のリガンドと相互作用すると予測されるMORの結合領域におけるアミノ酸が同定されました。オピオイド受容体によく結合する多様なリガンドのセットは複雑な薬理学をもたらすが、いくつかの一貫したリガンド-タンパク質相互作用が観察される36,37。様々なMOR結晶構造への分子ドッキングに基づいて、モルヒネおよびフェンタニルの両方、高親和性MORアゴニストは、D147、Y148、M151、W293、I296、H297、V300、I322、およびY326と相互作用する36,38。残基D147、Y148、M151、およびH297は、モルヒネアゴニストBU72に結合したMORの結晶構造にも関与しており、D147、M151、H297、およびY326も、不可逆的なモルヒネアンタゴニストβ-funaltrexam37への結合に重要です。これらの証拠ラインを考慮して、ヒトMORをテンプレート配列として使用し、部分的、予測的、仮説的、および低品質の配列を除外して、レベル3評価のために9残基(D147、Y148、M151、W293、I296、H297、V300、I322、Y326)を選択しました。重要なことに、文献で報告されているアミノ酸の位置は、NCBIタンパク質アクセッションに対して64アミノ酸セグメントを除外しており、このため、レベル3の位置は、正しいアライメント配列のためにテンプレート配列と整列するものを表すように選択されました。
ヒトMORのレベル3分析では、脊椎動物種(哺乳類、鳥類、両生類、爬虫類、魚類)全体で284種が評価されました。評価されたすべての種において、9つのアミノ酸は、側鎖分類および分子量に基づいて完全一致または部分一致のいずれかであった。その結果、評価されたすべての種は、はいに対する「Y」の感受性予測をもたらしました(表3および補足ファイル1)。これらのアミノ酸は強力なMORアゴニストと強力なアンタゴニストの両方の結合に重要であるため、これらのデータは、ヒトμオピオイド受容体を標的とするオピオイド化合物が脊椎動物種全体の受容体と同様に相互作用する可能性があることを示唆しています。オピオイド化合物のECOTOXナレッジベース内でこれまでに利用可能な経験的データはほとんどありませんが、いくつかの研究は、魚が影響を受けやすい可能性が高いことを示唆しています31,32,33。全体として、SeqAPASSの結果は、種を超えてMOR調節化学物質のより広範な環境への影響の可能性を指摘しており、より多くの研究とおそらくモニタリングが価値がある可能性があることを示しています。すべての分析のデータは、補足ファイル1で入手できます。
表3:μオピオイド受容体への化学的結合に重要なアミノ酸残基の保存に関するSeqAPASSレベル3分析。 すべての分類グループにわたって利用可能な配列データを持つ種の数、同様に感受性があると予測される種の数(Y)、および同様に感受性が低いと予測される種の数、ならびに完全アミノ酸、部分アミノ酸、および一致しないアミノ酸を表示する要約表。略語: SeqAPASS = 種全体の感受性を予測するための配列アラインメント。 この表をダウンロードするには、ここをクリックしてください。
補足表S1:ヒトトランスサイレチンタンパク質に結合することが知られている関心のある4つの化学物質について利用可能なECOTOXデータを有する種。各化学物質について入手可能なデータは、レベル1、2、および3全体で同様の感受性のSeqAPASS予測と一致しています。ヒトトランスサイレチン配列に関連するすべてのSeqAPASS予測。略語:SeqAPASS =種全体の感受性を予測するための配列アラインメント。DES =ジエチルスチルベストロール;PFHxA =ペルフルオロヘキサン酸;PFOS = ペルフルオロオクタンスルホン酸;TBBPA = テトラブロモビスフェノールA. この表をダウンロードするには、ここをクリックしてください。
補足表S2:ヒトトランスサイレチンタンパク質に結合することが知られている選択された化学物質のSeqAPASSおよびECOTOX評価全体で利用可能なデータを持つ種の総数。SeqAPASSは、経験的毒性データが利用できない多くの種にわたる種の感受性を予測する手段を提供します。 この表をダウンロードするには、ここをクリックしてください。
補足ファイル1:すべての代表的な結果のSeqAPASSおよびECOTOXデータ。ファイルには、ToCとそれに続くデータシートが含まれています:タブ1-hTTRシークアパス結果レベル1、タブ2-hTTRシークアパス結果レベル2、タブ3-hTTRシークアパス結果レベル3、タブ4-DESのエコトックスデータ、タブ5-PFOSのエコトックスデータ、タブ6-PFHxAのエコトックスデータ、タブ7-TBBPAのエコトックスデータ、タブ8-エコトックスグループ平均計算、 タブ9-シークアパスエコトックスデータ比較、タブ10-hMORシークアパス結果レベル1、タブ11-hMORシークアパス結果レベル2、およびタブ12-μ-hMORシークアパス結果レベル3。略語:SeqAPASS =種全体の感受性を予測するための配列アラインメント。目次 = 目次;hTTR =ヒトトランスサイレチン;ECOTOX = 生態毒性学のナレッジベース;DES =ジエチルスチルベストロール;PFOS = ペルフルオロオクタンスルホン酸;PFHxA =ペルフルオロヘキサン酸;TBBPA = テトラブロモビスフェノールA;hMOR =ヒトミューオピオイド受容体。 このファイルをダウンロードするには、ここをクリックしてください。
毒物学的に関心のある化学物質にさらされる可能性のある生物のゲノム的、表現型的、生理学的、および行動的多様性を捉えるのに十分な種を経験的にテストすることは現実的ではないという認識が広まっています。SeqAPASSの目標は、既存および継続的に拡大しているタンパク質配列および構造データを最大限に活用して、分子レベルの比較を通じて、試験された生物から数百または数千の他の種への化学毒性データ/知識の外挿を支援し、情報を提供することです。SeqAPASSツールは、透過的に生成およびダウンロード可能な要約表、インタラクティブなデータの視覚化、絶滅危惧種や絶滅危惧種、および一般的なモデル生物の簡単な識別を含む合理化された迅速な分析を通じて、科学者、リスク評価者、規制当局のタンパク質配列比較の複雑さを軽減するように設計されています。ここでは、一次アミノ酸配列の類似性、機能ドメインの保存、および化学-タンパク質およびタンパク質-タンパク質相互作用に関与する重要なアミノ酸を評価するために、SeqAPASSレベル1、2、および3を実行するためのプロトコルについて説明します。SeqAPASSの各レベル分析から収集された一連の証拠は、種全体の化学物質感受性を予測し、一貫性があり、容易に解釈できるデータを提供します。現在まで、このツールは、特定の受容体に結合する化学物質の同定や、哺乳類系を持つ脊椎動物の生態学的受容体のリードアクロスの可能性の評価など、幅広いアプリケーションで使用されてきました。さらに、甲状腺ホルモン分布タンパク質、TTR、およびMORに焦点を当てた2つのケーススタディをここで説明し、SeqAPASS v2からv6の新機能を示します。
他の計算アプローチと同様に、SeqAPASSツール内で種の感受性の予測を生成する機能は、適切なパラメータ8、9、13の入力に大きく依存します。したがって、分析を実施する前に、問題定式化ステップを実施して、目的のターゲットについて既存のデータと文献を調査することが重要です。タンパク質ターゲットの知識から解析を開始することで、ユーザーは適切なタンパク質アクセッション番号と高品質の配列を特定することができます。同様に、感受性または標的種、またはアッセイまたはAOP開発に使用されるモデル生物に関する知識は、他のすべての種と比較される適切なクエリ種の選択を確実にする。レベル2の機能ドメインとレベル3の重要なアミノ酸残基を選択することも、予測を生成するための適切な入力パラメータを特定する必要がある重要なステップです。化学-タンパク質相互作用に関する既存の知識が必要であるため、SeqAPASSツールの最近のバージョンリリースには、クエリの開始に関連する情報(他のツールへのリンクなど)にユーザーを誘導できるように設計されたユーザーフレンドリーなリソースが統合されています(表2および図2)。さらに、ポップアップ情報メッセージとアラートがツールに統合されており、分析を通じてユーザーをガイドし、解決する必要のあるエラーをユーザーに通知するのに役立ちます。
化学的相互作用の複雑さは、SeqAPASSツールの制限を提示します。種全体の毒性データを外挿する場合、分子標的の保存は考慮すべき多くの要因の1つです。化学物質はこれらのプロセスによって活性化または解毒される可能性があるため、化学物質の吸着、分布、代謝、および排泄(ADME)は、化学物質の毒性を考慮する際に非常に重要です39,40。化学物質曝露経路、生物のライフステージとライフヒストリー、食事などの他の要因も、種全体の化学物質過敏症を決定する上で重要な役割を果たす可能性があります41,42。この制限に対処するには、化学物質の感受性を予測する際にSeqAPASSが尋ねる主な質問を理解することが重要です:化学物質のタンパク質標的は、化学物質が作用するために別の種に存在する可能性がありますか?この問題は、オルソログ候補を特定し、既知の感受性種または標的種と比較して、種全体でその標的の保全を検討することによって対処されます。この情報は、種間外挿の証拠のラインとして使用でき、化学的ストレス要因に対する種の感受性をよりよく理解するために、他の証拠ストリーム(曝露の可能性など)に統合できます。SeqAPASSのアップデートには、US EPA ECOTOX ナレッジベース43やUS Fish & Wildlife Service Environmental Conservation Online System(ECOS)44などの外部ツールへの統合リンクが組み込まれています。これらのデータベースへの接続により、SeqAPASSユーザーは、シーケンスベースの予測と比較するための経験的な化学毒性データに簡単にアクセスでき、保護ステータスを持つ可能性のある種を特定する手段が得られます。
SeqAPASSツールは、進化生物学の概念や予測を利用可能な経験的結果と比較する事例によってサポートされている固有感受性の計算予測のための科学的根拠に基づくプラットフォームを提供します。さらに、SeqAPASSは無料で、広くアクセス可能な(https://seqapass.epa.gov/seqapass/)十分にサポートされているWebベースのプラットフォームで公開されています。このツールは、既存のデータベースからの配列データとタンパク質情報を活用するため、シーケンシング技術が進歩し、新種のゲノムが配列決定され、注釈が付けられるにつれて、より多様な種における化学物質感受性を予測する能力は絶えず向上しています。これは、データの可用性に関して明確な利点を提供しますが、公開されている配列情報が、一部の種では一貫性のない品質、不十分なアノテーション、およびタンパク質配列の不完全性にさらされる可能性があるという制限も提示します。しかし、バイオインフォマティクスにおけるオミクス技術と手法は急速に進歩しており、配列のキュレーションと品質は時間の経過とともに向上し続ける可能性があります。
SeqAPASSツールの主な目標の1つは透明性であり、バックエンドに統合されているすべてのデータソースとツールへのリンクの形でアクセスを提供します。このような透明性により、ユーザーはNCBIからの配列または分類情報の元のソースに迅速にアクセスできます。このツールの適用範囲は、意味のある解析を実行するために必要な情報によって定義されます。既知の敏感種または標的種における化学-タンパク質またはタンパク質-タンパク質相互作用の知識は、クエリを開始するための重要な要素であるため、この情報なしで実行されるクエリは意味がないことを認める必要があります。さらに、複数の未定義の生物学的標的を持つ化学物質、または効力の程度が異なる異なる標的と相互作用する化学物質も、現在の形でのツールの課題と制限を提示します。バイオインフォマティクス、計算モデリング、細胞ベースのハイスループットスクリーニングとトランスクリプトミクスの改善により、特定のタンパク質との相互作用に関する化学空間の多様性にわたる知識が解明され続けることが期待されています。種の多様性にわたる化学的悪影響の可能性を理解することと比較して、種の外挿のより広範な課題にSeqAPASSを適用する能力は、引き続き向上することが期待されています。
結論として、SeqAPASSツールは、化学物質の安全性評価における種間外挿の大きな課題に対処するために分子情報を容易に適用するアクセス可能なプラットフォームです。ここで強調した例は、化学物質感受性の予測を生成することに焦点を当てていますが、結果は生物学的経路の全体的な保存を理解するのにも役立ちます。このツールは、さまざまな証拠をまとめ、複数のプラットフォームやデータベースへのアクセスを容易にすることで、化学試験の優先順位付けとリソースの割り当てのための透明なケースを構築するのに役立ちます。科学的およびバイオインフォマティクス機能の継続的な開発により、ツールのパワーと有用性は、種間の評価に必要なリソースを削減しながら、研究および規制コミュニティのニーズを満たすために成長および改善され続けます。
著者は開示する利益相反を持っていません。
著者らは、Daniel L. Villeneuve博士(米国EPA、計算毒性学および曝露センター)とJon A. Doering博士(ルイジアナ州立大学環境科学部)が原稿の以前の草稿にコメントを提供してくれたことに感謝する。この作業は、米国環境保護庁の支援を受けました。このホワイトペーパーで表明された見解は著者のものであり、必ずしも米国環境保護庁の見解や政策を反映しているわけではなく、商号や商用製品の言及は連邦政府による承認を示すものでもありません。
Name | Company | Catalog Number | Comments |
Spreadsheet program | N/A | N/A | Any program that can be used to view and work with csv files (e.g. Microsoft Excel, OpenOffice Calc, Google Docs) can be used to access data export files. |
Basic computing setup and internet access | N/A | N/A | SeqAPASS is a free, online tool that can be easily used via an internet connection. No software downloads are required. |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved