Method Article
在这里,我们提出了一个协议,以利用最新版本的美国环境保护署序列比对来预测跨物种敏感性(SeqAPASS)工具。该协议演示了在线工具的应用,以快速分析蛋白质保存,并提供可定制且易于解释的跨物种化学敏感性预测。
美国环境保护署跨物种敏感性预测序列比对(SeqAPASS)工具是一种快速,免费提供的在线筛选应用程序,允许研究人员和监管机构推断跨物种的毒性信息。对于模型系统中的生物靶标,如人类细胞、小鼠、大鼠和斑马鱼,可以使用各种化学物质的毒性数据。通过评估蛋白质靶标保守性,该工具可用于将从此类模型系统生成的数据外推到数千种缺乏毒性数据的其他物种,从而预测相对内在化学敏感性。该工具的最新版本(版本 2.0-6.1)包含新功能,允许快速合成、解释和使用数据以进行发布以及演示质量的图形。
这些功能包括可定制的数据可视化和全面的摘要报告,旨在汇总SeqAPASS数据,以便于解释。本文描述了指导用户提交作业、浏览各种级别的蛋白质序列比较以及解释和显示结果数据的协议。重点介绍了 SeqAPASS v2.0-6.0 的新功能。此外,还描述了使用此工具专注于转甲状腺素蛋白和阿片受体蛋白质保存的两个用例。最后,讨论了SeqAPASS的优势和局限性,以定义该工具的适用范围,并强调跨物种外推的不同应用。
传统上,毒理学领域严重依赖使用全动物测试来提供化学安全评估所需的数据。此类方法通常成本高昂且需要大量资源。然而,由于目前使用的化学品数量众多,新化学品的开发速度很快,全球范围内都认识到需要更有效的化学品筛选方法1,2。这种需求以及由此产生的从动物试验的范式转变导致了许多新方法的开发,包括高通量筛选测定、高通量转录组学、二代测序和计算建模,这些都是有前途的替代测试策略3,4。
评估可能受化学品暴露影响的物种多样性的化学安全性一直是一个持久的挑战,不仅要进行传统的毒性测试,还要使用新的方法。比较和预测毒理学的进步为理解不同物种的相对敏感性提供了框架,计算方法的技术进步继续提高这些方法的适用性。在过去的十年中,已经讨论了几种策略,这些策略利用现有的基因和蛋白质序列数据库以及特定化学分子靶点的知识,以支持跨物种外推的预测方法,并增强典型模式生物以外的化学安全性评估5,6,7,8。
为了将科学转化为行动,在这些预测毒理学基础研究的基础上,优先考虑化学测试工作并支持决策,创建了美国环境保护署序列比对以预测跨物种敏感性(SeqAPASS)工具。该工具是一个公共且免费提供的基于Web的应用程序,它使用不断扩展的蛋白质序列信息的公共存储库来预测物种多样性的化学敏感性9。基于可以通过评估该化学品的已知蛋白质靶标的保守性来确定物种对特定化学物质的相对内在敏感性的原理,该工具可快速比较具有已知敏感性的物种的蛋白质氨基酸序列与具有现有蛋白质序列数据的所有物种。该评估通过三个级别的分析完成,包括(1)伯爵氨基酸序列,(2)功能结构域和(3)关键氨基酸残基比较,每个级别都需要更深入地了解化学 - 蛋白质相互作用,并在敏感性预测中提供更高的分类分辨率。SeqAPASS的一个主要优势是,用户可以根据感兴趣的化学-蛋白质或蛋白质-蛋白质相互作用的可用信息量,通过添加额外的证据线来定制和完善他们的评估。
第一个版本于2016年发布,允许用户以简化的方式评估伯代氨基酸序列和功能结构域,以预测化学敏感性,并且包含最少的数据可视化功能(表1)。个体氨基酸差异已被证明是化学 - 蛋白质相互作用跨物种差异的重要决定因素,这会影响物种的化学敏感性10,11,12。因此,开发了后续版本以考虑对直接化学相互作用很重要的关键氨基酸13。为了响应利益相关者和用户的反馈,该工具每年发布一次版本,增加了新功能,旨在满足研究人员和监管界应对跨物种外推挑战的需求(表1)。2020 年推出的 SeqAPASS 5.0 版本带来了以用户为中心的功能,这些功能包括数据可视化和数据合成选项、外部链接、汇总表和报告选项以及图形功能。总体而言,该版本的新属性和功能改进了数据合成、外部数据库之间的互操作性以及预测跨物种敏感性的数据解释的便利性。
1. 入门
注意:此处介绍的协议侧重于工具实用程序和关键功能。有关方法、特性和组件的详细说明,请参见网站上的综合用户指南(表1)。
表 1:SeqAPASS 工具的演变。 从初始部署添加到 SeqAPASS 工具的功能和更新列表。缩写:seqAPASS = 序列比对以预测跨物种敏感性;ECOTOX = 生态毒素学知识库。 请按此下载此表格。
图 1:SeqAPASS 问题表述:成功分析所需的初步信息的示意图。缩写:seqAPASS = 序列比对以预测跨物种敏感性;LBD = 配体结合结构域。请点击此处查看此图的大图。
图 2:跨数据库的 SeqAPASS 互操作性。 集成到SeqAPASS中的外部工具,数据库和资源的示意图。缩写:seqAPASS = 序列比对以预测跨物种敏感性;AOP = 不良结局途径;NCBI = 国家生物技术信息中心;ECOTOX = 生态毒素学知识库。 请点击此处查看此图的大图。
表 2:集成到 SeqAPASS 工具中的链接、资源和工具。 SeqAPASS 工具中利用的各种数据源、链接和资源的列表。缩写:seqAPASS = 序列比对,用于预测跨物种的敏感性。 请按此下载此表格。
2. 开发和运行 SeqAPASS 查询:级别 1
注意:在 1 级分析中,将查询蛋白的整个主要氨基酸序列与具有可用序列信息的所有物种的主要氨基酸序列进行比较。该工具使用算法来挖掘、收集和编译公开可用的数据,以快速对齐和比较跨物种的氨基酸序列。后端存储来自国家生物技术信息中心(NCBI)数据库的信息,并战略性地利用蛋白质基本局部比对搜索工具(BLASTp)54 和基于约束的多重比对工具(COBALT)55的独立版本。
3. 开发和运行 SeqAPASS 查询:级别 2
注意:由于整个蛋白质序列不直接参与化学相互作用,因此2级分析仅比较功能域的氨基酸序列,以在较低的分类学等级(例如,类,目,科)下进行敏感性预测。
4. 访问和理解数据:SeqAPASS 级别 1 和级别 2
5. 操作数据设置:SeqAPASS 级别 1 和级别 2
注意:在1级和2级分析中,假设蛋白质相似性越大,化学物质以与查询物种/蛋白质类似的方式与蛋白质相互作用的可能性就越大,使它们容易受到具有该分子靶标的化学物质的潜在影响。由于这些数据的相似性,理解1级和2级数据的步骤一起概述在一个协议中。
6. 可视化数据:序列APASS 级别 1 和级别 2
7. 开发和运行 SeqAPASS 分析:级别 3
注意:3级分析评估查询蛋白质中用户鉴定的氨基酸残基,并快速比较不同物种这些残基的保存情况。假设这些残基保守的物种更有可能以与模板物种/蛋白质类似的方式与化学品相互作用。由于 Level 3 侧重于单个氨基酸,因此只有在对化学-蛋白质或蛋白质-蛋白质相互作用至关重要的氨基酸残基有详细的了解时,才能进行分析。
8. 使用鉴定的文献鉴定关键氨基酸残基
9. 可视化 3 级 SeqAPASS 数据
注意:与以前的级别一样,提供主要和完整报告。除了与 1 级和 2 级数据相同的数据外,主要报告还显示氨基酸位置、缩写以及与模板预测相似的是/否 (Y/N) 敏感性。同样,完整报告包含有关氨基酸侧链分类和分子量的信息。
10. SeqAPASS结果的解释:蛋白质保存的证据线
注意:为了便于解释,此工具包括一个 决策摘要 报告(DS报告),旨在整合跨级别的数据。DS报告包含用户选择的结果(即数据表和/或可视化),并允许同时快速评估多个物种的多个级别的敏感性预测。
为了演示SeqAPASS工具的应用并突出新功能,描述了两个案例研究,代表了蛋白质保守预测不同物种(人甲状腺素转运蛋白)的化学敏感性存在差异并且没有差异(μ阿片受体[MOR])的情况。这些例子中的第一个涉及蛋白质序列/结构比较,以预测不良结果途径的适用性领域(AOP,定义见 表2 ),而第二个则侧重于开发与废水中存在的阿片类药物的跨物种敏感性相关的研究假设。这些案例研究中描述的基本方法可以应用于任何化学品,并证明该工具在决策和研究方面的广泛用途。
甲状腺激素对正常的生长和发育至关重要。它们在甲状腺中合成并分泌到血液中,在那里它们与分布蛋白结合并在整个身体中循环14,15,16,17,18。最近的研究表明,环境污染物,如多氯联苯(PCB)、多溴联苯醚(PBDEs)以及全氟和多氟烷基物质(PFAS),可以竞争性地与分布蛋白转甲状腺素蛋白(TTR)结合并破坏正常的甲状腺过程19,20,21,22,23,24,25.已经开发出一种AOP,描述了与TTR的竞争性结合,导致人类神经发育毒性(https://aopwiki.org/aops/152)。虽然有证据表明这种AOP也适用于啮齿动物,但对其他分类群的适用性尚待确定。由于TTR结合化学物质存在于环境中,因此了解该AOP的分类相关性非常重要,这一挑战可以通过SeqAPASS分析部分解决。使用该工具的问题制定策略,分析的目标可以陈述如下:在知道TTR结合化合物导致人类不良后果的情况下,预计哪些分类群具有相似的易感性?
人转甲状腺素蛋白具有很好的表征,并且已知有几种经过充分研究的配体在人TTR(hTTR)结合位点结合,使其成为SeqAPASS分析的最佳靶标8,9,13。使用人甲状腺素转运蛋白的NCBI加入物P02766.1,使用默认设置进行1级分析。1 级分析的结果将相似百分比临界值设定为 49%,哺乳动物(哺乳动物)、鸟类(Aves)、爬行动物(睾丸、鳞龙、鳄鱼)、两栖动物(两栖动物)和大多数鱼类(放线鸟、腔肠动物、克拉迪斯塔、软骨鱼)都高于这一临界值(图 3)。因此,来自这些分类组的所有物种都导致了"Y"的敏感性预测(即,是),并且可能对已知与hTTR相互作用的化学物质敏感(图3和补充文件1)。
对于功能结构域的2级评估,使用NCBI保守结构域数据库将TR_THY(加入smart00095)识别为包含从残基27到147的TTR亚基蛋白成熟链的保守结构域。由于NCBI中报道的TTR蛋白质序列包括与当前分析无关的20个氨基酸前片段,因此将比较重点放在成熟链上为跨物种保存该蛋白质提供了额外的,更具体的证据线。从 2 级评估中,报告的相似性临界值百分比为 58%,哺乳动物、鸟类、爬行动物、两栖动物和大多数鱼类再次低于此临界值(图 4)。因此,SeqAPASS得出了来自这些分类群的物种的敏感性预测为"Y"(即是),表明它们可能对与hTTR蛋白相互作用的化学物质敏感(图4 和 补充文件1)。总体而言,1级和2级分析的结果表明,大多数脊椎动物物种共享hTTR的保护,并且可能对已知与这种蛋白质相互作用的化学物质敏感。
图 3:跨分类组的甲状腺素转运蛋白保护的 SeqAPASS 1 级分析,以及与人类蛋白质相关的可用序列信息。 蛋白质氨基酸序列的相似度百分比显示在Y轴上;分类组显示在 X 轴上。开放圆圈 (○) 表示查询序列,闭圈 (●) 表示分类组中相似度最高的物种。在图中,每个框的顶部和底部表示第 75个 和第 25个 百分位数,晶须延伸到四分位数范围的 1.5 倍,平均值和中值由框上的水平黑线表示。虚线表示敏感性预测的截止值。缩写:TTR = 甲状腺素转运蛋白;SeqAPASS = 序列比对以预测跨物种敏感性。 请点击此处查看此图的大图。
图 4:跨分类组的甲状腺素转运蛋白受体配体结合结构域保守的 SeqAPASS 2 级分析,具有与人类蛋白质 LBD 相关的可用序列信息。 配体结合域氨基酸序列的相似度百分比显示在Y轴上;分类组显示在 X 轴上。开放圆圈 (○) 表示查询序列,闭圈 (●) 表示分类组中相似度最高的物种。在图中,每个框的顶部和底部表示第 75个 和第 25个 百分位数,晶须延伸到四分位数范围的 1.5 倍,平均值和中值由框上的水平黑线表示。虚线表示敏感性预测的截止值。缩写:TTR = 甲状腺素转运蛋白;SeqAPASS = 序列比对以预测跨物种敏感性。 请点击此处查看此图的大图。
通过分子建模分析和蛋白质晶体学研究,在TTR的结合区鉴定出氨基酸,这些氨基酸预计与内源性配体3,3′,5,5′-四碘-L-甲状腺原氨酸(T4,PDB 2ROX)以及三种环境化学物质相互作用:全氟辛烷磺酸(PFOS,PDB 5JIM),四溴双酚A(TBBPA,PDB 5HJG)和己烯雌酚(DES,PDB 1TZ8)19, 21,22,26.氨基酸残基Lys35,Ser137,Leu130,Ala128,Ala129和Thr139都被鉴定为通过直接氢键相互作用或范德华相互作用在蛋白质 - 配体相互作用中起关键作用。使用hTTR作为模板序列,并排除非同源,假设,部分和低质量序列,在跨物种的3级分析中评估了这六个氨基酸残基(补充文件1)。由于先前确定TTR仅在脊椎动物物种中保存,因此无脊椎动物物种被排除在分析之外(图3和图4)。此外,重要的是要注意,文献中报道的氨基酸位置排除了成熟hTTR蛋白中不存在的20个氨基酸前段,因此,在Level 3中提交的位置与文献中报告的位置进行了调整,以确保与所选模板蛋白15(补充文件1)准确对齐。
在TTR的3级分析中,选择了294种脊椎动物物种(哺乳动物,鸟类,两栖动物,爬行动物和鱼类)进行对齐。在评估的物种中,18种显示出关键氨基酸的差异,导致敏感性预测为"N"(即,否)。有趣的是,五种海洋哺乳动物在位置2(128A)出现氨基酸取代,而四种鱼类在位置2(128A)或位置6(139T)表现出取代(图5)。由于这些氨基酸在TTR结合通道中的蛋白质-配体相互作用中起重要作用,这些数据表明TTR配体在这些物种中的相互作用可能不同,并且会导致相对于人类不同的化学敏感性。
图 5:对 TTR 化学结合很重要的氨基酸残基守恒的 SeqAPASS 3 级分析。 (A) 3级汇总表,显示所有分类群中具有可用序列数据的物种数量,预测为类似易感物种的数量(Y),以及预测不具有类似易感的物种数量(N)。(B) 3 级热图显示预测相对于人转甲状腺素蛋白 TTR 蛋白不具有类似敏感性的选定物种,显示完整、部分和不匹配的氨基酸。缩写:TTR = 甲状腺素转运蛋白;SeqAPASS = 序列比对以预测跨物种敏感性。 请点击此处查看此图的大图。
为了响应利益相关者和用户的反馈,SeqAPASS工具设计了新功能并将其纳入其中,包括连接到不同应用程序的经验数据的能力。该工具与 ECOTOX 知识库(表 1)的互操作性是通过在 ECOTOX 中存在的种质的 1 级和 2 级数据表中嵌入外部链接并在工具中创建 ECOTOX 小部件以直接过滤到 ECOTOX 中最相关的毒性数据来实现的。通过链接和小部件,用户可以快速查询ECOTOX并收集具有SeqAPASS敏感性预测的物种的相应毒性数据。目前,SeqAPASS预测通过化学压力源和物种与ECOTOX相关联;然而,毒性数据尚未与特定的基因/蛋白质相关联,这将允许与SeqAPASS中感兴趣的特定终点/分子靶标直接连接。虽然将预测与基于化学应激源的毒性数据联系起来并不理想,因为数据可能不特定于给定的途径,但建立连接以将结果汇集在一起是第一步。作为SeqAPASS-ECOTOX集成的第一次迭代,当前的方法为用户提供了广泛的化学应激源和物种的所有可用毒性数据。这些数据与SeqAPASS预测相结合,可以提供广泛的背景(脊椎动物与无脊椎动物),并且可以在AOP框架的背景下考虑。
TTR为检查这种联系提供了一个很好的案例,因为现有的AOP(AOP 152)为解释潜在相关的ECOTOX毒性数据提供了背景。从SeqAPASS Level 3中检查的配体开始,收集了已知与TTR配体结合域相互作用的四种化学物质(己烯雌酚[DES],全氟己烷酸[PFHxA],全氟辛烷磺酸[PFOS]和四溴双酚A [TBBPA])的环境毒性数据19,21,23,24.对于每种化学品,使用自定义搜索参数(补充文件1)通过化学文摘社(CAS)编号查询ECOTOX的水生和陆地数据。数据被过滤到感兴趣的物种组(两栖动物,鸟类,鱼类,无脊椎动物,哺乳动物,爬行动物)。在过滤的查询结果中,计算并实施研究的最小和最大效应浓度的平均值,作为未报告平均效应浓度值的任何命中的平均值的近似值(图6A和补充文件1)。在单一化学品的背景下,进行了Kruskal-Wallis检验,以比较不同分类组的平均效应浓度,因为数据不符合方差分析检验假设。然后使用邓恩检验对所有化学物质进行事后成对比较测试,因为分类组由不相等的样本量组成。水生和陆地结果分别分析,因为两种类型的暴露之间的数据没有直接可比性。在ECOTOX中,可以选择两栖动物,鸟类,无脊椎动物和鱼类的水生毒性数据(图6A)。选定化学品的陆地毒性数据仅可用于哺乳动物和DES(补充文件1)。
图 6:将 SeqAPASS 结果与经验数据联系起来 。 (A)跨分类组的平均效应浓度,ECOTOXicicic知识库中提供了已知与人类TTR蛋白结合的特定化学物质的数据。(B)每个SeqAPASS分析中包含的物种数量与可获得ECOTOX数据的物种重叠。在面板 A 中,x 轴上的括号表示聚合数据的查询命中数。星号表示在单一化学品的背景下物种组之间具有显著差异的效应浓度对(邓恩检验,p < 0.05),其中星号数越高表示显著性水平越强(*: p < 0.05; **: p < 0.01; ***: p < 0.001; ****: p < 0.0001)。每个框内的中心线表示中位数,框边缘表示四分位数间距。晶须延伸至四分位距的 1.5 倍。超出该范围的异常值显示为单个点。缩写:TTR = 甲状腺素转运蛋白;SeqAPASS = 序列比对以预测跨物种易感性;ECOTOX = 生态毒素学知识库。 请点击此处查看此图的大图。
总体而言,这些数据表明,所评估的化学物质的生物活性发生在脊椎动物物种中,但不发生在无脊椎动物中。虽然ECOTOX中缺乏生物靶标和途径信息使得无法将这些经验数据直接与TTR联系起来,但这些结果确实支持了SeqAPASS的预测,即无脊椎动物物种不具有易感性。所有有数据可查的脊椎动物物种都表明对全氟辛烷磺酸和TBBPA都易感,尽管鱼类和鸟类的平均效应浓度明显高于两栖动物。这些数据表明,分类群之间的敏感性可能存在差异,这可能归因于生物途径差异(包括TTR)。值得注意的是,代谢和排泄等其他变量也可能在敏感性差异中发挥作用。就全氟辛烷磺酸和全氟辛烷磺酸而言,鱼类明显比无脊椎动物和鸟类更敏感,就DES而言,两栖动物的平均效应浓度明显高于无脊椎动物。同样,这些数据支持我们的SeqAPASS预测,即无脊椎动物与脊椎动物物种没有共同的易感性。在使用该工具评估的所有物种中,只有少数物种具有四种感兴趣的化学品的相应ECOTOX数据(图6B,补充表S1和补充表S2)。对于那些缺乏顶端数据的物种,SeqAPASS对易感性的预测增加了额外的证据线,表明相关物种的行为可能与具有顶端数据的物种相似。所有SeqAPASS和ECOTOX分析的数据可在补充文件1中找到。
根据疾病控制和预防中心(CDC)的数据,2017年,阿片类药物导致美国约47,600人因过量服用而死亡,这一数字继续上升27人。美国的废水厂在全国范围内受到美国环境保护署的国家污染物排放消除系统的监管,该系统不需要在其排放中测试阿片类药物或其他药物28。近年来,已经努力使用基于废水的流行病学作为绘制社区阿片类药物使用情况的工具。阿片类药物监测工作在废水中检测到浓度高达1.27微克/升,在地表水中检测到浓度高达0.7微克/升29,30。最近评估阿片类药物暴露对鱼类影响的毒性研究报告了成瘾行为的发展和不利的免疫影响(例如,更高的感染率,免疫基因的下调)31,32,33。总体而言,这些研究表明存在不良环境阿片类药物暴露的可能性,并强调了了解这些化学物质对水生物种构成的风险的重要性。鉴于可能在环境中遇到这些化合物的物种范围,使用SeqAPASS识别潜在的易感物种对于确定测试或监测工作的优先级可能很重要。
MOR是治疗疼痛的主要阿片类药物靶标,并负责人类阿片类生物碱的强大镇痛和成瘾特性34,35。由于该受体对人类健康的重要性,MOR配体是众所周知的,并且可以使用高质量的X射线晶体学研究,使该靶标成为SeqAPASS分析的理想选择8,9,13。使用人μ阿片受体的NCBI加入物ACM90349.1,使用默认设置进行1级分析。1级的易感性临界值确定为55%,哺乳动物(哺乳动物)、鸟类(Aves)、爬行动物(睾丸、鳞龙、鳄鱼)、两栖动物(两栖动物)和大多数鱼类(放线鸟、腔肠龙、克拉迪斯塔、软骨鱼)的相似性百分比高于此临界值;因此,来自这些分类群的物种导致易感性预测为"Y"(即是),表明它们可能对已知与人类MOR相互作用的化学物质敏感(图7和补充文件1)。使用NCBI保守结构域数据库,7tmA_Mu_opioid_R被鉴定为功能结构域(加入cd15090),包括MOR蛋白从133到411的所有七个螺旋,包括一个假定的配体结合位点。与 1 级相比,2 级结果确定了更高的易感性临界值,相似度为 88%,哺乳动物、鸟类、爬行动物、两栖动物和大多数鱼类都高于此临界值,导致易感性预测为"Y"表示是(图 8)。总体而言,1级和2级分析的结果表明,大多数脊椎动物物种共享MOR的保护,并且可能容易受到已知与人类MOR相互作用的化学物质的影响。
图 7:跨分类组μ阿片受体保护的 SeqAPASS 1 级分析,以及与人类蛋白质相关的可用序列信息。 蛋白质氨基酸序列的相似度百分比显示在Y轴上;分类组显示在 X 轴上。开放圆圈 (○) 表示查询序列,闭圈 (●) 表示分类组中相似度最高的物种。在图中,每个框的顶部和底部表示第 75 个和第 25 个百分位数,晶须延伸到四分位数间距的 1.5 倍,平均值和中值由框上的水平黑线表示。虚线表示敏感性预测的截止值。缩写:MOR = μ-阿片受体;SeqAPASS = 序列比对以预测跨物种敏感性。 请点击此处查看此图的大图。
图 8:相对于人类蛋白质结构域的阿片受体配体结合结构域保守μ的 SeqAPASS 2 级分析。 配体结合域氨基酸序列的相似度百分比显示在Y轴上;分类组显示在 X 轴上。开放圆圈 (○) 表示查询序列,闭圈 (●) 表示分类组中相似度最高的物种。在图中,每个框的顶部和底部表示第 75 个和第 25 个百分位数,晶须延伸到四分位数间距的 1.5 倍,平均值和中值由框上的水平黑线表示。虚线表示敏感性预测的截止值。缩写:MOR = μ-阿片受体;SeqAPASS = 序列比对以预测跨物种敏感性。 请点击此处查看此图的大图。
通过分子建模和蛋白质晶体学研究的分析,在MOR的结合区域中鉴定出氨基酸,这些氨基酸预计与已知配体相互作用。尽管与阿片受体结合良好的各种配体导致复杂的药理学,但观察到一些一致的配体 - 蛋白质相互作用36,37。基于分子对接到各种MOR晶体结构,包括吗啡和芬太尼,高亲和力MOR激动剂,与D147,Y148,M151,W293,I296,H297,V300,I322和Y326相互作用36,38。残基D147、Y148、M151和H297也与吗啡激动剂BU72结合的MOR晶体结构有关,而D147、M151、H297和Y326在与不可逆吗啡拮抗剂β-funaltrexam37结合中也至关重要。考虑到这些证据线,选择九个残基(D147、Y148、M151、W293、I296、H297、V300、I322、Y326)进行3级评估,使用人类MOR作为模板序列,排除部分、预测、假设和低质量序列。重要的是,文献中报道的氨基酸位置排除了相对于NCBI蛋白加入的64个氨基酸片段,因此,选择3级的位置来代表那些与模板序列对齐以获得正确比对序列的位置。
在对人类MOR的3级分析中,评估了脊椎动物物种(哺乳动物,鸟类,两栖动物,爬行动物和鱼类)的284个物种。在评估的所有物种中,基于侧链分类和分子量,九种氨基酸要么完全匹配,要么部分匹配;因此,所有评估的物种的敏感性预测为"Y"为"是"(表3和补充文件1)。由于这些氨基酸在强MOR激动剂和强拮抗剂的结合中都很重要,这些数据表明,靶向人类μ阿片受体的阿片类化合物可能与脊椎动物物种的受体发生类似的相互作用。尽管迄今为止,ECOTOX知识库中关于阿片类化合物的经验数据很少,但几项研究表明,鱼类可能易感31,32,33。总体而言,SeqAPASS的结果表明,MOR调节化学品对跨物种的环境影响更大,这表明更多的研究和监测可能是有价值的。所有分析的数据可在补充文件1中找到。
表3:SeqAPASS 3级分析,用于对与μ阿片受体的化学结合很重要的氨基酸残基的保存。 汇总表显示了所有分类群中具有可用序列数据的物种数量、预测为类似易感物种的数量 (Y)、预测不具有类似易感性的物种数量,以及完整、部分和不匹配的氨基酸。缩写:seqAPASS = 序列比对,用于预测跨物种的敏感性。 请按此下载此表格。
补充表S1:已知与人甲状腺素蛋白结合的四种感兴趣的化学物质的可用ECOTOX数据的物种。每种化学品的可用数据与SeqAPASS对1级,2级和3级相似敏感性的预测一致。与人转甲状腺素蛋白序列相关的所有SeqAPASS预测。缩写:seqAPASS = 序列比对以预测跨物种敏感性;DES = 己烯雌酚;PFHxA = 全氟己酸;全氟辛烷磺酸=全氟辛烷磺酸;TBBPA = 四溴双酚 A. 请点击此处下载此表。
补充表S2:在SeqAPASS和ECOTOX评估中具有可用数据的物种总数,用于已知与人转甲状腺素蛋白结合的选定化学物质。SeqAPASS提供了预测许多物种的物种易感性的方法,这些物种没有经验毒性数据。 请按此下载此表格。
补充文件1:所有代表性结果的SeqAPASS和ECOTOX数据。文件包含ToC,后跟以下数据表:选项卡1-hTTR序列APASS结果级别1,选项卡2-hTTR序列APASS结果级别2,选项卡3-hTTR序列APASS结果级别3,选项卡4-DES的EcoTox数据,选项卡5-PFHxA的EcoTox数据,选项卡7-TBBPA的EcoTox数据,选项卡8-EcoTox组平均值计算, 选项卡 9-序列APASS EcoTox 数据比较、选项卡 10-hMOR 序列APASS 结果级别 1、选项卡 11-hMOR 序列APASS 结果级别 2 和选项卡 12-μ-hMOR 序列APASS 结果级别 3。缩写:seqAPASS = 序列比对以预测跨物种敏感性;目录 = 目录;hTTR = 人甲状腺素转运蛋白;ECOTOX = 生态毒理学知识库;DES = 己烯雌酚;全氟辛烷磺酸=全氟辛烷磺酸;PFHxA = 全氟己酸;TBBPA=四溴双酚A;hMOR = 人 μ-阿片受体。 请点击此处下载此文件。
人们普遍认识到,对足够的物种进行经验测试以捕获可能暴露于毒理学相关化学物质的生物体的基因组、表型、生理和行为多样性是不可行的。SeqAPASS的目标是最大限度地利用现有和不断扩展的蛋白质序列和结构数据,通过分子水平的比较,帮助和告知从测试生物体到数百或数千种其他物种的化学毒性数据/知识的外推。SeqAPASS工具旨在通过简化和快速的分析来降低科学家,风险评估人员和监管机构蛋白质序列比较的复杂性,其中包括透明生成和可下载的汇总表,交互式数据可视化以及轻松识别受威胁和濒危物种以及常见模式生物。此处描述了运行 SeqAPASS 级别 1、2 和 3 的协议,以评估初级氨基酸序列相似性、功能域保守以及参与化学-蛋白质和蛋白质-蛋白质相互作用的关键氨基酸。从每个级别的SeqAPASS分析中收集的证据线预测了跨物种的化学敏感性,提供了一致且易于解释的数据。迄今为止,该工具已被广泛用于广泛的应用,包括鉴定与某些受体结合的化学物质以及评估具有哺乳动物系统的脊椎动物生态受体的读取潜力。此外,这里还介绍了两个专注于甲状腺激素分布蛋白、TTR 和 MOR 的案例研究,以演示 SeqAPASS v2 至 v6 的新特性和功能。
与任何计算方法一样,在SeqAPASS工具中生成物种敏感性预测的能力高度依赖于适当参数8,9,13的输入。因此,至关重要的是,在进行分析之前,要进行问题制定步骤,以调查现有数据和文献,以寻找预定目标。在了解蛋白质靶标的情况下开始分析,用户可以识别适当的蛋白质加入数和高质量序列。同样,对敏感或目标物种或用于测定或AOP开发的模式生物的了解可确保选择与所有其他物种进行比较的适当查询物种。为2级选择功能域,为3级选择关键氨基酸残基也是关键步骤,需要用户确定适当的输入参数以生成预测。由于需要预先存在的化学-蛋白质相互作用知识,最新版本的SeqAPASS工具集成了用户友好的资源,旨在帮助指导用户获取启动查询的相关信息(例如,指向其他工具的链接)(表2和图2)。此外,弹出信息消息和警报已集成到工具中,以指导用户完成分析并帮助通知用户需要解决的任何错误。
化学-生物相互作用的复杂性是SeqAPASS工具的局限性。在跨物种推断毒性数据时,分子靶标的守恒是需要考虑的众多因素之一。在考虑化学毒性时,化学物质的吸附,分布,代谢和排泄(ADME)至关重要,因为化学物质可以通过这些过程被激活或解毒39,40。其他因素,如化学暴露途径,生物体生命阶段和生活史以及饮食,也可以在确定跨物种的化学敏感性方面发挥重要作用41,42。为了解决这一限制,重要的是要了解SeqAPASS在预测化学敏感性时提出的主要问题:化学物质的蛋白质靶标是否可能存在于另一个物种中,以便化学物质起作用?这个问题可以通过确定直系同源物候选物并考虑相对于已知敏感或目标物种跨物种保护该目标来解决。该信息可用作跨物种外推的证据线,并整合到其他证据流中(例如,暴露的可能性),以更好地了解物种对化学应激源的易感性。SeqAPASS的更新包含了与外部工具的集成链接,包括美国EPA ECOTOX知识库43 和美国鱼类和野生动物管理局环境保护在线系统(ECOS)44。通过连接到这些数据库,SeqAPASS用户可以轻松访问经验化学毒性数据,以便与基于序列的预测进行比较,并具有识别可能具有保护状态的物种的方法。
SeqAPASS工具为内在敏感性的计算预测提供了一个基于科学的平台,这些预测得到了进化生物学概念和将预测与可用经验结果进行比较的案例的支持。此外,SeqAPASS是免费的,并且可以在支持良好的基于Web的平台上公开获得,该平台可广泛访问(https://seqapass.epa.gov/seqapass/)。由于该工具利用了来自现有数据库的序列数据和蛋白质信息,因此随着测序技术的进步以及新物种的基因组被测序和注释,它预测更广泛物种多样性的化学敏感性的能力正在不断提高。尽管这在数据可用性方面提供了明显的优势,但它也存在一个局限性,即公开可用的序列信息可能会受到某些物种的蛋白质序列质量不一致、注释差和不完整的影响。然而,生物信息学中的组学技术和方法正在迅速发展,因此,随着时间的推移,序列管理和质量可能会继续提高。
SeqAPASS工具的一个主要目标是透明度,以链接的形式提供对后端集成的所有数据源和工具的访问。这种透明度使用户能够快速访问NCBI的序列或分类信息的原始来源。此工具的适用范围由进行有意义的分析所需的信息定义。由于了解已知敏感或目标物种中的化学-蛋白质或蛋白质-蛋白质相互作用是开始查询的关键要素,因此必须承认,在没有这些信息的情况下进行的查询是没有意义的。此外,具有多个未定义生物靶标或与不同靶标相互作用且效力不同的化学品也对当前形式的工具提出了挑战和限制。预计随着生物信息学,计算建模以及基于细胞的高通量筛选和转录组学的改进,将继续阐明化学空间多样性中有关与特定蛋白质相互作用的更多知识。预计将SeqAPASS应用于物种外推的更广泛挑战的能力,相对于了解物种多样性中不利化学效应的可能性,将继续提高。
总之,SeqAPASS工具是一个可访问的平台,可以轻松应用分子信息来解决化学品安全评估中跨物种外推的巨大挑战。虽然这里强调的例子侧重于生成化学敏感性的预测,但结果也有助于理解生物途径的整体保护。该工具汇集了不同的证据线,便于访问多个平台和数据库,有助于为化学测试的优先级和资源分配建立透明的案例。随着科学和生物信息能力的不断发展,该工具的功能和实用性将继续增长和改进,以满足研究和监管界的需求,同时减少跨物种评估所需的资源。
作者没有利益冲突需要披露。
作者感谢Daniel L. Villeneuve博士(美国环保署计算毒理学和暴露中心)和Jon A. Doering博士(路易斯安那州立大学环境科学系)对手稿的早期草稿提供评论。这项工作得到了美国环境保护署的支持。本文中表达的观点是作者的观点,不一定反映美国环境保护署的观点或政策,提及的商品名称或商业产品也不表示联邦政府的认可。
Name | Company | Catalog Number | Comments |
Spreadsheet program | N/A | N/A | Any program that can be used to view and work with csv files (e.g. Microsoft Excel, OpenOffice Calc, Google Docs) can be used to access data export files. |
Basic computing setup and internet access | N/A | N/A | SeqAPASS is a free, online tool that can be easily used via an internet connection. No software downloads are required. |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。