文献翻译——基于关联规则挖掘识别的鸡源大肠杆菌共有多重耐药模式(下)

荒凉一梦 提交于 2020-01-10 05:55:07

原文来源

https://www.frontiersin.org/articles/10.3389/fmicb.2019.00687/full

引言

尽管细菌具有抗生素耐药性基因比1940年发现和临床使用抗生素还要早,抗生素使用为致病的和非致病的细菌选择了抗生素耐药性。通过在食物生产动物中使用抗生素,会使增加的AMR出现和存留在食物源病原菌中。据推断,由于不断增加的肉产品需求和人口增长,从2010到2013年,食物产出动物的AMU提高了67%。通过选择受治疗个体中的表型耐药细菌的生长和存留,每一种AMU实例直接地造成了AMR。AMU还通过增加某个群体的耐药表型间接地造成了AMR,并增加了未来耐药感染的风险。
通过直接接触,耐药病原菌可以从移植的食物产出动物传播到一小部分人类,如果肉类在屠宰环节被病原菌感染,则还会通过食物链传播到更广大的人类群体。
相比对一种或一类药品耐药的病原菌,具有多重耐药性的病原菌是一个更大的公共健康威胁,因为要找到一种能够有效抵抗MDR感染的抗生素会非常困难或者不可能。MDR不是随机共同出现的个体药品耐药的简单结果。Chang等人发现MDR发生的概率往往比偶然预期更高,并描述了造成MDR出现的一些机制。一些生物学机制或变更(流出泵)抵抗几种抗生素药品或种类,创造了交叉耐药。此外,耐药性基因会被基因性链接,通过发生在共同迁移因子或者染色体区域上,并倾向于共同继承和转移。MDR在没有暴露于杀菌抗生素的细菌中自然地发生,然而AMU以两种关键的方式选择了MDR。AMU的变化或者多种抗生素的同时使用会通过基因性资本主义导致MDR的出现,因此,已经对一种抗菌素产生耐药性的细菌具有适应度优势,因此更有可能通过突变、重组或水平基因转移获得额外的耐药性。了解特定细菌宿主环境中常见的MDR模式有助于指导抗菌治疗和管理。
美国国家耐药性监测系统建立于1996年,是美国的国家监督系统,用于监测动物传染病、食物源病菌(包括肠道沙门氏菌、弯曲菌属和大肠杆菌)的耐药性。它包含了来自临床患病的人类、屠宰场中基于危险的食用动物尸体样本,以及零售肉类的分类样本。作为革兰氏阴性细菌耐药性的指导机构,NARMS从2000年开始监测分离自鸡尸体的大肠杆菌,从2002年开始监测零售鸡肉。NARMS报告了单个药品的耐药率和趋势、MDR模式和MDR流行率,但同时使得菌株级别的最小抑菌浓度数据公开化。耐药性之间的生物学和基因学链接可以通过菌株级数据推断出来。总的来说,AMR数据可以作为连续的(纸片扩散区直径)、顺序的(MIC)和二分的(敏感或耐药)数据进行分析。然而,要分析AMR数据中的关联性是很有挑战性的,因为这些数据往往违反经典统计学测试和模型的假设。例如,MIC和纸片扩散分布倾向于是非高斯的,二分的解释倾向于是稀疏的和过度离散的。有一些技术和统计学模型被应用于NARMS数据和相似地AMR数据集,用来研究药品耐药性之间的关联关系。图形化马尔科夫网络揭示了药品耐药性之间的两两关联。对数线性模型被用于研究药品耐药性之间的高阶关联,但是当每个耐药或敏感性联合中的预期菌株数少于5个时,这些模型违反了关键假设。最终,贝叶斯方法可以评估药品耐药性之间的相互作用,并且识别出了NARMS数据中耐药性之间的三路和四路交互。
关联规则挖掘是一种无监督机器学习方法,被广泛适用于零售商店的顾客消费模式识别,以此提升销量并做出更好的商业决策。规则挖掘可以有效地发现大型稀疏数据集中二值化或分类变量之间的关联。尽管“大型数据集”或“大数据”的定义有所不同,但被广泛应用于关联规则挖掘的Apriori算法是为包含几万条零售事务的数据集建立的。稀疏数据指的是很少的观测有非零值的情况。当AMR数据被二分化到敏感性(“0”和耐药“1”)解释,在耐药率较低时数据就是稀疏的。因此,关联规则挖掘很适合于分析AMR监测数据,这些数据通常包含几千个对一些药品有低耐药率的菌株。此外,关联规则挖掘不假设数据的高斯性或者预期计算值。研究表明,相比于回归技术和卡方检验,关联规则挖掘在研究临床数据中暴露和疾病结果之间的关系是,更加敏感。关联规则挖掘被用于研究医院感染趋势、抗菌谱分析和敏感性测试验证。由于抗生素敏感性结果可以被解读为二值化变量(对给定的抗生素是敏感还是耐药),关联规则可以识别单个抗生素敏感性的多路关联,其名感性可能来源于交叉耐药或共耐药。本研究的目标是利用关联规则挖掘揭示抗生素耐药性检测数据中有意义的MDR模式。多重耐药是指对三种或更多的药品种类有耐药性;由于关联规则涉及到两种或更多的抗生素,我们将MDR定义为对两种或更多种类的药品有耐药性。用回归模型技术很难研究MDR,因为会有很多潜在结果。然而,关联规则挖掘则有效地识别一个数据集中最强的模式,并且对这些关联规则的分析可以提供对单个抗生素耐药性之间关联强度的深刻理解。我们对NARMS中来自鸡尸体和零售鸡肉的大肠杆菌耐药性数据采用关联规则挖掘,以识别两种或更多抗微生物药品之间的重要关联,并分析屠宰与零售MDR模式的时间趋势与差异。

讨论

几个统计学技术被用于探索NARMS分离菌的多重耐药模式,包括对数线性模型、贝叶斯网络、马尔科夫网络。尽管其他机器学习技术(决策树、分层聚类)被用于耐药性数据集,但关联规则挖掘还没有被作为模式识别和多重耐药性趋势的研究方法。传统的统计学技术可能受限于非高斯性和AMR监测数据的稀疏性;规则挖掘克服了这些局限性,因为它不对数据分布做任何假设。此外,规则挖掘可以识别复杂的高阶关联(在这个数据中达到了8路交互),因为它在整个MDR模式空间中进行搜索。相反的,马尔可夫网络研究成对交互而贝叶斯网络可以在NARMS鸡大肠杆菌数据中识别的数据达到了四路交互。
Apriori算法可以有效地处理包含很多菌株和被测抗生素的数据集。然而,成千上万的关联可以从相对小的数据集中识别出来,并且必须适当地削减以发现有意义的模式,从而表达数据中的真实关联。利用PCA实现一个质量度量选择管道,以此识别那些在NARMS数据集中有最大正交变化的规则质量度量。置信度,提升度,φ和支持度度量区分了关联的不同方面:条件概率,独立性,关联性和相对频率。然而,他们应当同时进行阐释,因为单独的质量度量可以被耐药性偏斜分布反向影响。分离自2004年到2012年屠宰鸡和零售鸡肉的大肠杆菌对于许多被测抗生素都不频繁耐药。这限制了支持度作为一个削减质量度量的作用,还降低了Apriori算法用于发现关联规则的效率。当一些耐药性很罕见而另一些很频繁时,规则置信度会很高,即使耐药性是相互独立的。因此一个偏斜耐药性分布也会影响利用条件概率评价规则的能力。这反映在置信度在错误发现率重采样方法中的贫乏。通过将置信度和支持度与提升度和phi进行组合,我们能够识别抗生素耐药模式是独立的、普遍的还是可靠的。
这种重采样方法证明,当采用置信度>0.75,提升度>2,以及φ>0.5检查规则时,NARMS数据集的预期错误发现率是<1%的;对于被测数据集这是精确的,因为规则质量度量可以被耐药性流行率和样本大小影响(phi对于条件-结果关联表的规模很敏感)。因此,我们相信在规则削减之后还未被覆盖的抗生素耐药模式近似地表达了这些数据集中的真实关联。然而,这些关联可能并没有出现在其他数据集中,也可能反映出更多的鸡源大肠杆菌抗生素耐药模式。NARMS对屠宰厂的采样策略和处理工厂在2006年从随机(无目标)和有目的采样相结合改变到了基于风险采样,随后在2013年又变成了随机盲肠采样。自2002年以来零售样品都被随机筛选,尽管不是所有的州都展示在零售采样网络中。因此本研究中利用的NARMS数据集像是一个对所有大肠杆菌感染的鸡的有偏重性展示,潜在的变量可能隐藏或混淆了多重耐药模式。在相同大肠杆菌分离菌的抗生素耐药性列联表中发现的显著不平均分布支持了这一点。
在NARMS数据集中,过渡离散和潜在变量似乎造成了变量规则重叠和中度积累规则稳定性。如果足够的元数据随着分离菌敏感性结果公布,那么潜在的混淆变量可以被包含在关联规则中,规则重叠也可能会对探测MDR模式的真实时序变化有更大的潜力。由于我们使用了错误发现率<1%的最优规则集来计算规则重叠,二类错误(漏报)可能也会造成这种在连续年份之间的重叠变化,和屠宰与零售之间的低重叠。放宽错误发现率会提高发现所有有意义关联的能力,但同时要以一些错误发现为代价。屠宰与零售之间的低规则发现率并不是数据集大小造成的。可能是某些关联引起的,包括GEN-STR,TET-FIS,FIS-GEN,这些关联在零售最优规则中频繁出现,但在屠宰最优规则中几乎没有。这些连接在剪枝之前出现于屠宰最优规则,并且总是有一个中等的φ值(>0.2),但比提升度和置信度的最小阈值低。因此,这些规则可能是剪枝步骤中的漏报,而适当的阈值可能会提高屠宰与零售之间的规则重叠。2010年的屠宰零售之间的重叠率增加原因是不确定的。我们不清楚2010年NARMS采样策略的变化可能会导致屠宰与零售采集的样本更相似。一种可能性是源自鸡尸体的大肠杆菌爆发,造成了零售鸡肉上的同源细胞相关菌株的高流行率。然而,2010年并没有与鸡源大肠杆菌爆发相关的报道。
如果某个MDR模式(由基因关联或者一个普遍机制引起的)的强度不随着时间显著变化,那么一个MDR关联规则的置信度应当保持相对稳定,并且支持度可能会随时间变化,这个MDR模式也会更加流行。对数据集之间规则质量的检查可以证明最优规则有一致的稳定性,在年份与年份、零售与屠宰之间只有很小的置信度变化。然而,最优规则的支持度以平均支持度的百分比显著地变化。规则支持度的巨大变化可以反映出年份与年份、零售与屠宰之间的MDR模式流行性差异。更接近地,目标大肠杆菌群体的多重耐药模式的高方差和相对小的样本数量造成了数据集中MDR模式流行性的巨大方差。相对较小的置信度变化说明目标群体中共享的MDR模式基本没有变化。大肠杆菌的总体流行性在过去70年有显著增加;应用关联规则挖掘来检视长时间段的数据可以阐明特定MDR模式的出现与传播。
多重耐药模式稳定性同样被β内酰胺类、四环素、硫代异噁唑和氨基糖苷类的一致耐药性子网所支持。有两种方法识别了β内酰胺类耐药性的关联,在NARMS鸡大肠杆菌MIC数据上利用马尔科夫网络,以及在二值化耐药性数据上使用贝叶斯网络。对AMP,AMC,FOX,TIO和AXO的耐药性是加拿大最普遍的鸡源大肠杆菌MDR模式之一。对多重β内酰胺类的耐药性通过交叉耐药(流出泵或β内酰胺类产物)被多次减轻了,但菌株仍然可能带有多重β内酰胺类耐药性基因(共耐药)。与AMP相连的连接,与其他β内酰胺类的连接相比,数量和权重都相对更低,这说明至少有两种不同的机制或者β内酰胺类耐药性基因表现在这些大肠杆菌中,因为给予对新β内酰胺类耐药性的基因,同时也会给予对AMP的耐药性。例如,许多大肠杆菌携带一种广谱β内酰胺酶,可以水解盘尼西林和氨苄西林但不包括头孢菌素(FOX, TIO, AXO),并且会被克拉维酸抑制。其他的菌株可能有AmpCβ内酰胺酶,可以给予对几乎所有β内酰胺类和β内酰胺酶抑制剂的抵抗性。对于AMP的耐药率比其他β内酰胺类高,这也支持了不同β内酰胺类耐药性基因的传播。屠宰和零售规则网络中β内酰胺类的一致连接说明了鸡的尸体和零售肉上大肠杆菌出现对β内酰胺类耐药性基因的延续性。
从β内酰胺类、氨基糖苷类、硫代异噁唑和四环素耐药性中观察到的相关性,可能随着多重耐药流出泵发生,尽管一些耐药泵给予了所有抗生素种类的耐药性。如果对这些药物的耐药性基因被吸收到相同的可动遗传因子中,那么它们可能会有基因性链接,另外,连续或同时使用不同的抗生素,可能会形成耐药性基因关联。在加拿大,不同的MDR模式涉及到一种或者几种TET、SRT、和FIS,另外包括AMP或者全部的五种β内酰胺类,都被记录在鸡源大肠杆菌中。在1950年到2002年之间,人类和动物源的大肠杆菌分离菌也有类似的MDR模式,包含TET、STR、和FIS外加AMP或者AMP、AMC和头孢菌素。涉及到AMP与FIS、TET、STR或者GEN的关联规则,与AMP和头孢菌素或者其他抗生素种类的关联规则相比,显得更弱并且不频繁。这说明AmpC或者广谱β内酰胺酶与其他抗生素种类之间的共同耐药性基因,与类似TEM-1的β内酰胺酶基因和其他耐药性基因之间的共同耐药性相比会更多。
马尔科夫网络识别出一个涉及氨基糖苷类、磺酰胺类和四环素耐药性的子网络,β内酰胺类耐药性和这些药品种类之间的成对关联也被小LASSO惩罚所揭示。贝叶斯网络揭示了一个相似模式,即氨苄西林与一种β内酰胺类耐药性链接的网络和氨基糖苷类-磺酰胺类-四环素耐药性网络。涉及到GEN、FIS、STR和TET(不含β内酰胺酶)的MDR模式在加拿大鸡源大肠杆菌和美国早期的人类和动物源大肠杆菌分离菌中被识别到。这种关联规则分解图不包含一个单独的氨基糖苷类-磺酰胺类-四环素耐药性子网络,但包含了GEN、FIS、STR和TET耐药性与β内酰胺类耐药性单独链接的子网络。许多单独最优规则的确包含了那些前项中的相同抗生素,然而分解图只把每一种单独前项链接到后项,以减小图形密度。由于这些药品只与β内酰胺类在最有规则中出现,其他数据集中GEN-FIS-STR-TET的MDR模式可能反映出一种随机可能性,单独耐药性的耐药率比某个强共同耐药性还要高。
在美国,一些抗生素种类被批准使用在肉用仔鸡中:大环内酯类、氨基糖苷类、氨基香豆素、低聚糖抗生素、多肽、斑贝霉素、四环素、林可酰胺类、磺酰胺类和链霉杀阳菌素。氨基糖苷类和大环内酯类被认为对人类健康极度重要,林可酰胺类、磺酰胺类、链霉杀阳菌素和四环素为高度重要。低聚糖抗生素、氨基香豆素和斑贝霉素在人类健康中最近没有被使用。尽管β内酰胺类没有被批准在肉鸡中使用,涉及到β内酰胺类与磺酰胺类、四环素类以及氨基糖苷类的耐药性关联规则证明,β内酰胺类在鸡源大肠杆菌中的耐药率会通过其他受批准药物的使用而提升。
关联规则挖掘可以被用于任何大于几百个分离菌株的抗生素药敏数据集;在这个分析中最小的数据集只有299个分离菌株。当大量抗生素被检测时,这种技术非常有用,因为可能的MDR模式的数量随着被测药品的数量呈指数增长。作为探测医院中感染爆发的一种方法,关联规则挖掘先前曾被使用。这个任务中的规则包含大量的元数据,来自医院、临床部门和带有耐药性的病人或者细菌生物,将其作为后项。这些研究观察了杠杆效率、置信度和专家意见来决定那些规则是有意义的,以及何时感染爆发可能会发生。相反的,我们的方法集中于研究规则中的药品耐药性,以此探测MDR模式。我们采用了主成分分析方法来鉴别规则质量度量,这个方法说明了规则中最大数量的变量,并以此使我们可以选择最强、最有意义的规则。这种方法还可以用于临床数据,来探测医院或者社区感染中的MDR模式。与临床菌株相关联的元数据可以被MDR模式吸收为前项或者后项,来鉴别当地的耐药性趋势或者医院内的感染爆发。对抗生素管理工作或者感染空值的建议可以从这种关联规则中建立。
总之,关联规则挖掘是一个有效的工具,可以用来鉴别抗生素药敏检测数据中的多重耐药模式,评估这些模式的统计学和生物学意义。用于排列和区分规则的规则质量度量可以用重采样方法检测,以此把错误发现率降到最低。规则挖掘识别了涉及到β内酰胺类、磺胺异噁唑、四环素、庆大霉素和链霉素的一致耐药模式,利用了2004年到2012年之间分离自鸡尸体和肉的大肠杆菌。普遍的低规则重叠率说明,过度离散或者潜在变量造成了规则分解后的巨大方差。相反的,分解图中的密度稳定性和共同连接则表示,鸡源大肠杆菌中药品耐药性的潜在关联随着时间没有明显变化。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!