微信公众号

您当前的位置: 首页 > 资源详情

预测质粒序列实验室来源的新工具

编译者:陈方发布时间:2021-3-8点击量:293 来源栏目:研究开发

预测质粒序列实验室来源的新工具

随着合成生物学和基因工程技术的快速发展,科学界正尝试开发技术来识别DNA序列的来源实验室从而增强生物工程研究过程的透明度,减轻人们对生物安全问题的担忧。

2021年2月26日Nature Communications报道,美国莱斯大学计算机系的Todd Treangen团队开发了一种名为“PlasmidHawk”的用于质粒来源追踪的软件。该软件通过直接比对来自基因组数据集的未知字符串,并将其与合成生物学研究实验室常见或独特的泛基因组区域进行匹配。为了预测起源实验室,PlasmidHawk根据未分类序列与质粒全基因组之间的匹配区域对每个实验室进行评分,然后将未知序列分配给评分最低的实验室。

最近发表论文描述的通过循环神经网络(RNN)深度学习技术追踪序列来源,其单个来源实验室预测的准确性为70%。研究者使用相同的数据集进行训练,PlasmidHawk可以成功预测76%的未知序列的来源实验室,而85%的正确实验室都在前10位的候选名单中。与深度学习方法不同,PlasmidHawk减少了数据的预处理,在向现有项目中添加新序列时不需要重新培训。

事实证明,PlasmidHawk是一种可解释的、准确地预测质粒序列实验室起源的工具。此外,这个工具不仅可用于跟踪潜在有害的工程序列,而且还可用于保护质粒序列相关的知识产权。

吴晓燕 编译自https://www.sciencedaily.com/releases/2021/02/210226121249.htm

原文链接:https://www.nature.com/articles/s41467-021-21180-w

原文标题:PlasmidHawk improves lab of origin prediction of engineered plasmids using sequence alignment

原文题目

预测质粒序列实验室来源的新工具

提供服务:导出本资源

版权所有@2017中国科学院文献情报中心

制作维护:中国科学院文献情报中心信息系统部地址:北京中关村北四环西路33号邮政编号:100190