1.一种用于确定将应用于至少一种微生物菌株内的基因以改善表型性能的修饰的计算机实施的方法,所述方法包括:
至少部分地基于对至少一种微生物菌株中的第一组基因进行的第一基因修饰而存取第一表型性能数据;
使用计算装置至少部分地基于所述第一表型性能数据及所述第一基因修饰与第二基因修饰共有的至少一个修饰特征而预测所述第二基因修饰的第二表型性能;及
使用计算装置至少部分地基于所述第二表型性能而对待应用于第二组基因的所述第二基因修饰进行优先级排序,
其中,至少部分地基于所述优先级排序,可将所述第二基因修饰的至少一子集应用于至少一种微生物菌株内的基因。
2.根据权利要求1所述的方法,其中所述至少一个修饰特征包含本体类别。
3.根据权利要求1或2中任一权利要求所述的方法,其中所述至少一个修饰特征包含基因修饰类型。
4.根据权利要求3所述的方法,其中所述修饰类型包含启动子交换。
5.根据权利要求3所述的方法,其中所述修饰类型包含启动子交换的启动子强度。
6.根据权利要求5所述的方法,其中所述预测将中等强度启动子比将强启动子或弱启动子更重地加权。
7.根据权利要求5所述的方法,其中所述预测将弱启动子不如将强启动子及中等强度启动子那么重地加权。
8.根据权利要求3所述的方法,其中所述修饰类型是snp交换。
9.根据权利要求1或2中任一权利要求所述的方法,其中所述至少一个修饰特征包含对所述至少一种菌株中的至少两个基因的一或多个类型的修饰。
10.根据权利要求9所述的方法,其中所述预测将产生正性上位效应的所述一或多个类型的修饰更重地加权。
11.根据权利要求1或2中任一权利要求所述的方法,其中所述第二组基因不包含所述第一组基因内的任何基因。
12.根据权利要求2所述的方法,其中所述第二组基因内的基因子集内的基因各自为多个类别的成员,且预测第二表型性能包括基于每一基因所属的所述类别中的每一者的经预测表型性能的组合而预测复合第二表型性能。
13.根据权利要求2或12中任一权利要求所述的方法,其中所述第二组基因内的基因在至少一个共同类别中共享成员,且预测包括在共同类别为所述共同类别内的所有基因所属的唯一类别的情况下将所述相同第二表型性能分配到此些基因。
14.根据权利要求2所述的方法,其中所述第二组基因内的基因各自为唯一单个类别的成员。
15.根据权利要求2所述的方法,其中至少一个修饰特征包含来自第一分类系统的第一本体类别及来自第二分类系统的第二本体类别。
16.根据权利要求1所述的方法,其中所述至少一个修饰特征包含由至少一种微生物菌株合成的产物的特性。
17.根据权利要求1所述的方法,其中预测第二表型性能采用来自所述第一组基因的基因作为机器学习预测模型中的训练集。
18.根据权利要求1或2中任一权利要求所述的方法,其中
预测第二表型性能包括至少部分地基于所述第一表型性能数据而预测所述第二基因修饰的每类别富集概率;且
对所述第二基因修饰进行优先级排序是至少部分地基于所述经预测每类别富集概率的排名。
19.根据权利要求1所述的方法,其进一步包括:
至少部分地基于将所述第二基因修饰中的一或多个基因修饰应用于所述第二组基因内的基因而获得经更新第一表型性能数据;及
至少部分地基于所述经更新第一表型性能数据而预测所述第二基因修饰的子集的经更新第二表型性能;及
至少部分地基于所述经更新第二表型性能而对待应用于所述第二组基因的子集的所述第二基因修饰的所述子集进行优先级排序。
20.根据权利要求1所述的方法,其包括基于从将所述第二基因修饰中的一或多个基因修饰迭代地应用于所述第二组基因内的基因获得的表型性能数据而迭代地更新待应用于所述第二组基因内的基因子集的所述第二基因修饰的修饰子集的优先级排序。
21.根据权利要求2所述的方法,其中所述至少一个修饰特征包含基因本体分类内的不同抽象级别。
22.根据权利要求2所述的方法,其中所述至少一个修饰特征包含基于代谢网络的分类。
23.根据权利要求1所述的方法,其中所述至少一个修饰特征与至少一种微生物菌株特性相关。
24.根据权利要求1所述的方法,其中所述第二组基因驻存于与所述第一组基因驻存于其中的所述至少一种微生物菌株不同的至少一种微生物菌株内。
25.根据权利要求24所述的方法,其中所述第一表型性能数据与由所述第一组基因驻存于其中的所述至少一种微生物菌株产生的第一产物的至少一个特性相关,且所述第二表型性能与不同于所述第一产物的第二产物的至少一个特性相关。
26.根据权利要求25所述的方法,其中所述第二产物是由与所述第一组基因驻存于其中的所述至少一种微生物菌株不同的至少一种微生物菌株产生。
27.一种微生物菌株,其包括通过根据权利要求1到26中任一权利要求所述的方法按优先级排序的一或多个第二基因修饰。
28.一种微生物菌株,其包括应用于权利要求19所述的所述第一组基因中的基因的第一基因修饰。
29.根据权利要求28所述的微生物菌株,其进一步包括经优先级排序为高于阈值优先级排序且应用于所述第二组基因中的至少一个基因的第二基因修饰。
30.根据权利要求29所述的微生物菌株,其中相比于响应于所述优先级排序是基于所述经预测第二表型性能,响应于所述优先级排序是基于所述经预测的经更新第二表型性能而将所述经应用基因修饰按优先级排序为更高。
31.根据权利要求1所述的方法,其中所述至少一个修饰特征表示以下本体类别中的至少一者:
从头开始的ctp生物合成过程,
3-异丙基苹果酸脱水酶活性,
4铁,
4硫簇结合,
atp结合,
dna结合,
dna拓扑异构酶活性,
dnai型拓扑异构酶活性,
dna拓扑改变,
以dna为模板,
l-天冬氨酸:2-氧戊二酸酯氨基转移酶活性,
l-苯丙氨酸:2-氧戊二酸酯氨基转移酶活性,
nadh脱氢酶活性,
ump激酶活性,
乙酰乳酸合酶活性,
腺苷酸环化酶活性,
醇脱氢酶(nad)活性,
氨基酸结合,
芳香族化合物生物合成过程,
生物合成过程,
支链氨基酸生物合成过程,
camp生物合成过程,
催化活性,
细胞氨基酸生物合成过程,
细胞组分组织或生物发生,
细胞大分子生物合成过程,
细胞氮化合物生物合成过程,
细胞过程,
染色体组织,
密码子特异性的,
环状核苷酸生物合成过程,
杂环生物合成过程,
细胞内信号转导,
离子转运,
铁-硫簇结合,
异构酶活性,
激酶活性,
亮氨酸生物合成过程,
裂解酶活性,
代谢过程,
金属离子结合,
核苷酸结合,
核苷酸磷酸化,
有机酸生物合成过程,
氧化还原过程,
氧化还原酶活性,
磷-氧裂解酶活性,
磷酸化,
钾离子转运,
蛋白水解,
含嘌呤的化合物代谢过程,
磷酸吡哆醛结合,
嘧啶核苷酸生物合成过程,
含嘧啶的化合物代谢过程,
细胞生物合成过程调控,
转录调控,
序列特异性dna结合,
丝氨酸型内肽酶活性,
信号转导蛋白活性,
信号转导,
小分子代谢过程,
转氨酶活性,
转录,
转录因子活性,
转移酶活性,
翻译,
翻译释放因子活性,
翻译终止,
转运,
尿苷酸激酶活性,
dna代谢过程,
生物合成过程,
细胞氨基酸代谢过程,
代谢过程,
含核碱基的化合物代谢过程,
翻译,或
转运。