改进的乙酰
‑
coa羧化酶变体
1.本技术是申请日为2014年9月12日、发明名称为“改进的乙酰
‑
coa羧化酶变体”的中国发明专利申请no.201480050054.7的分案申请。
2.对相关申请的交叉引用
3.本技术要求2013年9月13日提交的美国临时申请no.61/877418和2013年10月17日提交的美国临时申请no.61/892242的利益,在此通过引用将它们的全部公开内容合并入本文。
4.序列表
5.本技术含有序列表,所述序列表已通过efs
‑
web以ascii形式提交,通过引用将该序列表的全文合并入本文。所述ascii拷贝于2014年9月12日建立,名为ls00050pct_sl.txt,大小为128,259字节。
技术领域
6.本公开涉及用于生产丙二酰
‑
coa衍生化合物的乙酰
‑
coa羧化酶(acc)变体,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物。进一步涉及表达acc变体的宿主细胞和相关的细胞培养物。还包括通过使用表达acc变体的宿主细胞生产丙二酰
‑
coa衍生化合物的方法。
背景技术:7.石油是地球上发现的液体、气体或固体形式的有限的天然资源。但是,开发石油产品的成本相当大,不管是在财政上还是在环境上。从地球开采的天然形式的原油几乎没有商业用途。它是不同长度和复杂度的碳氢化合物,例如链烷烃(或烷),烯烃(或烯),炔,环烷烃(或环烷),脂肪族化合物,芳香族化合物等的混合物。此外,原油含有其它有机化合物(例如含有氮、氧、硫等的有机化合物)和杂质(例如硫、盐、酸、金属等)。由于其高能量密度及其易于运输性,大部分石油被精炼成燃料,例如运输燃料(例如汽油、柴油、航空燃料等),燃料油,液化石油气等。
8.石化产品可用于制造专用化学品,例如塑料、树脂、纤维、弹性体、药物、润滑剂或凝胶。专用化学品具有许多商业用途。可以由石化产品原料生产的专用化学品的实例包括脂肪酸、碳氢化合物(例如长链碳氢化合物、支链碳氢化合物、饱和碳氢化合物、不饱和碳氢化合物等)、脂肪醇、脂肪酯、脂肪醛、酮、润滑剂等。脂肪酸在商业上被用作表面活性剂。表面活性剂可以,例如在去垢剂和肥皂中找到。脂肪酸还可以被用作燃料、润滑油、涂料、油漆、蜡烛、起酥油、化妆品和乳化剂中的添加剂。此外,脂肪酸在橡胶产品中被用作加速活化剂。脂肪酸还可以被用作给料,以生产甲酯、酰胺、胺、酰基氯、酸酐、乙烯酮二聚体、过氧酸和酯。
9.脂肪酯具有许多商业用途。例如,生物柴油,一种替代燃料,由酯(例如脂肪酸甲酯(fame)、脂肪酸乙酯(faee)等)组成。一些低分子量的酯是易挥发的,具有令人愉悦的气味,这使它们可以用作香料或调味剂。此外,酯可用作油漆、涂料和清漆的溶剂。而且,一些天然存在的物质,例如蜡、脂肪和油,是由酯组成的。酯还可以用作树脂和塑料中的软化剂,汽油
和油中的增塑剂、阻燃剂和添加剂。此外,酯可以用来制造聚合物、薄膜膜、纺织品、染料和药物。
10.类似地,脂肪醇具有许多商业用途。例如,脂肪醇和它们的衍生物在全球每年的销售超过十亿美元。短链脂肪醇在化妆品和食品工业中用作乳化剂、润肤剂和增稠剂。由于其两性性质,脂肪醇表现为非离子型表面活性剂,它们在个人护理用品和日用品中是有用的,例如去垢剂。此外,脂肪醇用于蜡、胶、树脂、药液、润滑油添加剂、纺织品抗静电和整理剂、增塑剂、化妆品、工业溶剂和用于脂肪的溶剂中。
11.乙酰coa羧化酶(acc)在调节脂肪酸合成和降解中具有重要的作用。它是依赖于生物素的酶复合物,催化脂肪酸生物合成的第一个关键步骤,即乙酰
‑
coa的不可逆羧化形成丙二酰
‑
coa。acc通过它的两种催化活性,即生物素羧化酶(bc)和羧基转移酶(ct)产生丙二酰
‑
coa。在大部分原核生物中,acc是多亚基酶,包括四个多肽(亚基),它们由不同的基因编码,它们的协调表达通过多水平上的调控来控制(cronan et al.(2002)progress inlipid research41:407
‑
435;james et al.(2004)journal of biological chemistry 279(4):2520
‑
2527)。acc的四个多肽以固定的比例组装成复合物(broussard et al.(2013)structure21:650
‑
657)。更具体地说,acc反应需要四种蛋白,即生物素羧化酶(bc)、生物素基(或生物素)羧基载体蛋白(bccp)和两个形成羧基转移酶(ct)的蛋白。可以通过依赖于atp的酸不稳定的nah
14
co3向酸稳定的丙二酸的转化来测定整个acc反应。细菌和植物质体的acc亚基之间存在相似性和差异。但是,尽管植物蛋白的复杂度高,其acc活性所必不可少的序列与细菌同源物之间没有明显差异(cronan et al.,见上文)。
12.已报道大肠杆菌acc是已知acc酶中最不稳定的。仅在所有四个亚基都以高浓度存在时才能测量整体活性,虽然在稀释蛋白溶液中可以测量两个分步反应。稳定复合物被认为是bc复合物和ctα2β2复合物。全长bccp已被纯化为二聚体,并且有迹象表明存在不稳定的bc2‑
bccp2复合物。其它细菌accs似乎比大肠杆菌accs更稳定,且可以在幽门螺杆菌(helicobacter pylori)和香茅醇假单胞菌(pseudomonas citronellolis)的稀释提取物中测量acc活性。此外,植物质体accs似乎比大肠杆菌accs更稳定。但是,与大肠杆菌一样,完整酶的进一步纯化导致解离和acc活性的损失,acc活性可以通过混合含有部分反应活性的级分而恢复。子复合物是bc
‑
bccp和ct,且没有证据表明存在游离的完整bccp或游离的ctβ,这表明bccp和ctβ当游离于溶液中时被降解了(cronan et al.,见上文)。
13.包括acca、accb、accc和accd在内的大肠杆菌acc基因的鉴别有利于研究acc蛋白。辐射自杀筛选(radiat ion suicide select ions)已被用于分离脂肪酸合成中的突变体,包括在分别编码acc亚基bccp和ctβ的基因accb和accd上的突变体。accb突变体已经被更广泛地研究,突变g133s对温度敏感生长起决定作用。这种突变导致生物素域(biot inoyl domain)内的空间位阻(steric clash)。得到的这种突变蛋白在较高的温度下容易变性,并因此对细胞内蛋白酶敏感。突变bccp株在生长时,仅有正常水平的大约25%的bccp,但是生长速率和脂肪酸合成是正常的(cronan et al.,见上文)。但是,已知增加acc的所有四种蛋白的浓度可以在某种程度上改善通过脂肪酸合成的通量(davis et al.(2000)journal of biological chemistry275(37):28593
‑
28598)。相反,已显示大肠杆菌acc可以被acp的酰化衍生物抑制,而缺少酰基部分的acp不能抑制acc(davies et al.(2001)journal of bacteriology 183(4):1499
‑
1503)。
14.需要替代方法生成目前来源于汽油的燃料和产物。因此,微生物系统为多种类型的生物燃料和化学品的生物生产提供了可能性。可再生燃料和化学品可以来自于基因工程生物体(例如细菌、酵母和藻类)。可以从基因上改变天然存在的生物合成途径,以使基因工程生物体合成可再生燃料和化工产品。此外,可以定制微生物,或对微生物进行代谢上的工程化,以利用不同的碳源作为给料生产燃料和化工产品。因此,将acc工程化,以使它在重组宿主细胞中表达时,生产更高产率的丙二醇衍生化合物(例如,脂肪酯、脂肪醇和其它脂肪酸衍生物,以及非脂肪酸化合物)是合乎需要的。
15.虽然本领域中有研究进展,仍然需要在基因修饰的酶、重组宿主细胞、方法和系统上进行改进,以稳健地、节约成本地通过重组宿主细胞的发酵生产燃料和化学品。本公开通过提供acc变体满足了该需求,所述acc变体增加丙二醇衍生化合物的产率和滴度。
16.发明简述
17.本公开的一个方面提供在其氨基酸序列中具有至少一个突变的变体生物素羧基载体蛋白(bccp)。在一个特定方面,本公开提供在其氨基酸序列中包含至少一个突变的变体生物素羧基载体蛋白(bccp),其中所述变体bccp具有来自下述任何一个或多个序列识别号的多肽序列,所述序列识别号包括seq id nos:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88和90。在一个实施方案中,与相应的野生型细胞相比,变体bccp赋予细胞增加的丙二酰
‑
coa
‑
衍生化合物生产。在另一个实施方案中,当在细胞中表达变体bccp时,可以赋予提高的乙酰
‑
coa羧化酶(acc)活性,导致与相应的野生型细胞相比,丙二酰
‑
coa
‑
衍生化合物的生产增加。丙二酰
‑
coa
‑
衍生化合物包括,但不限于,脂肪酸衍生物例如游离脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物(例如,ω
‑
羟基脂肪酸、ω
‑
羟基二醇、ω
‑
羟基fame、ω
‑
羟基faee)、不饱和脂肪酸衍生物,以及不基于脂肪酸的化合物例如黄烷酮和/或类黄酮、聚酮化合物和3
‑
羟基丙酸。
18.本公开的另一个方面提供在其氨基酸序列中具有至少一个突变的变体生物素羧基载体蛋白(bccp),其中所述突变是在n
‑
末端氨基酸区域中。在一个实施方案中,突变在seq id no:2的氨基酸位置2上。在另一个实施方案中,与相应的野生型细胞相比,变体bccp赋予细胞增加的丙二酰
‑
coa
‑
衍生化合物生产。在另一个实施方案中,当在细胞中表达变体bccp时,可以赋予提高的乙酰
‑
coa羧化酶(acc)活性,导致与相应的野生型细胞相比,丙二酰
‑
coa
‑
衍生化合物的生产增加。
19.本公开的另一个方面提供在其氨基酸序列中具有至少一个突变的变体生物素羧基载体蛋白(bccp),其中所述变体bccp选自seq id nos:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88和/或90。在一个实施方案中,与相应的野生型细胞相比,变体bccp赋予细胞增加的丙二酰
‑
coa
‑
衍生化合物生产。在另一个实施方案中,当在细胞中表达变体bccp时,可以赋予提高的乙酰
‑
coa羧化酶(acc)活性,导致与相应的野生型细胞相比,丙二酰
‑
coa
‑
衍生化合物的生产增加。
20.本公开的另一个方面提供由变体accb基因或accb核酸序列编码的变体bccp,其中所述核酸序列选自seq id nos:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、
nos:93、94、95或96或它们的变体。
24.本公开进一步提供包含变体操纵子的重组微生物或宿主细胞,所述变体操纵子控制bccp的表达。在一个实施方案中,操纵子导致bccp表达的改变。在一个实施方案中,操纵子导致重组细胞中bccp的表达增加,并由此提高重组细胞中乙酰
‑
coa羧化酶(acc)的活性,导致与相应的野生型细胞相比丙二酰
‑
coa
‑
衍生化合物的生产增加。在另一个实施方案中,变体操纵子进一步包括启动子。
25.本公开的另一个方面提供生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养表达变体bccp的微生物或宿主细胞。在一个实施方案中,细胞是分别可与野生型微生物或野生型宿主细胞形成对比或者分别可与它们相比较的重组微生物或重组宿主细胞。在另一个实施方案中,细胞本质上是微生物(microbial in nature)。丙二酰
‑
coa
‑
衍生化合物包括脂肪酸衍生物,例如,脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物(例如,ω
‑
羟基脂肪酸、ω
‑
羟基二醇、ω
‑
羟基fame、ω
‑
羟基faee)、不饱和脂肪酸衍生物;以及不基于脂肪酸的化合物例如黄烷酮和/或类黄酮、聚酮化合物和3
‑
羟基丙酸。
26.本公开的另一个方面提供生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养表达变体bccp和变体操纵子的宿主细胞。在一个实施方案中,细胞是分别可与野生型微生物或野生型宿主细胞形成对比或者分别可与它们相比较的重组微生物或重组宿主细胞。在另一个实施方案中,细胞本质上是微生物(microbial in nature)。丙二酰
‑
coa
‑
衍生化合物包括脂肪酸衍生物,例如,脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物(例如,ω
‑
羟基脂肪酸、ω
‑
羟基二醇、ω
‑
羟基fame、ω
‑
羟基faee)、不饱和脂肪酸衍生物;以及不基于脂肪酸的化合物例如黄烷酮和/或类黄酮、聚酮化合物和3
‑
羟基丙酸。
27.本公开进一步涉及包含变体生物素羧基载体蛋白(bccp)的微生物,所述变体生物素羧基载体蛋白(bccp)在其氨基酸序列中具有至少一个突变。在一个实施方案中,变体bccp具有在n
‑
末端氨基酸区域中的突变。在另一个实施方案中,突变是取代。在不同的实施方案中,取代是天冬氨酸(d)取代成天冬酰胺(n);或天冬氨酸(d)取代成组氨酸(h);或天冬氨酸(d)取代成异亮氨酸(i);或天冬氨酸(d)取代成苏氨酸(t);或天冬氨酸(d)取代成丝氨酸(s);或天冬氨酸(d)取代成酪氨酸(y);或天冬氨酸(d)取代成精氨酸(r);或天冬氨酸(d)取代成亮氨酸(l);或天冬氨酸(d)取代成谷氨酰胺(q);或天冬氨酸(d)取代成谷氨酸(g)。在另一个实施方案中,变体bccp具有seq id no:6,其包含具有突变的多肽,所述突变包括天冬氨酸(d)取代成天冬酰胺(n)。在另一个实施方案中,变体bccp具有seq id no:4或seq id no:8,其包含具有突变的多肽,所述突变包括天冬氨酸(d)取代成组氨酸(h)。在另一个实施方案中,变体bccp具有seq id no:10或seq id no:12,其包含具有突变的多肽,所述突变包括天冬氨酸(d)取代成异亮氨酸(i)。在另一个实施方案中,变体bccp的表达赋予微生物增加的丙二酰
‑
coa
‑
衍生化合物生产。在另一个实施方案中,变体bccp的表达可以赋予微生物中的提高的乙酰
‑
coa羧化酶(acc)活性,导致微生物的丙二酰
‑
coa
‑
衍生化合物生产增加。丙二酰
‑
coa
‑
衍生化合物包括,但不限于,脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物、不饱和脂肪酸衍生物、黄烷酮、类黄酮、聚酮化合物和3
‑
羟基丙酸。在一个实施方案中,丙二酰
‑
coa
‑
衍生化合物是
fame或faee。在另一个实施方案中,丙二酰
‑
coa
‑
衍生化合物是脂肪醇。在另一个实施方案中,微生物(microorganism)是微生物细胞(microbial cel l)。在另一个实施方案中,微生物细胞是重组细胞。微生物细胞的实例包括,但不限于,来自埃希氏杆菌属(escherichia)、芽孢杆菌属(bacillus)、蓝藻门(cyanophyta)、乳杆菌属(lactobacillus)、发酵单胞菌属(zymomonas)、红球菌属(rhodococcus)、假单胞菌属(pseudomonas)、曲霉属(aspergillus)、木霉属(trichoderma)、脉孢菌属(neurospora)、镰刀菌属(fusarium)、腐质霉属(humicola)、根毛霉属(rhizomucor)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、毛霉属(mucor)、蚀丝霉属(myceliophtora)、青霉属(penicillium)、显革菌属(phanerochaete)、侧耳属(pleurotus)、栓菌属(trametes)、金孢霉属(chrysosporium)、酵母属(saccharomyces)、寡养单胞菌属(stenotrophamonas)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)和链霉菌属(streptomyces)的微生物。在一个实施方案中,微生物细胞来自于埃希氏杆菌属。在一个实施方案中,微生物细胞来自于大肠杆菌。在另一个实施方案中,微生物细胞来自于蓝细菌或蓝藻门属。在另一个实施方案中,微生物细胞来自于蓝细菌或蓝藻,包括但不限于,原绿球藻(prochlorococcus)、聚球藻(synechococcus)、集胞藻(synechocystis)、蓝杆藻(cyanothece)和点状念球藻(nostoc punctiforme)。在另一个实施方案中,微生物细胞来自于具体的蓝细菌物种,包括但不限于细长聚球藻(synechococcus elongatus)pcc7942、集胞藻(synechocystis sp.)pcc6803和聚球藻(synechococcus sp.)pcc7001。
28.本发明的另一方面提供具有核酸序列表达的改变的表达的重组微生物,所述核酸序列包括accb或accc或它们的组合,其导致所述微生物的丙二酰
‑
coa
‑
衍生化合物生产改变。在一个实施方案中,改变的表达是增加的表达。在另一个实施方案中,改变的表达是减少的表达。在另一个实施方案中,改变的表达是由于驱动所述核酸序列表达的一个或多个启动子的改变。accb的核酸序列编码bccp。在一个实施方案中,accb的变体核酸序列编码变体bccp。在一个实施方案中,丙二酰
‑
coa
‑
衍生化合物包括,但不限于,脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物、不饱和脂肪酸衍生物、黄烷酮、类黄酮、聚酮化合物和3
‑
羟基丙酸。在一个实施方案中,微生物包括,但不限于,来自埃希氏杆菌属(escherichia)、芽孢杆菌属(bacillus)、蓝藻门(cyanophyta)、乳杆菌属(lactobacillus)、发酵单胞菌属(zymomonas)、红球菌属(rhodococcus)、假单胞菌属(pseudomonas)、曲霉属(aspergillus)、木霉属(trichoderma)、脉孢菌属(neurospora)、镰刀菌属(fusarium)、腐质霉属(humicola)、根毛霉属(rhizomucor)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、毛霉属(mucor)、蚀丝霉属(myceliophtora)、青霉属(penicillium)、显革菌属(phanerochaete)、侧耳属(pleurotus)、栓菌属(trametes)、金孢霉属(chrysosporium)、酵母属(saccharomyces)、寡养单胞菌属(stenotrophamonas)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)或链霉菌属(streptomyces)的微生物。在一个实施方案中,微生物细胞来自于埃希氏杆菌属。在一个实施方案中,微生物细胞来自于大肠杆菌。在另一个实施方案中,微生物细胞来自于蓝细菌或蓝藻门属。在另一个实施方案中,微生物细胞是来自于原绿球藻(prochlorococcus)、聚球藻(synechococcus)、集胞藻(synechocystis)、蓝杆藻(cyanothece)和点状念球藻(nostocpunctiforme)的蓝细菌或蓝
藻。在一个实施方案中,微生物是来自于细长聚球藻(synechococcus elongatus)pcc7942、集胞藻(synechocystis sp.)pcc6803和聚球藻(synechococcus sp.)pcc7001的具体蓝细菌物种。
29.本公开的另一个方面提供具有acc变体的改变的表达的,并且进一步表达脂肪酸生物合成蛋白的微生物或宿主细胞。在一个实施方案中,宿主细胞是微生物细胞。在另一个实施方案中,宿主细胞是重组细胞。在另一个实施方案中,宿主细胞是重组细菌细胞。在另一个实施方案中,acc变体是生物素羧基载体蛋白(bccp)或生物素羧化酶(bc)或它们的组合。在一个实施方案中,改变的表达是增加或减少的表达。在一个实施方案中,改变的表达是增加的表达,其中增加的表达导致在存在碳源的条件下培养所述微生物细胞时,丙二酰
‑
coa
‑
衍生化合物生产增加。
30.在本公开的特定实施方案中,宿主细胞可以进一步表达具有酶活性并能增加脂肪酸衍生物生产的生物合成蛋白。在一个实施方案中,具有酶活性的蛋白可以是天然存在于宿主细胞中,并且它的基因可以通过启动子或其它基因改变而被过表达。在另一个实施方案中,具有酶活性的蛋白可以是在宿主细胞中表达外源或异源基因的结果。这种酶活性的实例包括,但不限于,硫酯酶活性(e.c.3.1.2.*或e.c.3.1.2.14或e.c.3.1.1.5)、酯合酶活性(e.c.2.3.1.75)、酰基
‑
acp还原酶(aar)活性(e.c.1.2.1.80)、醇脱氢酶活性(e.c.1.1.1.1.)、脂肪醇酰基
‑
coa还原酶(far)活性(e.c.1.1.1.*)、羧酸还原酶(car)活性(ec 1.2.99.6)、脱羰基酶或脱甲酰基酶活性、酰基
‑
coa还原酶活性(e.c.1.2.1.50)、酰基
‑
coa合酶(fadd)活性(e.c.2.3.1.86)、olea活性和olebcd活性。
31.在另一个方面,本公开提供具有acc变体的改变的表达的,并且进一步表达脂肪酸生物合成蛋白的微生物或宿主细胞,其中改变的表达是增加的表达,所述增加的表达导致在存在碳源的条件下培养所述细胞时,丙二酰
‑
coa
‑
衍生化合物生产增加。在一个实施方案中,宿主细胞是微生物细胞。在另一个实施方案中,宿主细胞是重组细胞。在另一个实施方案中,宿主细胞是重组细菌细胞。在另一个实施方案中,微生物或宿主细胞是在相同条件下可以与野生型细胞相比较或者与之形成对比的重组细胞。本文中丙二酰
‑
coa
‑
衍生化合物包括,但不限于,脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物、不饱和脂肪酸衍生物、黄烷酮、类黄酮、聚酮化合物和3
‑
羟基丙酸。在一个实施方案中,微生物细胞选自埃希氏杆菌属(escherichia)、芽孢杆菌属(bacillus)、蓝藻门(cyanophyta)、乳杆菌属(lactobacillus)、发酵单胞菌属(zymomonas)、红球菌属(rhodococcus)、假单胞菌属(pseudomonas)、曲霉属(aspergillus)、木霉属(trichoderma)、脉孢菌属(neurospora)、镰刀菌属(fusarium)、腐质霉属(humicola)、根毛霉属(rhizomucor)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、毛霉属(mucor)、蚀丝霉属(myceliophtora)、青霉属(penicillium)、显革菌属(phanerochaete)、侧耳属(pleurotus)、栓菌属(trametes)、金孢霉属(chrysosporium)、酵母属(saccharomyces)、寡养单胞菌属(stenotrophamonas)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)或链霉菌属(streptomyces)的细胞。
32.本公开的另一个方面提供具有seq id no:6的变体生物素羧基载体蛋白(bccp)。在一个实施方案中,突变是在n
‑
末端氨基酸区域内天冬氨酸(d)被取代成天冬酰胺(n),其中所述取代是在氨基酸位置2上。在另一个实施方案中,变体bccp由变体accb基因编码,其
中变体accb基因具有seq id no:5的核酸序列。本公开的另一个方面提供具有seq id no:4或seq id no:8的变体生物素羧基载体蛋白(bccp)。在一个实施方案中,突变是在n
‑
末端氨基酸区域内天冬氨酸(d)被取代成组氨酸(h),其中所述取代是在氨基酸位置2上。在另一个实施方案中,变体bccp由变体accb基因编码,其中变体accb基因分别具有seq id no:3或seq id no:7的核酸序列。本公开的另一个方面提供具有seq id no:10或seq id no:12的变体生物素羧基载体蛋白(bccp)。在一个实施方案中,突变是在n
‑
末端氨基酸区域内天冬氨酸(d被)取代成异亮氨酸(i),其中所述取代是在氨基酸位置2上。在另一个实施方案中,变体bccp由变体accb基因编码,其中变体accb基因分别具有seq id no:9或seq id no:11的核酸序列。
33.在不同的实施方案中,当与相应的野生型细胞相比时,不同的bccps赋予重组细胞增加的丙二酰
‑
coa
‑
衍生化合物生产,其中所述丙二酰
‑
coa
‑
衍生化合物包括脂肪酸衍生物,其是脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物;或非脂肪酸化合物例如黄烷酮、类黄酮、聚酮化合物和3
‑
羟基丙酸。本公开进一步包括微生物,所述微生物包括或表达变体bccps。在一些实施方案中,微生物选自埃希氏杆菌属(escherichia)、芽孢杆菌属(bacillus)、蓝藻门(cyanophyta)、乳杆菌属(lactobacillus)、发酵单胞菌属(zymomonas)、红球菌属(rhodococcus)、假单胞菌属(pseudomonas)、曲霉属(aspergillus)、木霉属(trichoderma)、脉孢菌属(neurospora)、镰刀菌属(fusarium)、腐质霉属(humicola)、根毛霉属(rhizomucor)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、毛霉属(mucor)、蚀丝霉属(myceliophtora)、青霉属(penicillium)、显革菌属(phanerochaete)、侧耳属(pleurotus)、栓菌属(trametes)、金孢霉属(chrysosporium)、酵母属(saccharomyces)、寡养单胞菌属(stenotrophamonas)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)或链霉菌属(streptomyces)的微生物。
34.进一步涉及生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养表达变体bccp的重组微生物。由该方法生产的丙二酰
‑
衍生化合物脂肪酸衍生物,包括脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物;或非脂肪酸化合物例如黄烷酮、类黄酮、聚酮化合物和3
‑
羟基丙酸。
35.附图简述
36.当与附图结合阅读时,本公开的内容得到最好的理解,所述附图用于举例说明优选实施方案。然而,应当理解,公开内容并不限于附图中公开的具体实施方案。
37.图1是工程化生化途径的一个实施方案的示意图,所述工程化生化途径涉及乙酰
‑
coa羧化酶(acc)变体例如变体生物素羧基载体蛋白(bccp)。如图所示,当在细胞中表达bccp时,bccp可以赋予提高的乙酰
‑
coa羧化酶(acc)活性。这可以导致增加的丙二酰
‑
coa和酰基
‑
acp的生产,其接下来可以导致增加的丙二酰
‑
coa
‑
衍生化合物的生产,所述丙二酰
‑
coa
‑
衍生化合物包括,例如,脂肪酸衍生物例如脂肪酯、脂肪醛、脂肪醇、脂肪酸和其它脂肪酸衍生物。
38.图2显示了来自七个不同物种的bccp的七种氨基酸序列的比对。方框区域显示在大部分bccp种类上保守的基序。
39.图3是工程化生化途径的另一个实施方案的示意图,所述工程化生化途径涉及乙酰
‑
coa羧化酶(acc)变体例如变体生物素羧基载体蛋白(bccp)。如图所示,当在细胞中表达bccp时,bccp可以赋予提高的乙酰
‑
coa羧化酶(acc)活性。这可以导致增加的丙二酰
‑
coa和酰基
‑
coa的生产,其接下来可以导致增加的丙二酰
‑
coa
‑
衍生化合物的生产,所述丙二酰
‑
coa
‑
衍生化合物包括,例如,脂肪酸衍生物例如脂肪酯、脂肪醛、脂肪醇、脂肪酸和其它脂肪酸衍生物。
40.图4是工程化生化途径的几个实施方案的概括,所述工程化生化途径涉及乙酰
‑
coa羧化酶(acc)变体例如变体生物素羧基载体蛋白(bccp)。如图所示,当在细胞中表达bccp时,bccp可以赋予提高的乙酰
‑
coa羧化酶(acc)活性。这可以导致增加的丙二酰
‑
coa和丙二酰
‑
coa衍生化合物的生产,所述丙二酰
‑
coa衍生化合物包括聚酮化合物、3
‑
羟基丙酸(3
‑
hp)、黄烷酮和类黄酮;以及导致增加的中间产物,例如,增加的酰基
‑
coa(还参见图3);增加的酰基
‑
acp(还参见图1),以及增加的丙二酸盐(或丙二酸)。增加的中间产物可以进一步导致增加的终产物例如脂肪酸衍生物,包括脂肪酯、脂肪醛、脂肪醇和其它脂肪酸衍生物。
41.图5显示了描述在大肠杆菌宿主细胞中表达不同的bccp变体(在accb基因的位置2上)导致的fas滴度(fame)的图。wt是野生型acc复合物的对照。这些bccp变体中的一些将fas滴度提高了超过5倍(还参见表1)。
42.发明详述
43.一般性概述
44.本公开涉及能在微生物中表达的变体乙酰
‑
coa羧化酶(acc)多肽或acc变体。这些acc变体在基因上被改变,并且被认为赋予提高的酶活性,可以增加丙二酰
‑
coa衍生化合物包括脂肪酸衍生物的生产。在本文中,本公开涉及多肽和蛋白,与野生型细胞中的相应acc活性相比,当在宿主细胞中表达所述多肽和蛋白时,可以导致提高的乙酰
‑
coa羧化酶(acc)活性。为了对此进行举例说明,通过在一个acc基因中以及在一个acc操纵子中引入突变来改变acc基因。这些改变都可以在宿主细胞中独立地增加脂肪酸衍生物的产生。预期这些突变提高衍生自丙二酰
‑
coa的产物的滴度和生产,所述产物包括但不限于脂肪酸衍生化合物(即,脂肪酸衍生物)例如,脂肪酸、脂肪酯、脂肪醇、脂肪醛、脂肪胺、双功能脂肪酸衍生物和不基于脂肪酸的化合物例如黄烷酮和类黄酮、聚酮化合物和3
‑
羟基丙酸。脂肪酯的实例是脂肪酸甲酯(fame)和脂肪酸乙酯(faee)。双功能脂肪酸衍生物的实例包括,但不限于,ω
‑
羟基脂肪酸、ω
‑
羟基二醇、ω
‑
羟基fame和ω
‑
羟基faee。
45.已确定为了产生较高产率的丙二酰
‑
coa衍生化合物,需要增加编码完整acc复合物的所有四种acc基因的表达(davis et al.(2000),见上文)。然而,本公开令人惊讶地发现,在仅仅一个acc基因中进行靶向突变可以提高衍生自丙二酰
‑
coa的化合物,包括脂肪酸衍生物的生产。例如,在accb基因中的靶向突变和/或在accbc操纵子中的靶向表达改变明显将脂肪酸酯的生产提高了达630%(参见图5以及下面的表1和实施例)。不希望受到理论的束缚,认为变体acc多肽或acc变体直接或间接地赋予acc复合物提高的酶活性,其导致宿主细胞中衍生自丙二酰
‑
coa的化合物的更高的生产。认为宿主细胞的特定活性增加,由此导致增加的丙二酰
‑
coa衍生化合物的生产。这种丙二酰
‑
coa衍生化合物包括脂肪酸衍生物和不基于脂肪酸的化合物。
46.定义
47.如本说明书和所附权利要求中所使用的,单数形式“一(a)”、“一(an)”和“这(the)”包括复数引用,除非上下文另外明确指出。因此,例如,提及“一种宿主细胞”包括两种或更多种这样的宿主细胞,提及“一种脂肪酯”包括一种或多种脂肪酯,或酯的混合物,提及“一种核酸序列”包括一种或多种核酸序列,提及“一种酶”包括一种或多种酶,诸如此类。
48.本说明书中通篇所述的序列登录号获自美国国立卫生研究院(national insti tutes of health,u.s.a.)维护的ncbi(nat ional center for biotechnology informat ion)提供的数据库(在本文中被称为“ncbi登录号”或者被称为“genbank登录号”,或者简单地被称为“登录号”),以及获自瑞士生物信息学研究所(swiss insti tute of bioinformat ics)提供的uniprot knowledgebase(uniprotkb)和swiss
‑
prot数据库(在本文中被称为“uniprotkb登录号”)。
49.酶分类(ec)号由国际生物化学和分子生物学联盟命名委员会(nomenclature committee of the internat ional union of biochemistry and molecular biology(iubmb))制定,其相关描述可以在互联网的iubmb酶命名网站获取。ec编号根据所催化的反应对酶进行分类。例如,乙酰
‑
coa羧化酶(acc)酶活性被分类为e.c.6.4.1.2。acc是存在于大部分原核生物和大部分植物和藻类的叶绿体中的多亚基酶复合物。acc催化atp和乙酰
‑
coa和hco3‑
反应生成adp和磷酸盐和丙二酰
‑
coa。acc的功能在大部分原核生物中在物种之间是保守的。因此,不同的微生物物种可能携带相同的被分类为e.c.6.4.1.2的乙酰
‑
coa羧化酶(acc)的酶活性。
50.如本文所述的,术语“核苷酸”指多核苷酸的单体单元,它由杂环碱基、糖和一个或多个磷酸基团组成。天然存在的碱基(鸟嘌呤(g)、腺嘌呤(a)、胞嘧啶(c)、胸腺嘧啶(t)和尿嘧啶(u))通常是嘌呤或嘧啶的衍生物,虽然应当理解还包括天然和非天然存在的碱基类似物。天然存在的糖是戊糖(五碳糖)脱氧核糖(其形成dna)或核糖(其形成rna),尽管应当理解还包括天然和非天然存在的糖类似物。核酸通常经由磷酸键连接,以形成核酸或多核苷酸,虽然许多其他连接是本领域已知的(例如硫代磷酸酯、硼烷磷酸酯(boranophosphate)等等)。
51.术语“多核苷酸”指核糖核苷酸(rna)或脱氧核糖核苷酸(dna)的聚合物,其可以是单链或双链的,并且可以含有非天然或改变的核苷酸。术语“多核苷酸”、“核酸序列”和“核苷酸序列”在本文中可互换使用,指任何长度的核苷酸聚合形式,rna或dna。这些术语指分子的一级结构,因此包括双链和单链dna,以及双链和单链rna。该术语包括,作为等价物,由核苷酸类似物和经修饰的多核苷酸制备的rna或dna的类似物,例如,虽然不限于甲基化的和/或封端多核苷酸。多核苷酸可以是任何形式,包括但不限于,质粒、病毒、染色体、est、cdna、mrna和rrna。
52.如本文使用的,术语“多肽”和“蛋白质”可互换使用,指氨基酸残基的聚合物。术语“重组多肽”指通过重组技术产生的多肽,其中通常将编码所表达蛋白质的dna或rna插入到合适的表达载体中,然后用所述表达载体转化宿主细胞,以产生多肽。编码所表达蛋白质的dna或rna还可以通过同源重组或本领域熟知的其它方法被插入到宿主染色体中,并用于转化转化宿主细胞以产生多肽。类似地,术语“重组多核苷酸”或“重组核酸”或“重组dna”通过本领域技术人员已知的重组技术产生。
53.如本文使用的,术语“同源物”和“同源的”指包含与相应的多核苷酸或多肽序列至少约50%相同的序列的多核苷酸或多肽。优选地,同源多核苷酸或多肽具有与相应的氨基酸序列或多核苷酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%的同源性的多核苷酸序列或氨基酸序列。如本文使用的,术语序列“同源性”和序列“同一性”可互换使用。
54.本领域普通技术人员清楚知道测定两个或更多个序列之间的同源性的方法。简言之,两种序列之间的“同源性”的计算可以如下进行。为了最佳的比较目的对序列进行比对(例如可以在第一个和第二个氨基酸或核酸序列之一或两者中引入缺口,用于进行最佳比对,为比较的目的可以弃去非同源序列)。在一个优选实施方案中,为比较目的进行比对的第一个序列的长度是第二个序列长度的至少约30%、优选至少约40%、更优选至少约50%、甚至更优选至少约60%,且甚至更优选至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%或约100%。随后比较在第一个和第二个序列的相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一个序列中的位置被与第二个序列中的相应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置处是相同的。两个序列之间的同源性百分比是序列共有的相同位置数目的函数,并考虑为进行两个序列的最佳比对而需要引入的的缺口数目和每个缺口的长度。两个序列之间的序列比较和同源性百分比的确定可以使用数学算法来完成,所述数学算法例如blast(al tschul et al.(1990)j.mol.biol.215(3):403
‑
410)。两个氨基酸序列之间的同源性百分比还可以使用needleman和wunsch的算法确定,所述needleman和wunsch的算法已并入gcg软件包中的gap程序内,使用blossum62矩阵或pam250矩阵,以及16、14、12、10、8、6或4的缺口权重和1、2、3、4、5或6的长度权重(needleman and wunsch(1970)j.mol.biol.48:444
‑
453)。两个核苷酸序列之间的同源性百分比还可以使用gcg软件包中的gap程序确定,使用nwsgapdna.cmp矩阵以及40、50、60、70或80的缺口权重和1、2、3、4、5或6的长度权重。本领域普通技术人员可以进行初始同源性计算且相应地调整算法参数。优选参数集(以及在操作者不确定应当应用何种参数来确定分子是否在权利要求限定的同源性范围内的情况下,应使用的参数)是blossum62评分矩阵,其中缺口罚分为12,缺口延伸罚分为4以及移码缺口罚分为5。其它的序列比对方法是生物技术领域中已知的(参见,例如,rosenberg(2005)bmcbioinformatics6:278;altschul et al.(2005)febsj.272(20):5101
‑
5109)。
55.术语“在低严谨、中等严格、高严谨或极高严谨条件下杂交”描述用于杂交和洗涤的条件。可以在molecular biology,john wi ley&sons,n.y.(1989),6.3.1
‑
6.3.6中找到用于进行杂交反应的指导。该参考文献中描述了水性和非水性方法,可以使用任何一种方法。本文提及的具体杂交条件如下:(1)低严谨杂交条件
‑‑
在约45℃下6x氯化钠/柠檬酸钠(ssc),然后至少在50℃下在0.2x ssc、0.1%sds中洗涤两次(对于低严谨条件,洗涤温度可以增至55℃);(2)中等严谨杂交条件
‑‑
在约45℃下6x ssc,然后在60℃下在0.2x ssc、0.1%sds中洗涤一次或多次;(3)高严谨杂交条件
‑‑
在约45℃下6x ssc,然后在65℃下在0.2x ssc、0.1%sds中洗涤一次或多次;和(4)极高严谨杂交条件
‑‑
在65℃下0.5m磷酸钠、7%sds,然后在65℃下在0.2x ssc、1%sds中洗涤一次或多次。极高严格杂交条件(4)是优选条件,除非另有说明。
[0056]“内源”多肽指由亲本细胞(或宿主细胞)的基因组编码的多肽。“外源”多肽指不由
亲本细胞的基因组编码的多肽。变体或突变多肽是外源多肽的实例。因此,一旦被引入到细胞内,非天然存在的核酸分子就被认为对于细胞是外源的。非天然存在的核酸分子对于特定的细胞也可以是外源的。例如,即使x和y是相同细胞类型,一旦从细胞x中分离的整个编码序列被引入到细胞y内,该编码序列对于细胞y就是外源核酸。
[0057]
术语“过表达的”表示与该基因的内源转录速率相比较,使基因以升高的速率转录。在一些实例中,过表达另外包括与该基因的内源翻译速率相比较,基因的翻译速率升高。测试过表达的方法是本领域众所周知的,例如可以使用rtpcr评价转录rna的水平,并且可以使用sds page凝胶分析评价蛋白质的水平。
[0058]
术语“异源的”表示来源于不同生物体、不同细胞类型或不同物种。如本文使用的,它指非天然存在于给定生物体中的核苷酸、多核苷酸、多肽或蛋白质序列。例如,对蓝细菌来说是天然的多核苷酸序列可以通过重组方法被引入到大肠杆菌的宿主细胞内,那么来自蓝细菌的多核苷酸对大肠杆菌细胞(例如重组细胞)来说是异源的。术语“异源”还可以用于核苷酸、多核苷酸、多肽或蛋白质序列,它们以非天然状态存在于重组宿主细胞中。例如,“异源”核苷酸、多核苷酸、多肽或蛋白质序列可以相对于天然存在于相应的野生型宿主细胞中的野生型序列被修饰,例如在表达水平上的或者在核苷酸、多核苷酸、多肽或蛋白质序列中的修饰。
[0059]
如本文使用的,术语多肽的“片段”指全长多肽或蛋白质的较短部分,其大小为两个氨基酸残基到整个氨基酸序列减去一个氨基酸残基。在本公开的特定实施方案中,片段指多肽或蛋白质的域(例如,底物结合域或催化域)的整个氨基酸序列。
[0060]
术语“诱变”指以稳定方式改变生物体的遗传信息的过程。蛋白质编码核酸序列的诱变产生突变蛋白质。诱变还指非编码核酸序列中的变化,其导致蛋白质活性改变。
[0061]
如本文使用的,“突变”指基因的核酸位置中或者多肽或蛋白质的氨基酸位置中的永久变化。突变包括取代、添加、插入和缺失。例如,氨基酸位置中的突变可以是将一种类型的氨基酸用另一种类型的氨基酸取代(例如,天冬氨酸(d)可以用酪氨酸(y)取代;赖氨酸(l)可以用t(苏氨酸)取代;等)。同样地,多肽或蛋白质可以具有一个或多个突变,其中一种氨基酸用另一种氨基酸取代。
[0062]
如本文使用的,术语“基因”指编码rna产物或蛋白质产物的核酸序列,以及影响rna或蛋白质表达的、可操作连接的核酸序列(例如,这种序列包括但不限于启动子或增强子序列),或影响rna或蛋白质表达的、可操作连接的核酸序列编码序列(例如,这种序列包括但不限于核糖体结合位点或翻译控制序列)。
[0063]
表达控制序列是本领域已知的,包括,例如,启动子、增强子、多腺苷酸化信号、转录终止子、内部核糖体进入位点(ires)等,它们其提供了多核苷酸序列在宿主细胞中的表达。表达控制序列与转录中涉及的细胞蛋白质特异性相互作用(maniatis et al.,science,236:1237
‑
1245(1987))。示例性的表达控制序列在例如goeddel,gene expression technology:methods in enzymology,vol.185,academic press,san diego,calif.(1990)中描述。在本公开的方法中,表达控制序列可操作地与多核苷酸序列连接。“可操作连接”表示多核苷酸序列和表达控制序列以这样的方式连接,所述方式允许基因在适当分子(例如转录激活蛋白)与表达控制序列结合时表达。可操作连接的启动子位于按转录和翻译方向的选定多核苷酸序列的上游。可操作连接的增强子可以位于选定多核苷酸的
上游、其内或下游。
[0064]
如本文使用的,术语“载体”指能够转运与之相连的另一核酸,即多核苷酸序列的核酸分子。一类有用的载体是游离体(即,能在染色体外复制的核酸)。有用的载体是能够自主复制和/或表达与之相连的核酸的那些载体。能够指导与之可操作连接的基因的表达的载体在本文中被称为“表达载体”。一般而言,在重组dna技术中使用的表达载体通常是“质粒”形式的,其一般指环状双链dna环,以其载体形式不结合染色体。术语“质粒”和“载体”在本文中可以互换使用,因为质粒是最常用形式的载体。但是,还包括的其它形式的表达载体,它们具有等同的功能且后来变得为本领域所知。在一些实施方案中,重组载体进一步包括与多核苷酸序列可操作连接的启动子。在一些实施方案中,启动子是发育调控启动子、器官特异性启动子、组织特异性启动子、诱导型启动子、组成型启动子或细胞特异性启动子。重组载体通常包含选自下述的至少一种序列:与多核苷酸序列可操作偶联(operatively coupled)的表达控制序列;与多核苷酸序列可操作偶联的选择标记;与多核苷酸序列可操作偶联的标记序列;与多核苷酸序列可操作偶联的纯化部分;与多核苷酸序列可操作偶联的分泌序列;和与多核苷酸序列可操作偶联的靶向序列。在特定的实施方案中,核苷酸序列稳定地被掺入到宿主细胞的基因组dna中,并且核苷酸序列的表达处于调控的启动子区的控制下。本文所述的表达载体包括本文所述的多核苷酸序列,其以适合于在宿主细胞中表达所述多核苷酸序列的形式存在。本领域技术人员应当理解,表达载体的设计可以取决于这样的因素,如待转化的宿主细胞的选择、所需多肽表达水平等。本文所述的表达载体可以被引入宿主细胞内,以产生由如本文所述的多核苷酸序列编码的多肽,包括融合多肽。
[0065]
术语“重组细胞”和“重组宿主细胞”在本文中可以互换使用,指可以表达acc变体细胞和/或包含可以增加重组细胞产生丙二酰
‑
coa衍生化合物的比活性的变体操纵子的细胞。重组细胞可以来自于微生物例如细菌、病毒或真菌。此外,重组细胞可以来自于植物或动物细胞。重组细胞可用于生产一种或多种脂肪酸衍生物,包括,但不限于,脂肪酸、脂肪酯(例如,蜡、脂肪酸酯、脂肪酯、脂肪酸甲酯(fame)、脂肪酸乙酯(faee))、脂肪醇、短链和长链醇、脂肪醛、烃类、脂肪胺、末端烯烃、内烯烃、酮、双功能脂肪酸衍生物(例如,ω
‑
羟基脂肪酸、ω
‑
羟基二醇、ω
‑
羟基fame、ω
‑
羟基faee);以及非脂肪酸化合物例如黄烷酮、类黄酮、聚酮化合物和3
‑
羟基丙酸。在一些实施方案中,重组细胞包括一种或多种多核苷酸,每一种多核苷酸编码具有脂肪酸生物合成酶活性的多肽,其中当在有效表达所述多核苷酸的条件下并在存在碳源的条件下培养所述重组细胞时,重组细胞产生脂肪酸衍生组合物。
[0066]
如本文所使用的,术语“微生物”指在显微镜下可见的生物体。微生物的实例是细菌、病毒或真菌。在一个实施方案中,微生物是细菌细胞。在另一个实施方案中,微生物是原核生物或原核细胞。在另一个实施方案中,微生物是真菌细胞例如酵母细胞。在另一个实施方案中,微生物是病毒细胞。在相关的实施方案中,“重组微生物”是在基因上被改变并且表达或包含外源和/或异源核酸序列的微生物。
[0067]
如本文使用的,术语“酰基
‑
acp”指在酰基载体蛋白(acp)的烷基链的羰基碳和磷酸泛酰巯基乙胺基部分的硫氢基之间形成的酰基硫酯。所述磷酸泛酰巯基乙胺基部分通过全酰基载体蛋白合酶(acps),磷酸泛酰巯基乙胺基转移酶的作用,在翻译后连接至acp上的保守丝氨酸残基。在一些实施方案中,酰基
‑
acp是完全饱和的酰基
‑
acp合成的中间产物。在其它实施方案中,酰基
‑
acp是不饱和酰基
‑
acp合成的中间产物。在一些实施方案中,碳链具
有约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个碳。这些酰基
‑
acps中的每个都是将它们转化为脂肪酸衍生物的酶的底物。
[0068]
术语“丙二酰
‑
coa衍生化合物”包括通过生化途径制备的任何化合物或化学实体(例如,中间产物或终产物),其中丙二酰
‑
coa作为所述化合物或化学实体的中间产物或在其上游被制备(例如,参见图4)。例如,丙二酰
‑
coa衍生化合物包括,但不限于,脂肪酸甲酯(fame)和/或脂肪酸乙酯(faee);脂肪醇;脂肪醛;脂肪胺;烷;烯烃或烯;烃类;β羟基脂肪酸衍生物,双功能脂肪酸衍生物,不饱和脂肪酸衍生物。丙二酰
‑
coa衍生化合物进一步包括,但不限于,非脂肪酸化合物例如,黄烷酮、类黄酮、聚酮化合物、丙二酸和3
‑
羟基丙酸。
[0069]
术语“脂肪酸”表示具有式rcooh的羧酸。r代表脂族基,优选烷基。r可以包含约4至约22个碳原子。脂肪酸可以具有支链和直链并且可以是饱和的、单不饱和的或多不饱和的。
[0070]“脂肪酸衍生物”是指部分由生产宿主生物体的脂肪酸生物合成途径制备的产物。“脂肪酸衍生物”包括部分由丙二酰
‑
acp衍生化合物,包括酰基
‑
acp或酰基
‑
acp衍生物制备的产物。示例性的脂肪酸衍生物包括脂肪酸、脂肪酯(例如,蜡、脂肪酸酯、脂肪酯、脂肪酸甲酯(fame)、脂肪酸乙酯(faee))、脂肪胺、脂肪醛、脂肪醇、短链和长链醇、烃类、酮类、末端烯烃、内烯烃、酮类、β羟基脂肪酸衍生物、双功能脂肪酸衍生物(例如,ω
‑
羟基脂肪酸、ω
‑
羟基二醇、ω
‑
羟基fame、ω
‑
oh faee)和不饱和脂肪酸衍生物。“脂肪酸衍生物”还包括由丙二酰
‑
coa衍生化合物例如酰基
‑
coa或酰基
‑
coa衍生物制备的产物。
[0071]
如本文所提及的“脂肪酸衍生组合物”由重组宿主细胞产生,并且通常包括脂肪酸衍生物的混合物。在一些情况下,混合物包括超过一种类型的脂肪酸衍生物产物(例如脂肪酸、脂肪酯、脂肪醇、脂肪醛、脂肪胺、双功能脂肪酸衍生物等)。在其它情况下,脂肪酸衍生组合物可以包括,例如,具有不同链长、饱和度和/或分支特征的脂肪酯(或另一种脂肪酸衍生物)的混合物。在其它情况下,脂肪酸衍生组合物可以包含超过一种类型的具有不同链长、饱和度和/或分支特征的脂肪酸衍生物产物和脂肪酸衍生物的混合物。在其它情况下,脂肪酸衍生组合物可以包括,例如,脂肪酯和β羟基酯的混合物。在其它情况下,脂肪酸衍生组合物可以包括,例如,脂肪醇和脂肪醛的混合物。在其它情况下,脂肪酸衍生组合物可以包括,例如,fame和/或faee的混合物。
[0072]
术语“变体生物素羧基载体蛋白(bccp)”和“生物素羧基载体蛋白(bccp)变体”在本文中可以互换使用,指在其氨基酸序列中具有一个或多个突变的acc变体。在一个实施方案中,氨基酸序列从1(即基于atg起始位点的初始甲硫氨酸(m))到156。这种bccp变体可以在氨基酸位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、和/或156上具有一个或多个突变。在一个实施方案中,突变包括在约位置1到约位置60的n
‑
末端氨基酸区域中的突变。在一个实施方案中,突变包括在氨基酸位置2(刚好在起始密码子之后)上的突变。
[0073]
术语“当与相应的野生型细胞相比,赋予(或导致)重组细胞增加的丙二酰
‑
coa
‑
衍生化合物生产”指acc相关多肽或蛋白的功能,所述acc相关多肽或蛋白在其氨基酸序列中具有一个或多个突变(即acc变体或acc突变体),并且当它在该细胞中表达时,与不表达acc变体或突变体的野生型细胞相比,在细胞中导致提高的丙二酰
‑
coa衍生化合物生产。它还指acc变体的功能,所述acc变体在细胞中表达时,具有使细胞产生丙二酰
‑
coa衍生化合物的比活性较高的作用。不希望受到理论的束缚,这可能是直接或间接在细胞中产生较高的乙酰
‑
coa羧化酶(acc)酶活性(e.c.6.4.1.2)的结果。这可以通过将表达acc变体的细胞产生的丙二酰
‑
coa衍生化合物的滴度和/或生产与相应的野生型细胞(即不表达acc变体的细胞)产生的丙二酰
‑
coa衍生化合物的滴度和/或生产进行比较来测量。本领域技术人员应当理解测量方法是易于获得的,包括,例如气相色谱火焰离子化检测器(gc
‑
fid)和其它方法。acc变体蛋白的一个实例是生物素羧基载体蛋白(bccp)变体。acc变体可以包含在acc复合物的四个亚基的一个和/或两个中的突变。acc变体可以包含四个亚基的任一个和/或任两个的浓度的变化。当细胞已被acc变体转化时,它是表达acc变体的细胞(即重组细胞)。在一个实施方案中,由表达acc变体的细胞产生的丙二酰
‑
coa衍生化合物的滴度和/或生产是相应野生型细胞(即不表达acc变体的相应细胞)的至少2倍。在另一个实施方案中,由表达acc变体的细胞产生的丙二酰
‑
coa衍生化合物的滴度和/或生产比相应的野生型细胞高至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍或至少约10。在一个实施方案中,由表达acc变体的细胞产生的丙二酰
‑
coa衍生化合物的滴度和/或生产比相应的野生型细胞高至少约1%、至少约2%、至少约3%、至少约4%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%或至少约10%。在另一个实施方案中,由于acc变体的表达导致的滴度和/或生产比野生型acc复合物高至少约20%到至少约100%。在一个实施方案中,由细胞产生的丙二酰
‑
coa衍生化合物的滴度和/或生产比相应的野生型细胞高至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%或至少约100%。在另一个实施方案中,由细胞产生的丙二酰
‑
coa衍生化合物的滴度和/或生产比相应的野生型细胞高至少约200%、至少约250%、至少约300%、至少约350%、至少约400%、至少约450%、至少约500%、至少约550%、至少约600%、至少约610、620、630、640或650%、至少约700%、至少约750%、至少约800%或至少约850%。
[0074]
如本文所使用的,术语“脂肪酸生物合成途径”表示生产脂肪酸衍生物的生物合成途径。脂肪酸生物合成途径可以包括额外的酶以生产具有所希望特性的脂肪酸衍生物。
[0075]
如本文所使用的,“脂肪酯”表示具有式rcoor’的酯。如本文所提及的脂肪酯可以是由脂肪酸制备的任何酯,例如脂肪酸酯。在一些实施方案中,r基团的长度为至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18或至少19个碳。替代地或额外地,r基团的长度为20或更少、19或更少、18或更少、17或更少、16或更少、15或更少、14或更少、13或更少、12或更少、11或更少、10或更少、9或更少、8或更少、7或更少、或6或更少个碳。因此,r基团可以具有由上述端点中的任何两个约束的r基团。例如,r基团可以是长度为6
‑
16个碳、长度为10
‑
14个碳、或长度为12
‑
18个碳。在一些实施方案中,脂肪酯组合物包含c6、c7、c8、c9、c10、c11、c12、c13、c14、c15、c16、c17、c18、
c19、c20、c21、c22、c23、c24、c25和c26脂肪酯中的一种或多种。在其它实施方案中,脂肪酯组合物包括c6、c7、c8、c9、c10、c11、c12、c13、c14、c15、c16、c17和c18脂肪酯中的一种或多种。在其它实施方案中,脂肪酯组合物包括c12、c14、c16和c18脂肪酯;c12、c14和c16脂肪酯;c14、c16和c18脂肪酯;或c12和c14脂肪酯。
[0076]
脂肪酸衍生物例如脂肪酯的r基团可以是直链或支链。支链可以具有超过一个分支点,并且可以包括环状分支。在一些实施方案中,分支脂肪酸、分支脂肪醛或分支脂肪酯是c6、c7、c8、c9、c10、c11、c12、c13、c14、c15、c16、c17、c18、c19、c20、c21、c22、c23、c24、c25或c26分支脂肪酸、分支脂肪醛或分支脂肪酯。在特定的实施方案中,分支脂肪酸、分支脂肪醛或分支脂肪酯是c6、c7、c8、c9、c10、cl l、c12、c13、c14、c15、c16、c17或c18分支脂肪酸或分支脂肪酯。本公开的脂肪酯可以被称为含有a侧和b侧。如本文所使用的,酯的“a侧”指与酯的羧化物氧相连的碳链。如本文所使用的,酯的“b侧”指包含酯的亲本羧化物的碳链。当脂肪酯来自于脂肪酸生物合成途径时,a侧通常由醇贡献,并且b侧由脂肪酸贡献。
[0077]
任何醇均可用于形成脂肪酯的a侧。例如,醇可以来自于脂肪酸生物合成途径,例如本文描述的那些。或者,醇可以通过非脂肪酸生物合成途径产生。此外,醇可以外源提供。例如,在脂肪酯由生物体产生的情况下,可以在发酵液中供应醇。或者,在脂肪酯由还产生醇的生物体产生的情况下,可以外源供应羧酸,例如脂肪酸或乙酸。
[0078]
包含酯的a侧或b侧的碳链可以具有任何长度。在一个实施方案中,酯的a侧的长度是至少约1、2、3、4、5、6、7、8、10、12、14、16或18个碳。当脂肪酯是脂肪酸甲酯时,酯的a侧的长度是1个碳。当脂肪酯是脂肪酸乙酯时,酯的a侧的长度是2个碳。酯的b侧的长度可以是至少约4、6、8、10、12、14、16、18、20、22、24或26个碳。a侧和/或b侧可以是直链或支链。支链可以具有一个或多个分支点。此外,支链可以包括环状分支。而且,a侧和/或b侧可以是饱和或不饱和的。如果是不饱和的,a侧和/或b侧可以具有一个或多个不饱和点。此外,根据本公开产生的脂肪酯的醇基团无需在首要(c1)位置上。在一个实施方案中,脂肪酯通过生物合成产生。在该实施方案中,首先脂肪酸被“活化”。“活化”脂肪酸的非限制性实例是酰基
‑
coa、酰基acp和酰基磷酸酯。酰基
‑
coa可以是脂肪酸生物合成或降解的直接产物。此外,酰基
‑
coa可以由游离脂肪酸、coa和腺嘌呤核苷三磷酸(atp)合成。产生酰基
‑
coa的酶的实例是酰基
‑
coa合酶。
[0079]
在特定的实施方案中,分支脂肪酸衍生物是异脂肪酸衍生物,例如异脂肪酯,或反异脂肪酸衍生物,例如反异脂肪酯。在示例性的实施方案中,分支脂肪酸衍生物选自异
‑
c7:0、异
‑
c8:0、异
‑
c9:0、异
‑
c10:0、异
‑
c11:0、异
‑
c12:0、异
‑
c13:0、异
‑
c14:0、异
‑
c15:0、异
‑
c16:0、异
‑
c17:0、异
‑
c18:0、异
‑
c19:0、反异
‑
c7:0、反异
‑
c8:0、反异
‑
c9:0、反异
‑
c10:0、反异
‑
c11:0,反异
‑
c12:0、反异
‑
c13:0、反异
‑
c14:0、反异
‑
c15:0、反异
‑
c16:0、反异
‑
c17:0、反异
‑
c18:0和反异
‑
c19:0分支脂肪酯。
[0080]
分支或未分支脂肪酸衍生物的r基团可以是饱和或不饱和的。如果是不饱和的,r基团可以具有一个或超过一个不饱和点。在一些实施方案中,不饱和脂肪酸衍生物是单不饱和脂肪酸衍生物。在特定的实施方案中,不饱和脂肪酸衍生物是c6:l、c7:l、c8:l、c9:l、c10:l、c11:l、c12:l、c13:l、c14:l、c15:l、c16:l、c17:l、c18:l、c19:l、c20:l、c21:l、c22:1、c23:1、c24:1、c25:1或c26:1不饱和脂肪酸衍生物。在特定的实施方案中,不饱和脂肪酸衍生物是c10:1、c12:1、c14:1、c16:1或c18:1不饱和脂肪酸衍生物。在其它实施方案中,不
饱和脂肪酸衍生物在ω
‑
7位置处是不饱和的。在特定的实施方案中,不饱和脂肪酸衍生物包含顺式双键。
[0081]
如本文所使用的,术语“克隆”通常指起源于单个共同祖先并且在基因上基本上等同于该单个共同祖先的细胞或细胞群,例如由单个细菌细胞产生的克隆的细菌菌落的细菌。
[0082]
如本文所使用的,术语“培养物”通常指包含活细胞的液体培养基。在一个实施方案中,培养物包含在控制条件下在预定培养基中繁殖的细胞,例如在包含选定的碳源和氮源的液体培养基中生长的重组宿主细胞培养物。“培养(cul turing)”或“培养(cul tivation)”指在合适条件下在液体或固体培养基中使重组宿主细胞群体生长。在特定的实施方案中,培养指底物向终产物的发酵生物转化。培养基是众所周知的,而且这种培养基的单个组分可以从商业来源获得,例如difco
tm
培养基和bbl
tm
培养基。在一个非限制性实例中,水性营养培养基是“富营养培养基”,包括氮、盐和碳的复杂来源,例如yp培养基,其包含10g/l蛋白胨和10g/l这种培养基的酵母提取物。
[0083]
如本文所使用的,重组宿主细胞中的“改变的”或“水平改变的”蛋白活性,例如酶的活性,指相对于亲本或天然宿主细胞,所测定的活性中的一种或多种特性上的差异。通常,活性上的差异在具有改变活性的重组宿主细胞和相应的野生型宿主细胞之间进行测定(例如,将重组宿主细胞培养与与相应的野生型宿主细胞比较)。改变的活性可以是,例如,由改变的重组宿主细胞表达的蛋白的数量导致(例如由增加的或减少的编码蛋白质的dna序列的拷贝数,增加的或减少的编码蛋白质的mrna转录物的数量,和/或增加的或减少的由mrna向蛋白质的蛋白质翻译量);蛋白质结构的变化(例如对一级结构的改变,例如对蛋白质编码序列的改变,其导致底物特异性的变化、所观察到的动力学参数的变化);和蛋白质稳定性的变化(例如增加的或减少的蛋白质降解)的结果。在一些实施方案中,多肽是本文所述的多肽的任一种的突变体或变体,例如变体acc包括变体bccp。在某些情况下,本文所述的多肽的编码序列是密码子优化的,以便于在特定的宿主细胞中表达。例如,对于在大肠杆菌中的表达,可以优化一个或多个密码子(grosjean et al.(1982)gene18:199
‑
209)。
[0084]
本文所使用的术语“调控序列”通常指dna中的碱基序列,它与编码蛋白质的dna序列可操作地相连,其最终控制蛋白质的表达。调控序列的实例包括但不限于rna启动子序列、转录因子结合序列、转录终止序列、转录调节剂(例如增强子元件)、影响rna稳定性的核苷酸序列和翻译调控序列(例如核糖体结合位点(例如,原核生物中的shine
‑
dalgarno序列或真核生物中的kozak序列)、起始密码子、终止密码子)。如本文所使用的,短语“所述核苷酸序列的表达相对于野生型核苷酸序列改变”,表示内源核苷酸序列的表达和/或活性或者异源或非天然多肽编码核苷酸序列的表达和/或活性水平的增加或减少。术语“改变的表达水平”和“更改的表达水平”可互换使用,表示与相同条件下相应的野生型细胞中的浓度相比较,多核苷酸、多肽或烃在工程化的宿主细胞中以不同浓度存在。如本文所使用的,对于多核苷酸,术语“表达”是使其具有功能。当表达时,编码多肽(或蛋白质)的多核苷酸将被转录和翻译,以产生该多肽(或蛋白质)。如本文所使用的,术语“过表达”表示使多核苷酸或多肽在细胞中以高于相同条件下相应的野生型细胞中正常表达的浓度的浓度表达或导致其这样表达。
[0085]
如本文所使用的,术语“滴度”指每单位体积的宿主细胞培养物产生的丙二酰
‑
coa
衍生化合物,包括脂肪酸衍生物的量。在本文所述的组合物和方法的任何方面,脂肪酸衍生物或其它化合物以约25mg/l、约50mg/l、约75mg/l、约100mg/l、约125mg/l、约150mg/l、约175mg/l、约200mg/l、约225mg/l、约250mg/l、约275mg/l、约300mg/l、约325mg/l、约350mg/l、约375mg/l、约400mg/l、约425mg/l、约450mg/l、约475mg/l、约500mg/l、约525mg/l、约550mg/l、约575mg/l、约600mg/l、约625mg/l、约650mg/l、约675mg/l、约700mg/l、约725mg/l、约750mg/l、约775mg/l、约800mg/l、约825mg/l、约850mg/l、约875mg/l、约900mg/l、约925mg/l、约950mg/l、约975mg/l、约1000mg/l、约1050mg/l、约1075mg/l、约1100mg/l、约1125mg/l、约1150mg/l、约1175mg/l、约1200mg/l、约1225mg/l、约1250mg/l、约1275mg/l、约1300mg/l、约1325mg/l、约1350mg/l、约1375mg/l、约1400mg/l、约1425mg/l、约1450mg/l、约1475mg/l、约1500mg/l、约1525mg/l、约1550mg/l、约1575mg/l、约1600mg/l、约1625mg/l、约1650mg/l、约1675mg/l、约1700mg/l、约1725mg/l、约1750mg/l、约1775mg/l、约1800mg/l、约1825mg/l、约1850mg/l、约1875mg/l、约1900mg/l、约1925mg/l、约1950mg/l、约1975mg/l、约2000mg/l(2g/l)、3g/l、5g/l、10g/l、20g/l、30g/l、40g/l、50g/l、60g/l、70g/l、80g/l、90g/l、100g/l滴度或由前述值中的任何两个约束的范围产生。在其它实施方案中,脂肪酸衍生物或其它化合物以超过l00g/l、超过200g/l或超过300g/l的滴度产生。由根据本公开方法的重组宿主细胞产生的脂肪酸衍生物或其它化合物的一个优选滴度是5g/l
‑
200g/l、10g/l
‑
150g/l、20g/l
‑
120g/l和30g/l
‑
100g/l。滴度可以指由给定重组宿主细胞培养物产生的特定脂肪酸衍生物或脂肪酸衍生物的组合或另一种化合物或其它化合物的组合。例如,与表达相应的野生型多肽的重组宿主细胞相比较,acc变体在重组宿主细胞例如大肠杆菌中的表达导致产生更高的滴度。在一个实施方案中,更高的滴度范围为至少约5g/l至约200g/l。
[0086]
如本文所使用的,“由宿主细胞产生的包括脂肪酸衍生物或其它化合物的丙二酰
‑
coa衍生化合物的产率”指在宿主细胞中输入碳源转化为产物(即包括脂肪酸衍生物和/或其它化合物的丙二酰
‑
coa衍生化合物)的效率。根据本公开的方法被工程化以产生包括脂肪酸衍生物的丙二酰
‑
coa衍生化合物的宿主细胞具有至少约3%、至少约4%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、至少约10%、至少约11%、至少约12%、至少约13%、至少约14%、至少约15%、至少约16%、至少约17%、至少约18%、至少约19%、至少约20%、至少约21%、至少约22%、至少约23%、至少约24%、至少约25%、至少约26%、至少约27%、至少约28%、至少约29%、或至少约30%或由前述值中的任何两个约束的范围的产率。在其它实施方案中,一种或多种脂肪酸衍生物或其它化合物以超过约30%、超过约35%、超过约40%、超过约45%、超过约50%、超过约55%、超过约60%、超过约65%、超过约70%、超过约75%、超过约80%、超过约85%、超过约90%、超过100%、超过200%、超过250%、超过300%、超过350%、超过400%、超过450%、超过500%、超过550%、超过600%、超过650%、超过700%、超过750%或更多的得率产生。或者,或另外地,产率是约30%或更少、约27%或更少、约25%或更少、或约22%或更少。在另一个实施方案中,产率是约50%或更少、约45%或更少、或约35%或更少。在另一个实施方案中,产率是约95%或更少、90%或更少、产率是85%或更少、80%或更少、75%或更少、70%或更少、产率是65%或更少、60%或更少、55%或更少、或50%或更少。因此,产率可以由上述端点中的任何两个约束。例如,由根据本公开方法的重组宿主细胞产生的包括一种或多种脂肪酸衍生物的丙二酰
‑
coa衍
生化合物的产率可以是约5%到约15%、约10%到约25%、约10%到约22%、约15%到约27%、约18%到约22%、约20%到约28%、约20%到约30%、约30%到约40%、约40%到约50%、约50%到约60%、约60%到约70%、约70%到约80%、约80%到约90%、约90%到约100%、约100%到约200%、约200%到约300%、约300%到约400%、约400%到约500%、约500%到约600%、约600%到约700%或约700%到约800%。产率可以指由给定的重组宿主细胞培养物产生的特定丙二酰
‑
coa衍生化合物,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物或脂肪酸衍生物的组合或另一种化合物或化合物的另一种组合。在一个实施方案中,与表达相应野生型多肽的重组宿主细胞相比较,acc变体在重组宿主细胞例如大肠杆菌中的表达导致丙二酰
‑
coa衍生化合物的更高产率的生产,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物,例如,脂肪酯。在一个实施方案中,更高产率的范围为约10%到约800%的理论产率。
[0087]
如本文所使用的,术语“生产率”指每单位时间每单位体积的宿主细胞培养物产生的丙二酰
‑
coa衍生化合物的量,所述丙二酰
‑
coa衍生化合物包括一种或多种脂肪酸衍生物或另一种化合物或另一些化合物。在本文所述的组合物和方法的任何方面,由重组宿主细胞产生的丙二酰
‑
coa衍生化合物的生产率是至少l00mg/l/小时、至少200mg/l/小时、至少300mg/l/小时、至少400mg/l/小时、至少500mg/l/小时、至少600mg/l/小时、至少700mg/l/小时、至少800mg/l/小时、至少900mg/l/小时、至少1000mg/l/小时、至少1100mg/l/小时、至少1200mg/l/小时、至少1300mg/l/小时、至少1400mg/l/小时、至少1500mg/l/小时、至少1600mg/l/小时、至少1700mg/l/小时、至少1800mg/l/小时、至少1900mg/l/小时、至少2000mg/l/小时、至少2100mg/l/小时、至少2200mg/l/小时、至少2300mg/l/小时、至少2400mg/l/小时、2500mg/l/小时或高达10g/l/hr(取决于细胞团),所述丙二酰
‑
coa衍生化合物包括一种或多种脂肪酸衍生物或其它的一种或多种化合物。例如,由根据本公开方法的重组宿主细胞产生的丙二酰
‑
coa衍生化合物的生产率可以是500mg/l/小时到2500mg/l/小时、或700mg/l/小时到2000mg/l/小时,所述丙二酰
‑
coa衍生化合物包括一种或多种脂肪酸衍生物或其它化合物。生产率可以指由给定重组宿主细胞培养物产生的特定丙二酰
‑
coa衍生化合物,所述特定丙二酰
‑
coa衍生化合物包括脂肪酸衍生物或脂肪酸衍生物的组合或其它化合物。例如,与表达相应野生型多肽的重组宿主细胞相比较,acc变体在重组宿主细胞例如大肠杆菌中的表达导致丙二酰
‑
coa衍生化合物的增加生产率的生产,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物或其它化合物。在一个实施方案中,更高的生产率范围为约0.3g/l/h到约3g/l/h到约10g/l/h到约100g/l/h到约1000g/l/h。
[0088]
如本文所使用的,就表达acc变体的宿主细胞能产生的脂肪酸衍生物的量而言,如通过gc
‑
fid评估的,术语“总脂肪种类”和“总脂肪酸产物”在本文中可以互换使用。当提及脂肪酸衍生物分析时,相同术语可以用于表示,例如,脂肪酯、脂肪醇、脂肪醛、脂肪胺和游离脂肪酸。
[0089]
如本文所使用的,术语“葡萄糖利用率”表示每单位时间培养物使用的葡萄糖量,按克/升/小时(g/l/hr)报道。
[0090]
如本文所使用的,术语“碳源”指适合用作原核或简单真核细胞生长的碳源的底物或化合物。碳源可以是多种形式的,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如co和co2)。示例性的碳源包括,但不限于,单糖,例如葡萄糖、果糖、甘露
糖、半乳糖、木糖和阿拉伯糖;寡糖,例如果寡糖和半乳寡聚糖;多糖例如淀粉、纤维素、果胶和木聚糖;二糖,例如蔗糖、麦芽糖、纤维二糖和松二糖;纤维素材料和变体例如半纤维素、甲基纤维素和羧甲基纤维素钠;饱和或不饱和脂肪酸、琥珀酸盐、乳酸盐和乙酸盐;醇,例如乙醇、甲醇和甘油、或它们的混合物。碳源还可以是光合作用的产物,例如葡萄糖。在特定的实施方案中,碳源是生物质。在其它实施方案中,碳源是葡萄糖。在其它实施方案中,碳源是蔗糖。在其它实施方案中,碳源是甘油。在其它实施方案中,碳源是简单碳源。在其它实施方案中,碳源是可再生碳源。
[0091]
如本文所使用的,术语“生物质”指由其衍生碳源的任何生物材料。在一些实施方案中,生物质被加工成适合于生物转化的碳源。在其它实施方案中,生物质不需要进一步加工成碳源。碳源可以被转化成包含脂肪酯的组合物。脂肪酯在许多产品中有用,包括但不限于表面活性剂、聚合物、薄膜、纺织品、染料、药物、香料和调味剂、油漆、涂料、清漆、树脂和塑料中的软化剂、增塑剂、阻燃剂以及汽油和油中的添加剂。
[0092]
示例性的生物质来源是植物物质或植物,例如玉米、甘蔗或柳枝稷。另一种示例性生物质来源是代谢废弃物,例如动物物质(例如牛粪)。其它的示例性的生物质来源包括藻类及其它海洋植物。生物质还包括来自工业、农业、林业和家庭的废弃物,包括但不限于甘油、发酵废料、青贮饲料、稻草、木材、污水、垃圾、纤维质城市垃圾和剩余食物(例如肥皂、油和脂肪酸)。术语“生物质”还可以指碳源,例如碳水化合物(例如单糖、二糖或多糖)。
[0093]
如本文所使用的,对于产物(例如脂肪酸衍生物)来说,术语“分离的”指与细胞组分、细胞培养基或者化学或合成前体分离的产物。由本文所述的方法产生的脂肪酸衍生物可以是在发酵液中以及在细胞质中相对不能混合的。因此,脂肪酸衍生物可以在细胞内或细胞外的有机相中收集。
[0094]
如本文所使用的,术语“纯化(purify)”、“纯化的(purified)”或“纯化(purification)”表示通过例如分离(isolation)或分离(separation),分子从其环境中的取出或与其环境的分离。“基本上纯化的”分子是至少约60%不含(例如至少约70%不含、至少约75%不含、至少约85%不含、至少约90%不含、至少约95%不含、至少约97%不含、至少约99%不含)与它们结合的其它组分。如本文所使用的,这些术语还指从样品中去除污染物。例如,污染物去除可以导致样品中丙二酰
‑
coa衍生化合物百分比的增加,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物或其它化合物。例如,当在重组宿主细胞中生产丙二酰
‑
coa衍生化合物时,可以通过去除宿主细胞蛋白质来纯化丙二酰
‑
coa衍生化合物,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物或其它化合物。在纯化后,样品中丙二酰
‑
coa衍生化合物的百分比增加,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物或其它化合物。术语“纯化(purify)”、“纯化的(purified)”或“纯化(purification)”是不要求绝对纯度的相对术语。因此,例如,当在重组宿主细胞中生产丙二酰
‑
coa衍生化合物(包括脂肪酸衍生物或其它化合物)时,丙二酰
‑
coa衍生化合物(包括脂肪酸衍生物或其它化合物)是基本上与其他细胞组分(例如核酸、多肽、脂质、碳水化合物或其他烃)分离的丙二酰
‑
coa衍生化合物(包括脂肪酸衍生物或其它化合物)。
[0095]
如本文所使用的,术语“减弱”表示意指弱化、降低或缩小。例如,多肽可以通过修饰多肽以降低其活性而被减弱(例如通过修饰编码多肽的核苷酸序列)。
[0096]
乙酰
‑
coa羧化酶(acc)变体
[0097]
脂肪酸合酶(fas)表示一组多肽,它们催化酰基链的起始和延长(marrakchi et al.(2002)biochemical society 30:1050
‑
1055)。酰基载体蛋白(acp)与fas途径中的酶一起,控制所产生的脂肪酸的长度、饱和度和分支。fas途径中包括的酶包括,但不限于acc、fabd、fabh、fabg、faba、fabz、fabi、fabk、fabl、fabm、fabb和fabf。取决于所希望的产物,这些基因的一个或多个可以在重组宿主细胞中任选地被减弱或过表达(参见,例如,美国专利nos.8658404、8597922、8535916、8530221、8372610、8323924、8313934、8283143、8268599、8183028、8110670、8110093和8097439)。
[0098]
acc酶(e.c.6.4.1.2.)催化脂肪酸生物合成中的第一个关键步骤,乙酰
‑
coa羧化形成丙二酰
‑
coa。同时,它为脂肪酸、脂肪酸衍生物和其它非脂肪酸化合物提供了丙二酰
‑
coa底物(参见,例如,图4)。acc酶存在于大部分活生物体中,在大部分原核生物和大部分植物和藻类的叶绿体中以多亚基酶的形式存在。原核acc酶或acc酶复合物包括由四个不同基因编码的(即acca、accb、accc和accd),它们以固定的比例组装成复合物(上述broussard et al.(2013))。基因accb和accc分别编码acc亚基生物素羧基载体蛋白(bccp)和生物素羧化酶(bc)。本公开令人惊讶地表明,仅在acc基因的一个或两个(例如accb、accc)中的突变足以增加脂肪酸的通量,并导致更高的丙二酰
‑
coa衍生化合物的滴度和/或产率,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物,例如脂肪酸甲酯(fame)。本公开表明在accb基因的编码区中的突变是有益的,accb和accc基因二者的表达同时改变也是有益的。在大肠杆菌中,发现accb和accc基因在染色体的一个操纵子中,相互邻近。本文公开的acc变体含有四个acc基因的一个或两个上的突变或表达变化,其足以赋予已经含有其它acc亚基基因和多肽的细胞增加的acc酶活性。
[0099]
因此,本公开涉及,尤其是,当在细胞中表达时导致丙二酰
‑
coa衍生化合物的高滴度和/或高产率的acc变体;这种acc变体的多肽序列及其功能性片段;编码acc变体多肽序列的多核苷酸;包括编码acc变体多肽的核酸的微生物;能表达acc变体多肽的微生物;这种微生物的培养物;生产丙二酰
‑
coa衍生化合物的过程,所述丙二酰
‑
coa衍生化合物包括脂肪酸衍生物和非脂肪酸化合物;和所得到的组合物。特别地,本发明提供acc变体多肽和表达这些多肽的微生物以及相关方法。acc变体的实例是下面的表1和3中所示的bccp变体。
[0100]
大肠杆菌野生型accb核苷酸序列显示在seq id no:1中。相应的大肠杆菌野生型bccp氨基酸序列(由seq id no:1的accb编码)显示在seq id no:2中。seq id no:2被用作模板来产生改进的acc变体多肽,以对本公开进行举例说明(参见下述实施例1)。优选的acc变体与seq id no:2的大肠杆菌野生型氨基酸序列具有至少约50%、约60%、约70%、约80%、约90%或约99%的序列同一性。atg之后的第一个氨基酸被指定为第“2”个氨基酸。
[0101]
在一方面,本公开提供acc变体多肽或acc变体和编码它们的核苷酸序列。不同氨基酸位置(或残基)上的不同突变会增加不同脂肪酸衍生物的生产,例如脂肪酸甲酯(fame)的生产。例如,如靶位点
‑
饱和诱变的技术可用于确定哪个位置和哪种突变提供最大的改进。
[0102]
野生型accb基因在位置2上含有gat密码子,其编码天冬氨酸(asp,d)。在一个实施方案中,可以看到,在seq id no:2的野生型accb基因中的氨基酸位置2上的突变提高fame的生产。这些变体acc多肽(即由突变的accb基因编码的)相对于野生型acc能够增加脂肪酯的生产。下面的表1总结了accb位置2上的最佳变体。技术人员将会认识到,增加酯生产是测
试变体acc多肽增加丙二酰
‑
coa衍生化合物例如脂肪酸衍生物生产的能力的一种方式。脂肪酯的生产(而不是任何其它脂肪酸衍生物的生产,例如,脂肪醇的生产或脂肪醛的生产或脂肪酸的生产等)仅用于举例说明的目的,而不是要限制本公开。技术人员将会认识到,按照本公开的教导,并且使用本文公开的并且为本领域技术人员普遍可用的方法和方案,衍生自丙二酰
‑
coa的其它化合物也会增加。
[0103]
表1:具有增加的fame生产的accb变体
[0104]
[0105][0106]
取决于突变的位置,在特定位置上的单个或多重氨基酸的改变导致脂肪酸衍生物生产的增加以及非脂肪酸化合物生产的增加。在一个实施方案中,单个或多重氨基酸的改变导致脂肪酸生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致脂肪酯生产的增加,所述脂肪酯包括但不限于,脂肪酸甲酯(fame)和/或脂肪酸乙酯(faee)。在另一个实施方案中,单个或多重氨基酸的改变导致脂肪醛生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致脂肪醇生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致脂肪胺生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致烃类生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致烷烃生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致烯或烯烃生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致双功能脂肪酸生产的增加,包括但不限于羟基脂肪酸和/或二酸。在另一个实施方案中,单个或多重氨基酸的改变导致双功能脂肪醇生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致双功能脂肪酯和/或脂肪胺生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致β
‑
羟基脂肪酸衍生化合物生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致不饱和脂肪酸衍生化合物生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致黄烷酮和/或类黄酮生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致聚酮化合物生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致3
‑
羟基丙酸(3
‑
hp)生产的增加。在另一个实施方案中,单个或多重氨基酸的改变导致丙二酸或丙二酸酯生产的增加。
[0107]
因此,在特定位置上一个或多个氨基酸改变的组合可以导致脂肪酸衍生物和/或游离脂肪酸生产和/或不基于脂肪酸的化合物例如黄烷酮和/或类黄酮、聚酮化合物、丙二酸酯、3
‑
羟基丙酸(3
‑
hp)和其它化合物的增加。每一种单个氨基酸改变对于脂肪酸衍生物生产的效果可以与或者可以不与其它单个氨基酸改变对于脂肪酸衍生物生产或非脂肪酸化合物生产的效果叠加。在一些实施方案中,在特定位置上的一个或多个氨基酸改变的组
合导致脂肪酸衍生物的生产增加。相应地,在特定位置上的一个或多重氨基酸的改变导致脂肪酸衍生物的生产增加。类似地,在特定位置上的一个或多重氨基酸的改变导致非脂肪酸化合物的增加。
[0108]
除了上面表1所示的acc变体之外,建立了accb基因的易错文库,并使用seq id no:1作为模板进行筛选。通过引入单个或多重突变鉴别其它的accb变体(参见下述实施例1,表3)。由此,在accb的编码区鉴别了63种有益突变(参见表1和3),它们导致fame的滴度增加。很明显,在约氨基酸位置1到约位置60的n
‑
末端氨基酸区域发现大量的突变。
[0109]
在一方面,本公开涉及与seq id no:2具有至少约50%序列同一性的acc变体多肽。在一些实施方案中,变体acc多肽与seq id no:2的野生型acc序列显示出至少约50%(例如,约48%到约52%)、至少约60%、至少约70%、至少约75%、至少76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少99%的序列同一性,并且还包括一个或多个取代,其导致本文所述的有用的特性和/或性质。在本公开的一个方面,具有改进特性的acc变体多肽与seq id no:6具有约100%序列同一性。在本公开的另一个方面,acc变体多肽与下述seq id nos的任一个具有约100%的序列同一性,所述seq id nos包括,但不限于,seq id no:4、seq id no:8、seq id no:10、seq id no:12、seq id no:14、seq id no:16、seq id no:18、seq id no:20、seq id no:22、seq id no:24、seq id no:26、seq id no:28、seq id no:30、seq id no:32、seq id no:34、seq id no:36、seq id no:38、seq id no:40、seq id no:42、seq id no:44、seq id no:46、seq id no:48、seq id no:50、seq id no:52、seq id no:54、seq id no:56、seq id no:58、seq id no:60、seq id no:62、seq id no:64、seq id no:66、seq id no:68、seq id no:70、seq id no:72、seq id no:74、seq id no:76、seq id no:78、seq id no:80、seq id no:82、seq id no:84、seq id no:86、seq id no:88和seq id no:90。
[0110]
在相关的方面,acc变体多肽由与seq id no:5具有100%序列同一性的核苷酸序列编码。在另一个相关的方面,acc变体多肽由与下述seq id nos的任一个具有约100%的序列同一性的核苷酸序列编码,所述seq id nos包括,但不限于,seq id no:3、seq id no:7、seq id no:9、seq id no:11、seq id no:13、seq id no:15、seq id no:17、seq id no:19、seq id no:21、seq id no:23、seq id no:25、seq id no:27、seq id no:29、seq id no:31、seq id no:33、seq id no:35、seq id no:37、seq id no:39、seq id no:41、seq id no:43、seq id no:45、seq id no:47、seq id no:49、seq id no:51、seq id no:53、seq id no:55、seq id no:57、seq id no:59、seq id no:61、seq id no:63、seq id no:65、seq id no:67、seq id no:69、seq id no:71、seq id no:73、seq id no:75、seq id no:77、seq id no:79、seq id no:81、seq id no:83、seq id no:85、seq id no:87和seq id no:89。
[0111]
在另一个方面,本公开涉及具有提高的acc活性的acc变体多肽,其与seq id no:6具有至少约50%的序列同一性。在一些实施方案中,acc变体多肽与seq id no:6的acc变体序列具有至少约50%(例如,约48%到约52%)、至少约60%、至少约70%、至少约75%、至少76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约
id no:15、seq id no:17、seq id no:19、seq id no:21、seq id no:23、seq id no:25、seq id no:27、seq id no:29、seq id no:31、seq id no:33、seq id no:35、seq id no:37、seq id no:39、seq id no:41、seq id no:43、seq id no:45、seq id no:47、seq id no:49、seq id no:51、seq id no:53、seq id no:55、seq id no:57、seq id no:59、seq id no:61、seq id no:63、seq id no:65、seq id no:67、seq id no:69、seq id no:71、seq id no:73、seq id no:75、seq id no:77、seq id no:79、seq id no:81、seq id no:83、seq id no:85、seq id no:87和seq id no:89。在一些实施方案中,所述核酸序列编码具有一个或多个导致本文所述的有用的特性和/或性质的取代的acc变体。在其它实施方案中,所述变体acc核酸序列来自于生物体例如大肠杆菌。
[0113]
在另一个实施方案中,本公开涉及acc变体多肽,它包括由核酸编码的氨基酸序列,所述核酸在严谨条件下与相应于下述seq id nos的核酸的基本上全长杂交,所述seq id nos包括,但不限于,seq id no:3、seq id no:5、seq id no:7、seq id no:9、seq id no:11、seq id no:13、seq id no:15、seq id no:17、seq id no:19、seq id no:21、seq id no:23、seq id no:25、seq id no:27、seq id no:29、seq id no:31、seq id no:33、seq id no:35、seq id no:37、seq id no:39、seq id no:41、seq id no:43、seq id no:45、seq id no:47、seq id no:49、seq id no:51、seq id no:53、seq id no:55、seq id no:57、seq id no:59、seq id no:61、seq id no:63、seq id no:65、seq id no:67、seq id no:69、seq id no:71、seq id no:73、seq id no:75、seq id no:77、seq id no:79、seq id no:81、seq id no:83、seq id no:85、seq id no:87和seq id no:89。在一些实施方案中,所述核酸序列编码来自于生物体例如大肠杆菌的acc变体核酸序列。在相关的方面,本公开提供由核苷酸序列编码的acc变体,所述核苷酸序列与seq id no:1具有至少约70%、至少约75%、至少76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少99%的序列同一性,并包含一个或多个本文公开的取代。
[0114]
本公开表明,单独在accb基因的编码区中的突变是有益的(见上文),而accb和accc基因的表达同时改变也是有益的。在大肠杆菌中,发现accb和accc基因在染色体的一个操纵子中,相互邻近。建立了accbc操纵子的表达文库,并筛选显示出acc活性(通过细胞中丙二酰
‑
coa衍生化合物的生产的增加来测量)比野生型accbc启动子提高的变体。表2(见上文)总结了基于accbc t5启动子序列的最佳变体,所述accbc t5启动子序列如下所示(下划线区域表示启动子的
‑
35和
‑
10位置):
[0115]
大肠杆菌野生型accbc启动子(paccbc)区域核苷酸序列(seq id no:91):
[0116]
ttgttgcaaattacacggtgttgaaggttatttacatgttagctgttgattatcttc cctgataagaccagtatttagct
[0117]
噬菌体t5启动子(pt5)核苷酸序列(seq id no:92):
[0118]
aatcataaaaaatttatttgctttcaggaaaatttttctgtataatagattc
[0119]
表2:具有增加的fame生产的accbc t5启动子变体
[0120][0121]
可以使用引物将天然accbc启动子区域替换为任何合适的启动子文库(例如杂合启动子、人工或合成启动子、来自不同生物体的启动子、来自相同生物体的不同基因的启动子、商购启动子等)来构建文库,所述文库通常含有简并核苷酸以引入随机突变。在特定的实施方案中,启动子是发育调控启动子、器官特异性启动子、组织特异性启动子、诱导型启动子、组成型启动子或细胞特异性启动子。本文中考虑所有合适的启动子。在其它实施方案中,可以使用本领域技术人员已知的多种技术使accbc操纵子的表达改变,包括,但不限于,将启动子替换为不同的大肠杆菌启动子或异源启动子、天然启动子的突变、accb和accc的核糖体结合位点(rbs)中分别突变或一起突变、accbc启动子和accb基因之间的非翻译区(utr)的改变、accbc操纵子在染色体中或在质粒上重复、将染色体accbc操纵子替换为质粒编码的操纵子、与accbc启动子区域结合的转录因子的工程化。在一个示例性的实施方案中,使用噬菌体t5启动子。在一个实施方案中,可以通过pcr技术将启动子文库与合适的同源区域相连,然后文库可以被整合到细菌染色体中(参见实施例2),替换天然accbc启动子。可以如实施例2所示筛选表达文库(见下文)。
[0122]
改进的acc变体的性质
[0123]
通过诱变对野生型bccp(seq id nos:1和2)进行基因上的改变,以产生高百分比的丙二酰
‑
coa衍生化合物如fame,而不需要用大肠杆菌的表达作为例证模型来过表达任何其它基因(参见实施例1,见下文)。通过同样的方式对accbc操纵子进行基因上的改变(参见实施例2,见下文)。这样,当在重组宿主细胞例如大肠杆菌中表达时,野生型bccp的变体导致较高的所希望产物的滴度和产率,即,当它们在宿主细胞(例如重组细胞)中表达时,与野生型宿主细胞(不表达acc变体)相比,产生更大量的丙二酰
‑
coa衍生化合物,如脂肪酸衍生物。野生型acc是天然蛋白复合物,它通常需要所有四种蛋白以具有活性,包括生物素羧化酶(bc)、生物素羧基载体蛋白(bccp)和两个形成羰基转移酶(ct)的蛋白。但是,本公开的变体bccps看来赋予细胞增加丙二酰
‑
coa衍生化合物生产的能力。不希望受到理论的束缚,设想这可能是变体bccps的直接结果,所述变体bccps直接或间接赋予表达天然acc的细胞增加的acc活性。例如,与野生型细胞相比,当bccp变体多肽在宿主细胞中表达时,产生约100%到约650%的fame(参见上文表1,和下文表3)。这表示观察到的fame的滴度为野生型细胞正常产生的fame滴度的达650%。在另一个实施例中,accbc操纵子的改变获得变体bccp多肽,与野生型细胞相比,当它的宿主细胞中表达时,产生约200%到约350%的fame(参见上文表2)。
[0124]
在一个实施方案中,预期acc变体多肽与野生型acc酶相比产生增加量的脂肪酸衍生物,所述脂肪酸衍生物包括,但不限于,脂肪酯例如脂肪酸甲酯(fame)和脂肪酸乙酯(faee)、脂肪胺、脂肪醛、脂肪醇、短链和长链醇、烃、酮、烷、末端烯烃、内烯烃、β羟基脂肪酸
衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。在另一个实施方案中,预期acc变体多肽与野生型acc酶相比产生增加量的不基于脂肪酸的化合物(例如,黄烷酮和类黄酮、聚酮化合物、3
‑
羟基丙酸、丙二酸等)。本领域技术人员将认识到,可以通过acc变体生产的终产物包括几类化合物,包括脂肪酸衍生物和非脂肪酸化合物,这取决于被丙二酰
‑
coa的上调所影响的不同生化途径。图4提供了可能化合物的非穷尽的实例。
[0125]
制备acc变体的方法
[0126]
在实施本发明的方法时,诱变被用于制备多组重组宿主细胞,以便进行筛选。典型地,重组宿主细胞包含一种或多种多核苷酸序列,其包括acc变体多肽的开放阅读框,例如变体accb基因,连同可操作连接的调控序列和/或accb基因连同可操作连接的变体accbc启动子。本文描述了可用于实施本公开方法的包括变体bccp多肽的变体acc多肽的多个实例。本文还描述了可用于实施本公开方法的调控序列的实例。可以使用基因工程技术,例如定点诱变、随机化学诱变、核酸外切酶ii i删除程序或标准克隆技术进行这种多核苷酸序列的诱变。或者,可以通过化学合成或修饰程序产生多核苷酸序列中的突变。本领域普通技术人员会认识到可以对本文中所使用的方案和程序进行修改,这种修改是依据本公开的变化形式。例如,当以特定的顺序描述方法步骤时,步骤的顺序可以被修改,和/或可以并行或顺序进行。
[0127]
诱变方法是本领域公知的,包括,例如,下述方法。在易错pcr(leung et al.(1989)technique1:11
‑
15;和caldwel l et al.(1992)pcr methods applic.2:28
‑
33)中,在dna聚合酶复制保真度低的条件下进行pcr,以在pcr产物的全长上获得高的点突变率。简短地说,在这种程序中,待诱变的多核苷酸与pcr引物、反应缓冲液、mgcl2、mncl2、taq聚合酶和合适浓度的dntps混合,以便在pcr产物的全长上获得高的点突变率。例如,可使用20fmoles待突变的核酸,30pmole每种pcr引物,含有50mm kcl、10mm tris hcl(ph 8.3)和0.01%明胶、7mm mgcl2、0.5mm mncl2的反应缓冲液,5单位taq聚合酶,0.2mm dgtp、0.2mm datp、1mm dctp和1mm dttp进行反应。pcr可以进行30个循环,每个循环为94℃ 1min,45℃ 1min和72℃ 1min。应当理解,这些参数可以适当地改变。然后将诱变的多核苷酸克隆到合适的载体中,并评价由诱变的多核苷酸编码的受影响多肽的活性。还可以通过寡核苷酸定点诱变(reidhaar
‑
olson et al.(1988)science 241:53
‑
57)进行诱变,以在任何感兴趣的克隆dna中产生位点特异性突变。简短地说,在这种程序中,合成多个双链寡核苷酸并将其拼装到待诱变的克隆dna中,所述双链寡核苷酸带有一个或多个要被引入到克隆dna中的突变。回收含有诱变dna的克隆,并评价所影响的多肽的活性。另一种用于产生多核苷酸序列变体的诱变方法是拼装pcr(assembly pcr)。拼装pcr涉及来自于小dna片段的混合物的pcr产物的拼装。大量不同的pcr反应在相同的瓶中平行进行,其中一个反应的产物启动另一个反应的产物。拼装pcr在例如美国专利no.5965408中描述。产生多核苷酸序列变体的另一种方法是有性pcr诱变(stemmer(1994)pnas,usa 91:10747
‑
10751)。在有性pcr诱变中,作为基于序列同源性的dna分子的随机片段化的结果,在体外在不同的但高度相关的dna序列的dna分子之间形成被迫的同源重组。然后在pcr反应中通过引物的延伸固定交联。
[0128]
acc变体还可以通过体内诱变产生。在一些实施方案中,在一些实施方案中,通过在细菌菌株,例如大肠杆菌菌株中增殖多核苷酸序列而产生核酸序列中的随机突变,所述多核苷酸序列带有一种或多种dna修复途径中的突变。这种“增变基因”菌株具有比野生型
菌株更高的随机突变率。在这些菌株中的一种菌株中增殖dna序列最终在dna内产生随机突变。适用于体内诱变的增变基因菌株在例如pct国际专利申请公开号wo91/16427中描述。
[0129]
acc变体还可使用盒式诱变产生。在盒式诱变中,双链dna分子的小的区域被不同于原始多核苷酸序列的合成寡核苷酸“盒”替代。寡核苷酸通常含有完全和/或部分随机化的原始多核苷酸序列。盒式诱变存在许多应用;例如,通过盒式诱变制备突变体蛋白(richards,j.h.(1986)nature323:187;ecker et al.(1987)j.biol.chem.262:3524
‑
3527);密码子盒式诱变以插入或替换单个密码子(kegler
‑
ebo et al.(1994)nucleicacids res.22(9):1593
–
1599);通过包含调控序列的非编码多核苷酸序列(例如,核糖体进入位点)的随机化制备变体多核苷酸序列(参见,例如,barrick et al.(1994)nucleic acids res.22(7):1287
–
1295);wi lson et al.(1994)biotechniques 17:944
‑
953)。
[0130]
递归整体诱变(recurs ive ensemble mutagenes is)(arkin et al.(1992)pnas,usa 89:7811
‑
7815)也可以用来产生多核苷酸序列变体。递归整体诱变是用于蛋白质工程(即蛋白质诱变)的算法,所述蛋白质工程被开发以产生不同的表型相关突变体群,所述突变体群的成员的氨基酸序列存在差异。该方法利用反馈机制控制组合的盒式诱变的连续循环。指数整体诱变(exponential ensemble mutagenesis)(delegrave et al.(1993)biotech.res.11:1548
‑
1552)也可以用来产生acc的多核苷酸序列变体。指数整体诱变是产生组合文库的过程,所述组合文库具有高百分比的独特的和功能性的突变体,其中小组残基被平行随机化,以在每个改变的位置确定产生功能性蛋白的氨基酸。还可以使用随机和定点诱变(arnold(1993)curr.opin.biotech.4:450
‑
455)。
[0131]
进一步,可以使用体内诱变的标准方法。例如,可以通过暴露于辐射(例如,uv光或x
‑
射线)或暴露于化学物质(例如,乙基化剂、烷化剂或核酸类似物),使包含一个或多个多核苷酸序列的宿主细胞经受诱变,所述一个或多个多核苷酸序列包括acc多肽的开放阅读框以及可操作连接的调控序列。在一些宿主细胞类型中,例如,细菌、酵母和植物中,转座元件也可以用于体内诱变。
[0132]
编码acc相关多肽的一个或多个多核苷酸序列通常导致acc多肽产物的表达,所述acc多肽产物证明有改变的和改进的生物学功能。例如,包括accb的一个或多个多核苷酸序列的诱变通常导致bccp多肽产物的表达,所述bccp多肽产物证明有改变的和改进的生物学功能例如增强的acc活性。当通过对一个或多个包括编码bccp的开放阅读框和可操作连接的调控序列的多核苷酸序列进行诱变来制备一组重组微生物时,由得到的诱变多核苷酸序列表达的蛋白将显示出增强的acc生物学功能。因此,在有效表达突变体accb多核苷酸的条件下培养重组微生物之后,观察到提高的丙二酰
‑
coa衍生化合物例如脂肪酸衍生物或其它化合物的产率,和/或增加的它们的组合物,包括改变的脂肪酸衍生物或其它化合物(在链的长度、饱和度等方面)的混合物。
[0133]
热点
[0134]
本公开还基于,至少是部分基于鉴别了特定的在变体acc多肽包括变体bccp多肽之间在结构上保守的“热点”。热点是观察到大量导致高滴度的脂肪酸衍生物如fame或个高滴度的非脂肪酸化合物的突变的区域。值得注意的是,在变体bccp多肽中观察到这种区域,即在氨基酸位置1到约氨基酸位置60的n
‑
末端氨基酸区域观察到热点(例如,显示出最高的
突变数量)。
[0135]
基序
[0136]
本公开还基于,至少部分基于鉴别了特定的在变体acc多肽包括变体bccp多肽之间在结构上保守的基序。生物素蛋白连接酶(ec6.3.4.15),也被称为全羧化酶合成酶,催化生物素辅基与acc的bccp亚基的特定赖氨酸的共价结合。bccp
‑
类型的蛋白在生物素结合位点具有保守基序。该基序包括k(赖氨酸),它是生物素化的赖氨酸残基。不同细菌物种的bccp多肽都具有该保守基序,表明在该区域的任何突变可以导致功能降低。该基序的共有序列如下所示,其中k是生物素化的赖氨酸:
[0137]
(l/i/v)e(a/v)mk(m/l)
[0138]
图2显示了来自七个不同细菌物种的bccp氨基酸序列的一部分的比对,包括大肠杆菌(seq id no:97(部分);seq id no:2(全长);登录号np_417721),短乳杆菌(lactobacillus brevis)(seq id no:98(部分);seq id no:104(全长);登录号wp_011667655),嗜麦芽寡养单胞菌(stenotrophomonas maltophilia)(seq id no:99(部分);seq id no:105(全长);登录号ail09846),恶臭假单胞菌(pseudomonas putida)(seq id no:100(部分);seq id no:106(全长);登录号ae016246_3),枯草芽孢杆菌(bacillius subtilis)(seq id no:101(部分);seq id no:107(全长);登录号np_390315),谷氨酸棒杆菌(corynebacterium glutamicum)(seq id no:102(部分);seq id no:108(全长);登录号wp_011013826),和酿酒酵母(saccharomyces cerevisiae)(seq id no:103(部分);seq id no:109(全长);登录号aaa20073)。虽然整体氨基酸序列的同一性在约10%到约66%之间,该基序在所有七个物种之间是保守的(参见图2中方框区域)。例如,短乳杆菌的bccp与大肠杆菌相比显示出28%的同一性。嗜麦芽寡养单胞菌的bccp与大肠杆菌相比显示出55%的同一性。恶臭假单胞菌的bccp与大肠杆菌相比显示出66%的同一性。枯草芽孢杆菌的bccp与大肠杆菌相比显示出40%的同一性。谷氨酸棒杆菌和酿酒酵母的bccp与大肠杆菌相比显示出10%的同一性。这证明即使是在趋异的物种中该基序也是保守的。但是,在一些情况下,bccp多肽在不同物种之间具有高的氨基酸序列同一性,从约85%的同一性到约100%的同一性。例如,escherichia alberti的bccp与大肠杆菌有约98%相同;弗氏志贺菌的bccp与大肠杆菌有约93%相同;以及肺炎克雷伯菌与大肠杆菌有约85%相同。
[0139]
宿主细胞和宿主细胞培养物
[0140]
应当理解,考虑到本公开,本文涉及的任何实施方案可以用任何可通过引入编码一个或多个acc变体的一个或多个核酸序列而进行基因修饰的宿主细胞或微生物来实施。因此,本公开的重组微生物是作为宿主细胞,并包含一个或多个编码变体acc多肽的开放阅读框和有利于acc多肽在宿主细胞中表达的可操作连接的调控序列的多核苷酸序列,所述变体acc多肽赋予提高的/增加的acc活性和/或提高的/增加的丙二酰
‑
coa衍生化合物生产。在一个实施方案中,赋予提高的/增加的acc活性和/或提高的/增加的丙二酰
‑
coa衍生化合物生产的多肽是bccp的变体或突变体。在另一个实施方案中,赋予提高的/增加的acc活性和/或提高的/增加的丙二酰
‑
coa衍生化合物生产的多肽是由accbc操纵子的表达改变而获得的改进的bcc或其它改进的acc多肽或它们的组合。在本公开的重组宿主细胞中,开放阅读框编码序列和/或调控序列可以相对于相应的bccp多肽的野生型编码序列被修饰。通过在有效表达变体acc多肽包括变体bccp的条件以及在存在碳源的条件下培养表达acc
变体的宿主细胞(即重组宿主细胞)产生脂肪酸衍生组合物(参见图1和图3)。突变体或变体acc多肽的表达导致产生脂肪酸衍生组合物,其脂肪酸、脂肪酯、脂肪醇、脂肪胺、脂肪醛、双功能脂肪酸衍生物、二酸、烃、酮、烷、烯或烯烃和/或诸如此类物质的产率增加。在一个实施方案中,突变体或变体acc多肽例如变体bccp多肽的表达导致包括fame和/或faee的脂肪酯组合物的产率增加。通过在有效表达变体acc多肽包括变体bccp的条件以及在存在碳源的条件下培养表达acc变体的宿主细胞(即重组宿主细胞)产生非脂肪酸化合物(参见图4)。突变体或变体acc多肽的表达导致产生非脂肪酸化合物的产率增加,包括聚酮化合物、黄烷酮、类黄酮、3
‑
羟基丙酸(3
‑
hp)、丙二酸和其它物质(参见图4)。
[0141]
本公开的宿主细胞或微生物包括宿主菌株或宿主细胞通过基因工程而含有基因上的改变,以测试特定突变对于酶活性的效力(即重组细胞或微生物)。不同的可选的基因操作和改变可以从一种宿主细胞到另一种之间互换使用,这取决于原始宿主细胞中存在何种天然酶促途径。在一个实施方案中,宿主菌株可用于测试acc变体。宿主菌株可以包含多个基因改变,以测试特定变量和培养环境,包括,但不限于,培养条件,包括发酵组分、碳源(例如给料)、温度、压力、降低培养污染条件和氧水平。
[0142]
在一个实施方案中,使用被称为bd64的宿主菌。bd64基于大肠杆菌菌株mg1655,其包含任选的fade和fhua缺失。酰基
‑
coa脱氢酶(fade)是重要的酶,用于代谢脂肪酸。它催化脂肪酸利用中的第二步(β
‑
氧化),其是将脂肪酸(酰基
‑
coas)的长链打断成为乙酰
‑
coa分子。更具体地说,细菌中脂肪酸降解的β
‑
氧化循环的第二步是酰基
‑
coa氧化为2
‑
烯酰
‑
coa,其由fade催化。当大肠杆菌缺少fade时,它不能以脂肪酸作为碳源在其上生长,但可以在醋酸盐上生长。它没有使用任何链长的脂肪酸的能力,这与报道的fade菌株,即fade功能被破坏的fade突变体菌株的表型一致。fade基因可以任选地被敲除或被减弱,以确保酰基
‑
coas,这个途径的中间产物,可以在细胞中积累,以使所有酰基
‑
coas可以被酯合成酶有效转化为脂肪酯。但是,当使用糖作为碳源的时候,fade的减弱是可选的,因为在这种条件下,fade的表达可能被阻遏,因此fade可能仅少量存在,不能有效与酯合酶竞争酰基
‑
coa底物。fade由于分解代谢物阻遏而被阻遏。与脂肪酸相比,大肠杆菌和许多其它微生物更喜欢消耗糖,因此当这两个来源均可利用时,糖通过阻遏fad调节子而首先被消耗(参见d.clark,j bacteriol.(1981)148(2):521
‑
6))。而且,糖的缺乏诱导fade表达。酰基
‑
coa中间产物可能不能为β氧化途径所利用,因为由fad调节子(包括fade)表达的蛋白被上调并有效竞争酰基
‑
coas。因此,将fade基因敲除或减弱可能是有益的。由于许多碳源是基于糖的,因此减弱fade是可选的。基因fhua编码tona蛋白,它是大肠杆菌外膜中的能量偶联的转运蛋白和受体(v.braun(2009)j bacteriol.191(11):3431
–
3436)。它的缺失是可选的。fhua的缺失使得细胞变得对噬菌体的攻击更具有抵抗力,这在某些发酵条件下可能是有利的。因此,在发酵运行期间可能遭受潜在污染的宿主细胞中,缺失fhua可能是合乎需要的。
[0143]
宿主菌株bd64(见上文)还包含一种或多种下述基因的任选的过表达:来自大肠杆菌的fadr,来自鼠伤寒沙门氏菌(salmonella typhimurium)的faba(np_460041),来自鼠伤寒沙门氏菌的fabd(np_460164),来自鼠伤寒沙门氏菌的fabg(np_460165),来自鼠伤寒沙门氏菌的fabh(np_460163),来自霍乱弧菌(vibrio cholera)的fabv(yp_001217283)和来自丙酮丁醇梭菌(clostridium acetobutylicum)的fabf(np_350156)。编码脂肪酸生物合成中的酶和调节物的这些基因中的一种或多种的过表达,可以用来进一步增加不同培养条
oryzae)细胞、特异腐质霉(humicola insolens)细胞、梳棉状嗜热丝孢菌(humicola lanuginose)细胞、混浊红球菌(rhodococcus opacus)细胞、米黑根毛霉(rhizomucor miehei)细胞、或米黑毛霉(mucor michei)细胞。在其它的实施方案中,宿主细胞是变铅青链霉菌(streptomyces lividans)细胞或鼠灰链霉菌(streptomyces murinus)细胞。在其它的实施方案中,宿主细胞是放线菌(actinomycetes)细胞。在一些实施方案中,宿主细胞是酿酒酵母细胞。
[0151]
在其它实施方案中,宿主细胞是来自真核植物、藻类、蓝细菌、绿硫细菌、绿色非硫细菌、紫硫细菌、紫色非硫细菌、极端微生物、酵母、真菌、其工程化生物体、或合成生物体的细胞。在一些实施方案中,宿主细胞依赖于光或者固碳。在一些实施方案中,宿主细胞具有自养活性。
[0152]
在一些实施方案中,宿主细胞具有光合自养活性,例如在存在光的条件下。在一些实施方案中,宿主细胞在缺乏光的条件下是异养的或兼养的。在特定的实施方案中,宿主细胞是来自于拟南芥(arabidops is thal iana)、柳枝稷(panicum virgatum)、巨芒(miscanthus giganteus)、玉蜀黍(zea mays)、布朗葡萄藻(botryococcusebraunii)、莱茵衣藻(chlamydomonas reinhardtii)、盐生杜氏藻(dunaliela salina)、聚球藻(synechococcus sp.)pcc 7002、聚球藻(synechococcus sp.)pcc 7942、集胞藻(synechocystis sp.)pcc 6803、细长嗜热聚球藻(thermosynechococcus elongates)bp
‑
1、微温绿硫菌(chlorobium tepidum)、嗜热光合绿曲菌(chlorojlexus auranticus)、酒色着色菌(chromatiummvinosum)、深红红螺菌(rhodospirillumrubrum)、荚膜红细菌(rhodobacter capsulatus)、沼泽红假单胞菌(rhodopseudomonas palusris)、杨氏梭菌(clostridiumljungdahlii)、热纤梭菌(clostridiumthermocellum)、产黄青霉(penicilliumchrysogenum)、巴斯德毕赤酵母(pichia pastoris)、酿酒酵母、粟酒裂殖酵母(schizosaccharomyces pombe)、荧光假单胞菌(pseudomonas fluorescens)、或运动发酵单胞菌(zymomonas mobilis)的细胞。.
[0153]
在一个实施方案中,微生物细胞来自于蓝细菌,所述蓝细菌包括,但不限于,原绿球藻、聚球藻、集胞藻、蓝杆藻和点状念球藻。在另一个实施方案中,微生物细胞来自于特定的蓝细菌物种,包括,但不限于细长聚球藻pcc7942、集胞藻pcc6803和聚球藻pcc7001。
[0154]
制备重组宿主细胞和培养物的方法
[0155]
可使用各种本领域公知的方法对宿主细胞进行工程化,以产生脂肪酸衍生物和/或脂肪酸衍生组合物或其它化合物。所述方法可以包括使用载体,优选表达载体,所述载体包含编码突变体或变体acc的核酸,所述突变体或变体acc包括突变体或变体bccp,如本文所述。本领域技术人员理解多种病毒和非病毒载体可用于本文所述的方法中。
[0156]
在本公开的一些实施方案中,特定组合物中的更高滴度的化合物例如脂肪酸酯是指与由相应的野生型宿主细胞的对照培养物产生的相同脂肪酸酯或脂肪酸酯的组合的滴度相比,由重组宿主细胞培养物产生的特定类型的脂肪酸酯或脂肪酸酯的组合物的滴度更高。在其它实施方案中,其它脂肪酸衍生物或非脂肪酸化合物由重组宿主细胞培养物以类似的方式产生。在一些实施方案中,包括突变体或变体accb多核苷酸(或基因)序列的突变体或变体acc多核苷酸(或基因)序列通过重组载体由宿主细胞提供,所述重组载体包含与所述多核苷酸序列可操作连接的启动子。在特定的实施方案中,启动子是发育调控启动子、
器官特异性启动子、组织特异性启动子、诱导型启动子、组成型启动子或细胞特异性启动子。重组载体通常包含选自下述的至少一种序列:与多核苷酸序列可操作偶联(operatively coupled)的表达控制序列;与多核苷酸序列可操作偶联的选择标记;与多核苷酸序列可操作偶联的标记序列;与多核苷酸序列可操作偶联的纯化部分;与多核苷酸序列可操作偶联的分泌序列;和与多核苷酸序列可操作偶联的靶向序列。包含编码蛋白质和可操作连接的调控序列的开放阅读框多核苷酸序列可以被整合到重组宿主细胞的染色体中,被并入到一个或多个常驻于重组宿主细胞中的质粒表达系统中,或者这两个过程都有。
[0157]
本文所述的表达载体包括本文所述的多核苷酸序列,其以适合于在宿主细胞中表达所述多核苷酸序列的形式存在。本领域技术人员应当理解,表达载体的设计可以取决于这样的因素,如待转化的宿主细胞的选择、所需多肽表达水平等。本文所述的表达载体可以被引入宿主细胞内,以产生由如本文所述的多核苷酸序列编码的多肽,包括融合多肽。编码多肽的基因在原核生物例如大肠杆菌中的表达,最常用含有组成型或诱导型启动子并指导融合或非融合多肽的表达的载体来进行用于原核细胞和真核细胞二者的合适的表达系统是本领域公知的;参见,例如,sambrook et al.,“molecular cloning:a laboratory manual,”second edi tion,cold spring harbor laboratory,(1989)。在特定的实施方案中,本公开的多核苷酸序列与来自细菌噬菌体t5的启动子可操作连接。在一个实施方案中,宿主细胞是酵母细胞。在该实施方案中,表达载体是酵母表达载体。载体可以通过多种用于将外源核酸(例如dna)引入到宿主细胞中的本领域公认的技术被引入到原核细胞或真核细胞中。用于转化或转染宿主细胞的合适的方法可以在例如sambrook et al.(见上文)中找到。
[0158]
对于细菌细胞的稳定转化,已知的是,取决于所使用的表达载体和转化技术,只有一小部分细胞会摄取并复制表达载体。为了鉴别并选择这些转化体,可以将选择标记(例如对抗生素的抗性)与感兴趣的基因一起引入到宿主细胞中。选择标记包括赋予对药物的抗性的那些,例如,但不限于,氨苄青霉素、卡那霉素、氯霉素或四环素。编码选择标记的核酸可以与编码本文所述的多肽的核酸在同一个载体上被引入到宿主细胞中,或者可以被引入到不同的载体上。用引入的核酸稳定转化的细胞可以通过在存在合适的选择药剂的条件下的生长而被鉴别。
[0159]
重组宿主细胞的培养和发酵
[0160]
如本文所使用的,术语“发酵”泛指由宿主细胞将有机材料转化为靶物质,例如,通过在包含碳源的培养基中增殖重组宿主细胞的培养物,使重组细胞将碳源转化为脂肪酸或其衍生物。如本文所使用的,术语“允许生产的条件”是指允许宿主细胞生产所需产物,例如包括脂肪酸衍生物和其它非脂肪酸化合物的丙二酰
‑
coa衍生化合物的任何条件。类似地,术语“载体的多核苷酸被表达的条件”表示允许宿主细胞合成多肽的任何条件。合适的条件包括,例如,发酵条件。发酵条件可以包括许多参数,包括但不限于温度范围、通气水平、给料速率和培养基成分。这些条件的每一个,单独或组合,允许宿主细胞生长。发酵可以是需氧的、厌氧的、或它们的变化形式(例如微需氧的)。示例性的培养基包括培养液或凝胶。通常,培养基包括能够被宿主细胞直接代谢的碳源。此外,在培养基中可以使用酶来促进碳源的固定(例如使淀粉或纤维素解聚为可发酵的糖)和后续的代谢。
[0161]
对于小规模的生产来说,工程化的宿主细胞可以以例如每批约100μl、200μl、300μ
l、400μl、500μl、1ml、5ml、10ml、15ml、25ml、50ml、75ml、100ml、500ml、1l、2l、5l或10l的量生长;发酵;并诱导表达所需的多核苷酸序列,例如编码acc变体多肽的多核苷酸序列。对于大规模生产来说,工程化的宿主细胞可以每批约10l、100l、1000l、10,000l、100,000l、1,000,000l或更大体积培养物的量生长;发酵;并并诱导表达所需的多核苷酸序列。本文所述的脂肪酸衍生组合物或其它化合物可以在重组宿主细胞培养物的胞外环境中找到,并且可以容易地从培养基中分离。脂肪酸衍生物可由重组宿主细胞分泌,被运送至细胞外环境中或被动地被转移到重组细胞培养物的胞外环境中。在一个实施方案中,可以通过本领域已知的常规方法从重组宿主细胞培养物中分离脂肪酯组合物。可以在胞外或胞内产生任何非脂肪酸化合物。
[0162]
筛选重组宿主细胞
[0163]
在本公开的一个实施方案中,可以通过培养重组宿主细胞(包含一个或多个诱变的或变体acc序列),然后筛选鉴别例如由重组宿主细胞产生的脂肪酸衍生组合物或其它化合物的特性,例如脂肪酸衍生物或其它化合物的滴度、产率和生产,从而确定突变体或变体acc多肽的活性。在另一个实施方案中,通过培养重组宿主细胞(包含一个或多个诱变的或变体acc序列),然后筛选鉴别例如由重组宿主细胞产生的脂肪酸衍生组合物(例如脂肪酯、脂肪醇、脂肪醛等)或其它化合物的特性,例如脂肪酸衍生物或其它化合物的滴度、产率和生产,从而确定突变体或变体acc多肽的活性。可以使用常规方法测定突变体或变体acc多肽或突变体或变体bccp多肽及其片段的提高的acc活性和/或提高的/增加的丙二酰
‑
coa衍生化合物的生产。例如,使突变体或变体acc多肽或突变体或变体bccp多肽及其片段在允许多肽发挥作用的条件下与底物(例如,酰基
‑
coa、酰基
‑
acp、游离脂肪酸、醇)接触。在一个实施方案中,可以测量底物水平的减少或脂肪酯或脂肪酯组合物水平的增加,以确定acc活性。对于脂肪醇、脂肪醛、脂肪胺和其它脂肪酸衍生物以及其它化合物的生产使用同样的方法。
[0164]
来自于重组宿主细胞的产物
[0165]
如本文所使用的,“现代碳级分(fraction of modem carbon)”或fm具有与由美国国家标准技术研究所(national insti tute of standards and technology)(nist)的标准参考材料(srms 4990b和4990c,分别称为草酸标准hoxi和hoxii)定义的相同含义。基础定义涉及0.95倍的
14
c/
12
c同位素比率hoxi(参考ad1950)。这大致等于衰变校正的工业革命前树木。对于现在的生命生物圈(植物物质),fm为大约1.1。
[0166]
生物产品(例如根据本公开产生的脂肪酸衍生组合物或非脂肪酸组合物)包括生物产生的有机化合物。特别地,使用本文所述的脂肪酸生物合成途径产生的脂肪酸酯组合物,是由可再生的碳源生产的,并且是新物质组合物。基于双重碳
‑
同位素指纹分析或
14
c年代测定,可以将这些新的生物产品与衍生自石油化学品碳的有机化合物区分开。此外,可以通过双重碳同位素指纹分析测定生物来源碳的特定来源(例如葡萄糖相对于甘油)(参见,例如,美国专利no.7169588)。在商业中,区别生物产品与基于石油的有机化合物的能力在追踪这些材料上是有利的。例如,包含基于生物的和基于石油的碳同位素谱二者的有机化合物或化学制品可以区别于仅由基于石油的材料制备的有机化合物和化学产品。因此,在商业中,可基于本文的生物产品的独特的碳同位素谱来追踪或跟踪它们。通过比较每个样品中稳定碳同位素比(
13
c/
12
c),可将生物产品与基于石油的有机化合物区分开。给定生物
产品中
13
c/
12
c比是二氧化碳被固定时大气二氧化碳中的
13
c/
12
c比的结果。它还反映了准确的代谢途径。还存在区域差异。石油、c3植物(阔叶植物)、c4植物(草本植物)及海洋碳酸盐在
13
c/
12
c及相应的δ
13
c值中全部表现出显著差异。c4和c3植物都表现出一定范围的
13
c/
12
c同位素比,但是对于c4植物,典型值是约千分之
‑
7至约千分之
‑
13,而对于c3植物,是约千分之
‑
19至约千分之
‑
27(参见,例如,stuiver et al.,radiocarbon 19:355(1977))。煤和石油通常落在这个范围内。
[0167]
δ13c(
‰
)=[(
13
c/
12
c)样品
‑
(
13
c/
12
c)标准]/(
13
c/
12
c)标准
×
1000
[0168]
已与iaea、usgs、nist和其它选定的国际同位素实验室合作开发了一系列替代的pms。与pdb的偏差千分数记为δ
13
c。通过高精度的稳定比率质谱(irms)在质量44、45和46的分子离子上对co2进行测量。本文所述的组合物包括通过本文所述的任何方法生产的脂肪酯组合物和产物。具体而言,脂肪酯组合物或产物可以具有约
‑
28或更大、约
‑
27或更大、
‑
20或更大、
‑
18或更大、
‑
15或更大、
‑
13或更大、
‑
10或更大或
‑
8或更大的δ
13
c。例如,脂肪酯组合物或产物可以具有约
‑
30到约
‑
15、约
‑
27到约
‑
19、约
‑
25到约
‑
21、约
‑
15到约
‑
5、约
‑
13到约
‑
7或约
‑
13到约
‑
10的δ
13
c。在其它情况下,脂肪酯组合物或产物可以具有约
‑
10、
‑
11、
‑
12或
‑
12.3的δ
13
c。还可以通过比较每种化合物中
14
c的量,将根据本公开的脂肪酯组合物或产物区别于石油基有机化合物。因为
14
c具有5730年的核半衰期,所以含有“较老的”碳的基于石油的燃料可以区别于含有“较新的”碳的生物产品(参见,例如,currie,“source apportionment of atmospheric part icles”,characterization of environmental part icles,j.buffle and h.p.van leeuwen,eds.,1of vol.i of the iupac environmental analytical chemistry series(lewis publ ishers,inc.)3
‑
74,(1992))。
[0169]
放射性碳年代测定法的基本假设是大气中
14
c浓度的恒定性导致活有机体中
14
c的恒定性。然而,由于1950年以来的大气核试验以及1850年以来的化石燃料的燃烧,
14
c已经获得了次级的地球化学时间特性(geochemical time characteristic)。它在大气co2中以及由此在生物圈中的浓度在19世纪60年代中期核试验的高峰时几乎翻倍。此后,其逐渐地返回至大约1.2x 10
‑
12
的稳态宇宙发生(大气)基线同位素率(
14
c/
12
c),并且近似驰豫“半衰期”(relaxation"half
‑
l ife")为7到10年。(后者所述的该半衰期不必按照字面理解;而是必须使用详细的大气核输入/衰变函数来追踪核时代开始以来的大气和生物圈的
14
c的变化。)后者所述的该生物圈
14
c时间特性支持每年对近代生物圈的碳进行年代测定的承诺。可以通过加速器质谱(ams)测量
14
c,结果以“现代碳级分”(fm)的单位给出。本文所述的脂肪酯组合物和产物包括具有至少大约1的fm 14
c的生物产品。例如,本公开的生物产品可以具有至少约1.01的fm 14
c、至少约1到约1.5的fm 14
c、约1.04到约1.18的fm 14
c、或约1.111到约1.124的fm 14
c。
[0170]
已知
14
c的另一种量度为现代碳的百分率(pmc)。对于使用
14
c年代的考古学家或地质学家而言,ad1950等于“零年龄”。这也代表100pmc。在1963年热核武器的顶峰时,大气中的“炸弹碳(bomb carbon)”达到正常水平的几乎两倍。其在大气中的分布从其出现以来一直是近似的,表现出比从ad 1950以来生活的植物和动物的100pmc更大的值。它随时间逐渐降低,现在的值接近107.5pmc。该意味着新鲜生物质材料,例如玉米,将给出接近107.5pmc的
14
c特征。基于石油的化合物将具有零的pmc值。化石碳与现代碳的组合导致现在pmc含量
的稀释。通过假定107.5pmc代表现在生物质材料的
14
c含量并且0pmc代表基于石油的产物的
14
c含量,测量的该材料的pmc值将反映两种组分类型的比例。例如100%来源于现代大豆的材料将给出接近107.5pmc的放射性碳特征。如果使用基于石油的产品将该材料稀释50%,它会给出约54pmc的放射性碳特征。通过设定“100%”等于107.5pmc并且设定“0%”等于0pmc,得到基于生物学的碳含量。例如,测量为99pmc的样品将给等同的93%的基于生物学的碳含量。这个值被称为平均的基于生物学的碳结果,并假定所分析的材料中的所有组分均起源于现代的生物材料或基于石油的材料。包含本文所述的一种或多种脂肪酯的生物产品可以具有至少约50、60、70、75、80、85、90、95、96、97、98、99或100的pmc。在其它的情况下,本文所述的脂肪酯可以具有约50和约100之间、约60和约100之间、约70和约100之间、约80和约100之间、约85和约100之间、约87和约98之间、或者约90和大约95之间的pmc。在其它情况下,本文所述的脂肪酯可以具有约90、91、92、93、94或94.2的pmc。
[0171]
脂肪酯组合物
[0172]
脂肪酯的实例包括脂肪酸酯,例如衍生自短链醇的那些,包括faee和fame,以及衍生自长链脂肪醇的那些。所产生的脂肪酯和/或脂肪酯组合物可用作,单独地或以适当的组合,生物燃料(例如生物柴油)、工业化学品、或生物燃料或工业化学品的组分或给料。在一些方面,本公开涉及生产脂肪酯组合物的方法,所述脂肪酯组合物包含一种或多种脂肪酸酯,包括,例如,faee、fame和/或长链醇的其它脂肪酸酯衍生物。在相关的方面,该方法包含适合于制备脂肪酯和脂肪酯组合物的基因工程生产宿主,所述脂肪酯和脂肪酯组合物包括,但不限于,fame、faee、脂肪酸丙酯、脂肪酸异丙酯、脂肪酸丁酯、单甘酯、脂肪酸异丁酯、脂肪酸2
‑
丁酯、脂肪酸叔丁酯等。
[0173]
酯具有许多商业用途。例如,生物柴油,一种替代燃料,由酯(例如脂肪酸甲酯、脂肪酸乙酯等)组成。一些低分子量的酯是易挥发的,具有令人愉悦的气味,这使它们可以用作香料或调味剂。此外,酯可用作油漆、涂料和清漆的溶剂。而且,一些天然存在的物质,例如蜡、脂肪和油,是由酯组成的。酯还可以用作树脂和塑料中的软化剂,汽油和油中的增塑剂、阻燃剂和添加剂。此外,酯可以用来制造聚合物、薄膜膜、纺织品、染料和药物。
[0174]
通常,从宿主细胞的胞外环境分离脂肪酯或脂肪酯组合物。在一些实施方案中,脂肪酯或脂肪酯组合物自然地从宿主细胞中分泌,部分地或全部地。在替代的实施方案中,脂肪酯或脂肪酯组合物被运送到胞外环境中,任选地在一种或多种转运蛋白的帮助下。在其它实施方案中,脂肪酯或脂肪酯组合物被动地被运送到胞外环境中。
[0175]
脂肪醇组合物
[0176]
脂肪醇的实例包括饱和的、不饱和的、直链的和支链的脂肪醇。所产生的脂肪醇和/或脂肪醇组合物可以用作,单独地或以适当的组合,去垢剂、工业化学品、或工业化学品的组分或给料。在一些方面,本公开涉及生产包含一种或多种脂肪醇的脂肪醇组合物的方法,所述一种或多种脂肪醇包括,例如,短链和长链脂肪醇。在相关的方面,该方法包含适合于制备脂肪醇和脂肪醇组合物的生产宿主。
[0177]
该方法可以生产包含c6
‑
c26脂肪醇的脂肪醇。在一些实施方案中,脂肪醇包括c6、c7、c8、c9、c10、c11、c12、c13、c14、c15、c16、c17、c18、c19、c20、c21、c22、c23、c24、c25和/或c26脂肪醇。在特定的实施方案中,脂肪醇是1
‑
癸醇、1
‑
月桂醇、1
‑
肉豆蔻醇、1
‑
十六烷醇、十八烯醇、十四碳烯醇或十六碳烯醇。在其它实施方案中,脂肪醇包括直链脂肪醇。在其它实
施方案中,脂肪醇包括支链脂肪醇。在其它实施方案中,脂肪醇包含环部分。在一些实施方案中,脂肪醇是不饱和脂肪醇。在其它实施方案中,脂肪醇是单不饱和脂肪醇。在其它实施方案中,脂肪醇是饱和脂肪醇。在另一个实施方案中,本发明的特征是由本文所述的任何方法或任何微生物产生的脂肪醇,或包含是由本文所述的任何方法或任何微生物产生的脂肪醇的表面活性剂。在一些实施方案中,脂肪醇具有约
‑
15.4或更大的δ
13
c。在特定的实施方案中,脂肪醇具有约
‑
15.4到约
‑
10.9,或约
‑
13.92到约
‑
13.84的δ
13
c。在一些实施方案中,脂肪醇具有至少约1.003的f
m14
c。在特定的实施方案中,脂肪醇具有至少约1.01或至少约1.5的f
m14
c。在一些实施方案中,脂肪醇具有约1.111到约1.124的f
m14
c。
[0178]
脂肪醇具有许多商业用途。短链脂肪醇在化妆品和食品工业中用作乳化剂、润肤剂和增稠剂。由于其两性性质,脂肪醇表现为非离子型表面活性剂,其可用作去垢剂。此外,脂肪醇用于蜡、胶、树脂、药液、润滑油添加剂、纺织品抗静电和整理剂、增塑剂、化妆品、工业溶剂和用于脂肪的溶剂中。
[0179]
通常,从宿主细胞的胞外环境分离脂肪醇或脂肪醇组合物。在一些实施方案中,脂肪醇或脂肪醇组合物自然地从宿主细胞中分泌,部分地或全部地。在替代的实施方案中,脂肪醇或脂肪醇组合物被运送到胞外环境中,任选地在一种或多种转运蛋白的帮助下。在其它实施方案中,脂肪醇或脂肪醇组合物被动地被运送到胞外环境中。
实施例
[0180]
下述特定实施例是为了对本公开进行举例说明,不应当被理解为限制权利要求的范围。
[0181]
为了对本发明的发现进行举例说明,开发了两种不同的方法来改进天然大肠杆菌acc酶,以提高fame的生产,即获得更高的滴度和产率。虽然已知在文献中,增加所有四种大肠杆菌acc基因的表达可以提高脂肪酸的生产,但令人惊讶地发现,accb基因的靶向突变和accbc操纵子中的靶向表达变化可以提高fame生产。
[0182]
方案:
[0183]
1.用于accbc的菌株构建
[0184]
使用被称为bd64(见上文)的宿主菌株表达accbc。生产宿主菌株含有几个基因操作,以测试accbc的表达。含有accbc操纵子的染色体区域被修饰。在存在acc互补系统的条件下进行基因操作。补充10mm的丙二酸盐,并从低拷贝质粒同时表达三叶草根瘤菌(rhizobium trifolii)的两个丙二酸盐利用基因matb和matc。使用标准操作技术将这些基因克隆到pkd46整合质粒的组成型操纵子的后面。accbc操纵子被敲除(参见datsenko et al.(2000)proceedings of thenational academy of sciences 97(12):6640
‑
6645),除了选择性平板含有10mm丙二酸盐。用相同的程序整合修饰的accbc操纵子,除了选择性平板缺少丙二酸盐。
[0185]
2.用于accb的菌株构建
[0186]
使用被称为bd64(见上文)的宿主菌株表达accb。使用与accbc的构建相同的策略修饰含有accb基因的染色体区域(见上文)。
[0187]
3.accfame生产测定
[0188]
使用fame生产系统测定对大肠杆菌acc酶活性的改变。含有所希望的acc变体的菌
株bd64(见上文)用被称为pkev13的酯合酶(es)质粒转化。通过将商业ptrc启动子(life technologies)和除烃海杆菌(marinobacter hydrocarbonoclasticus)atcc 49840的酯合酶基因克隆到质粒pcl1920中构建质粒pkev13(lerner et al.(1990)nucleic acids research 18(15):4631.)。发酵、提取菌株,并根据标准程序测量fame生产,在下面详细说明。
[0189]
如下所述进行发酵;取在96孔板中生长的lb培养物,使用30μl lb培养物接种270μl fa2p培养基,然后在振荡培养箱中在32℃培养约16小时。使用30μl过夜种子物接种含有2%甲醇和1mm iptg的300μl fa4p培养基。fa2p和fa4p培养基都是改良的m9基本培养基,其含有0.2g/l或0.4g/l(分别)磷酸盐。在fa2p和fa4p培养基中碳源都是50g/l葡萄糖。培养物在振荡培养箱中在32℃培养24小时,这时按照下面详细描述的标准提取方案对它们进行提取。
[0190]
如下所述进行提取;向每一个待提取的孔加入40μl 1m hcl,然后加入300μl醋酸丁酯以及500mg/l c11
‑
fame作为内标。使用封板机(alps
‑
300;abgene,thermoscient ific,rockford,il)对96孔板进行热封,并使用mixmate(eppendorf,hamburg,germany)以2000rpm摇动15分钟。摇动之后,在室温以4500rpm将板离心10分钟(al legra x
‑
15r,rotor sx4750a,beckman coulter,brea,ca),以分离水层和有机层。将50μl有机层转移到96孔板(96
‑
孔板,聚丙烯,corning,amsterdam,the netherlands)中。将板热封,然后储存于
‑
20℃,直到用气相色谱火焰离子化检测器(gc
‑
fid)进行评价。
[0191]
如下所述进行提取和fame的定量;将1ul样品注入带有火焰离子化检测器(fid)的trace gc ultra(thermo fisher scientific,wal tham,ma)中的ufm柱(cat#:ufmc00001010401,thermo fisher scient ific,wal tham,ma)上。设置仪器以检测c8到c18 fame并对c12到c18β
‑
oh fame定量。
[0192]
实施例1:accb中的突变增加fame生产
[0193]
建立accb基因的易错文库,并筛选相对于野生型基因显示出改进的变体。下面的表3描述了最佳变体的概况。使用可商购的试剂盒(genemorph ii,agi lent technologies)建立accb基因的易错文库。使用soe pcr技术将accb基因连接到合适的同源区域,如方案1所述将文库整合到大肠杆菌染色体中,替换天然大肠杆菌accb基因。根据方案2筛选易错文库。
[0194]
表3:用于fame生产的accb变体
[0195]
[0196][0197]
表3的各栏表示变体的原始孔位置、fame滴度相对于对照的提高、和每个变体中氨基酸和dna密码子的改变。表3的结果表明氨基酸位置2上的突变可能获得滴度的最大增加。孔5a02显示滴度增加到正常acc活性的435%。
[0198]
接下来,进行靶位点饱和诱变,以确定哪个位置和突变提供最大的改进。确定accb的位置2(紧在起始密码子之后)上的真实突变增加fame的滴度。野生型accb在位置2含有gat密码子,编码天冬氨酸(asp,d)。表1(见上文)总结了accb位置2的最佳变体。使用在第二accb位置含有简并碱基nnn的寡核苷酸引物建立位点饱和文库。使用soe pcr技术将accb基因连接到合适的同源区域,并如方案1所述将文库整合到大肠杆菌染色体中,替换天然的大肠杆菌accb基因。根据方案2筛选易错文库。如表1(见上文)中所示,在突变体d2h中观察到滴度增加到正常acc活性的达630%。图5进一步反映出这些发现,并给出图显示mg/l单位的fas滴度。更具体地,该图描述了作为在大肠杆菌宿主细胞中表达不同bccp变体(在accb基因的位置2)的结果的fas滴度(fame)。wt是野生型acc复合物的对照。这些bccp变体中的一些将fas滴度提高超过5倍(还参见表1)。这些发现是令人惊讶的,因为bccp变体在生产脂肪酸衍生物上胜过整个acc复合物。测试编码相同的氨基酸取代的不同密码子,表明具有相同的效果,这证明增加丙二酰衍生化合物,在这个例子中是脂肪酸衍生物,的效果与bccp中的氨基酸变化相关。
[0199]
实施例2:改变accbc操纵子的表达增加fame生产
[0200]
建立accbc操纵子的表达文库,并筛选相对于野生型accbc启动子表现出改进的变体。表2(见上文)总结了最佳变体。使用引物建立文库,用噬菌体t5启动子文库替换天然accbc启动子区域,所述引物含有简并引物以引入随机突变。使用soe pcr技术,将t5启动子文库连接到合适的同源区域,并如方案1所述将文库整合到大肠杆菌染色体中,替换天然的大肠杆菌accbc启动子。根据方案2筛选表达文库。如表2(见上文)所示,使用变体启动子观察到滴度增加到正常acc活性的达315%。
[0201]
实施例3:accb和accbc工程化可以提高任何丙二酰
‑
coa衍生化合物的生产
[0202]
accb突变(实施例1)和accbc表达改变(实施例2)可用于增加衍生自丙二酰
‑
coa的任何产物的滴度和产率。可以使用标准基因操作技术将实施例1的具体突变引入到任何微
生物菌株中。可以根据实施例2或者通过本领域技术人员已知的其它方法,使用标准的基因操作技术改变任何细菌或酵母中accbc的表达。发现accbc的操纵子结构在许多细菌和其它微生物中是高度保守的。这允许在几种不同的生物体中使用相同的技术。衍生自丙二酰
‑
coa的化合物有许多种,包括脂肪酸、脂肪酸酯(fame、faee等)、脂肪醇、脂肪胺、双功能脂肪酸(羟基、二酸)、双功能脂肪醇、双功能脂肪酯、双功能脂肪胺、β
‑
羟基脂肪酸衍生化合物、不饱和脂肪酸衍生化合物以及不基于脂肪酸的黄烷酮和类黄酮、聚酮化合物和3
‑
羟基丙酸。
[0203]
本发明涉及以下实施方式:
[0204]
1.在其氨基酸序列中包含至少一个突变的变体生物素羧基载体蛋白(bccp),其中所述变体bccp包含选自由seq id nos:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88和90组成的组的多肽序列,并且其中当与相应的野生型细胞相比,所述变体bccp的表达赋予重组细胞增加的丙二酰
‑
coa
‑
衍生化合物的生产。
[0205]
2.实施方式1的变体bccp,其中所述突变在n
‑
末端氨基酸区域中。
[0206]
3.实施方式2的变体bccp,其中所述突变在seq id no:2的氨基酸位置2上。
[0207]
4.实施方式1的变体bccp,其中所述变体bccp包含seq id no 4或seq id no:6。
[0208]
5.实施方式1的变体bccp,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0209]
6.实施方式4的变体bccp,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0210]
7.实施方式1的变体bccp,其中所述bccp由变体accb基因编码。
[0211]
8.实施方式7的变体accb基因,其中所述变体accb基因包含选自由seq id nos:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、42、43、45、47、49、50、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87和89组成的组的核酸序列。
[0212]
9.包含实施方式1
‑
8任一项的变体bccp的重组微生物。
[0213]
10.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养实施方式9的重组微生物。
[0214]
11.实施方式10的方法,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0215]
12.实施方式11的方法,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0216]
13.控制bccp表达的变体操纵子,其中所述操纵子导致与野生型微生物细胞相比,重组微生物细胞中bccp表达的变化。
[0217]
14.实施方式13的变体操纵子,其中当与相应的野生型微生物细胞相比时,所述操纵子赋予所述重组微生物细胞提高的丙二酰
‑
coa
‑
衍生化合物的生产。
[0218]
15.实施方式14的变体操纵子,进一步包含选自由异源启动子、异源启动子变体、合成启动子、基因修饰的accbc启动子、天然存在的大肠杆菌启动子和大肠杆菌启动子变体组成的组的启动子。
[0219]
16.实施方式15的变体操纵子,其中所述基因修饰的accbc启动子是accbc启动子
变体。
[0220]
17.实施方式15的变体操纵子,其中所述异源启动子是t5启动子或t5启动子变体。
[0221]
18.实施方式17的变体操纵子,其中所述t5启动子变体选自seq id nos:93、94、95和96的任一个。
[0222]
19.包含实施方式13
‑
18任一项的变体操纵子的重组微生物。
[0223]
20.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养实施方式19的重组微生物。
[0224]
21.实施方式20的方法,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0225]
22.实施方式21的方法,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0226]
23.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养包含实施方式1的变体bccp和实施方式13的变体操纵子的重组微生物。
[0227]
24.实施方式23的方法,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0228]
25.实施方式24的方法,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0229]
26.包含在其氨基酸序列中具有至少一个突变的变体生物素羧基载体蛋白(bccp)的重组微生物,其中所述变体bccp的表达给所述重组微生物赋予增加的丙二酰
‑
coa
‑
衍生化合物的生产,并且其中所述变体bccp在n
‑
末端氨基酸区域中具有突变。
[0230]
27.实施方式26的重组微生物,其中所述变体bccp包含seq id no:6。
[0231]
28.实施方式26的重组微生物,其中所述变体bccp包含seq id no:4或seq id no:8。
[0232]
29.实施方式26的重组微生物,其中所述变体bccp包含seq id no:10或seq id no:12。
[0233]
30.实施方式26的重组微生物,其中所述丙二酰
‑
coa
‑
衍生化合物选自由脂肪酸衍生物、脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物组成的组。
[0234]
31.实施方式30的重组微生物,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0235]
32.实施方式30的重组微生物,其中所述重组微生物是重组微生物细胞。
[0236]
33.实施方式32的重组微生物,其中所述重组微生物细胞选自由埃希氏杆菌属、芽孢杆菌属、蓝藻门、乳杆菌属、发酵单胞菌属、红球菌属、假单胞菌属、曲霉属、木霉属、脉孢菌属、镰刀菌属、腐质霉属、根毛霉属、克鲁维酵母菌属、毕赤酵母属、毛霉属、蚀丝霉属、青霉属、显革菌属、侧耳属、栓菌属、金孢霉属、酵母属、寡养单胞菌属、裂殖酵母属、耶氏酵母属和链霉菌属组成的组。
[0237]
34.实施方式33的重组微生物,其中所述埃希氏杆菌属是大肠杆菌。
[0238]
35.实施方式33的重组微生物,其中所述蓝藻门选自由原绿球藻、聚球藻、集胞藻、蓝杆藻和点状念球藻组成的组。
[0239]
36.实施方式35的重组微生物,其中所述蓝藻门选自由细长聚球藻pcc7942、集胞
藻pcc6803和聚球藻pcc7001组成的组。
[0240]
37.包含改变的核酸序列的表达的重组微生物,所述核酸序列包含accb或accc或它们的组合。
[0241]
38.实施方式37的重组微生物,其中所述改变的表达是增加的或减少的表达。
[0242]
39.实施方式38的重组微生物,其中所述增加的表达导致当在有碳源的条件下培养所述微生物时,丙二酰
‑
coa衍生化合物的生产增加。
[0243]
40.实施方式37的重组微生物,其中所述改变的表达是由驱动所述核酸序列的表达的一个或多个启动子的改变导致的。
[0244]
41.实施方式37的重组微生物,其中所述核酸序列编码生物素羧基载体蛋白(bccp)或生物素羧化酶(bc)或它们的组合。
[0245]
42.实施方式37的重组微生物,其中所述丙二酰
‑
coa
‑
衍生化合物选自由脂肪酸衍生物、脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物组成的组。
[0246]
43.实施方式37的重组微生物,其中所述重组微生物细胞选自由埃希氏杆菌属、芽孢杆菌属、蓝藻门、乳杆菌属、发酵单胞菌属、红球菌属、假单胞菌属、曲霉属、木霉属、脉孢菌属、镰刀菌属、腐质霉属、根毛霉属、克鲁维酵母菌属、毕赤酵母属、毛霉属、蚀丝霉属、青霉属、显革菌属、侧耳属、栓菌属、金孢霉属、酵母属、寡养单胞菌属、裂殖酵母属、耶氏酵母属和链霉菌属组成的组。
[0247]
44.实施方式43的重组微生物,其中所述埃希氏杆菌属是大肠杆菌。
[0248]
45.实施方式43的重组微生物,其中所述蓝藻门选自由原绿球藻、聚球藻、集胞藻、蓝杆藻和点状念球藻组成的组。
[0249]
46.实施方式45的重组微生物,其中所述蓝藻门选自由细长聚球藻pcc7942、集胞藻pcc6803和聚球藻pcc7001组成的组。
[0250]
47.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养实施方式37的重组微生物。
[0251]
48.重组微生物细胞,包含:
[0252]
(i)改变的acc变体的表达;和
[0253]
(i i)脂肪酸生物合成蛋白。
[0254]
49.实施方式48的重组微生物细胞,其中所述acc变体是生物素羧基载体蛋白(bccp)或生物素羧化酶(bc)或它们的组合。
[0255]
50.实施方式48的重组微生物细胞,其中所述脂肪酸生物合成蛋白具有选自由硫酯酶活性(e.c.3.1.2.*或e.c.3.1.2.14或e.c.3.1.1.5)、酯合酶活性(e.c.2.3.1.75)、酰基
‑
acp还原酶(aar)(e.c.1.2.1.80)活性、醇脱氢酶活性(e.c.1.1.1.1.)、脂肪醇酰基
‑
coa还原酶(far)(e.c.1.1.1.*)活性、羧酸还原酶(car)(ec 1.2.99.6)活性、脱羰基酶或脱甲酰基酶活性、酰基
‑
coa还原酶(e.c.1.2.1.50)活性、酰基
‑
coa合酶(fadd)(e.c.2.3.1.86)活性、olea活性和olebcd活性组成的组的酶活性。
[0256]
51.实施方式48的重组微生物细胞,其中所述改变的表达是增加的或减少的表达。
[0257]
52.实施方式51的重组微生物细胞,其中所述增加的表达导致当在有碳源的条件下培养所述微生物细胞时,丙二酰
‑
coa衍生化合物的生产增加。
[0258]
53.实施方式52的重组微生物细胞,其中所述丙二酰
‑
coa
‑
衍生化合物选自由脂肪酸衍生物、脂肪酸、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物组成的组。
[0259]
54.实施方式48的重组微生物细胞,其中所述细胞选自由埃希氏杆菌属、芽孢杆菌属、蓝藻门、乳杆菌属、发酵单胞菌属、红球菌属、假单胞菌属、曲霉属、木霉属、脉孢菌属、镰刀菌属、腐质霉属、根毛霉属、克鲁维酵母菌属、毕赤酵母属、毛霉属、蚀丝霉属、青霉属、显革菌属、侧耳属、栓菌属、金孢霉属、酵母属、寡养单胞菌属、裂殖酵母属、耶氏酵母属和链霉菌属组成的组。
[0260]
55.包含seq id no:6的变体生物素羧基载体蛋白(bccp)。
[0261]
56.实施方式55的变体bccp,其中所述突变在n
‑
末端氨基酸区域中,包含天冬氨酸(d)到天冬酰胺(n)的取代。
[0262]
57.实施方式56的变体bccp,其中所述取代在氨基酸位置2上。
[0263]
58.实施方式55的变体bccp,其中当与相应的野生型细胞相比时,所述变体bccp赋予重组细胞增加的丙二酰
‑
coa衍生化合物的生产。
[0264]
59.实施方式58的变体bccp,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0265]
60.实施方式55的变体bccp,其中所述bccp由变体accb基因编码。
[0266]
61.实施方式60的变体accb基因,其中所述变体accb基因包含seq id no:5的核酸序列。
[0267]
62.包含实施方式55
‑
61任一项的变体bccp的重组微生物。
[0268]
63.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养实施方式55的重组微生物。
[0269]
64.实施方式63的方法,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0270]
65.实施方式64的方法,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0271]
66.包含seq id no:4或seq id no:8的变体生物素载体蛋白(bccp)。
[0272]
67.实施方式66的变体bccp,其中所述突变在n
‑
末端氨基酸区域中,包含天冬氨酸(d)到组氨酸(h)的取代。
[0273]
68.实施方式67的变体bccp,其中所述取代在氨基酸位置2上。
[0274]
69.实施方式66的变体bccp,其中当与相应的野生型细胞相比时,所述变体bccp赋予重组细胞增加的丙二酰
‑
coa衍生化合物的生产。
[0275]
70.实施方式69的变体bccp,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0276]
71.实施方式66的变体bccp,其中所述bccp由变体accb基因编码。
[0277]
72.实施方式71的变体accb基因,其中所述变体accb基因分别包含seq id no:3或seq id no:7的核酸序列。
[0278]
73.包含实施方式66
‑
72任一项的变体bccp的重组微生物。
[0279]
74.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养实施方式55的重组微生物。
[0280]
75.实施方式74的方法,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0281]
76.实施方式75的方法,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0282]
77.包含seq id no:10或seq id no:12的变体生物素载体蛋白(bccp)。
[0283]
78.实施方式77的变体bccp,其中所述突变在n
‑
末端氨基酸区域中,包含天冬氨酸(d)到异亮氨酸(i)的取代。
[0284]
79.实施方式78的变体bccp,其中所述取代在氨基酸位置2上。
[0285]
80.实施方式77的变体bccp,其中当与相应的野生型细胞相比时,所述变体bccp赋予重组细胞增加的丙二酰
‑
coa衍生化合物的生产。
[0286]
81.实施方式80的变体bccp,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0287]
82.实施方式77的变体bccp,其中所述bccp由变体accb基因编码。
[0288]
83.实施方式82的变体accb基因,其中所述变体accb基因分别包含seq id no:9或seq id no:11的核酸序列。
[0289]
84.包含实施方式55
‑
61任一项的变体bccp的重组微生物。
[0290]
85.生产丙二酰
‑
coa
‑
衍生化合物的方法,包括在含有碳源的发酵液中培养实施方式77的重组微生物。
[0291]
86.实施方式85的方法,其中所述丙二酰
‑
coa
‑
衍生化合物包含任何一种脂肪酸的脂肪酸衍生物、脂肪酸甲酯(fame)、脂肪酸乙酯(faee)、脂肪醇、脂肪胺、β羟基脂肪酸衍生物、双功能脂肪酸衍生物和不饱和脂肪酸衍生物。
[0292]
87.实施方式86的方法,其中所述丙二酰
‑
coa
‑
衍生化合物是fame。
[0293]
正如对于本领域技术人员来说显而易见的,可以对上述方面和实施方案进行不同的改变和变化,这不背离本公开的精神和范围。这种改变和变化在本公开的范围内。