華理田錫煒老師團隊突破 !AI+光譜技術(shù)助力慶大霉素發(fā)酵效價提升33%,沃美生物鼎力支持!
引言
華東理工大學生物工程學院田錫煒老師近日在《Bioresource Technology》發(fā)表重磅研究成果!他們創(chuàng)新性地將近紅外(NIR)與拉曼光譜技術(shù)結(jié)合人工智能(AI),成功實現(xiàn)慶大霉素發(fā)酵過程的實時監(jiān)測與精準控制,使目標產(chǎn)物濃度提升33%!
華東理工大學生物工程學院田錫煒老師的研究團隊,近日在《Bioresource Technology》期刊上發(fā)表了一篇題為《Harnessing near-infrared and Raman spectral sensing and artificial intelligence for real-time monitoring and precision control of bioprocess》的文章。
該文主要研究了將近紅外光譜和拉曼光譜技術(shù)整合,并用于慶大霉素發(fā)酵的實時監(jiān)測和精確控制。通過機器學習算法篩選特征波長,使光譜模型R2提高了9.2%-100.4%。團隊還開發(fā)了一個AI驅(qū)動的全自動發(fā)酵平臺,結(jié)合雙傳感器和機器學習,動態(tài)調(diào)整補料速率來精確維持低葡萄糖濃度。與傳統(tǒng)方法相比,慶大霉素C1a濃度提高33%。該平臺展示了光譜技術(shù)與機器學習在實時監(jiān)測中的潛力,為提升工業(yè)發(fā)酵效率和產(chǎn)品效價提供了可擴展方案。
主要內(nèi)容
1 構(gòu)建全近紅外光譜和全拉曼光譜的回歸模型
采用近紅外(NIR)和拉曼光譜技術(shù)監(jiān)測慶大霉素C1a發(fā)酵過程中的關(guān)鍵參數(shù)。將蒙特卡羅交叉驗證(MCCV)與13種機器學習(ML)算法相結(jié)合,對近紅外光譜、拉曼光譜及其融合數(shù)據(jù)進行建模和分析。將NIR和拉曼光譜數(shù)據(jù)整合后,模型性能顯著提升,平均R2值從單獨使用的0.6874和0.8578提高到整合后的0.9031。
使用機器學習算法對光譜數(shù)據(jù)進行模型性能評估
(a)近紅外光譜模型的R2值;(b)拉曼光譜模型的R2值;(c)組合光譜模型的R2值;(d)近紅外光譜模型的均方根誤差;(e)拉曼光譜模型的均方根誤差;(f)組合光譜模型的均方根誤差
使用近紅外光譜、拉曼光譜和組合光譜對各種分析物進行最優(yōu)預(yù)測
注:RPD — residual predictive deviation (殘差預(yù)測偏差)
2 構(gòu)建基于特征波長的回歸模型
不同來源的光譜數(shù)據(jù)通常包含噪聲、冗余和無關(guān)信息,因此選擇特征波長對于提高模型精度至關(guān)重要。為此,將13種機器學習算法與6種特征選擇方法相結(jié)合,得到了78種組合,并利用這些特征開發(fā)了最優(yōu)回歸模型。從預(yù)測結(jié)果來看,特征選擇和機器學習算法的結(jié)合,識別出關(guān)鍵的特征波段,從而提高了光譜模型對多個生物過程參數(shù)的預(yù)測性能。
組合光譜模型的在線光譜圖及不同特征選擇方法評估
(a)原始近紅外光譜圖;(b)采用一階導(dǎo)數(shù)處理后的近紅外光譜圖;(c)原始拉曼光譜圖;(d)采用一階導(dǎo)數(shù)處理后的拉曼光譜圖。(e)葡萄糖模型的R2 值;(f)銨離子模型的R2 值;(g)生物量模型的R2值;(h)慶大霉素C1a模型的 R2值;(i)葡萄糖模型的均方根誤差;(j)銨離子模型的均方根誤差;(k)生物量模型的均方根誤差;(l)慶大霉素C1a模型的均方根誤差
3 回歸模型的外部驗證
通過外部驗證,在實際發(fā)酵條件下對預(yù)測模型進行了評估。對于葡萄糖,近NIR模型表現(xiàn)出較高的準確性(R2=0.9077),RMSE比訓(xùn)練時使用的測試集低2.9%。同樣,拉曼光譜模型在外部驗證集上對葡萄糖的預(yù)測R2為0.8666。與單光譜模型相比,組合光譜模型的預(yù)測性能(R2=0.9969)提高了9.8%-15.0%,RMSE降低了81.5%-83.3%??傊?,外部驗證結(jié)果證明了集成近紅外-拉曼光譜模型在準確預(yù)測關(guān)鍵工藝參數(shù)方面的有效性。
使用未見光譜數(shù)據(jù)集的回歸模型性能
(a)使用近紅外光譜法進行葡萄糖預(yù)測;(b)使用拉曼光譜法進行葡萄糖預(yù)測;(c)使用組合光譜法進行葡萄糖預(yù)測;(d)使用近紅外光譜法進行銨離子預(yù)測;(e)使用拉曼光譜法進行銨離子預(yù)測;(f)使用組合光譜法進行銨離子預(yù)測;(g)使用近紅外光譜法進行生物量預(yù)測;(h)使用拉曼光譜法進行生物量預(yù)測;(i)使用組合光譜法進行生物量預(yù)測;(j) 使用近紅外光譜法進行慶大霉素C1a預(yù)測;(k)使用拉曼光譜法進行慶大霉素C1a預(yù)測;(l)使用組合光譜法進行慶大霉素C1a預(yù)測
4 慶大霉素C1a發(fā)酵過程的實時監(jiān)測與智能控制
鑒于在發(fā)酵后期通過有效控制葡萄糖濃度可顯著提高慶大霉素C1a效價,因此采用所開發(fā)的組合光譜模型對發(fā)酵過程中的葡萄糖補料進行智能控制。對于目標葡萄糖濃度為1 g/L的情況,組合光譜模型的R2達到0.9946,RMSE為0.86 g/L,預(yù)測準確性很高。對于5 g/L,集成光譜模型得出的R2為0.9957,RMSE為0.79 g/L。在葡萄糖濃度為10 g/L時,集成光譜模型的R2達到0.9935,RMSE為1.74 g/L,表明該模型即使在高濃度下也具有良好的魯棒性。
慶大霉素C1a發(fā)酵過程中的葡萄糖變化曲線,補料基于組合光譜測量自動控制
(a)基于人工智能的控制操作圖;(b)1 g/L葡萄糖的控制;(c)5 g/L葡萄糖的控制;(d)10 g/L葡萄糖的控制;(e)1 g/L葡萄糖過程截取放大曲線的控制;(f)5 g/L葡萄糖過程截取放大曲線的控制;(g)10 g/L葡萄糖過程截取放大曲線的控制
注:圖中的計算機展示了在控制葡萄糖濃度為1 g/L時,使用集成光譜方法進行自動化控制的快速分析和執(zhí)行情況。
使用組合光譜技術(shù)對三次補料分批發(fā)酵實驗進行性能評估
總結(jié)概括
本研究開發(fā)了一種機器學習輔助的組合光譜模型,用于慶大霉素C1a發(fā)酵。模型可在1分鐘內(nèi)精確預(yù)測葡萄糖、銨離子、生物量和慶大霉素C1a濃度,而傳統(tǒng)方法需2小時。結(jié)合自動化控制系統(tǒng),平臺能動態(tài)調(diào)整補料速率,維持低葡萄糖濃度(5 g/L),使慶大霉素C1a濃度提升33%,達到346.5 mg/L。該方法顯著提高了發(fā)酵效率,展現(xiàn)了工業(yè)生物制造自動化的巨大潛力。
文章致謝
本工作得到了國家重點研發(fā)計劃(2024YFA0917900)、山東省泰山學者計劃(tsqn202312316)等的資助,感謝益海嘉里慈善基金會的資金支持。感謝瑞普分析儀器(天津)有限公司、梅特勒-托利多儀器(中國)有限公司和蘇州沃美生物有限公司工程師們的技術(shù)支持。
感謝田錫煒老師課題組對本號的支持,感謝文章作者徐峰提供本文稿件支持!
原文鏈接https://doi.org/10.1016/j.biortech.2025.132204
Xu F, Su L, Gao H, et al. Harnessing near-infrared and Raman spectral sensing and artificial intelligence for real-time monitoring and precision control of bioprocess. Bioresour Technol. 2025 Feb 7;421:132204.
結(jié)語
期待沃美生物與更多高校的持續(xù)合作,為中國生物制造注入更多創(chuàng)新動能!