Loading...

1 概述

我们的软件旨在为合成生物学研究团队提供一个低门槛、灵活、易使用和图形交互代谢建模与分析平台。该平台基于 COBRApy实现FBA(Flux Balance Analysis)核心计算,并通过 Web UI界面提供可视化和带有专属FBA知识库的Agent实现用户自然语言操作软件。

主要功能包括:

  1. 模型选择:支持用户在不同代谢模型之间切换。
  2. 目标反应与权重设置:允许灵活指定目标反应及其优化权重,用于定义模拟的优化方向。
  3. 反应上下限调整:支持修改代谢反应的流量边界条件,便于探索不同环境或工程改造下的代谢行为。
  4. 基因敲除模拟:通过设置基因敲除实验,分析其对代谢网络和产物合成的影响。
  5. FBA 计算与可视化:提交操作后,系统调用 COBRApy 执行 FBA(Flux Balance Analysis),并借助 Escher 自动生成清晰的代谢通量图,直观展示结果。
  6. 智能Agent知识问答和操作辅助:此外,平台内置一个Agent(DeepSeek-R1:7B) ,能够将用户的自然语言指令自动转化为上述操作。例如,用户可以直接输入“请把Yeast9-GEM设为目标模型”,Agent 会解析并执行相应步骤,大幅降低了软件使用的门槛。

通过将代谢建模计算、可视化展示与自然语言交互三者结合,我们的软件既适合有一定建模经验的研究人员进行深度分析,也能让初学者更便捷地探索合成生物学中的代谢网络设计。

Tips:

Toggle

如果您不了解FBA是什么,可以跳转至model部分了解其详细的原理和作用。

简而言之,FBA是一种基于约束的线性规划计算方法,用于预测代谢网络中代谢通量的分布。它通过利用基因组尺度代谢模型(GEM),并结合物理化学约束(如质量守恒、能量平衡和反应速率边界)进行数学优化,从而模拟生物体在特定环境下的代谢状态。FBA 不依赖于详细的动力学参数,广泛应用于预测基因敲除效应、发现生物标志物、优化生物合成途径及指导代谢工程改造等领域。

2 亮点

2.1 我们的项目具备泛用性与实用性

合成生物学研究的核心是从“设计-构建-测试-学习”(DBTL)循环中迭代。而优秀的模型可以为设计准确,指导性意义的建议,加速并准确实现DBTL迭代。我们的平台为底盘菌株设计提供了代谢网络模型进行分析,提供了不可或缺的实用性

我们的软件可以提供预测目标产物理论产量,识别关键基因靶点,代谢网络分析这些泛用性和实用性的功能

  1. 预测目标产物理论产量:团队需要知道,在理想情况下,他们的底盘细胞能生产多少目的产物(如番茄红素、紫杉醇),天花板在哪里?FBA可以快速计算最大理论产量,为项目可行性提供关键决策依据。
  2. 识别关键基因靶点:团队需要回答:我应该敲除或过表达哪些基因,才能最大限度地使代谢流向目的产物,同时抑制副产物?FBA的基因必需性分析和鲁棒性分析(ROOM)等功能能够系统地筛选出最优的基因编辑靶点清单。
  3. 理解代谢网络行为:团队需要理解在特定条件下(如厌氧),细胞的代谢通量如何重新分布?哪些途径被激活,哪些被抑制?FBA的通量变异性分析(FVA)等功能可以提供全局视角。
  4. 我们的平台底盘模型拓展性强:支持多种底盘细胞,如Yeast9-GEM,IJO1366,e_coli_core。还支持定制化模型,支持导入由其他软件(如CarveMe)生成的特定组织或条件的简化模型。同时,支持自由添加新反应,例如,引入一条从文献中发现的新的异源代谢途径,或假设一个全新的酶促反应。支持创建新的代谢物,为模型中加入尚未被标准数据库收录的假设性代谢中间体。

2.2 我们的软件充分考虑了与合成生物学常见标准的兼容性

  1. SBML 支持:平台基于 COBRApy 构建,天然支持 SBML 格式的代谢模型文件。这使得用户能够直接导入 BiGG Models 等数据库中的标准模型,并确保结果的可复现性和可共享性。点击此处了解导入操作
  2. COBRApy 集成:COBRApy 是一个基于 Python 的开源工具包,它主要用于基因组尺度的代谢网络重建与约束性建模分析。简单来说,它帮助研究人员用计算机模拟和预测细胞内部的代谢过程。我们软件的核心计算部分直接调用 COBRApy API,保证与代谢建模社区主流工具的兼容性
  3. Escher 可视化:Escher 是一个用于构建、可视化和分析基因组尺度代谢模型(Genome-scale metabolic models, GEMs) 的交互式、开源的Web应用程序。它的核心功能是将复杂的代谢网络和数据(如通量平衡分析FBA的结果)以直观、美观且可交互的图形方式呈现出来。我们的软件通过 Escher 的接口生成代谢通量图,结果与现有 Escher JSON 格式兼容,可在社区中共享和复用。
  4. DeepSeek LLM Agent:DeepSeek-R1-Distill-Qwen-7B是一款先进的大型语言模型,通过对海量文本数据的深度学习,掌握复杂的语言规律,能够生成流畅且贴合上下文的文本内容。我们设计了与LLM自然语言交互接口,用户输入的指令会被解析为结构化操作,再调用任务函数完成任务。同时我们为未来扩展提供了统一的 API 层,可加入更多任务。

2.3 可维护性、可扩展性好

我们在开发过程中注重了代码的可维护性和可扩展性:

  1. 代码注释与文档:核心模块均包含详细注释和函数说明,配备安装与使用指南(README、Wiki 教程),方便后续队伍快速上手。点击此处了解安装教程
  2. 架构清晰:软件采用前后端分离的架构(前端 Web 界面 – 后端 Flask – 底层 COBRApy/Escher/LLM API),模块职责明确,便于扩展

2.4 用户友好

我们的软件以用户友好为核心设计原则:

  1. 直观界面:目前,市面上较少FBA可视化和图形化交互的计算软件,大多是依赖于使用者进行编程计算。关于可视化的步骤也往往只针对结算结果,计算流程还是需要编程。在传统研究范式下,进行代谢网络分析通常意味着研究人员必须熟练使用MATLAB(配合COBRA Toolbox)或Python(配合COBRApy)。他们不仅要懂得生物学逻辑,还要掌握另一门编程语言的语法、库安装和调试技巧。而我们的软件实现了计算结果全程可视化和图形化交互,大大降低了使用门槛。部署我们的软件后,所有建模操作均通过 Web 界面完成,无需复杂命令行操作。利用 Escher 生成交互式代谢通量图可视化结果,使结果一目了然。
  2. 自然语言交互:我们集成大语言模型 Agent,用户只需输入自然语言即可完成复杂操作,大幅降低使用门槛。

    具体辅助体现在两大方面:

    1. 知识问答与解释:

      研究人员可以直接用自然语言提问,Agent能基于内置的代谢建模知识库和当前模型上下文给出即时、准确的回答。

    2. 操作辅助与自动化:

      这是最具革命性的功能。用户无需编写任何代码,也无需在菜单中寻找功能,只需用自然语言“告诉”Agent他们的分析意图,Agent会自动将其转化为后台操作。

    点击此处了解详情

2.5 我们的软件通过实验工作进行了验证

为了计算红藻作为碳源的可行性,我们利用软件进行FBA计算。湿实验结果最终确定,红藻的确可以用来作为碳源底物,并取得了不错的产量。点击此处了解详情

3 流程图

pic1

Figure 1,2(left and middle) Laboratory firefighting facilities

以上是我们项目的流程图。用户访问网页后,可选择直接交互模式或者选择与Agent交流,完成选择模型、选择目标反应、调整反应上下限、基因敲除,最终完成FBA计算任务,实现结果的可视化。

4 架构图

pic1

Figure 1,2(left and middle) Laboratory firefighting facilities

上面是我们项目的架构图,前端部分可分为WebUI和LLM ChatBox,后端部分可分为Flask,COBRApy,Escher。

5 软件演示

5.1 网页界面与操作演示

在本教程中,我们将演示如何使用我们的软件来进行FBA分析。点击此处了解部署方式

第0步:访问FBA主页

访问我们部署的FBA平台,您将看到以下页面:

pic1

第一步:进行FBA计算的第一步是选择模型。

我们预先提供了一些常用的模型,如e_coli_core、Yeast-9。您也可以通过在BIGG下载模型或本地模型,通过import按钮导入我们的平台。

在页面中,您可以输入要检索的模型ID,然后执行查询。

在选择完模型后,可以点击下一步。在上方会显示你所选择的模型。

pic1

第二步:进行FBA计算的第二步是选择目标反应。

这一步涉及两个任务,即搜索目标反应和为其设置权值。因为目标反应可能为多个反应的线性组合。

如果没有选择反应,将默认最大生物量为目标反应。

pic1

在权值页面,要求反应的权重和必须为100%。

pic1

第三步:进行FBA计算的第三步是约束环境。

您可以在Reaction Constraints页面设置反应的上下限。

pic1

同样地,您可以在Gene Knockout页面敲除基因。

pic1

接着,您可以在确认页面,确定刚才所做的操作。

您可以随时回退到之前的页面,点击清空按钮,清空相应的设置。待检查无误后,可以点击提交按钮,软件的后台将会进行计算。

pic1

当结果理想时,会将计算出的代谢数据映射到代谢图中,从而可视化代谢通路。

pic1

同时,我们还提供了暗黑模式,让夜晚的使用者可以更舒适地使用。

pic1

5.2 Agent系统介绍

我们的Agent基于DeepSeek-R1:7B开发,并集成了一套专门针对 FBA 的专业知识库。该知识库的构建融合了五位合成生物学工作者的实际使用经验,涵盖了常见问题、高频操作及典型应用场景。基于他们的反馈,我们系统性地整理了用户常见疑问与操作需求,确保 Agent 能够更精准地理解并响应用户请求。

在部署 Agent 后,您可通过自然语言进行如下类型的提问或操作。

Agent智能问答:

  1. What is the principle of FBA?
  2. What files or data are needed to start FBA calculations?
  3. Where can I find and download reliable, validated metabolic models?
  4. What exactly do the "constraints" refer to? How should I understand and set these constraints (e.g., reaction rate upper and lower limits)?

Agent智能辅助操作:

  1. 将模型设置为 Yeast9-GEM
  2. 向指定模型中添加新的代谢物或反应
  3. 设置特定目标函数
  4. 修改某一反应的速率上下限
  5. 生成代谢通量分布图

6 专家意见

在Agent的相关实践中,我们询问了张通教授的意见。点击此处了解详情

比如,关于“模型的选择”,他建议我们尝试使用千问等开源模型(如32B版本)进行本地化部署,以缓解因调用DeepSeek等公共API导致的响应延迟问题,并提升系统稳定性。

关于“幻觉问题的缓解”,他指出幻觉问题目前难以彻底解决,但可通过构建事实库、反事实验证、特征对齐等方法在一定程度上予以缓解。建议建立专有歧义词库,并尝试使用注意力机制等技术手段识别和处理语义歧义。

关于“是否需要引入知识或者工具去做约束来避免错误解释?”,张通教授给出了肯定的答案。“这个是必要的。因为存在很多比较专一的,或者说属于你们自己的这个方向下的一些知识,大模型根本就没有学到。更何况要做的这个相对来讲是一个创新性的任务。那肯定是需要进行一个二次训练,或者是一定程度上采用外挂一个知识库,给它做一些知识的补全。”

关于“长文本与记忆机制设计”,他推荐“引入长文本记忆与自适应遗忘机制如LSTM(Long Short-Term Memory),以改善多轮对话中的信息连贯性,同时避免误差累积和语义干扰。还可结合强化学习思路优化记忆权重分配。”

最后,在项目的创新性和可行性方面,教授提供了高度肯定,鼓励发挥跨学科优势,将AI与领域知识深度融合,体现缩短研发周期、降低成本等实际价值。

7 部署方式

如果无python,先安装python,根据当前的OS选择合适的安装包。

  1. 安装python

    访问 Python 官方网站下载页面,运行下载的安装程序

    最重要的一步:勾选 "Add Python 3.x to PATH" 复选框

  2. 验证安装是否成功

    无论哪种方法,安装完成后都应该验证:

    打开命令行工具(Windows:CMD/PowerShell;Mac/Linux:终端),输入以下命令:

                  
    # Windows 通常使用
    python --version
    # Mac/Linux 通常使用
    python3 --version
    
    

    如果显示 Python 版本号(如 "Python 3.9.7"),说明安装成功。

  3. 进行配置并运行
    • Recommended: Four-Step Setup

      Follow these steps to set up the environment and run the software:

      1. Create a virtual environment
                                
        python -m venv venv`
        
        
      2. Activate the virtual environment
                                
        source venv/bin/activate    # Mac/Linux
        .\venv\Scripts\activate     # Windows
        
        
      3. Install dependencies
                                
        pip install -r requirements.txt
        
        
      4. Run the software
                                
        python app.py
        
        

    • Optional: One-Click Script

      For convenience, we also provide setup scripts:

      
      #Mac/Linux:
      bash setup.sh
      #Windows:
      setup.bat
      
      

      These scripts will automatically create/activate the virtual environment and install the required dependencies.

    • After completing either method, you can start using the platform via the web interface.

References
[1] Orth, J., Thiele, I. & Palsson, B. What is flux balance analysis?. Nat Biotechnol 28, 245–248 (2010). https://doi.org/10.1038/nbt.1614
[2] Zhang, C., Sánchez, B. J., et al. (2024). Yeast9: a consensus genome-scale metabolic model for S. cerevisiae curated by the community. Molecular Systems Biology. https://doi.org/10.1038/s44320-024-00060-7
[3] Rowe, E., King, Z. A., Palsson, B. O., & Ebrahim, A. (2018). Escher-FBA: a web application for interactive flux balance analysis. BMC Systems Biology, 12, 84. https://doi.org/10.1186/s12918-018-0607-5 
[4] von Kamp, A., Klamt, S., & others. (2023). Balancing biomass reaction stoichiometry and measured growth phenotypes improves model predictions in genome-scale metabolic models. Bioinformatics, 39(10), btad600. https://doi.org/10.1093/bioinformatics/btad600
[5] Sahu, A., Reddy, S., & Bhattacharya, S. (2021). Advances in flux balance analysis by integrating machine learning-based methods. Computational and Structural Biotechnology Journal, 19, 4423–4434. https://doi.org/10.1016/j.csbj.2021.07.023
[6] Ruofan Jin, Zaixi Zhang, Mengdi Wang, Le Cong, et al. (2025). STELLA: Self-Evolving LLM Agent for Biomedical Research. arXiv preprint arXiv:2507.02004v1. https://arxiv.org/abs/2507.02004v1
[7] Zhucong Li, Bowei Zhang, Jin Xiao, Zhijian Zhou, Fenglei Cao, Jiaqing Liang, Yuan Qi. (2025). ChemHAS: Hierarchical Agent Stacking for Enhancing Chemistry Tools. arXiv. https://arxiv.org/abs/2505.21569
[8] Yijie Xia, Xiaohan Lin, Zicheng Ma, Jinyuan Hu, Yanheng Li, Zhaoxin Xie, Hao Li, Li Yang, Zhiqiang Zhao, Lijiang Yang, Zhenyu Chen, Yi Qin Gao. (2025). Large Language Models as AI Agents for Digital Atoms and Molecules: Catalyzing a New Era in Computational Biophysics. arXiv preprint arXiv:2505.00270. https://arxiv.org/abs/2505.00270
Up Arrow