组内跨学科合作
我们的项目团队由来自天津大学化工学院生物工程、合成生物学、化学工程专业,智能与计算学部计算机科学与技术和软件工程专业,共五个专业的九名本科生组成,生物专业与计算机专业的学科交叉是我们团队成员构成上的优势。
在我们的项目制定、过程实施和项目总结的全过程中我们也积极发挥多学科交叉的优势,开展组内跨学科合作。生物背景的同学向计算机背景的同学解释启动子的概念、特征与实验室获得新启动子的常用方式等相关知识,计算机背景的同学向生物背景的同学介绍算法原理与实现流程。自项目开展以来,共开展12次全体讨论会议,将生物知识结合计算机技术,将生物思想结合计算机原理,推进项目的设计、实施与不断改进。
图1 项目开题讨论会
图2 项目中期审核会
图3 项目总结汇报会
通过组内跨学科合作,我们有以下收获:
- 生物领域与计算机领域的交叉融合,促进项目进展有序推进;
- 生物中“淘汰与进化”的思想,给生成模型的构建带来启发。
组外专家讨论咨询
与组外专家讨论咨询同样是本项目合作部分的重要组成内容。在项目的研究过程中多次与组外合成生物学专家请教和学习,包括清华大学汪小我教授,天津大学合成生物学专业教师罗云孜教授、吴毅教授,江南大学邓禹教授和南京工业大学董维亮教授。其中,本项目在构思设计时受到2018年在NAR发表的“Synthetic promoter design in Escherichia coli based on a deep generative network”文章的启发。我们也通过邮件向该篇文章的通讯作者汪小我老师进行了讨论与咨询,主要针对以下两个问题向汪老师请教与交流:
- (1)生成器方面:我们使用的遗传算法生成启动子序列的创新性与可行性,与汪老师使用的GAN算法进行比较;
- (2)预测器方面:构建的不同训练数据集的训练效果以及预测模型的预测定量预测能力的提升方法与建议。
通过邮件向汪小我老师咨询:
汪小我老师邮件回复的经验和建议:
通过组外专家咨询讨论,我们有以下收获:
- 在生成模型方面,遗传算法用于序列生成需要注意对序列间长程和弱的相互作用关系的的模拟和学习,指导我们改进遗传算法得到改进的遗传算法模型用于序列生成;
- 在预测模型方面,汪老师的工作证实了我们的发现,即转录组数据用于预测模型的训练效果不佳,基于荧光强度的启动子强度数据的有更好的预测效果。
>> 我们的发现过程与分析 详见 模型页面