生物学这个坑,如果你具备了这些条件,就往里跳吧……

作者:卢平

编辑:婉珺

许多年以后,当卢平在各种场合面对“为什么进了生物大坑”的问题时,总会想起十一岁 在新闻联播里看到“人类基因组草图完成”的那个傍晚。还上小学的卢平对电视画面里螺旋缠绕的两条链和“碱基”这个词感到茫然又觉得震惊,难以想象这和一贯爱看的《动物世界》和小时候养过的花金龟有什么联系。

六年以后,我又再次被高中课本里精致优美的DNA复制转录模型和可爱的教生物的小姐姐吸引,终于踏上了学生物的不归路。

演化,不止你以为的样子

提到生物演化,相信大家头脑中浮现的大多是化石,恐龙,南方古猿,以及生物为了适应环境和竞争,演化出的多样而奇特的性状:蝙蝠演化出了翅膀,长颈鹿可以吃到树叶,海豹的四肢变成了鳍,鸟类的骨头中间有洞,羚羊和猎豹都越跑越快,雄极乐鸟的绚丽出自雌性的挑剔。

在很多人眼里,生物演化大概是个非常有趣的学科。只要粗粗了解一下达尔文的演化论,自然选择适者生存的规则似乎也不难理解,甚至可以轻松把它“应(wai)用(qu)”到解释社会现象上。 总之,关于生物演化,总能有很多动人的故事可以讲。

然而,作为科学研究的演化生物学,很多时候比讲故事要“没意思”得多,而很多人熟悉的达尔文的自然选择学说只是完整演化图景中的一部分。

在演化生物学中,《物种起源》的定性描述只是开始,后来在种群遗传学的基础上还发展出了有数学模型的定量表达。更重要进展的是20世纪80年代开始中性学派提出的分子演化的中性理论/近中性理论。中性学派的代表人物是木村资生、太田朋子和根井正利,他们发现基因组层面的演化在很大程度上不那么“优胜劣汰”,事实上,那些差不多好的、不好不坏的、甚至稍微有点儿坏但无伤大雅的遗传变异都能随机保留下来。这种所谓“中性”的随机过程,可以用一套数学和统计学模型来定量描述,是现代演化生物学研究的核心理论和“零假设”。

零假设又是什么呢?现代科学的一大方法论就是对假设进行统计检验。如果想用新的因素/作用A解释我们观察到的某现象B,首先要剔除这种因素做一个“零假设”,也就是对“没有A时应该观察到什么”进行计算或实验。如果发现有A时的观察结果“遗世而独立”,不能用零假设中观察到的随机模式来解释,那么就可以从统计上拒绝零假设,宣称“我发现了A在B中的作用或存在~”

这套思路自然也应该用在基因组演化的研究中。自然选择作用下的适应性演化是演化学界的掌上明珠,但是要证明“在自然选择作用下,某性状是对环境的一种适应”,就要用到上述思路:从逻辑上来说,中性突变是不需要有任何选择压力就会自发进行的,所以我们要先假定演化过程是随机而且中性的,然后验证我们感兴趣的性状能不能在中性过程中演化出来。如果不能,这个性状就很可能是由于适应环境而被选择保留下来的了。 因此随机性和零假设是十分重要的。

讲讲我都做些什么样的研究吧

我的研究就是关注了一个有趣的性状——趋同演化(大家可以看我之前介绍趋同演化的两篇文章,这个和这个)。

我们熟悉的趋同演化现象基本都是适应环境的典型例子,比如翼龙、蝙蝠和鸟类都演化出翅膀等等。

生物学这个坑,如果你具备了这些条件,就往里跳吧……

从上往下依次是翼龙、蝙蝠和鸟类。可以看出虽然有翅膀,支撑翅膀所用的骨骼结构确实不一样的,所以趋同演化与否要看如何定义。图片来源:Wikipedia

近期,不少研究想要寻找这些趋同性状的分子机理。比如说蝙蝠和齿鲸都能利用回声进行定位,于是回声定位是蝙蝠和齿鲸两大类群中独立发生的趋同性状,研究者分析了二者基因组中的许多蛋白质序列,发现也有趋同现象,就宣称这些趋同是跟回声定位这个性状有关系,是选择导致的适应。

但这些趋同演化有没有可能是随机发生的呢? 根据前辈们发展出的各种蛋白质序列中性演化模型,我可以算出在基因组中,两类生物随机发生趋同演化导致蛋白序列“异曲同工”的频率。把这个理论频率和实际观察到的频率比较之后我们发现,很多蛋白序列的趋同演化其实可以用中性的随机事件来解释,比如在蝙蝠和齿鲸基因组中发现的绝大部分趋同事件,跟二者趋同演化出的回声定位功能没关系,恐怕也谈不上什么环境适应性。虽然这个结论有些无趣,但是正如前面所说,这为我们严谨地推断适应性演化提供了背景模型。作为科学的生物演化,必须是严谨的,不能随意讲故事。

这就是现代分子演化生物学研究的一个小例子。

生物信息学博士的“演化”之路

等等,在介绍里我明明不是演化专业的啊!我一个密歇根大学生物信息学专业的学生,怎么就去做演化了呢?

对我来说,分子演化对数学和统计学的广泛应用,恰恰就符合生物信息学专业的定义——用计算方法解决生物学问题。事实上,在博士研究中,我没有在实验台前做过实验,一直是在跟计算机里的一条条字符串,也就是蛋白质序列打交道。由于我要计算的东西是别人没有算过的,我需要自己编写程序(Python大法好)来分析蛋白质序列,根据数学模型计算趋同演化的理论概率,等等。

而对于整个生物信息学/计算生物学专业来说,PhD们的研究方向可谓千差万别。虽然我们系有几个下属的实验室,但很多学生会跑到其他系的实验室做研究,比如我的实验室就在生态学与演化生物学系。说到底,计算方法只是一种工具,学好了工具之后,大家有各自感兴趣的生物学问题:有人研究狗狗的驯化历史和人类演化史,有人比较大规模基因组测序数据来寻找疾病相关基因,有人用超级计算机推断蛋白质结构和动力学,有人利用机器学习方法让AI根据核磁共振图片预测老年痴呆,有人推算动力学方程来解释哺乳类发育过程中体节形成的周期性……

密大生物信息专业隶属于医学院,课程要求包括生物、数学和编程三方面,而如前所述科研方向的选择自由度很高。为了做好研究,生物信息学的学生通常要掌握基本的编程能力和算法常识作为工具,学习数学和统计学作为描述和建立模型的理论基础,然后还要有足够的生物学背景来发现和理解问题。作为重视多样性和全球化的公立大学,密大招收国际学生比例相当高,生物信息学尤其如此。取决于每个人在博士期间重点培养的能力和个人兴趣,毕业之后的去向也是非常多样,有的继续在计算生物学领域做科研,有的去新兴生物科技公司参与研发,有的真的跳出大坑转型成为了程序工程师等等。

在日常的科研生活中,做计算的生物汪们往往看起来相对轻松一些。比起实验室养酵母的小姐姐每天风雨无阻给正在努力演化的酵母传种接代,我们的大部分工作甚至可以在家里远程登录实验室的计算机完成,而且课题推进速度通常更快。但是由此认为生物信息学“好做”就想错了。

绝大多数生物学现象背后的影响因素错综复杂,这不仅反映在做“湿”实验(实验室里那些实验,比如培养酵母)时结果不可预料,也反映在“干”实验(通过计算进行推演,比如我的工作)中各种数据和方法都存在偏差(bias)。为了剔除无关因素,真正考察我们感兴趣的东西,计算生物学研究中也需要非常严谨的实验设计,做好合理的对照和零假设,知道不同的方法有什么“坑”需要注意。不然花了几天时间跑完程序,却意识到结果里令人振奋的相关性来自于数据太“脏”没清理好,也是会想和实验台上的同学们抱头痛哭的。另外,只有计算分析的课题有时并不具有完整的逻辑链,不和湿实验结合难以发表高质量有影响力的论文。这也是学科交叉的合理发展趋势。

在北美地区,科研以外的生活很大程度上取决于你选择了哪所学校。对比一下位于纽约上城的哥大,位于安娜堡市的密大和位于玉米地里(喂!)的普渡大学你就能明白。

生物学这个坑,如果你具备了这些条件,就往里跳吧……

也算是……自然好风光?摄影:刘小星的同学

安娜堡市基本是以密大为基础的典型大学城,虽然只有十万人口,但文化活动和各国口味的餐馆还是相当丰富的,既没有大都市的喧嚣和脏兮兮,又不会只有玉米可以玩(不对),而且还有着优秀的体育传统(Go Blue!)。

生物学这个坑,如果你具备了这些条件,就往里跳吧……

当然,我不会告诉你这里一年中有五个月会下雪。

想读博吗?这是我的一点建议

我想谈谈对读博的看法。

一个基础自然科学领域的博士是研究导向的:资格考试衡量的是独立发现科学问题提出研究方案的能力,毕业标准是在本领域做出了足够的原创研究贡献。正如前面所说,科研生活的大部分时间都是细致烧脑的实验分析,大部分读博的痛苦来自于没有或者失去了对于自己研究课题的足够强烈的兴趣。因此,想清楚自己对一线研究是否真的喜爱非常重要,切忌因为“不知道还能干什么”而选择跳坑。

当然,如果你对探索未知的自然科学问题有极大的兴趣,同时也做好了承受压力和面对困难的准备,欢迎读博。 你将知道,对这个世界人类还有太多的未知,但你也将成为最有资格探索这些未知的人,为人类对世界的认识添砖加瓦。好的科研训练,会赋予你自主学习的能力、客观看待世界的眼界、理性的逻辑思维和分析解决问题的思考本能。如果你最终没有把科研作为终身职业,这段经历这些收获,也会是你做好任何工作的重要资本。正经的科研不光是一种职业,更是一类三观。

祝大家都能找到适合自己的人生道路;祝有志读博的同学们实现梦想,做出好的研究,成为优秀的知识分子。

作者名片

生物学这个坑,如果你具备了这些条件,就往里跳吧……

编辑:婉珺

排版:晓岚

欢迎个人转发到朋友圈

本文来自果壳网

转载请联系授权:sns@guokr.com

投稿请联系scientificguokr@163.com

科研最新进展,学术最新动态

顶级学者的思考和见解

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据