主题:Fold it, 草根科学的曙光? -- PBS
蛋白质结构是指蛋白质分子的空间结构。作为一类重要的生物大分子,蛋白质主要由碳、氢、氧、氮、硫等化学元素组成。所有蛋白质都是由20种不同的L型α氨基酸连接形成的多聚体,在形成蛋白质后,这些氨基酸又被称为残基。要发挥生物学功能,蛋白质需要正确折叠为一个特定构型,主要是通过大量的非共价相互作用(如氢键,离子键,范德华力和疏水作用)来实现;此外,在一些蛋白质(特别是分泌性蛋白质)折叠中,二硫键也起到关键作用(比如胰岛素)。
蛋白质的分子结构可划分为四级,以描述其不同的方面:
一级结构:组成蛋白质多肽链的线性氨基酸序列。
二级结构:依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α螺旋和β折叠。
三级结构:通过多个二级结构元素在三维空间的排列所形成的一个蛋白质分子的三维结构。
四级结构:用于描述由不同多肽链(亚基)间相互作用形成具有功能的蛋白质复合物分子。
所以蛋白折叠非常有讲究,简单说就是结构要有序,下图就给了这样一个示意,从一级结构向三级结构的变化,也就是折叠:
蛋白质折叠过程是一个非常热门的经久不衰的研究方向,今年与屠呦呦同时获得拉斯克奖的另外2名科学家就是研究蛋白质折叠的。
我们可以说生命过程中的很大一部分目的就是将图里左边的蛋白质一级结构转变成图里右边的蛋白质三级结构,即折叠。而要终止一个生命过程,就要把图里右边的结构向图里左边的结构转化,专业术语称为变性,比如云南的过桥米线就是在做这样过程---而有人认为过桥米线的工艺不完美从而导致这个变性过程不彻底--这个我就不在这里详细讨论了。
顺便说一下这个蛋白质变性现象是中国生物化学家吴宪先生在1931年首次发现的,在蛋白质研究上是个突破性发现。
你怎么知道蛋白质已经折叠好了?这个折叠好的蛋白质样子如何?如果这个蛋白质是个病毒蛋白,哪里是它的的功能部位?如果我能看到这个功能部位,能不能设计一个药物填充到这个功能部位进而抑制这个病毒?
要回答上述问题,即为了从分子水平上了解蛋白质的作用机制,常常需要测定蛋白质的三维结构。由研究蛋白质结构而发展起来了结构生物学,采用了包括X射线晶体学、核磁共振等技术来解析蛋白质结构。
最有效的“看到”蛋白质结构的方法是X射线晶体学,说白了就是把组成蛋白质的每个原子在三维空间的坐标位置给确定下来,然后把一个个氨基酸残基给连起来看出它们在空间的走向和蛋白质内各个氨基酸的相互关系。
下面给个简图有关如何用X射线晶体学方法测定蛋白质结构:
测一个蛋白质的结构听上去很容易,实际做起来非常难,你想想一个蛋白质里的每个原子的空间位置都要确定下来不是一件容易的事,特别是制备蛋白晶体得到晶体不是很完美,它的分辨率往往不是令人满意,会有不同的后果:
分辨率(埃) 结构中可能出现的问题
>4.0 单个原子坐标无意义
3.0 - 4.0 整体折叠可能是正确的,但很可能有错误存在。 很多侧链摆放位置不正确。
2.5 - 3.0 整体折叠基本是正确的,除了位于结构表面的一些环状结构可能没有正确建模。长侧链的极性残基(Lys、Glu、Gln等)和小侧链残基(Ser、Val、Thr等)的侧链摆放位置有可能不正确。
2.0 - 2.5 与2.5 - 3.0类似,只是出现错误的情况更少。可以明显观察到水分子和小配基。
1.5 - 2.0 基本没有错误的侧链摆放位置,甚至一些小的错误也可以被检测到。整体折叠,包括位于结构表面的环状结构,基本不可能出现错误。
0.5 - 1.5 在这一分辨率下,一般不会有结构错误。侧链异构体库和立体几何研究都是利用这一分辨率范围内的结构来进行的。
所以"测"结构往往成为"猜"结构,从一张迷迷糊糊的照片上要看出蛋白质肽链的走向,没有2把刷子是不行的。据说美国布鲁克海文蛋白质结晶数据库里的相当多蛋白质结构是错误的。
猜测的年数多了,结晶学家们开始总结出一些规律,然后让计算机利用这些规律去发现蛋白质的结构,但是经常计算机还是搞不出来正确的结果--因为计算机在进行空间识别的计算中始终表现出一种傻乎乎的状态。
鉴于目前游戏机流行,各种游戏高手玩家层出不穷,结晶学家们注意到这些家伙往往有极高的空间识别能力,于是一个异想天开的方法出现了,让游戏玩家来玩蛋白质折叠的游戏,这个折叠游戏的结果如果越接近现实的蛋白质结构,则游戏玩家得分越高,就像西西河铁手让大家发文挣花类似。
通过网上蛋白质折叠游戏(Foldit),为科学家提供结果,解决蛋白质结构中的问题。最优秀的玩家能快速的识别计算机无法修正的问题,因此能轻而易举的战胜算法。
这个方法的思想发表在英国自然杂志上,署名作者包括了Foldit players。无名玩家们成为世界一流科学杂志的作者,我猜想在科学史上还是第一次吧。
Predicting protein structures with a multiplayer online game
人脑计算机同电子计算机结合的特点是由Foldit采用了一种混合方式:先用名叫Rosetta的算法创造出一些初始的蛋白质结构,然后让玩家在3D空间内摆弄结构,解决各种问题。人通常比机器更擅于处理模式结构问题。通过追踪最优秀玩家的动作,研究人员能找出为什么人类的模式识别能力远超机器的原因。例如,当一个疏水性氨基酸从蛋白质表面浮现时,人类能很容易发现它。他们会重新排列内部结构,使逃到外部的氨基酸能重新回到内部。这种大范围重排的做法超出了Rosetta算法的能力,因为涉及到的能量变化非常多。
今年5月,这个网上游戏系统解决了困扰病毒学家10多年的一个难题:成功地解析出了反转录病毒的蛋白酶的结构,结果发表在英国自然杂志的结构分子生物学分册上,两批Foldit游戏玩家们成为主要的作者群,而他们仅仅用了3个星期就完成了这个解析工作:
Crystal structure of a monomeric retroviral protease solved by protein folding game player
这个工作的意义很大,由于这个蛋白酶是艾滋病毒的一个组成部分,破译了这个蛋白的结构细节,对开发设计抗艾滋病的药物有重要的贡献。
从另一个方面可以看到现代技术使得科研在一个正确的理论指引下,千千万万的草根们可以完成和突破过去精英们长时间无法完成的任务。
近100年前,李大钊曾经写过《庶民的胜利》来歌颂一场革命,而因为各种原因,那场革命在精英团体的领导下失败了;而100年后,在相当高度发达的科技工业水平的条件下,庶民们以一种理性而又轻松的方式显示出其在科技革命乃至政治革命和经济革命上的旺盛能力,这种能力表现了以英国工业革命以来的草根们以更大的规模和热情投入到人类不知疲倦的探索之中。
如果说以瓦特,法拉第和爱迪生,莱特兄弟为代表的草根们成为英美工业革命的代表,那么今天的草根们就是千千万万有知识,有理性,有趣味和有热情的公民们正在做这样或那样的尝试,他们的行为最终将人类的事业推到一个新的高度。
在这个时代生活挺幸运的,是不是?
有关评论。
如果你也想成为蛋白质折叠研究的研究员之一,可以去Foldit,希望大家走运。
犯愁的是将来怎么发炸药奖啊?
本帖一共被 1 帖 引用 (帖内工具实现)
- 相关回复 上下关系8
🙂Fold it, 草根科学的曙光?
🙂俺参加了。。。炸药奖俺来了。。。。 山海马甲 字0 2012-01-01 06:09:11
🙂实验动物没有奖 为中华之崛起 字0 2011-10-08 19:26:45
🙂这只不过把一群闲人当成电脑使罢了 4 flux 字107 2011-09-29 12:09:11
🙂模式识别不少电脑是做不了的 1 洗心 字152 2011-09-29 16:48:01
🙂个人相当赞赏foldit的办法 山海马甲 字98 2012-01-01 06:06:28
🙂也有先例 5 新蝾螈 字218 2011-09-22 13:13:06
🙂没有把无名的群众整体列为作者的先例吧? PBS 字213 2011-09-24 18:06:15