泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

解读Folding@Home:真正有意义的计算

    泡泡网显卡频道5月7日 来看几个貌似毫无关联的关键字:癌症、高性能电脑、团队竞技、志愿者。当它们独立出现时,都是各自领域内值得研究的话题,日常生活中你我也会经常提及这些字眼,而当它们被穿成一条线之后,就发酵成为一个特殊而有意义的世界性项目Folding@home,分布式蛋白质折叠计算(下文简称“蛋白质折叠”),它是众多分布式计算项目之一,也是最出名、普及最广泛的之一。

    Folding@home蛋白质折叠项目的出现,满足了一部分人群在内心深处的愿望:通过自己的高性能电脑,以志愿者的身份加入团队竞技比拼,在不断的计算过程中协助攻克癌症、流行性感冒病毒、人类免疫缺陷病毒(HIV)等世界性难题。

    该项目最有价值和趣味性的地方,并非它有对于基础科研有多么不可或缺的重要性,而是在于民众参与,团队竞技,如何搭建合理的高性能电脑。

解读Folding@Home:真正有意义的计算

    但是无心插柳柳成荫,如此有意义的项目自然会被大众发掘。Folding@home蛋白质折叠项目官方表示,2000年10月至今,长达14年的推动和成果,已经聚集了全球740万总用户数,大概有100万活跃计算机,峰值计算速度达45PFLOPS(2014年4月30日数据),成为全球最大的分布式计算项目。它所凝聚的志愿者计算能力,比肩世界最快的超级计算机“天河二号”54.9PFLOPS(理论峰值)。

    最近两个月间,Folding@home项目连续在《自然》等学术杂志上发布新的科研成果,其官方网站上公布的论文数量也达到114篇。一些合作公司如Intel、Google、NVIDIA给予项目方的帮助不可估量,一些华人科学家如赵宇桐(Yutong Zhao)直接主持参与了内核计算程序的开发。

    今年3月24日,项目组公布了最近所研究的“c-src”蛋白质,能找到专门抑制此蛋白的药物,成了攻克癌症的关键。

    Folding@home项目通过分子动力学模拟,发现“c-src”蛋白质的某个弱点只存在于“c-src”的特定的中间态,因此只要能找到能与该弱点发生作用的蛋白质,就可以找到副作用极小的癌症的特效药,这是替代化疗方法的重要契机。

谁在推动Folding@home项目发展?

    该项目由斯坦福大学化学系的潘德小组(Pande Group)主持,于2000年10月1日正式启动。斯坦福大学教授Vijay Pande博士的实验室,是斯坦福大学化学、医学中心、结构生物学的重要部门,其主要工作是从理论和数值模拟等角度入手,研究蛋白质、RNA、合成聚合物的纳米级折叠过程。

解读Folding@Home:真正有意义的计算

    一个好汉三个帮,项目成立后发展迅猛,很多在校学生、在职科学家加入项目志愿者行列,帮助项目方翻译网页、传播推广。除了官方网站之外,很多全世界的非官方机构、论坛也掀起了讨论和参与Folding@home项目的高潮,中国分布式计算总站(Equn.com)的Folding@home频道和版区也成为志愿者热门关注区。

解读Folding@Home:真正有意义的计算

    只有“散兵游勇”的助阵显然不够,Intel、Google、NVIDIA、AMD(前ATI)、索尼、苹果、戴尔等厂商形成了一个支持Folding@home项目发展的同盟,在项目组的统领下和开发商协作,一直致力于改进软件以及第三方工具做出更好的接口,同时为项目提供了制度、资金、服务器设备支持。

Folding@home如何关联重大疾病和家用电脑?

    如果用7个字来解释这一问题,那就是——分子动力学模拟。

    相信你一定想了解更多细节,那就需要了解蛋白质折叠。蛋白质折叠(Protein Folding)问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。蛋白质可在短时间中从一级结构折叠至立体结构,研究者却无法在短时间中从氨基酸序列计算出蛋白质结构,甚至无法得到准确的三维结构。

    Folding@home项目正是从这端发力。蛋白质折叠计算分为热力学和动力学两大部分,Folding@home项目属于一般的蛋白质折叠模拟,它仅涉及分子动力学,通常都是把原子视为刚体,然后计算这些刚体之间的力学关系。

    分子动力学软件有很多,Folding@home项目有什么特别之处呢?你可以理解为:Folding@home项目基于GROMACS计算引擎的,是一个力学主导的分子动力学模拟,它的特点就在于支持大规模分布式计算。

解读Folding@Home:真正有意义的计算

    Folding@home所研究的是人类最基本的特定致病过程中蛋白质分子的折叠运动。项目的核心原理,在于求解任务目标分子中每一个原子在边界条件限制下由肽键和长程力等作用所导致的运动方程,进而达到实现模拟任务目标分子折叠运动的目的。

    每一个原子背后都附庸这若干个方程,每一个方程都可以转换成一组简单的向量指令。同时由于长程力的影响,条件分支也随处可见,对GPU Shader灵活度的要求很高,所以Folding@home很长一段时间内也见证了GPU从专用处理器走向通用的精彩历程。

    如果蛋白质没有正确地折叠,人类会受到病症的折磨。许多疾病如阿兹海默症(Alzheimer''s),疯牛病(Mad Cow/BSE),可传播性海绵状脑病(CJD),肌萎缩性脊髓侧索硬化症(ALS),还有帕金森氏症(Parkinson''s),特别是一些癌症等,正是由于一些细胞内的重要蛋白发生突变,导致蛋白质聚沉或错误折叠而造成的。

    也许这就是很多志愿者持续不断为项目提供计算能力的原因。

志愿者如何参与Folding@home项目?

    一个想获得众人支持的项目,必然要降低参与门槛,不能把志愿者自己的家变成一个超级计算中心,没几个人愿意提供这种支持。Folding@home项目组清楚这一点,所以他们为全世界不同国家的不同电脑提供了各种客户端。理论上只要你的电脑速度尚可,值得在朋友中炫耀一番,都可以尝试参与Folding@home项目。

解读Folding@Home:真正有意义的计算

    你可以下载并运行最新版客户端程序,下载安装运行Folding@home客户端,无论是Win还是Mac OS X操作系统,都让你的CPU和GPU不再停歇,让人类距离重大疾病的攻克进程不断推进。加入本项目的计算机越多,本项目计算的速度就越快。值得一提的是2006年6月6日,ATI(现AMD)公司的加入,通过研发GPU(显卡)让该项目计算力成倍提升。

    对于普通用户来说,通过该项目体验GPU计算是最合适不过的,因为所有的游戏都是阶段运行性的,而游戏之外的时间你的GPU完全闲置,所以Folding@home项目成为调动强劲资源的不二选择。

    不过令人头疼的一点是,这个项目至今没有妥善解决汉化问题,官方网站和客户端的汉化都未从官方口径发起,所以有用户在中国大陆推动分布式计算的网站上,为项目撰写了不同版本的中文版新手参与教程,需要的朋友们可搜索阅读。

在哪里获得Folding@home项目成果和论文?

    发出这一疑问的一般有两类人,首先是想了解项目发展和科学知识的用户,还有一部分对分布式计算抱有疑虑的人。答案很简单,在官方网站上,点击Science页面,可以了解到项目原理,点击Diseases Studied,可以了解到疾病与蛋白子相关知识,点击Papers / Results,可以了解到项目计算结果在分析之后,发表出的论文。

    比如Folding@home借助谷歌Exacycle(谷歌的大规模并行的云资源)在近期研究B2AR蛋白质动力学,G-蛋白偶联受体(GPCR)在许多医学和生物过程(尤其是哮喘和心脏病)取得重要成绩。该研究成果在化学顶级期刊《Nature Chemistry》上发布。

解读Folding@Home:真正有意义的计算

    当然如果你愿意,可以和项目方联系,索取更多计算结果。对于正在参与计算的志愿者,点击FAHControl工具,点击每个Project(任务编号),可以看到每个任务的计算内容。

    如曾今出现的5700至5756任务段,主要任务是构建螺旋束蛋白ACBP的结构函数,根据不同的构建结果模拟特定边界条件下ACBP的展开过程以及它与特种免疫球蛋白。

    通过对肿瘤组织中螺旋束蛋白ACBP的研究工作,我们将了解到肿瘤的形成、生长、分裂、扩散以及转移等不同阶段所表现出来的的特定生物活性以及肿瘤本身位于上述阶段的“生理现象”。简单的说,Folding@home项目所发布的该任务段,就是为研究肿瘤形成之后的一切生化活动的过程及其表达提供基础。

解读Folding@Home:真正有意义的计算

    该项目还有一个里程碑在2004年,Folding@home用一个全原子模拟进行p53的蛋白二聚体的复性分子动力学研究,仿真结果与实验结果一致。这是第一次在医学领域的行业专业出版物上,从分布式计算项目中得到关于癌症研究的成果。
次年,Folding@home通过一种新的方法来识别与氨基酸的稳定至关重要的蛋白质,这项成果也用于研究p53基因突变。该方法在识别癌症的突变,确定特定的基因突变等方面,获得的科研成果相当成功。

    可以肯定地说,如果你参加的是一个正规机构主导的,同时在全球具有广泛认可的项目,就不会出现这种情况。任何分布式计算就是借助志愿者的力量来完成积累,因此任何项目都承诺将结果完全无隐瞒地分享给公众,如果不公开运算结果,那么没有人会参与运算,任何蛛丝马迹发现后,会演变成巨大的负面新闻,让项目走向终结。

参与Folding@home项目有谁与我同行?谁与我竞争?

    Folding@home作为世界上最大的分布式计算计划2007年就已经为吉尼斯世界纪录所承认,在笔者看来,该项目的成功很大一部分原因是引入了团队竞技

    Folding@home项目组通过授予不同的任务包积分,按照运算量贡献的大小给予志愿者得分。得分虽然不能兑换金钱,但是可以用来攀比,这就是最简单最真实的团队竞技。

    Folding@home项目要求参与者填入用户名,同时填入团队代码加入团队,这个时候你就认识了同行者,可以在一些专业论坛找到他们,共同提升项目参数设置能力,搭建最便宜但是得分最高的机器。而团队之间,也从这个时刻开始,产生了激烈厮杀,比如国家色彩的团队:代码3213(中国队),代码31403(台湾队),代码47191(俄罗斯队),代码38156(越南队)等团队之间,经常会展现出与国家经济水平不相符的疯狂表现。

解读Folding@Home:真正有意义的计算

    一些厂商、媒体也加入了这一公益性项目的行列,有可能是为了彰显其社会责任感,也是利用Folding@home项目给自己提高圈子内部的知名度和美誉度。如目前排名第一的folding@evga,是一家欧洲著名显卡厂商,Maximum PC Magazine是行业知名科技媒体,AMD Zone是很多AMD用户的聚集地,Apple Inc.当然是苹果,Intel肯定是英特尔,Team 2ch是一个日本著名论坛,Team MacOS X亦或许是所有苹果爱好者。

Folding@home项目给我们的启示

    时过境迁,无论是志愿者分布式计算提出当初还是现在,这种聚合凡人力量改变世界的项目,虽然难以获得金钱的诱惑,但是比购买机器挖矿要有意义得多。项目方除了积分政策之外,好像尚未找到一种方式来刺激项目获得更大运算量。在撰写过程中,笔者和一位莱特币矿工聊天,得知他偶尔会抽出1/10的计算能力参与Folding@home项目,也算是对设备更高效率的利用。

    在Folding@home项目中国团队中,也不乏“大地主”,他们用自己的公司限制资源、服务器资源、朋友家中的显卡资源一道努力,创造出很多高产客户端。他们强有力地支撑了团队竞技,也让Folding@home项目充满了娱乐性和火药味,甚至让两岸三地乃至全世界的志愿者们为了该项目不断竞争不断提升。

    除了这个项目,还有哪些项目也开始利用志愿者的计算能力呢?在BOINC平台下有全世界最多的分布式计算项目,比如IBM主导的World Community Grid世界公共网格,历史悠久的寻找外星人项目SETI@Home,他们都凝聚了巨大的计算能力,为项目方收集了庞大的计算资源。

解读Folding@Home:真正有意义的计算

    中国科学院高能物理研究所主办CAS@home,于2010年6月13日正式开始测试,经过4个多月的测试CAS@home项目注册用户已达2550人,注册主机接近3800台,其提供的峰值聚合计算能力相当于一台每秒38万亿次的超级计算机。可惜该项目近期经常没有任务更新,人气显得较为低落。

    在中国,志愿计算的发展还处于起步阶段,CAS@home发起之前,几乎全部的志愿计算项目都是由欧美科学家发起的。无论如何,该项目还是让中国科学家们获得了世界各地的计算能力,也收获了分布式计算项目的运营经验。■

0人已赞

泡泡网

手机扫码关注