官方正版欢乐斗地主
人才动态

湾区逐梦 | 魏彦杰:潜心超级计算,助力解读生命密码

时间:2019-09-20  来源:党群处、发展处、人资处 文本大小:【 |  | 】  【打印

  庆祝新中国成立70周年,献礼中科院建院70周年,深圳先进院推出“引领科学风尚 传承科学精神”系列人物报道,树立先进典型,凝聚榜样力量,讲述科技工作者的精彩故事及取得的最新成果,弘扬他们胸怀祖国、服务人民的爱国精神,勇攀高峰、敢为人先的创新精神,追求真理、严谨治学的求实精神,淡泊名利、潜心研究的奉献精神,集智攻关、团结协作的协同精神,甘为人梯、奖掖后学的育人精神。

 

  基因测序技术不仅探知人体密码,也产生了海量数据。据悉,仅华大基因的基因数据总量就已达到?#25216;甘甈B,相当于约262万部高清电影的数据量。

  面?#38498;?#37327;基因数据,传统计算机已远无法满足高效分析的需求,高昂的存储和分析成本使得基因测序费用居高不下。潜心研究生物大数据挖掘与分析技术十余年的中国科学院深圳先进技术研究院高性能计算研究中心执行主任、党支部书记魏彦杰研究?#20445;?strong>利用超级计算机开发了一套快速分析软件,能够大大降低基因测序成本,其并行性能已领先国际同类系统。 

△ 高性能计算研究中心执行主任、党支部书记魏彦杰研究员

  研发国际领先超算软件 把基因“碎片”拼起来

  基因,支持着生命的基本构造和性能,储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息,破解基因大数据,对实现精?#23478;?#30103;至关重要。

  一个人的全基因测序数据量有多大?答案是约300G。“一个人有46条?#26087;?#20307;,全部读取存储下来约3G,而在?#23548;?#27979;序中,通常需要复制50-100份。”魏彦杰说,不仅数据量巨大,更让人头疼的是,46条?#26087;?#20307;在测序过程中都被剪成很小的基因片段。

△ 测序中基因被剪成片段(?#35745;?#26469;自网络)

  “正常的基因长度含几千甚至上万个碱基,而在测序中被剪成了一个个约100个碱基的长度。”魏彦杰打?#30830;?#35828;,“就像给你一本剪碎的百科全书,拿到?#39759;?#19968;个碎片?#32423;?#19981;出它的全貌,现在要用计算机的方法将它的每页?#31354;陆諢指?#20986;来。”

  针对基因大数据分析中的诸多难题,魏彦杰团队与华大基因共同承担了国家发改委项目,开发出高可扩展的基因组装分析软件SWAP-Assembler。这套软件基于超级计算机Mira,可在20分钟内处理4T的基因数据,为基因检测技术和临床服务提供了有力支撑。该软件在系统扩展?#38498;?#31995;?#25215;?#29575;上已处于全球领先水平,在Mira超级计算机上的扩展性达到25万核,其系?#25215;?#29575;达到30%以上。作为开源软件,自2014年上线以来,SWAP-Assembler已被美国阿贡国家实验室、俄亥俄州立大学、香港中文大学等机构广泛使用。

  高效解析蛋?#23383;?#32467;构 ?#22411;?#36741;助新药研发

  海量基因数据的高效分析,仅是超级计算机助力生命科学研究的一个方面。此外,魏彦杰还利用超级计算机和优化算法对蛋?#23383;?#32467;构进?#24515;?#25311;分析。据介绍,蛋?#23383;?#26159;生物体内的基本物质,约占人体细胞干重的70%,为生长及维持生命所必需。

  “几乎所有的器官都含有蛋?#23383;剩?#24182;各自具有特殊的三维结构,这些结构决定了蛋?#23383;使?#33021;的多样性,”魏彦杰说,“而解析蛋?#23383;?#32467;构及其折叠过程则是药物研发的关键。”

△ 蛋?#23383;?#20998;子的三维模型(来源:MIT News)

  在过去的数十年中,科研人员通常采用冷冻电子显微镜、核磁共振、X射线晶体衍射等技术来解析蛋?#23383;?#30340;结构,但每种方法?#23478;?#36182;大量的试错实验,普遍存在成本高、耗时长等问题。

  如今,随着IT与BT的深度融合,超级计算机也在蛋?#23383;?#32467;构模拟中派上用场,魏彦杰团队正在研究的就是通过开发高效的蛋?#23383;?#27169;拟和结构分析算法,关注蛋?#23383;?#30340;静态结构和动态变化,与老年痴呆症密切相关的淀粉样蛋白就是其中的重要方向。

  “淀粉样蛋白聚集的斑块广泛存在于阿尔茨海默症患者的脑血管中,近年来研究表明,当这种蛋白形成?#30333;?#32467;构?#20445;?#25165;是真正有毒的分?#26377;?#24577;,”魏彦杰说,“我们课题组做的就是利用并行计算思路,更高效地研究该蛋白从?#23435;?#29366;正常态结构到毒性态?#30333;?#32467;构间的动态转化过程。”

  了解毒性蛋?#23383;?#32467;构的形成过程后,将为药物研发提供新思路。同?#20445;?#39759;彦杰强调,解决蛋?#23383;?#25240;叠等重大生命科学问题,需要多学科深度交叉融合,从生命科学、物理、数学等基础科学理论以及计算机算法等多方面共同努力。

  当极简物理学遇上复杂生物学

  在过去十余年的科研工作中,魏彦杰交叉学科背景的?#25856;普?#26174;。回忆学生时代,他表示?#32422;?#39640;中最?#34892;?#36259;的学科是生物和物理。“物理?#22025;?#35748;为简单?#35789;?#32654;,而生命科学又相当复杂,这两个?#27492;?#30683;盾的方向相碰撞一定很有意思。”

  抱着对两门学科的浓厚兴趣,本科从四川大学应?#26790;?#29702;学专业毕业后,魏彦杰赴美国密歇根理工大学攻读计算生物物理学博士学位,随后在美国普林斯顿大学?#37038;?#35745;算生物学博士后研究。2011年8月,他回国加入深圳先进院高性能计算技术研究中心。

△ 魏彦杰(前排左一)与中心团队

  深圳包容开放的城市文化和深圳先进院新型科研机构的特色吸引了魏彦杰。“移民文化让深圳迅速发展,在深圳先进院有一大批优秀的青年科学家可以交流合作,”魏彦杰说,“这里相对自由的学术环境非常利于学术成长。”

  在生物大数据挖掘和分析领域,魏彦杰已发表高质量学术论文50余篇,主持多项研究课题,包括国家自然科学基金、国家发改委项目、科技部重点研发计划课题、广东省产学研项目?#21462;?/p>

  对于生物大数据未来的发展前景,魏彦杰十分看好,下一步他将继续在高性能计算/生物信息学交叉领域研发高效的算法,力争解决生命健康科学中的重大问题。  

  中共党员魏彦杰:作为党?#20445;?#19968;定要脚踏实地,严于律?#28023;?#19981;忘初心,为祖国的科研事业贡献一份力量!

官方正版欢乐斗地主 山东时时官方开奖 七星体育直播 琼海人才在线网 手球一般比分多少 中国福网老时时 江西快3游戏规则奉贤区 pk10技巧 稳赚公式 动物狂欢多人版开奖 游戏 抢庄牛牛游戏大厅 3d捕鱼达人攻略