研究队伍
现在位置:首页 > 研究队伍

姓  名:
赵方庆
学  科:
基因组学和计算生物学
联系电话:
010-84504172
电子邮件:
zhfq@biols.ac.cn
通讯地址:
北京市朝阳区北辰西路1号院5号 100101
更多信息:
  
简历:

  博士,研究员。中科院“百人计划”入选者。2001年获青岛海洋大学海洋生物学、计算机技术及其应用专业学士学位。2006年在中国科学院海洋研究所获博士学位,研究方向为海洋微藻的进化基因组学。在此期间获得了中国科学院院长特别奖(2006),中国科学院优秀博士论文(2007),国家海洋科学技术奖一等奖(2012)。2006年7月至2010年底在美国宾州州立大学比较基因组学和生物信息学研究中心,从事计算生物学和基因组学的研究工作。2010年10月被中国科学院北京生命科学研究院聘为“百人计划”研究员,主要研究方向是计算基因组学。现为中国科学院北京生命科学研究院科研部副主任、计算生物学联合研究中心秘书长、中国生物工程学会计算生物学专业委员会副主任委员、副秘书长。生物信息学国际刊物《Briefings in Bioinformatics》、《Hereditas》、《Genomics, Proteomics & Bioinformatics》编委。2012年获得中国科学院“科技创新交叉与合作团队”计划的资助,成立了“计算基因组学”交叉合作团队。承担国家自然科学基金3项,中科院知识创新工程资助课题1项和中科院院长特别奖基金1项。目前,以第一作者或通讯作者身份在生物信息学和基因组学领域国际刊物发表学术论文40余篇。

研究领域:

    1.基因组变异与精准医学 
    遗传变异不仅是人类表型变化的基础,也是疾病易感性的基础。根据发生突变的碱基数目,遗传变异可分为单核苷酸多态性(SNP)和结构变异。SNP和串联重复序列曾被认为是人类遗传变异最主要的形式,但最新的研究表明基因组结构变异广泛存在于健康和病患人体中,影响着基因的表达和表型的变化,甚至引发疾病或增加复杂性状疾病的发病风险。近年来,以基因组测序为核心技术的精准医学研究成为大家关注的热点,基因突变信息的识别是精准医学的核心关键技术。然而,目前对海量基因组数据中遗传变异,尤其是结构变异的挖掘算法远未成熟。 
    我们重点关注基因组结构变异挖掘中的关键性问题(如结构变异中断点的精准定位、重复序列区域附近的结构变异识别等),提出新的计算方法,建立较为完善的统计学模型及质量评估标准,以便快速、准确的从海量数据中挖掘出基因组结构变异。随着高通量测序技术的进步以及越来越多的个人基因组数据的出现,深度挖掘和分析其中的遗传变异,将对我们深入理解复杂性状疾病的分子机制、鉴定易感基因和认识遗传变异和疾病表型的关系具有重要意义。
    2.环形非编码RNA组学 
    近年来,环形RNA(circular RNAs)成为非编码RNA领域一个新的研究热点。与现有的线性非编码RNA分子不同,环形RNA是一类由线性RNA通过3’,5’-磷酸二酯键将两端相连而形成的RNA环状分子。然而由于计算方法及研究手段的限制,目前只发现少部分环形RNA并且绝大多数无法了解其功能。尤其是目前对更多环形RNA功能的探知和验证仍需要更多新颖的理论假说和大量的实验验证。但在此之前,能否从海量的RNA测序数据中高效识别环形RNA及其不同形式的转录本,成为后续功能验证及表达调控机制研究的重要前提。 
    我们针对环形RNA研究中的关键计算生物学问题开展研究,建立新的环形剪接位点预测工具(CIRI)。借助于CIRI,我们发现来源于内含子和基因间区的环形RNA约占所有环形RNA的12-20%。我们还发现及实验证实了仅在环形RNA中表达的片段(ICFs,intronic/intergenic circRNA fragments),并对其特征进行了描述。这些ICF的存在,提示环形RNA不仅仅是线性转录产物的副产物,而是作为一种非编码RNA,与编码RNA有着不同的形成机制。我们结合断点识别和最大似然估计算法,实现对各可变剪接丰度的准确估计以及全长序列组装与重建,为后续研究环形RNA的形成及可变剪接机制提供了重要的方法学工具。 
   3.宏基因组技术与人体健康 
    微生物广泛存在于各种生态环境中,与我们的生产、生活及自身健康密切相关。基于高通量测序的宏基因组学技术,已成为研究微生物群落组成、结构及功能最主要的技术手段。然而受高通量测序技术的限制,宏基因组研究中所利用的实验技术和计算方法遇到了很多困难。如何对缺乏参考序列的海量混合测序片段进行拼接和组装,这是所有宏基因组学研究面临的首要问题。此外,相对于研究基础较多的人体微生物组,新环境下宏基因组的研究更缺乏有效的实验和计算手段。 
    我们针对宏基因组研究的关键问题,重点开发基于单细胞测序技术的宏基因组拼接、序列归类和注释等方面的算法和工具。利用功能基因组学和代谢组学技术,研究人体口腔和肠道微生物组,揭示不同病理条件下微生物群落结构的组成、代谢功能及其变化规律。整合基因组学、计算生物学和系统生物学的研究手段,了解人类健康、生物被膜形成机制以及宿主与致病菌的相互作用等科学问题。

代表论著:
  1. Zhang Y, Ji P, Wang J & Zhao F*. RiboFR-Seq: a novel approach to linking 16S rRNA amplicon profiles to metagenomes. Nucleic Acids Res. 2016, doi: 10.1093/nar/gkw165.
  2.  Gao Y, Wang J & Zhao F*. CIRI: an efficient and unbiased algorithm for de novo circular RNA identification. Genome Biology. 2015, 16:4
  3. Zhao H & Zhao F*. BreakSeek: a breakpoint-based algorithm for full spectral range INDEL detection. Nucleic Acids Res. 2015, 43 (14):6701-6703.
  4. Ye N^*, Zhang X^, Miao M^, Fan X^, Zheng Y, Xu D, Wang J, Zhou L, Wang D, Gao Y, Wang Y, Shi W, Ji P, Li D, Guan Z, Shao C, Zhuang Z, Gao Z, Qi J* & Zhao F*. Saccharina genomes provide novel insight into kelp biology. Nature Communications. 2015, 6: 6986.
  5. Wang J, Gao Y & Zhao F*. Phage-bacteria interaction network in human oral microbiome.  Environmental Microbiology. 2015 DOI: 10.1111/1462-2920.12923
  6. Wang J, Qi J, Zhao H, He S, Zhang Y, Wei S* and Zhao F*. Metagenomic sequencing reveals microbiota and its functional potentials associated with periodontal disease. Sci. Rep. 2013, 3, 1843.
  7. Liu J, Wang H, Yang H, Zhang Y, Wang J, Zhao F* and Qi J*. Composition based classification of short metagenomic sequences elucidates landscapes of taxonomic and functional enrichment. Nucleic Acids Res 2013, 41(1):e3.
  8. Shen X, Tian M, Meng X, Liu H, Cheng H, Zhu C, Zhao F*. Complete mitochondrial genome of Membranipora grandicella (Bryozoa: Cheilostomatida) determined with next-generation sequencing: The first representative of the suborder Malacostegina. Comp Biochem Physiol Part D Genomics Proteomics. 2012 Mar 30.
  9. Qi J* and Zhao F*. A new scheme to identify and visualize structural variations from paired-end mapping data. Nucleic Acids Res 2011, 39: W567-W575
  10. Zhu E^, Zhao F^, Xu G, Hou H, Zhou L, Li X, Sun Z and Wu J. mirTools: microRNA profiling and discovery based on high-throughput sequencing. Nucleic Acids Res 2010, 38: W392-W397.
  11. Hou H^, Zhao F^, Zhou L, Zhu E, Teng H, et al. MagicViewer: integrated solution for next-generation sequencing data visualization and genetic variation detection and annotation. Nucleic Acids Res 2010, 38: W732-W736.
  12. Zhao F, Bai J, Wu J, et al., Sequencing and genetic variation of multidrug resistance plasmids in clinical samples.PLoS One 2010, 5(4): e10141.
  13. Qi J^, Zhao F^, Schuster SC. inGAP: an integrated next-gen genome analysis platform. Bioinformatics 2010 26(1):127-129.
  14. Zhao F, Qi J, Schuster SC. Tracking the past: Interspersed repeats in an extinct afrotherian mammal, Mammuthus primigeniusGenome Research 2009 19(8):1384-1392.
  15. Zhao F*, Hou H, Bao Q, Wu J*. PGA4genomics for comparative genome assembly based on genetic algorithm optimization. Genomics 2009, 94: 284-286.
  16. Zhao F, Zhao F, Li T, Bryant DA. A novel pheromone trail-based genetic algorithm for comparative genome assembly. Nucleic Acids Research 2008, 36:3455-3462. 
研究组成员:
工作人员
王金锋  博士 副研究员  
冀培丰  博士 助理研究员

研究生
彭公信 博士 2013年 陈  帅 硕士 2014年
史文聿 博士 2014年 张金阳 硕士 2015年
周  琳 博士 2015年 吴婉莹 硕士 2015年
贾  震 博士 2015年 马秀伶 硕士 2016年  
郑  毅 博士 2016年 

已出站博士后
申欣(2012-2015)、张延明(2012-2015)、陈丽娟(2013-2015)

已毕业研究生
冀培丰(2012-2016)、高远(2013-2016)、赵辉(2011-2015)、周慧玥(2011-2015)