綜合新聞
陳立宏博士等在《Nucleic Acids Research》雜志在線發表最新一版“病原菌致病因子數據庫”
病原菌致病因子數據庫(簡稱VFDB,http://www.mgc.ac.cn/VFs/)由我所陳立宏博士和楊劍研究員等于2004年建立(Chen L et al, Nucleic Acids Res. 2005)并長期維護,經過十多年的不斷升級和更新已經逐步發展成為國際上最大的病原細菌毒力因子資源中心,被國內外同行廣泛使用。
近年來新一代測序技術帶來的生物大數據對病原菌毒力因子相關的數據分析提出了新的挑戰。為了滿足日益增長的大數據分析需求,陳立宏博士等進一步對VFDB的基礎數據進行了整合與優化,一方面改進了底層的數據結構,去除了冗余數據,整理生成由已知毒力因子構成的核心數據集和包括所有潛在毒力因子的完整數據集。另一方面對核心數據集中的所有毒力相關基因的注釋信息進行了審核與精煉,提高了VFDB數據庫的數據質量。此外,還在VFDB數據庫中新增加了不動桿菌、氣單胞菌、無形體、伯克氏菌、柯克斯氏體、立克次氏體等六個屬的信息和數據,并引入了一個全新的基于JavaScript的圖形化用戶界面。
該研究工作不僅進一步優化和完善了VFDB數據庫,為其后續的發展奠定了基礎;而且產生出了適用于大數據快速分析的高質量非冗余毒力因子數據集,為VFDB數據庫在大數據時代的廣泛應用鋪平了道路。該研究論文已收編在生物信息學領域國際著名期刊《Nucleic Acids Research》2016年數據庫專刊,并于近期在線發表。