生物信息数据中心

数据存储及分析平台

      生物信息数据中心分析平台是以开源的并行/分布式计算框架和相应的生态系统组件为基础构建而成的集大数据存储、处理和分析访问的统一平台,旨在解决生物医药行业数据大规模、多样性、快速处理和洞察挖掘的需求和问题,并保持平台的伸缩性、扩展性 和开放性。该平台的总体架构设计是以数据操作为中心,通过开放的数据接口接入多种类型的数据源;集成海量的、多样性的大数据进入数据池中进行存储;支持多种计算引擎进行生物医药数据处理和分析,满足批处理、流处理和数据库查询等分析需求。中心目前已经建立了PB级数据存储及100万亿次/秒级的运算分析平台。

数据安全及保护

数据分级权限管理。

数据流转及分析过程中均以ID标识。

在非必须的情况下所有数据脱敏处理。

完备的数据访问日志记录,保证可溯源性。

数据计算及存储软硬组件最小权限分配原则。

所有敏感数据加密存储。

明确的权责分配,责任到人。