Xiphias搭载了格致精准数据自主研发的基因数据处理芯片,利用高度优化的生物信息处理软件,结合硬件的专用计算优势,对整个基因数据处理流程进行了优化加速。其中,Xiphias 单机有着传统软件近十倍的计算加速比,集群加速比更可达到传统软件的数十倍。其高效的计算、压缩性能,极高的存储压缩比和极低的功耗,为基因数据计算的痛点、难点提供了低成本且高效易用的完整平台。

Xiphias高性能生物信息计算平台是基于专用硬件实现计算加速的软硬件协同处理平台,提供从 FASTQ 到 VCF 的处理流程及 FASTQ 文件的高效压缩存储,产品包括:Xiphias 生信计算一体机以及 Xiphias 生信计算集群。同时,Xiphias可直接由原始数据输出如下所示的注释报告及提供从原始数据到报告生成的全流程高速一键式解决方案,极大地方便了科研院所及医院临床的使用,倾力推动精准医学在中国的普及。

Xiphias 生信计算一体机

Xiphias提供了从FASTQ到VCF的处理流程、FASTQ 文件的高效压缩存储以及从原始数据到注释报告和最终推荐 解读的一键式解决方案。同时,它还提供生物信息分析常用的Smith-Waterman、Alignment及PairHMM等专用计算模块,有效提高了基因数据处理与分析的效率。传统生信处理软件从FASTQ生成VCF需要经过众多繁琐的步骤,每个步骤都会花费相当长的时间。以DNA序列分析为例,对30倍人类全基因组数据进行分析处理,需花费近6小时进行序列比对,近12小时进行变异识别,总共需花费近一天时间才能得到VCF。Xiphias单机能在2.5小时内完成上述分析处理,5节点集群更是能在半小时左右完成。同时还能在极短的时间内自动生成注释报告,简单易用。

基于Xiphias平台的Variant Calling不仅有着极高的速率,还与GATK的calling结果有着极高的一致性:Mutect2一致性超过99.8%,HaplotypeCaller更是接近100%

一体机性能展示
Xiphias有着极高的计算效率,以DNA序列比对为例,Xiphias1.0 一体机当前能够在 2.5个小时内完成 30X WGS 数据的全流程分析,实现较传统软件近10倍的数据处理加速比;而 Xiphias2.0 将在 1.0 的基础之上实现更高的加速比,预计可达 30~50 倍。
Xiphias 生信计算集群

Xiphias集群的数据处理效率较一体机又有成倍的提升,5节点 Xiphias 集群可以在半小时左右完成从 FASTQ 到 VCF 的数据处理全流程,实现相较于常规生物信息数据处理软件几十倍的加速。

Xiphias还有着较常规 GZip算法近5倍的压缩速率,无损压缩有其2.5倍的压缩比;有损压缩更有较之5倍的压缩比。

集群方案的特点
本地化计算方案
多个计算节点联合优化
格致大数据的集群解决方案,应用客户本地化的服务器集群,对现有的硬件进行合理的利用,有效避免用户硬件成本的进一步提高;同时应用多个服务器节点进行联合计算,提高基因数据的计算效率。
资源利用最大化
优化的集群调度方案,任务、资源优化调度
格致大数据的集群解决方案,可以根据用户本地服务器的配置及性能,进行任务、资源的优化分配,以达到对用户本地服务器资源的最大化利用,实现基因数据分析计算的最优化。
高度准确
结果与GATK best practice 一致性达到99.9%以上
GATK是目前全球最广为使用的基因数据处理软件,GATK的分析结果是目前业界的事实标准。应用格致大数据的软件集群方案进行基因数据处理,计算结果与GATK的计算结果比较,一致性达到99.9%以上,实现数据计算分析的高度准确。
快速计算分析
单个30X WGS 4节点处理时间2.5小时,10X速度提升
采用格致大数据的集群解决方案可以快速完成基因数据的分析计算。单个人类30X WGS数据采用传统软件流程进行处理,单机需时约一天,而采用格致大数据的集群解决方案,4节点处理时间约为2.5小时,可以达到近10X的速度提升。 (根据本地服务器的配置不同,计算速度会有区别)