MultiQC作为NGS数据QC报告的整合工具,目前已支持165个生信工具的报告整合,一键就可以轻轻松松将多样本的QC结果整合起来并生成网页报告,不仅省时省力还方便查看,解决了用户查看多个单样本QC结果的繁琐与不便,好用至极。
目前已支持的工具列表,见链接:https://docs.seqera.io/multiqc/modules。
MultiQC其实是报告整合的框架,对于支持的工具,除了默认设置外,用户也可以通过配置文件修改软件的运行方式与报告格式,做到了个性化定制。对于列表外的工具,软件也提供了三种方式来生成自定义报告:基于配置文件的Custom content、基于插件的自定义报告以及基于模块的自定义报告。虽然后两种方式自由度高,但对于没有python编程基础的用户来说上手难度很高。而基于配置文件的自定义报告在牺牲了自由度的基础上大大降低了自定义报告的门槛。
这里来说说如何基于配置文件来生成自定义报告。以最近分析的单细胞数据为例,虽然单细胞数据都会生成标准分析的报告,但是多个样本并不方便放在一起比较QC。然后,又不是MultiQC支持的CellRanger报告,那只能自己动动手了。
单细胞上游分析工具通常生成报告时会保留源文件,咱们可以利用这些文件再结合配置文件来生成自定义报告。
例如样本统计信息的源文件内容:
# general table
Samplename Number_of_Cells Mean_Reads_per_Cell Median_Genes_per_Cell Number_of_Reads Valid_Barcodes Sequencing_Saturation Reads_Mapped_Confidently_to_Genome Fraction_Reads_in_Cells Total_Genes_Detected Median_UMI_Counts_per_Cell
sample1 49049 6839 1532 333845436 95.33% 29.51% 93.60% 89.17% 32904 2695
# Mapping figure
sample mapped_to_exon mapped_to_intron mapped_to_intergenic
sample1 152812774 99658173 25366877
# cell number figure
sample Number_of_Cells
sample1 49049
上面分别展示了三个部分的内容示例:General Statistics基本信息表格、Mapping数据比对情况的堆叠条形图、Cell Number细胞数条形图。
然后,将统计数据文件置于指定的文件夹里再结合配置文件,便可以一键生成可以交互的网页报告了:
multiqc -c multiqc_config.yaml -n summary report
这里展示了一个简单的自定义报告示例,大家可以根据自己需求修改,需要该配置文件模板的可以后台回复multiqc_config获取。












网友评论