美文网首页
长度分布折线图

长度分布折线图

作者: 花生学生信 | 来源:发表于2024-08-11 19:45 被阅读0次
library(readr)

# 加载数据
df <- read_delim("all_length.tsv", delim = "\t", col_names = TRUE)

# 移除所有包含 "INV" 的行
df_filtered <- df %>% 
  filter(type != "INV")

df<-df_filtered

# 查看过滤后的数据
head(df)
library(ggplot2)

df_summary <- df %>%
  mutate(binned_length = cut(length, breaks = c(0, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500))) %>%
  group_by(type, group, binned_length) %>%
  summarise(count = n()) %>%
  ungroup()
# 查看数据
head(df_summary)



write.csv(df_summary, file = "df_summary.csv", row.names = FALSE)


df_summary <- df %>%
  mutate(binned_length = cut(length, breaks = c(0, 100, 200, 300, 400, 500,600,700,800,900,1000,5000,10000,100000))) %>%
  group_by(type, group, binned_length) %>%
  summarise(count = n()) %>%
  ungroup()

p=ggplot(df_summary, aes(x = binned_length, y = count, color = type, linetype = group, group = interaction(type, group))) +
  geom_line(size = 1) +
  labs(title = "Length Distribution by Type and Group",
       x = "Length Interval",
       y = "Count",
       color = "Type",
       linetype = "Group") +
  scale_color_manual(values = c("INS" = "blue", "DEL" = "red", "DUP" = "green")) +
  scale_linetype_manual(values = c("Xian" = "solid", "Geng" = "dashed")) +
  theme_minimal()

p



# 保存图
ggsave("length_distribution.png", plot = p, width = 15, height = 8, dpi = 300)



# 计算每个类型、组别和长度区间内的平均值和标准差
df_summary_avg <- df %>%
  mutate(binned_length = cut(length, breaks = c(0, 100, 200, 300, 400, 500,600,700,800,900,1000,5000,10000,100000))) %>%
  group_by(type, group, binned_length) %>%
  summarise(
    mean_length = round(mean(length, na.rm = TRUE)),
    sd_length = round(sd(length, na.rm = TRUE))
  ) %>%
  ungroup()

# 查看结果
df_summary_avg
write.csv(df_summary_avg, file = "df_summary_avg.csv", row.names = FALSE)


相关文章

  • 统计fastq长度分布

    截取长度列j是线程数 f 是长度所在列 得到一列长度数 然后在R 中运行画 最后得出一个分布图 参考

  • 如何统计测序文件的reads长度分布

    记录今天学会的一个小知识:统计测序文件的reads长度分布 由于某些原因,需要统计reads长度分布对建库方法进行...

  • 如何在Power BI中制作正态分布图

    正态分布图本质也就是一个折线图而已,只要构造出符合正态分布的数据,画正态分布图与平时生成其他图表并没有什么不同。 ...

  • 小 RNA 长度分布统计

    统计 长度 分布,代码,参考别人针对自己的数据做了修改。 命令行,输入:python py.jiaoben *.f...

  • 玉米基因组的一些信息记录

    玉米的基因外显子的长度分布情况 外显子的平均长度为:283.9872外显子长度的中位数:142外显子的总长度:79...

  • 《用图表说话》-频率分布柱形图20160615

    将样本进行归纳式表示,就要用到频率分布柱状图或折线图。举个栗子,我们想要表达50个州每个公立学校老师的年收入分布,...

  • python可视化

    导入package 散点图 折线图 直方图 条形图 箱线图 扇形图 热图 蜘蛛图 二元变量分布 成对关系

  • 3. 数据的概括性度量

    数据的分布特征可以用柱形图、折线图或饼图等各种图表直观地进行展现。反映数据的分布特征的代表值,通常用集中趋势、离散...

  • [26] 《R数据科学》分类变量和连续变量

    上文的主要内容是,用连续变量显示分类变量分布时可以采用折线图(geom_freqpoly()),而当用分类变量显示...

  • fasta/fastq序列长度分布统计

    首先得到每条序列的长度,在这里使用seqkit软件。seqkit软件是一个强大的序列处理工具,安装方法参见官方网站...

网友评论

      本文标题:长度分布折线图

      本文链接:https://www.haomeiwen.com/subject/lkdrkjtx.html