脚本更新---高精度平台banksy聚类、细胞邻域、临界通讯

作者: 单细胞空间交响乐 | 来源:发表于2025-02-20 12:00 被阅读0次

（2）10X单细胞聚类
Clustree算法，让单细胞聚类结果更有生物学意义
5.单细胞 RNA-seq：质控后相关流程
【王兴国营养特训班】第5期第11课7组虞文施
9.单细胞 RNA-seq：聚类分析
10xGenomics单细胞转录组亚群细分策略
单细胞分析：细胞聚类（十）
热图
干细胞的起源，解开生命秘密的钥匙
单细胞研究 | Cell BLAST：一个自带高质量参考数据库的

作者，Evil Genius

大家多多学习，总结。

今日目标，高精度平台都可用，CODEX、CosMx、Xenium等

1、临界通讯

2、banksy聚类

3、细胞邻域

首先来看banksy聚类,python版本

# import packages
import scanpy as sc
import squidpy as sq

sys.path.append('./Banksy_py')
from banksy.initialize_banksy import initialize_banksy
from banksy.embed_banksy import generate_banksy_matrix
from banksy_utils.umap_pca import pca_umap
from banksy.cluster_methods import run_Leiden_partition


adata = sc.read('sample.h5ad')

# preprocess
adata.layers["counts"] = adata.X.copy()
sc.pp.calculate_qc_metrics(adata, percent_top=None, inplace=True)

sc.external.pp.scrublet(adata, n_prin_comps=30)
adata = adata[adata.obs['predicted_doublet']==False]
adata = adata[(adata.obs['nFeature_RNA']>=60) & (adata.obs['nCount_RNA']>=100) & (adata.obs['nCount_negprobes']<0.1*adata.obs['nCount_RNA']) & (adata.obs['nCount_RNA']/adata.obs['nFeature_RNA']>1)]
sc.pp.filter_genes(adata, min_cells=3)

sc.pp.normalize_total(adata)
sc.pp.log1p(adata)
adata.raw = adata

sc.pp.highly_variable_genes(adata, flavor='seurat', n_top_genes=1000, batch_key='sample')
hvg_filter = adata.var["highly_variable"]
adata_all = adata.copy()
adata = adata[:, hvg_filter]

# Scanpy umap&cluster
adata = sc.pp.scale(adata)
sc.tl.pca(adata)
sc.pp.neighbors(adata)

sc.tl.umap(adata)
sc.tl.leiden(adata,key_added='scanpy_leiden',resolution=1)

# Banksy umap&cluster
coord_keys=('x_slide_mm','y_slide_mm','spatial')
k_geom=8
nbr_weight_decay="scaled_gaussian"
max_m=1
lambda_list=[0.1]
resolutions=[1]

banksy_dict = initialize_banksy(
    adata,
    coord_keys,
    k_geom_sample,
    nbr_weight_decay=nbr_weight_decay,
    max_m=max_m,
    plt_edge_hist=False,
    plt_nbr_weights=False,
    plt_agf_angles=False,
    plt_theta=False
)
banksy_dict, banksy_matrix = generate_banksy_matrix(adata, banksy_dict, lambda_list, max_m, variance_balance=True)
pca_umap(
    banksy_dict,
    pca_dims = [20],
    add_umap = True,
    plt_remaining_var = False
)
results_df, max_num_labels = run_Leiden_partition(
    banksy_dict,
    resolutions,
    num_nn = 50,
    num_iterations = -1,
    partition_seed = 1234,
    match_labels = True
)

banksy_adata = banksy_dict[nbr_weight_decay][0.1]['adata']
reorder_banksy_adata = banksy_adata[adata.obs_names]
adata.obsm['X_umap'] = reorder_banksy_adata.obsm['reduced_pc_20_umap']
adata.obs['banksy_leiden'] = reorder_banksy_adata.obs['scaled_gaussian_pc20_nc0.1_r1']

# squidpy co_occurrence
sq.gr.spatial_neighbors(adata, coord_type="generic", delaunay=True)
sq.gr.co_occurrence(adata,spatial_key='spatial',cluster_key='sclc_celltype')
sq.pl.co_occurrence(
    adata,
    cluster_key='sclc_celltype',
    clusters='Endothelial'
)

接下来第二步，临界通讯

rm(list = ls())
options(stringsAsFactors = F)
library(ggplot2)
library(imcRtools)
library(cytomapper)
library(RColorBrewer)
library(ComplexHeatmap)
library(dplyr)
library(tidyr)
library(Seurat)
library(data.table)

####配受体对
cur_features = fread("all.csv",data.table=F)
counts <- cur_features[,grepl("Cell: Mean", 
                                  colnames(cur_features))]
meta <- cur_features[,c(1:5,8:21,762)]
coords <- cur_features[,c("Centroid X µm", "Centroid Y µm")]
colnames(coords) = c("Pos_X", "Pos_Y")
cur_ch <- strsplit(colnames(counts), ":")
colnames(counts) = sapply (cur_ch,function(x){x[1]}) 
spe3 <- SpatialExperiment(assays = list(counts = t(counts)),
                          colData = meta, 
                          sample_id = as.character(meta$Image),
                          spatialCoords = as.matrix(coords))
colnames(spe3) <- paste0(spe3$sample_id, "_", 1:length(counts))
assay(spe3, "exprs") <- asinh(counts(spe3)/1)
rowData(spe3)$use_channel <- !grepl("DAPI", rownames(spe3))
spe3 <- buildSpatialGraph(spe3, img_id = "Image", type = "knn", k = 20)
out2 <- testInteractions(spe3,
                        group_by = "Image",
                        label = "celltype",
                        method = "classic",
                        colPairName = "knn_interaction_graph",
                        BPPARAM = BiocParallel::SerialParam(RNGseed = 123))