pca 聚类分析,PCA分析

【pca 聚类分析,PCA分析】常用的聚类(K-means ，在scRNAseq 分析中，我们将比较不同基因在细胞中的表达来进行聚类。SVD和主成分分析PCA都是通过分解特征矩阵进行维数化的，聚类的目标是将不同的细胞类型分成独特的细胞群，6.单细胞RNA-seq:归一化和PCA 分析获得我们的高质量单细胞后，单细胞RNA Seq(scrunaseq)分析工作流程的下一步就是执行聚类。

1、数量生态学笔记||非约束排序||PCA看到这个笔记系列的名字了吗？:R在数量生态学矩阵度量中的应用聚类序空间。其实排序部分已经接近尾声了，因为空间分析我打算放弃哪一部分，目前的生态数据尺度中空间数据很少。接下来移动小板凳，我们来说说排序。如果说聚类分析的目的是发现数据的不连续性，那么排序的目的是发现数据的连续性(通过连续的排序轴显示数据的主要趋势) 。

假设我有一个10个样本的物种丰富度表:行为样本，列为物种(也可以理解为特征) 。我们需要对这10个样本进行排序:超过3个物种的时候怎么办？那是n维空间的一个点，画不出来。所以我们需要想办法把N维空间中的点在二维平面中表现出来。既然这么多点不能共面，那么就要找一个平面，使得空间中的所有点都能投影到这个平面上，投影点之间的距离更能反映真实的距离。

2、sklearn的PCA1.1 Dimension对于数组和数列，维度是形状返回的结果，形状返回的几个数字就是几个维度。对于图像，维数是图像中特征向量的数量。降维算法中的“降维”是指减少特征矩阵中的特征数量。1.2 sklearn中的降维算法在模块分解中，这个模块的本质是一个矩阵分解模块。

SVD和主成分分析PCA都是通过分解特征矩阵进行维数化的。1.3在降维过程中，PCA会减少特征的数量，也就是删除一些数据。如果数据量较少，则意味着模型可用的信息较少，模型的性能可能会受到影响。同时，在高维数据中，必然存在一些没有有效信息的特征(噪声) ，或者一些具有与其他特征重复的信息的特征(一些特征可能是线性相关的) 。

3、使用DESeq2标准化之后的数据进行PCA、聚类等可视化前者和后者，如果提取counts(dds，normalizedT)的数据，是否会再次进行标度或对数转换，达到类似r log和VST的效果？Counties (DDS ， Normalized T)用于标准化计数值，然后对其进行缩放。PCA效果接近rlog，但不完全相同。