k值的确定手肘法首先kmeans算法有以下目标函数: Obj=\sum_{k}\sum_{i\in S_k}(x_i-c_k)^2其中$c_k$是第$k$类的中心点,$S_k$是第$k$类的点集。手肘法通过枚举$k$并画出每个$k$对应的目标函数曲线,曲线的梯度会从小变大,曲线的拐点就是最适合的$k ...
Delaunay三角剖分
背景对于任意多边形我们总能将其划分成若干三角形组成,比如一个四边形可以划分成两个三角形,一个六边形可以划分成四个三角形。将多边形划分成若干三角形称为三角剖分。一个多边形有许多种三角剖分的方案,其中有一种三角剖分称为Delaunay三角剖分。Delaunay三角剖分具有这些性质:(1) Delauna ...
拉普拉斯矩阵和拉普拉斯算子
前言我们经常可以看到某些算法使用到拉普拉斯矩阵,比如在谱聚类算法中用到拉普拉斯矩阵,在图卷积神经网络中用到拉普拉斯矩阵等等。为什么会用到拉普拉斯矩阵呢,拉普拉斯矩阵的作用及意义是什么,其实这些都和拉普拉斯算子的作用及意义有关。 拉普拉斯算子在介绍拉普拉斯矩阵之前,先介绍一下拉普拉斯算子。拉普拉斯算子 ...
进程通信——共享内存
共享内存共享内存是指通过将不同进程或同一进程的不同虚拟地址映射到相同的物理地址,从而实现对不同虚拟内存的操作可以作用到同一段物理内存,从而实现通过内存通信。 mmapmmap的存在并不是为了实现共享内存,但mmap的确可以实现共享内存,也是最常用的共享内存方式。mmap是将硬盘的文件和进程的虚拟内存 ...
大数据计算之IP记数TopK问题
问题描述在多台机器上有海量的IP数据,现在需要利用这些机器的IP数据找出数量排在Top K的IP地址。 解决方法解决步骤如下:(1) 利用哈希将各个机器的IP数据映射到各个机器,使得相同的IP在同一个机器中(2) 在单机下再利用若干次哈希将IP映射到各个桶,稀释各个桶的不同IP数量(3) 对每个桶, ...
图神经网络(三)可微池化
前言在前面几章,我们介绍了图神经网络,最终我们可以得到图上每个节点的向量,当我们需要求到一个关于整个图的向量时,一般有两种做法,一个是基于统计的,另一个是基于学习的。 基于统计基于统计的方法就是将所有节点进行一个求和池化,平均池化或最大池化等等,将所有节点的向量聚合成一个向量作为整个图的代表向量。这 ...