推荐一篇文章《解读Cardinality Estimation算法》。 文章讲得很酷,还附带了一个电商数据统计的实际应用案例。 鉴于文章写得太好,明显是博主原创,所以我就不转载了,大家直接光顾原处看吧。下面是系列文章的目录: 解读Cardinality Estimation算法(第一部分:基础概念) 解读Cardinality Estimation算法(第二部分:Linear Counting) 解读Cardinality Estimation算法(第三部分:LogLog Counting) 解读Cardinality Estimation算法(第四部分:HyperLogLog Counting 和 Adaptive Counting) 另外,作者还有一篇《网站统计中的数据收集原理及实现》的科普文章,同样不错,有想了解数据统计基础原理的同学也可以看看。……

阅读全文