Danial Lemire 写了一篇很好的文章The Mythical Bitmap Index来反驳bitmap index仅仅适用于索引那些 distinct value 很少的情况,例如male,female这类数据。他在文章中说:压缩后的bitmap index的大小是和table的大小成比例的,与distinct value的数目无关。
记得从前上数据库课的时候,基本上所有的材料在讲什么时候该用bitmap index,都会提到few distinct value这一前提,而且具体的例子都会举male,female的例子,但到了实际项目中,该如何选择index依然是无从下手。Danial的这篇文章似乎给了一些启示。
另外,在google code上有Danial的一个bitmap index C++ library。
记得从前上数据库课的时候,基本上所有的材料在讲什么时候该用bitmap index,都会提到few distinct value这一前提,而且具体的例子都会举male,female的例子,但到了实际项目中,该如何选择index依然是无从下手。Danial的这篇文章似乎给了一些启示。
另外,在google code上有Danial的一个bitmap index C++ library。

Leave a comment