http://d.hatena.ne.jp/hiroppon/20130520/1369017430
ソートの問題が厳しく、更に時系列データは根本的にShardingに向かない。
(中略)
カラムベースのCassandraはこの辺りに確かに向いている
ほー
http://d.hatena.ne.jp/hiroppon/20130320/1363785182
shard keyが単調増加する場合、insertは常に(最後のchunk)に入る。
よって最後のchunkを抱えているshardでchunk splitが起き続け、必ずchunk数の不均等が発生する。
(中略)
MongoDB2.4で追加されてhashed shard keyは、shard keyの値をそのままchunkに割り当てるのではなく一旦hash化する。これだと単調増加shard keyであっても最後のchunkに追加されるとは限らず、理想的には均等にバラけるはず
(中略)
hashed shard keyの難点
- そもそもスピードも同じ位
- hash値の分ドキュメントがデカくなる。(元々小さいドキュメントでは影響大)
- shard key をhash化してしまう為、範囲探索が出来ない。
- これではスケールしない仕組みになってしまう。
素敵〜