HBaseのdeployむず過ぎる - 三つ目がとおる

例えば障害のはなしであればregionサーバが1台パニックリブートでサービスアウトせずにダウンしてもレプリカがどっかにあってリバランスしてなんとかなるっぽいんだけど、にも関わらずCassandraみたいに遅延して整合性をとる戦略が無い？のか（僕が知らないだけかも）deploy時にいちいち必ず障害時と同等のサービスアウトインが必要になってしまってとんでもない時間がかかる

この問題は日本語の情報がほとんど無い。ここを今頑張って読んでいってるけど疲れてきた…

https://docs.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_ig_hbase_cluster_deploy.html

国内ではLINEがいちばん有名で次はCyberAgentあたりがHBaseを運用してるらしい

いろいろググったけど、これ試してみる価値あるかも。サービスイン時のregion同期が　始まらないorものすごく遅い　問題なのでunloadしてloadする戦略であればうまくいきそう

https://github.com/apache/hbase/blob/master/bin/rolling-restart.sh

https://github.com/apache/hbase/blob/master/bin/graceful_stop.sh

"$bin"/graceful_stop.sh --config ${HBASE_CONF_DIR} --restart --reload -nob --maxthreads ${RR_MAXTHREADS} ${RR_NOACK} --movetimeout ${RR_MOVE_TIMEOUT} $hostname

ただ、unloadした後でloadができなかった場合にそのデータどうなっちゃうんだ？という懸念がある。kernel更新してマシン自体をrebootさせたらあがってこなくなったとかザラにあるわけで