HBaseのdeployむず過ぎる

例えば障害のはなしであればregionサーバが1台パニックリブートでサービスアウトせずにダウンしてもレプリカがどっかにあってリバランスしてなんとかなるっぽいんだけど、にも関わらずCassandraみたいに遅延して整合性をとる戦略が無い?のか(僕が知らないだけかも)deploy時にいちいち必ず障害時と同等のサービスアウトインが必要になってしまってとんでもない時間がかかる

 

この問題は日本語の情報がほとんど無い。ここを今頑張って読んでいってるけど疲れてきた…

https://docs.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_ig_hbase_cluster_deploy.html

 

国内ではLINEがいちばん有名で次はCyberAgentあたりがHBaseを運用してるらしい

 

いろいろググったけど、これ試してみる価値あるかも。サービスイン時のregion同期が 始まらないorものすごく遅い 問題なのでunloadしてloadする戦略であればうまくいきそう

https://github.com/apache/hbase/blob/master/bin/rolling-restart.sh

https://github.com/apache/hbase/blob/master/bin/graceful_stop.sh

 

"$bin"/graceful_stop.sh --config ${HBASE_CONF_DIR} --restart --reload -nob --maxthreads ${RR_MAXTHREADS} ${RR_NOACK} --movetimeout ${RR_MOVE_TIMEOUT} $hostname

 

 

ただ、unloadした後でloadができなかった場合にそのデータどうなっちゃうんだ?という懸念がある。kernel更新してマシン自体をrebootさせたらあがってこなくなったとかザラにあるわけで