HBaseのdeployむず過ぎる
例えば障害のはなしであればregionサーバが1台パニックリブートでサービスアウトせずにダウンしてもレプリカがどっかにあってリバランスしてなんとかなるっぽいんだけど、にも関わらずCassandraみたいに遅延して整合性をとる戦略が無い?のか(僕が知らないだけかも)deploy時にいちいち必ず障害時と同等のサービスアウトインが必要になってしまってとんでもない時間がかかる
この問題は日本語の情報がほとんど無い。ここを今頑張って読んでいってるけど疲れてきた…
https://docs.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_ig_hbase_cluster_deploy.html
国内ではLINEがいちばん有名で次はCyberAgentあたりがHBaseを運用してるらしい
いろいろググったけど、これ試してみる価値あるかも。サービスイン時のregion同期が 始まらないorものすごく遅い 問題なのでunloadしてloadする戦略であればうまくいきそう
https://github.com/apache/hbase/blob/master/bin/rolling-restart.sh
https://github.com/apache/hbase/blob/master/bin/graceful_stop.sh
"$bin"/graceful_stop.sh --config ${HBASE_CONF_DIR} --restart --reload -nob --maxthreads ${RR_MAXTHREADS} ${RR_NOACK} --movetimeout ${RR_MOVE_TIMEOUT} $hostname
ただ、unloadした後でloadができなかった場合にそのデータどうなっちゃうんだ?という懸念がある。kernel更新してマシン自体をrebootさせたらあがってこなくなったとかザラにあるわけで