zabbixの嫌なところ
ツッコミ歓迎
- トリガーはアイテム一覧から紐付きをチェックすればなんとか管理できるが少しでも計測方法が違うとアイテムが大量に増えるのでアイテム管理の手間がやばい
- その手間を抑制する目的なんだろうけど同じ計測方法を別名でアイテム登録できないことでUserParameterなどエージェント側の計測オプション使うときに逆に無駄にアイテムが増えがち
- サーバとしてデフォルトのメモリ設定やphp.iniがショボ過ぎるのにウィザードとかテンプレとか補助が薄い
- テンプレート同士で継承できちゃうからテンプレートの数が増え過ぎることより複雑さのせいで運用が行き詰まる。レガシー化が約束されている
- スクリーンの癖がすごい
- 監視ツールにしては動作が重い。Prometheusのように必要なものを足していくんじゃなく最初から全部入ってるからリソースの無駄遣いになってる
- アイテムのパースにjsonpath使えることになってるのに肝心な * と .. が機能しない
- 素直に構築すると計測データの格納先すらRDBになってディスクがはやめに詰んでしまう
■
ブログ続かない難しい…
■
リーナスに言われると泣きそうなる…
こんなに大きく世界を変えた人がこんなにも謙虚だと今ある仕事にきちんと向き合おうってなった
■
マトペさん転職してメルペイ行ったんやな…
HBaseのdeployむず過ぎる
例えば障害のはなしであればregionサーバが1台パニックリブートでサービスアウトせずにダウンしてもレプリカがどっかにあってリバランスしてなんとかなるっぽいんだけど、にも関わらずCassandraみたいに遅延して整合性をとる戦略が無い?のか(僕が知らないだけかも)deploy時にいちいち必ず障害時と同等のサービスアウトインが必要になってしまってとんでもない時間がかかる
この問題は日本語の情報がほとんど無い。ここを今頑張って読んでいってるけど疲れてきた…
https://docs.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_ig_hbase_cluster_deploy.html
国内ではLINEがいちばん有名で次はCyberAgentあたりがHBaseを運用してるらしい
いろいろググったけど、これ試してみる価値あるかも。サービスイン時のregion同期が 始まらないorものすごく遅い 問題なのでunloadしてloadする戦略であればうまくいきそう
https://github.com/apache/hbase/blob/master/bin/rolling-restart.sh
https://github.com/apache/hbase/blob/master/bin/graceful_stop.sh
"$bin"/graceful_stop.sh --config ${HBASE_CONF_DIR} --restart --reload -nob --maxthreads ${RR_MAXTHREADS} ${RR_NOACK} --movetimeout ${RR_MOVE_TIMEOUT} $hostname
ただ、unloadした後でloadができなかった場合にそのデータどうなっちゃうんだ?という懸念がある。kernel更新してマシン自体をrebootさせたらあがってこなくなったとかザラにあるわけで
台風19号で避難指示が出る日の朝にiPhoneがリンゴループ起動不可になった話
河川の近くに住んでいるので普段から大雨には警戒してて、流域の水位計はよくチェックしてる。yahoo天気がひじょうに助かる
それでも避難指示が出るほどの大雨は今回はじめてでしかも暴風のせいで出足が遅れると避難できなくなるぞ、と言われ数日前から準備をすすめてた
んだけど、前日があまりに静かすぎついover cookを夢中でやってしまうという痛恨のミス。朝起きたら既に避難すべきかどうかって状況になってめちゃ焦って携帯で水位計チェックしたら
アプリがひとつも起動しない…
LINEもメッセージも一瞬だけ画面上でアクティブになるんだけどすぐ落ちちゃう。ん?ん?てなってまあとりあえず再起動すっかーと思って不用意に電源を落としてしまうんだが、これがいけなかった
iPhoneが起動しない…
何度やってもリンゴマークがしばらく続いた後に画面まっくらになってまたリンゴマークに戻るという……
ヤバイ今から避難するのに…
市役所のパトロールカーが回ってきて避難勧告から避難指示になったので逃げてください、って今しがた家の横の道を通って行ったところなのに……
急いでパソコン使って検索していわゆるリンゴループという症状だと知るがその時はもう近所の川が氾濫危険水位に達しようとしてるところですぐに避難しないとマズイ状況
リンゴループのiPhoneを置いて避難したら浸水水没する可能性もあるので泣く泣く諦めて避難開始。安全な場所は事前に調べてあって良かったけど災害がどういう状況かわからないままただただリンゴループを眺めながら車の中で猛烈な雨風に震えながら1日を過ごすという…
そんな中でもコンビニはほとんどずっと営業してて、助かるなすげえなあと思った
リンゴループiPhoneは結局翌日にこの方法でiOSを更新して直した
https://www.iphone-d.jp/store/ikebukuro2_store/blog/1753.php
リカバリモードが15分で切れちゃうからその記述を入れて欲しかったけど、まあそこはてきとうに空気読んでiTunesの右上スミにあるボタンからダウンロード状況確認して、数Gのファイルをダウンロードしてるのがわかったからなんとなく察してiTunesの方の状況が変わるたびに何回かiPhoneの方をリカバリモードに変えながらiTunesも更新を何回か繰り返し実行していったらいつものiOS更新画面のプログレスバー付きリンゴマークになって無事に起動した…フゥ‥…良かった
最悪、初期化復元して戻すことになったけど、バックアップから戻すことも考えて普段からちゃんと計画しとかないとダメだなあ