2017年1月14日土曜日

Schoo / Webサーバー運用のためのLinux実践 3rd

Schooのメモ


メモ

RTO
Recovery Time Objective
障害から復旧までの目標時間
参照:RPOとRTOの考え方
ちなみに、RPOはRecovery Point Objectiveで、復旧させる時点のことらしいです。

Ansible
構成管理ツール

KNOPPIX
Optimal Diskからの起動を前提としたLinux distribution

OS不調時の対処
  • OSの再インストール
  • 代理boot
  • Snapshotからの復元
  • Orchestrationシステムからの復元

>grub でOS起動が止まった場合
/boot/grub2/grub.cfgが読み込めていない可能性がある

Virtual BoxでISOファイルから立ち上げる
マシンを停止させる
設定
ストレージ
IDE Controllerで光学式ディスクを追加
(今回はLive DVDにチェックを入れてみました)
システム
Boot OrderでOpticalを一番上にする
マシンを起動する
Troubleshooting
Rescue a CentOS system
1) Continue
$ chroot /mnt/sysimage
$ cd /boot/grub2
$ grub2-mkconfig -o /boot/grub2/grub.cfg $ exit $ exit

自動再起動
起動中のkernelパニックに有効な対処は再起動
自動再起動を設定することで、素早く対処することができる
$ cat /proc/sys/kernel/panic
0
kernel.panicオプションの値で、1以上だとシステムが停止したら自動で再起動する

- 設定 -
$ vi /usr/lib/sysctl.d/00-system.conf
~
kernel.panic = 10
$ sysctl -p 00-system.conf # 設定の反映
$ sysctl kernel.panic
kernel.panic=10 # 設定の確認

カーネルパニックを起こしてみる
echo c > /procy/sysrq-trigger
実際に10秒ぐらいで再起動かかった
ただ、ログイン必要ですね。。。。
現地には行かなくても済むけど、サービス断の短期化の効果は小さい

0 件のコメント:

コメントを投稿