Mất mount client sau khi network bị mất đột ngột

Vấn đề:
Pstorage mount point gặp tình trạng không thể kết nối lại cluster sau 60s khi network bị mất.
Kiểm tra log sẽ thấy các thông tin log tại /var/log/pstorage/$CLUSTERNAME/pstorage-mount.log.gz như sau:
21-11-13 18:19:48.503 fuse_statfs_resp: error 32 (The client ID is invalid or banned)
21-11-13 18:19:48.503 fuse_retry_req: STATFS {760}
21-11-13 18:19:48.503 Fatal: pstorage-mount: the server refused to accept our client ID, likely we're banned due to access revoke

Nguyên nhân:
Do trong trường hợp này phía Client server đã không thể access trong khoảng thời gian tối thiểu của các tham số quy định LOCK_TIMEOUT đến LOCK_TIMEOUT/2 ( mặc định là 60s ), Cluster sẽ chuyển resource trên Node này sang các Node khác để đảm bảo tính HA và sẽ “ban” Node có vấn đề.
Giải pháp:
Trong trường hợp network có vấn đề có thể xử lý nhanh bằng việc restart các service bên dưới.
~#service pstorage-fs restart
~# service shamand restart

Command trên sẽ khởi tạo lại client_id và shamand sẽ đánh dấu là node đã “Active”.
Trong trường hợp này nếu vấn đề không fix như trên thì shaman sẽ tự động reboot node sau khoảng thời gian tại tham số WATCHDOG_TIMEOUT ( 120s mặc định ).

BÌNH CHỌN:

Hãy bình chọn 5 sao nếu bạn tìm thấy nội dung hữu ích.

Xếp hạng: 0 / 5. Phiếu bầu: 0

Cảm ơn bạn đã bình chọn.

    YÊU CẦU TƯ VẤN DỊCH VỤ