Chunk xảy ra tình trạng ” CS#xxxx died unexpectedly (139 / SIGSEGV) “

Tình trạng.

Sau khi update bản cập nhật mới nhất của Virtuozzo (  Virtuozzo release 6.0 SP1 (build 6.0.11-3429) ) thì xảy ra tình trạng Chunk bất ổn, kéo I/O của cả cluster xuống làm các VM chuyển về chế độ pause và không start được. Thông báo lỗi xảy ra liên tục như sau:

#pstorage -c <cluster_name> get-event

MON ERR: CS#1025 died unexpectedly (139 / SIGSEGV)
MDS WRN: CS#1025 is inactive
MDS WRN: The cluster is degraded with 5 active, 1 inactive, 0 offline CS
MON ERR: CS#1025 died unexpectedly (139 / SIGSEGV)
MDS WRN: CS#1025 is inactive
MDS WRN: The cluster is degraded with 5 active, 1 inactive, 0 offline CS

#zcat /var/log/pstorage/cloudsmart/cs-BPRI1kY0/cs.log.gz

Got signal 11 with code 1: Segmentation fault at
> 0x7fb618c10772, invalid address is (nil) Register dump:

Nguyên nhân:

Hiện tại đây là 1 bug của Virtuozzo với mã id #PSBM-45099, sẽ được cập nhật bản fix trong những bản update tiếp theo.

Chi tiết là do những Chunk gặp vấn đề với viêc không có option checksum đi kèm khi khởi tạo từ trước.

Điều này gây mất an toàn với dữ liệu khi được chuyển xuống HDD từ SSD.

Hướng xử lý tạm thời.

Tiến hành xóa Chunk gặp vấn đề lỗi sau đó tạo lại Chunk. Chi tiết có thể xem cách tạo tại đây:
https://www.ods.vn/TaiLieu/ChiTiet/virtuozzo_storage/Cach_join_node_vao_cluster_bang_cach_thu_cong

Lưu ý không thêm option -S lúc tạo Chunk với pstorage -c make-cs do option “-S” là từ chối tạo checksum cho Chunk.