Cephpgが汚れてbackfill_toofullでスタックしている



Ceph Pg Stuck Unclean



環境では、多くのosdがnearl状態にあります。 osdを再重み付けすると、2つのpgがunclean状態とbackfill_toofull状態でスタックしていることがわかります。



cephヘルスの詳細を実行する



上に示したように、スタックされたpgは2.689であり、ceph pgマップ2.689が実行され、このpg upの3つのosdは32、153、66であることがわかります。これらの3つのosdでは、osdのディスクスペース使用量.153を超えています。アラームの85%はほぼ満杯です。

解決:



上に示したように、ceph osd dfコマンドの実行出力では、osd.153のリウェイトが0.9に調整されています。根本的な解決策は、このクラスターに新しいosdノードを追加し、データのバランスを取り直すことです。新しいosdが追加されていない場合、すべてのpgをアクティブ+クリーン状態に復元するために、引き続きceph osd reweight 153 0.8を実行して、osd.153のディスク使用スペースを削減できます。

参照:

https://yq.aliyun.com/articles/70833