ℹ️本記事は古いコンテンツを変換して表示しています。
表示が崩れたり、リンクが正しくない可能性があります。ご了承ください。
ℹ️本記事は古いコンテンツを変換して表示しています。
表示が崩れたり、リンクが正しくない可能性があります。ご了承ください。
2016/01/02 10:01 : daドライバのタイムアウト短縮
新年早々、ストレージサーバのディスクが一時的に行方不明になって、いろいろ止まった。
新年早々、ストレージサーバのディスクが一時的に行方不明になって、いろいろ止まった。
我が家の構成は、こんな感じ。zfsストレージサーバのハードが適当すぎる関係で、時々ディスクを見失ったりする。
VMもどうでもいい処理なら適当にコケるだけですむところが、swapアクセスが(mptタイムアウトで)コケると止まってしまう。
対策として以下を考えた。
[alraune:/] root# sysctl kern.cam.da.default_timeout=10 kern.cam.da.default_timeout: 60 -> 10 [alraune:/] root# sysctl kern.cam.da.retry_count=1 kern.cam.da.retry_count: 4 -> 1
ちなみにデフォルトは上で見えているとおり60と4だそうですよ。
man da より引用:
kern.cam.da.retry_count This variable determines how many times the da driver will retry a READ or WRITE command. This does not affect the number of retries used during probe time or for the da driver dump routine. This value currently defaults to 4. kern.cam.da.default_timeout This variable determines how long the da driver will wait before tim- ing out an outstanding command. The units for this value are sec- onds, and the default is currently 60 seconds.
さて、これで期待通りの動きになるか、それともタイムアウト多発でRAIDが維持できなくなるか。数日観察。