一、 首先介紹硬碟的 I/O Scheduler
* @! `: P! s- d5 q' j' _) Z! L
c/ g& I& T' u. g, N, `5 f6 g- S" a+ v& D' O* x; q3 l
I/O Scheduler是什麼?看看Wiki的說明:- g7 n+ q7 d. X1 C& m, e: I- a
Input / Output Scheduling or I/O Scheduling is a term used to describe the method computer operating systems decide the order that block I/O operations will be submitted to storage volumes. I/O Scheduling is sometimes called 'disk scheduling'.7 o6 Z0 F x! h _" |. a
7 I$ I' F& @; @2 a4 f. P: K1 U. e( r! ^1 h0 ]* f. l
簡單的說,就是讓我們可以經由不同的設定,來達到調整磁碟存取(I/O)模式的一種設定工具。
1 m9 ~# U" D8 \6 w, _0 H: e2 h' I/ K
1 w) B2 b. H* D/ R1 j
4 U/ u2 d6 K3 s! j) L! e目前Linux支援四種I/O Schedule模式,分別為:
# }5 ]1 W& l5 r9 I" _+ s
; w7 t* Z4 L. E v# F: R
4 c2 Y2 s; C8 ~; a( N* R0 Y% SNoop Scheduler (簡稱noop) -- RIAD 或 SSD 建議使用 noop% E3 q, J+ |3 b0 w0 ]$ C% ~( j
可以算是最基本且簡化的Scheduler,主要應用於一些較為特別的軟體與硬體搭配操作的環境中,且這些軟/硬體已經具備有自己的I/O存取機制,且對於系統核心的要求較少,這樣的Scheduler比較適合運用在嵌入式的環境系統中。
L; Q/ y: d0 E/ v1 a0 b, c+ ?" L# C- K) @
1 m m$ v# m/ ?- ? V3 YCompletely Fair Queuing (簡稱cfq)$ |: I6 e; x) ~& x$ h
顧名思義,針對硬碟與系統應用所需要的所有I/O任務,均分配給相同的佇列順序(Queuing),這樣的Scheduler最適合用於一般使用者桌上型電腦的操作環境,自從2006年12月Linux Kernel 2.6.18問世直至今日,CFQ Scheduler一直是Linux核心預設的 I/O scheduler。
$ ~# _+ v& U1 [. e. H6 M7 K5 c2 O7 P) r# Z& ]
0 r! r/ l; N8 D# F& B. c
Anticipatory Scheduling (簡稱anticipatory)% }! _. Z1 z6 V# s
曾經一度是Linux 2.6 Kernel 的預設 I/O Scheduler ,由Anticipatory (預先/預想) 的文字解釋來看,如果有第一個I/O出現,且同時又有別的系統第二個I/O請求操作時,Anticipatory Scheduling將會產生一個預設需要6毫秒的"猜測"(預想)時間,這個猜測,是在猜測第二個I/O請求是要做什麼用的,這樣的猜測預想模式在經常性進行隨機存取的系統內會造成較大的時間延遲,尤其是像資料庫這樣的系統環境,但反之,Anticipatory Scheduling對於像網頁伺服器這樣的系統則會表現的相當好。* F8 Z( g* F: Z
9 _0 t; ]& a$ u0 j. n. ?
3 M& P- a! P" q# qDeadline Scheduler (簡稱deadline) -- SATA 建議使用 deadline
9 Q0 q0 G# ~1 E7 |主要這個Scheduler就是針對Anticipatory Scheduling的缺點來進行改善,它會針對磁碟中經常遭到存取的不同應用程式,記錄並製作符合最小延遲時間的佇列順序,這樣的結果對於資料庫系統能提供更加的存取效率。
$ v! w- H) {( Y
" H5 K w" b+ g5 L: a5 z. I
. w% y1 U. B+ N) a' ?1 y# s下圖是Red Hat Enterprise Linux 4 (2.6 Kernel) 搭配Oracle10G資料庫與各種I/O Scheduler測試的結果 (圖片與資料來源屬Redhat公司所有)# g! W8 |7 G3 t, f D; d; C
6 o# b$ J8 s1 l8 O
( |/ V* |+ h5 V+ D' o2 k% f* J: H/ P簡單理解了I/O Scheduler模式的差異後,我們可以針對不同儲存設備來搭配不同的I/O Scheduler進行效能上的調校,首先我們先找到管理I/O Scheduler的系統檔案,這個檔案可用cat的方式來讀取:' v( g5 D( Q' ~: r3 N0 J
& Y5 \+ n7 H. R7 G2 m* Q% `5 k3 e _
#cat /sys/block/sda/queue/scheduler5 F1 y* L& ?$ }2 X* T" P. v
[noop] anticipatory deadline cfq( i5 e$ _% @! y- T! C2 W9 k+ Q
- _& G3 K/ t; @0 |- H3 \! h, k9 ^1 g# E* v) |, J& j
從上例,我們可以知道目前的I/O Scheduler模式為Noop. (有框號 [ ] 處)
* D! L8 o* e- i# I3 D$ y v
3 `. h) I3 A. H/ R3 C4 S; t7 ~% @" A& U8 O: P
若需要進行修改調整,作法有兩種:* n- E; g9 [ C; p: b
4 Y8 @# j6 j) a. T. f
2 r* P$ t( a4 d
1. 單次調整,即調整即生效,經由echo指令來更改I/O Scheduler的模式
" W& E. {, Z+ ]* `6 O7 s! e
; J9 |3 W4 ~; }; S2 ^9 k
; Q* o+ U2 p/ g; H9 S) Q- k#echo Deadline>/sys/block/sda/queue/scheduler) o& C8 K& i' r9 A0 _
* N% O7 b, D; W/ N! q4 k+ |7 `
3 _' Z& x: ~4 ]上例為將目前sda這顆硬碟的I/O Scheduler更改為Deadline模式,改完隨即生效,但重新開機後又會回到系統核心默認的I/O Scheduler模式* Y0 P+ A( D V/ A! I
" T$ D# a. @- c% h
! {6 b5 ^( K/ t" V4 U0 _" r2. 隨著系統開機進行調整生效:5 l0 W: M" s( a
以下2選15 P& W& B/ ]0 Y7 C4 @
❶ 在 /etc/rc.local 內加入一行: echo anticipatory > /sys/block/sdb/queue/scheduler ❷ 在系統的GRUB開機檔案中,最後一行加上elevator=deadline,即可於每次開機後都保有Deadline Scheduler的運作模式,如下例:1 V9 f3 p, M0 n5 l- L, `. i
]9 V/ S" X6 E, z' P
3 B z# K; {; n* |" w
編輯 /boot/grub/grub.conf+ M$ {3 i" E' v* F6 y7 W8 [
4 {: F# y# `7 T; W. X
- `3 k1 r3 V; F, ptitle Fedora Core (2.6.9-5.0.3.EL_lustre.1.4.2custom)
& t9 r7 C: K4 L& Kroot (hd0,0)
3 H$ n( E, A" { M7 F! b" M) ikernel /vmlinuz-2.6.9-5.0.3.EL_lustre.1.4.2custom ro% R. M9 C9 M' h" }+ D1 a
root=/dev/VolGroup00/LogVol00 rhgb noapic quiet elevator=deadline
^1 V+ m' m2 I2 z* S
$ y E2 \8 Z- W# A
. A( g7 F5 o4 Q: j% D4 D/ m7 C- B0 @1 w6 A2 L* n j
3 Q e) P+ X( |/ g1 h二、 接下來是硬碟的 Readahead 快取
2 Y# `( U$ Z: \3 Z& B0 n: k! Y9 I- _( D( } S# {4 ^9 a/ R* m
& _6 r3 j. _" g! n7 W
這部份就比較容易理解,經由系統磁碟的預先讀取設定來加速讀取效能,而經由調整Readahead Sectors大小來增進系統磁碟的讀取效能差異,這就是調校的主要目的。
' l# a; ]+ m2 V2 d5 I1 ?/ k5 o5 V5 n- C; A( n: R3 ?& X
c, a, i5 z; ^- w$ |9 m經由Linux系統指令: blockdev 來檢視目前sda硬碟的Readahead Sectors大小,範例如下6 T& ]7 r Q- z: t
% J0 X$ t" B1 y' _0 q- l2 w
' P' W* q4 p5 M) R
#blockdev --getra /dev/sda (系統預設是256M)8 g9 o5 j ]5 a9 ^5 d; A' `
512
' u) E |$ I: q' v
k; U& w% p7 W7 u% y7 ?4 D$ k$ A- \- u j6 r1 Y' f
而經由調整參數並帶入Sectors大小,來進行效能調整,範例如下:
4 N8 E$ _6 c; `3 T# y5 S! B( N- t, U0 {1 D% Y8 ^& M0 I! D# _! F7 g
. N+ D: ~9 J4 S5 h: \#blockdev --setra 4096 /dev/sda" |- x$ k+ b. M& k, E$ ~+ |; j
) {, W {7 }- @5 L2 h8 v' f' v0 }4 C
#blockdev --getra /dev/sda- R2 D5 E. W7 ?) @
4096, ?7 [: ^, n, W9 ^: H
# f4 |& u3 e. }! [+ t1 _" g
隨著系統開機自動設定:
6 b; ]4 Q; R& J+ n) E2 o1 x$ H; l在 /etc/rc.local 內加入一行:
" ^( t5 v3 s$ l3 F6 {, _% ^: _& P$ Eblockdev --setra 4096 /dev/sda
6 @) Q( Y5 k7 o7 U4 T3 C" I4 ^4 O' d4 v4 G, ~# U
經有這兩種硬碟效能調校的小方案,可望能在原本讀取效能就比較差的硬體環境之下,再多壓榨出一些讀取效能。! L9 q% ?% a- N. |1 J- P
實例:以前當server同時做很多工作,例如 ffmpeg, php(move_uploaded_file)上傳大檔案 ,tar , mv 大的檔案時,所有動作幾乎會卡住,完全動不了,經過上述的調整,問題完全解決。
& [- a' V0 f2 n5 Y/ ^$ I0 r! M0 T. {
另外,sysctl.conf的調整也是有幫助的( I% W) d6 }3 W8 o5 C. S
4 t( A7 b- N: @4 I1 p, a+ }. C, X' a& w
參考來源:
" }1 @$ y# F6 I5 U2 [! X7 h, b, a& |) }/ Y% Q
http://itstorage.storageforum.tw ... eadahead-cache.html1 n& l1 r( Q d7 i7 C" Y
|
|