[BSD] Server load - nem értem! :-(

Gabor HALASZ halasz.g at freemail.hu
2010. Május. 4., K, 13:03:48 CEST


On 2010.05.04. 12:50, Laszlo Nagy wrote:
>
> Nekem az tűnt föl, hogy újraindítás után tengernyi szabad memória volt,
> processzor kihasználtság is 10% alatt volt, mégis belassult.

Az nem tul jo


>
> Így néz ki az iostat amikor belassul:
>
> tty ad4 da0 da1 cpu
> tin tout KB/t tps MB/s KB/t tps MB/s KB/t tps MB/s us ni sy in id
> 0 904 0.00 0 0.00 19.84 251 4.86 18.50 4 0.07 19 0 8 1 73
> 0 77 0.00 0 0.00 16.00 74 1.15 16.00 4 0.06 15 0 5 1 78
> 0 718 0.00 0 0.00 16.00 106 1.66 16.00 1 0.02 14 0 5 1 80
> 0 77 0.00 0 0.00 18.98 160 2.97 16.00 1 0.02 12 0 3 1 84
> 0 678 0.00 0 0.00 15.87 105 1.63 0.00 0 0.00 12 0 5 1 83
>
> Szóval a tps oszlopban 0-4 közötti értékek vannak, a MB/sec oszlopban
> 0.00 meg 0.07 meg hasonlók.

Eppen nem csinal semmit.

> Amikor meg "normálisan" működik a rendszer akkor a tps értéke 100 és
> 5000 között van. Az átvitel néha 50 MB/sec fölé megy.

Az tps jo, a kesobbi infok birtokaban a bandwith-et keveslem.

> Az iostat megtévesztő lehet, mert a tps érték akkor is lassú, amikor épp
> nincs terhelés a gépen, meg akkor is lassú amikor "fagy" .

Transaction per sec.

> A kettő
> között az a különbség, hogy "fagyott" állapotban több percig tart
> beloginolni ssh-val. :-( Látszólag nincs rajta CPU terhelés, az összes
> postgresql processz "sbwait" állapotban várakozik. I/O művelet alig van,
> annak ellenére hogy nagyon sok processz I/O-ra vár.

Nyilvanvalo, hogy nem tevekenykedik. A sok io-ra varo processz es a 
keves io nem sok jot jelent, ez altalaban valamilyen deadlock tunete, 
varnak egymasra az io requestek.
>
> A vezérlő egy Areca 1680 típusú, dual core intel IO processzorral és 2GB
> write back cache-el:
>
> Main Processor 1.2GHz IOP348 C1
> CPU ICache Size 32KBytes
> CPU DCache Size 32KBytes/Write Back
> CPU SCache Size 512KBytes/Write Back
> System Memory 2048MB/533MHz/ECC
>

Akkor el is jutottunk a problema okahoz: doglodik a raid vagy a busz, 
stb...A processz varja az adatot a raid vezerlotol, de az nem jon, igy 
nem tud mit csinalni, csak var.

>
>
> Van rajta egy RAID 1 és egy RAID 6 tömb. Esetleg lehetséges lenne, hogy
> azért megy le a transaction/second érték, mert az IO processzor
> melegszik túl, és a RAID kártya hővédelme kapcsol be.

Igen, akar ez is lehet, nem annyira ismerem az areaca-k gyakorlati nyugjeit.

> Ezért nem látszódhat a FreeBSD kernel adatok között hogy "miért lassú", mert külső
> eszközre vár?

Szerintem igen, valami olvasasi gondja van (az iras nem akasztana meg 
ilyen mennyisegu ram mellett)

> Nem tudom, ez csak egy tipp. Még azt is el tudom képzelni,
> hogy nem is áll le a ventillátor, csak rossz a szenzor, és amikor a RAID
> kártya azt hiszi hogy nincs venti akkor leveszi az órajelet.

Ez is lehet, ehhez minimum tudni kellene, forog-e a ventillator, szoval 
nezni kellene a szemeddel, mert ha forog, mikozben azt mondja, hogy nem 
forog...

> Mindenesetre a RAID kártya logjában nincsen erre utaló jel, az IO
> processzor hőmérséklete normálisnak mondható 48C körüli, és azon kívül
> hogy néha küld egy "CPU Fan failed" üzenetet (és kb. 10 sec-en belül egy
> CPU Fan recovered üzenetet is), semmi különös nem látszódik rajta. Már
> megrendeltem az új ventillátort rá, és mindenképp ki fogom cserélni. Egy
> hibalehetőséggel kevesebb lesz.

Firmware upgrade a kartyan.

-- 
Gabor HALASZ <halasz.g at freemail.hu>



További információk a(z) BSD levelezőlistáról