[OT] BadRam (Was: [BSD] server leallas)
Marton Kenyeres
mkenyeres at konvergencia.hu
2004. Sze. 17., P, 13:03:59 CEST
On Friday 17 September 2004 12:28, Mohacsi Janos wrote:
> On Fri, 17 Sep 2004, Marton Kenyeres wrote:
> > On Friday 17 September 2004 08:18, Hajdú Zoltán wrote:
> >> On 2004. 09. 16., Szukacs Istvan has wisely spoken:
> >>> egyszer egy ismerosom azt mondta h o azert hasznal linuxot mert az
> >>> egyik memoria modulja hibas es a linux kernel nem hannya el magat ettol
> >>> a bsd kernel meg igen.
> >>
> >> Mintha régebben olvastam volna valami olyasmit, hogy volt egy patch
> >> a linux kernelhez, ami azt csinálta, hogy ha hibás memóriaterületet
> >> érzékelt, nem core dump -olt le, hanem azt a részt kizárta a további
> >> allokációból és megpróbált tovább működni. Anno a NetBSD tech
> >> levlistán feszegették, hogy kellene valami ilyesmi BSD vonalra is, de
> >> ha jól tudom, nem lett belőle semmi (mondjuk megértem, hibás hw-re nem
> >> lehet szolgáltatást alapozni).
> >
> > Majdnem... nem menetkozben keruli ki a kibas teruletet, hanem neked kell
> > valami memoria tesztelovel kitalalnod, hogy milyen cimek nem mukodnek, es
> > akkor azt bootolaskor kernel memoriakent lefoglalja, igy nem engedi, hogy
> > barmi mas hasznalja azt a memoria teruletet.
> >
> > Tovabbi info:
> >
> > http://rick.vanrein.org/linux/badram/
> >
> > m.
>
> Szerintem ez egy eleg nagy hack. Mekkora valoszinuseggel tudja detektalni
> a hibat? Mennyi ido alatt? A memtest bizony eleg sokaig tart. Es ha megsem
> sikerul? Akkor fagyunk? Te sem gondolhatod komolyan, hogy Mbajtnyi
> hiba utan megbizik valaki a memoria modulban. Le tudjuk tiltani a
> memoria modult teljesen. Minden architekturan mukodik? Esetleg masik
> chipkeszleten mar nem?
>
> Szoval HW tamogatas nelkul nem tartom eletkepes megoldasnak...
Ez egeszen biztosan egy bazinagy hack. A fent emlitett badram patch _nem_
tudja detektalni a hibat, arra valami memoria tesztelo progit kell hasznalni,
pl Memtest86-ot (nem tudom, hogy erre gondoltal-e, de nem ugyanaz, mint a
memtest). Ha megsem sikerul, akkor termeszetesen az tortenik, ami memoria
hibaknal altalaban, SIGSEGV, SIGBUS, fagyas, panic.
Szeretnem leszogezni, hogy en egy neha leragado bit utan is hajitanam ki a
modult a kukaba, soha nem hasznaltam ilyet, es nem is fogok, nehany eve mar
linuxot se, csak az archivum kedveert pontositottam, hogy mirol is van szo. A
fenti oldalon egyebkent nehaby bites-nehany byteos memoria hibakrol ir a
szerzo. Hogy ez a patch milyen architekturakon mukodik, azt nem tudom, de
maga az elv szerintem mukodokepes barmilyen architekturan. A chipkeszlet
biztos nem befolyasolja.
Mint ahogy Papp Tamas leirta, nem csak szerver van a vilagon, van aki
bevallalja a rizikot egy otthoni vagy irodai gepnel. Tobb distroban alapbol
benne van, sokan hasznaljak, szoval a megoldas eletkepes, csak az a kerdes,
hogy mi a feladat :) Nyilvan nem ezzel epit az ember hibaturo rendszereket.
>
> Udv:
>
> Janos Mohacsi
m.
További információk a(z) BSD levelezőlistáról