<div dir="ltr"><meta http-equiv="Content-Type" content="text/html; charset=utf-8"><meta name="ProgId" content="Word.Document"><meta name="Generator" content="Microsoft Word 11"><meta name="Originator" content="Microsoft Word 11"><link rel="File-List" href="file:///C:%5CDOCUME%7E1%5CKlemer%5CLOCALS%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_filelist.xml"><style>
<!--
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {mso-style-parent:"";
        margin:0cm;
        margin-bottom:.0001pt;
        mso-pagination:widow-orphan;
        font-size:12.0pt;
        font-family:"Times New Roman";
        mso-fareast-font-family:"Times New Roman";}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 90.0pt 72.0pt 90.0pt;
        mso-header-margin:35.4pt;
        mso-footer-margin:35.4pt;
        mso-paper-source:0;}
div.Section1
        {page:Section1;}
-->
</style>

<p class="MsoNormal">Hi .<br>
<br>
I agree with you !! About giving the admin to adopt or not the<br>
paranoid approach of not failing over the services.<br>
<br>
I supported in the past tru64 clusters & now days the HP serviceguard.(
hpux & linux ).<br>
<br>
Hp decided not develops the serviceguard on  linux  anymore
& we now start using Redhat-Cluster. <br>
<br>
Its seems that for very critical customers you need at least 2 fencing method
!!!<br>
<br>
& there is another thing to be fix ASAP  - when using HALVM -
The needs of comparing which file is newer , the lvm.conf or<br>
the initrd.img. - <br>
<br>
Regards.<br>
<br>
Shalom.</p>

<br><br><br><br><div class="gmail_quote">On Fri, Mar 5, 2010 at 10:01 PM, brem belguebli <span dir="ltr"><<a href="mailto:brem.belguebli@gmail.com">brem.belguebli@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
Corey,<br>
<br>
Hi Corey<br>
<br>
I was talking about a watchdog not a kernel panic (sysreq...), on<br>
common (X86) hardware, most server vendors implement embedded hardware<br>
chips that could be used.<br>
<br>
Indeed, SCSI3 reservation/registration could be combined to this whole<br>
stuff to be sure about the nodes sanity.<br>
<br>
I think the choice should be given to the admin to adopt or not the<br>
paranoid approach of not failing over the services.<br>
<br>
<br>
<br>
2010/3/4 Corey Kovacs <<a href="mailto:corey.kovacs@gmail.com">corey.kovacs@gmail.com</a>>:<br>
<div><div></div><div class="h5">> Brem,<br>
><br>
> It's been my understanding that the kernel panic technique you are<br>
> describing essentially is undesirable for the fact that the kernel is in an<br>
> unknown state. Basically anything can happen. The OS doesn't have to do a<br>
> sync for an hba do flush etc. Since RedHat isn't in the business of building<br>
> there own hardware like HP(DEC), Sun, IBM, they take the next best route to<br>
> ensure that nothing from that problematic machine can affect the storage and<br>
> the only way to guarantee that is to remove power from the whole machine.<br>
><br>
> VMS and Tru64 use the panic method but the other nodes will issue a<br>
> reservation on the scsi bus against that node to protect the storage. They<br>
> can do that because they know exactly how there hardware and implementation<br>
> of reservations work.<br>
><br>
> Corey<br>
><br>
> On Thu, Mar 4, 2010 at 5:32 AM, שלום קלמר <<a href="mailto:sklemer@gmail.com">sklemer@gmail.com</a>> wrote:<br>
>><br>
>> Thanks to all !!!!<br>
>><br>
>> <a href="mailto:Shalom.klemer@hp.com">Shalom.klemer@hp.com</a><br>
>><br>
>> On Thu, Mar 4, 2010 at 12:00 AM, Lon Hohberger <<a href="mailto:lhh@redhat.com">lhh@redhat.com</a>> wrote:<br>
>>><br>
>>> On Wed, 2010-03-03 at 13:10 +0200, שלום קלמר wrote:<br>
>>> > Hi.<br>
>>> ><br>
>>> > I got 2 power supplies. But if someone by mistake pull the power<br>
>>> > cables , is that mean<br>
>>> ><br>
>>> > That the services will not failover ??<br>
>>><br>
>>> The problem is:<br>
>>><br>
>>> no power = no ping + no DRAC access<br>
>>> no network = no ping, no DRAC access<br>
>>><br>
>>> If there's no power, then it is safe to fail over.<br>
>>><br>
>>> If there is no network (and power is OK), then it is not safe to fail<br>
>>> over.  Failover in this case is very likely to produce data corruption!<br>
>>><br>
>>> Because we can not tell which case happened, we do not fail over.<br>
>>><br>
>>> -- Lon<br>
>>><br>
>>><br>
>>> --<br>
>>> Linux-cluster mailing list<br>
>>> <a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
>>> <a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
>><br>
>> --<br>
>> Linux-cluster mailing list<br>
>> <a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
>> <a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
><br>
><br>
> --<br>
> Linux-cluster mailing list<br>
> <a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
> <a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
><br>
<br>
--<br>
Linux-cluster mailing list<br>
<a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a></div></div></blockquote></div><br></div>