<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 TRANSITIONAL//EN">
<HTML>
<HEAD>
  <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=UTF-8">
  <META NAME="GENERATOR" CONTENT="GtkHTML/3.3.2">
</HEAD>
<BODY>
On Tue, 2006-08-15 at 10:16 +0100, Andy Green wrote:
<BLOCKQUOTE TYPE=CITE>
<PRE>
<FONT COLOR="#000000">Roger wrote:</FONT>
<FONT COLOR="#000000">> Has anyone had issues with Fedora Core 5 64bit version. I tried to use </FONT>
<FONT COLOR="#000000">> it for one of my production servers and i had endless issues trying to </FONT>
<FONT COLOR="#000000">> get it to work, first i had the segfaults caused by some of my </FONT>
<FONT COLOR="#000000">> processes. Then the SATA drivers started giving errors and eventually my </FONT>
<FONT COLOR="#000000">> hard drive started failing etc. I believe in Fedora and dumped FC5 for </FONT>

<FONT COLOR="#000000">I used FC5 on x86_64 for several months completely happily.  Then a </FONT>
<FONT COLOR="#000000">couple of months ago that box killed first one SATA drive (this is on </FONT>
<FONT COLOR="#000000">nVidia SATA driver/controller) and then after one week, its replacement </FONT>
<FONT COLOR="#000000">SATA drive.  By 'killed' I mean I came in one morning and the drive is </FONT>
<FONT COLOR="#000000">repeatedly resetting itself on a 10-or-so second cycle, will not boot, </FONT>
<FONT COLOR="#000000">etc.  I abandoned the whole PC and moved my life into a laptop.</FONT>

<FONT COLOR="#000000">I have three ideas what may have happened:</FONT>

<FONT COLOR="#000000">  - Power supply problem: the 12V became weak and unstable and the drive </FONT>
<FONT COLOR="#000000">kept "powering up".  Problem with believing this is that there were few </FONT>
<FONT COLOR="#000000">devices in the box, and there had been no changes to the roster of </FONT>
<FONT COLOR="#000000">devices in there for months</FONT>

<FONT COLOR="#000000">  - Driver problems: on a later kernel, changes in the driver cause it </FONT>
<FONT COLOR="#000000">to try to reset the drive and there are problems with the logic that it </FONT>
<FONT COLOR="#000000">will keep doing so until it kills the drive, perhaps because the drive </FONT>
<FONT COLOR="#000000">firmware does not always handle soft resets properly (on a WD and a </FONT>
<FONT COLOR="#000000">Seagate though?)</FONT>

<FONT COLOR="#000000">  - Karmic burden from a past life caught up with me and it is just random</FONT>

<FONT COLOR="#000000">Please describe what happened with your dead drive.</FONT>

<FONT COLOR="#000000">-Andy</FONT>
<FONT COLOR="#000000">-- </FONT>
<FONT COLOR="#000000">fedora-list mailing list</FONT>
<FONT COLOR="#000000"><A HREF="mailto:fedora-list@redhat.com">fedora-list@redhat.com</A></FONT>
<FONT COLOR="#000000">To unsubscribe: <A HREF="https://www.redhat.com/mailman/listinfo/fedora-list">https://www.redhat.com/mailman/listinfo/fedora-list</A></FONT>
</PRE>
</BLOCKQUOTE>
<BR>
I installed FC on my new Intel 64 bit with SATA drives and i was overwhelmed by the performance such that i decided to replace my very old mail server which had been very faithful to me, it was a sad day indeed. Then on the second day my logfile reported the following<BR>
<BR>
<FONT COLOR="#000080">Jul 16 10:29:57 asterix kernel: qmailadmin[13468]: segfault at 0000000000000000 rip 0000003f2a064da1 rsp 00007fffffcd37f0 error 4</FONT><BR>
<FONT COLOR="#000080">Jul 16 10:30:00 asterix kernel: qmailadmin[13469]: segfault at 0000000000000000 rip 0000003f2a064da1 rsp 00007fffff9277d0 error 4</FONT><BR>
<FONT COLOR="#000080">Jul 16 10:30:15 asterix kernel: ata1: handling error/timeout</FONT><BR>
<FONT COLOR="#000080">Jul 16 10:30:15 asterix kernel: ata1: port reset, p_is 0 is 0 pis 0 cmd 4c017 tf 7f ss 0 se 0</FONT><BR>
<FONT COLOR="#000080">Jul 16 10:30:15 asterix kernel: ata1: status=0x50 { DriveReady SeekComplete }</FONT><BR>
<FONT COLOR="#000080">Jul 16 10:30:15 asterix kernel: sda: Current: sense key: No Sense</FONT><BR>
<BR>
......<BR>
<BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13903]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13904]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13905]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13906]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: ata1: handling error/timeout</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: ata1: port reset, p_is 0 is 0 pis 0 cmd 4c017 tf 7f ss 0 se 0</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: ata1: status=0x50 { DriveReady SeekComplete }</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: sda: Current: sense key: No Sense</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel:     Additional sense: No additional sense information</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13907]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13908]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13909]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<FONT COLOR="#000080">Jul 16 19:50:18 asterix kernel: tcpserver[13910]: segfault at 0000000000000064 rip 00000000004049a0 rsp 00007fffffdf8a98 error 6</FONT><BR>
<BR>
etc.<BR>
<BR>
I reset the machine and the machine worked for 7 seven days then it stopped and gave the ata1: handling error timeout. Then 4 or days it would run and then just suddenly stop, and i was thinking that maybe it is a hard drive error. But what happens now is that the hard drive starts to just die and then i guess switches to read-only mode and i cant even use ssh to get into the machine, such that i always reset it, but when i do it just runs for 4 days max and then just dies, do you reckon it to be the hard drive that is now weak or what.<BR>
<BR>
I have since replaced that server with a smaller machine running on FC3 with but uses a lot less memory and does not complain at all.<BR>
<BR>
Do you reckon it could be the SATA Drivers which kill the hard drives!<BR>
<BR>
Regards<BR>
<BR>
Roger<BR>
<BR>
</BODY>
</HTML>