<br><div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Jan 3, 2013 at 5:18 AM, Zdenek Kabelac <span dir="ltr"><<a href="mailto:zkabelac@redhat.com" target="_blank">zkabelac@redhat.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dne 31.12.2012 19:50, Tyler Gates napsal(a):<div><div class="h5"><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hello everyone,<br>
      I've been having an intermittent problem on random servers segfaulting<br>
while trying to create a snapshot under version  lvm2-2.02.17-7.38.3 on<br>
kernel 2.6.16.60-0.93.1-bigsmp (SLES 10 SP4). The messages I get are:<br>
##############################<u></u>#############<br>
Dec 27 07:45:39 chelco-app-01 kernel: Unable to handle kernel NULL pointer<br>
dereference at virtual address 0000001c<br>
Dec 27 07:45:39 chelco-app-01 kernel:  printing eip:<br>
Dec 27 07:45:39 chelco-app-01 kernel: f90ab3a7<br>
Dec 27 07:45:39 chelco-app-01 kernel: *pde = 3780a001<br>
Dec 27 07:45:39 chelco-app-01 kernel: Oops: 0000 [#1]<br>
Dec 27 07:45:39 chelco-app-01 kernel: SMP<br>
Dec 27 07:45:39 chelco-app-01 kernel: last sysfs file:<br>
/devices/pci0000:00/0000:00:<u></u>02.0/0000:04:00.1/irq<br>
Dec 27 07:45:39 chelco-app-01 kernel: Modules linked in: raw dock button<br>
battery ac loop dm_snapshot usbhid dm_mod uhci_hcd bnx2x hw_random ehci_hcd<br>
qla2xxx hpilo usbcore firmware_class scsi_transport_fc parport_pc lp parport<br>
ext3 jbd edd<br>
fan thermal processor cciss sd_mod scsi_mod<br>
Dec 27 07:45:39 chelco-app-01 kernel: CPU:    4<br>
Dec 27 07:45:39 chelco-app-01 kernel: EIP:    0060:[<f90ab3a7>]    Tainted: G<br>
     X VLI<br>
Dec 27 07:45:39 chelco-app-01 kernel: EFLAGS: 00210202<br>
(2.6.16.60-0.93.1-bigsmp #1)<br>
Dec 27 07:45:39 chelco-app-01 kernel: EIP is at __map_bio+0x50/0x11f [dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel: eax: f90960c4   ebx: 00000000   ecx:<br>
f7ff2a60   edx: f7794440<br>
Dec 27 07:45:39 chelco-app-01 kernel: esi: f7ff2a58   edi: f90960c4   ebp:<br>
f46306c0   esp: f4c15d28<br>
Dec 27 07:45:39 chelco-app-01 kernel: ds: 007b   es: 007b   ss: 0068<br>
Dec 27 07:45:39 chelco-app-01 kernel: Process lvcreate (pid: 6678,<br>
threadinfo=f4c14000 task=f7838680)<br>
Dec 27 07:45:39 chelco-app-01 kernel: Stack: <0>f7794340 f7794440 f7794440<br>
03201ff0 00000000 03201ff0 00000000 00000008<br>
Dec 27 07:45:39 chelco-app-01 kernel:        00000000 00000000 f90960c4<br>
f7ff2a68 f46306c0 f90abd1b 00000000 00000001<br>
Dec 27 07:45:39 chelco-app-01 kernel:        00000008 f428e2e0 fcdfe010<br>
ffffffff c0113d62 00000000 0000001f f7ff2a58<br>
Dec 27 07:45:39 chelco-app-01 kernel: Call Trace:<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<f90abd1b>] __split_bio+0x182/0x440<br>
[dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<c0113d62>] do_flush_tlb_all+0x0/0x5d<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<f90abff0>]<br>
__flush_deferred_io+0x17/0x20 [dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<f90ac14c>] dm_resume+0x8e/0xf9 [dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<f90aedd8>] dev_suspend+0x138/0x157<br>
[dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<f90af607>] ctl_ioctl+0x220/0x26e [dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<f90aeca0>] dev_suspend+0x0/0x157 [dm_mod]<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<c0179ce8>] do_ioctl+0x48/0x5e<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<c0179f60>] vfs_ioctl+0x262/0x275<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<c0179fc7>] sys_ioctl+0x54/0x6d<br>
Dec 27 07:45:39 chelco-app-01 kernel:  [<c0103dcb>] sysenter_past_esp+0x54/0x79<br>
Dec 27 07:45:39 chelco-app-01 kernel: Code: b4 0a f9 89 70 40 8b 06 83 c0 0c<br>
f0 ff 00 8b 54 24 08 8d 4e 08 8b 02 8b 52 04 89 44 24 0c 89 f8 89 54 24 10 8b<br>
5f 04 8b 54 24 08 <ff> 53 1c 83 f8 00 89 c2 0f 8e 93 00 00 00 8b 54 24 08 8b 42 0c<br>
##############################<u></u>##############################<u></u>#<br>
<br>
The result is the target volume gets suspended and the only way to fix it is<br>
to reboot and remove the faulty snapshot when it comes back up.<br>
<br>
Now the script I wrote that creates these snapshots will use all available<br>
extents from the Volume Group pool which in this case was actually larger than<br>
the size of the volume I was trying to snapshot. Thinking this was the<br>
problem, I tried creating the snapshot several times using a snapshot size<br>
less than or equal to the target volume and it worked every time. So, I tried<br>
a value larger than the target to generate a crash and it did BUT not every<br>
time. In fact now I can't get it to segfault at all.<br>
<br>
So my question is: is creating the snapshot volume with a size larger than the<br>
target volume inducing segfaults randomly or could there be another problem<br>
lurking? If these weren't production machines I would normally just go with a<br>
size smaller than the target but I really need to be sure what exactly is<br>
causing the segfaults.<br>
<br>
Any help would be appreciated.<br>
</blockquote>
<br>
<br></div></div>
Any special reason to use lvm2 from the year 2006 in the year 2013 ?<br></blockquote><div><br></div><div>Yes. It is from a specific version of an OS we tested as being stable back in the day, which unfortunately uses older software such as this LVM version. It wasn't until recently that I wanted to start using LVM.</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
There is no big point in fixing some particular bugs any many years obsoleted source code.<br>
<br>
Can you try to use/rebuild more recent version?<br></blockquote><div><br></div><div>I realize trying a more recent version would be the best thing to do assuming it would be easy (in this situation it would be a big hassle) but I was hoping someone could tell me either "yes over allocating to the snapshot could cause this" or  "it sounds like a bug in that version" before I go through all that trouble.</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Zdenek<br>
<br>
<br>
______________________________<u></u>_________________<br>
linux-lvm mailing list<br>
<a href="mailto:linux-lvm@redhat.com" target="_blank">linux-lvm@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/linux-lvm" target="_blank">https://www.redhat.com/<u></u>mailman/listinfo/linux-lvm</a><br>
read the LVM HOW-TO at <a href="http://tldp.org/HOWTO/LVM-HOWTO/" target="_blank">http://tldp.org/HOWTO/LVM-<u></u>HOWTO/</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><p><span style="font-style:normal">Tyler Gates</span><font color="#008000"><b><br></b></font></p><p><font color="#008000"><b>ATS</b></font> | Sr. Systems
Administrator</p><p><a href="mailto:Tyler.Gates@ats.coop" target="_blank">Tyler.Gates@ats.coop</a></p>
<p><i>The Power of </i><font color="#ff0000"><i><b>One</b></i></font><i>
Software Solution - </i><i><b>OpenOne</b></i></p>
<p><br> <font>910.210.4100 main  | 
910.210.4150 fax |  910.210.4118 direct |  910.358.3063
mobile | </font>
</p>
<p><font color="#1f497d"><font style="font-size:8pt" size="1"><br>
This email may contain information that is confidential or attorney-client privileged and may constitute inside<br>
information. The contents of this email are intended only for the recipient(s) listed above.  If you are not the<br>
intended recipient, you are directed not to read, disclose, distribute or otherwise use this transmission.  If you<br>
received this email in error, please notify the sender immediately and delete the transmission.  Delivery of the<br>
message is not intended to waive any applicable privileges.</font></font></p>
</div>