<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: Verdana; font-size: 10pt; color: #000000'>i've always been weary of starting up a server with two inconsistent drive in place. it's likely due to my ignorance <span>of how the system decided to pick which drive to mirror onto which drive.<br><br>if it was me, i'd would shut the system down, pull out the bad drive, power it up, answer the questions that mark the drive bad but not the array and then insert the drive after it has come up. then the system knows darn well that you want to rebuild with the running drive.<br><br>that's just me. it's what we did for years and never had a problem. the drive are hot pluggable. so it's a supported mechanism as far as i know for drive repair. not for "backing up" though. ;)<br><br><span name="x"></span>---<br>Lelio Fulgenzi, B.A.<br>Senior Analyst (CCS) * University of Guelph * Guelph, Ontario N1G 2W1<br>(519) 824-4120 x56354 (519) 767-1060 FAX (JNHN)<br>^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^<br>Cooking with unix is easy. You just sed it and forget it. <br>                              - LFJ (with apologies to Mr. Popeil)<br><span name="x"></span><br></span><br><hr id="zwchr"><b>From: </b>"Erick B." <erickbee@gmail.com><br><b>To: </b>"Wes Sisk" <wsisk@cisco.com><br><b>Cc: </b>"voip puck" <cisco-voip@puck.nether.net><br><b>Sent: </b>Thursday, February 3, 2011 2:48:49 PM<br><b>Subject: </b>Re: [cisco-voip] 7828H3 freezing up issue - manual reboot needed<br><br>Regarding the hard drive swap, on this model and version of CUCM...<br><br>TAC is telling us to power down the server and swap the HD and power<br>it back on, and it rebuild on it's own.<br><br>Just not finding any concrete cisco docs that say that, and finding<br>some other discussions that say a single drive failure may end up in a<br>rebuild.<br><br>the show hardware shows the questionable drive is always verifying...<br>and the SMART saids No on one of the drives so something up with drive<br>1.<br><br>----<br><br>admin:show hardware<br><br>HW Platform       : 7828H3<br>Processors        : 1<br>Type              : Intel(R) Xeon(R) CPU            3050  @ 2.13GHz<br>CPU Speed         : 2133<br>Memory            : 6144 MBytes<br>Object ID         : 1.3.6.1.4.1.9.1.901<br>OS Version        : UCOS 4.0.0.0-9<br><br>RAID Version      :<br>RAID Firmware Version: N/A<br>RAID BIOS Version:  Not supported<br><br>BIOS Information  :<br>Vendor: HP<br>Version: W04<br>Release Date: 06/10/2008<br><br>RAID Details      :<br>Controllers found: 1<br><br>----------------------------------------------------------------------<br>Controller information<br>----------------------------------------------------------------------<br>   Controller Status                   : OK<br>   Channel description                 : SATA<br>   Defunct disk drive count            : 0<br>   Logical drives/Failed/Degraded      : 1/0/0<br><br>----------------------------------------------------------------------<br>Logical drive information<br>----------------------------------------------------------------------<br>Logical drive number 1<br>   Logical drive name                  : Device 1<br>   Status of logical drive             : Optimal<br>   RAID level                          : 1<br>   Size                                : 238290 MB<br>   Number of chunks                    : 2<br>   Drive(s) (Channel,Device)           : 0,1 0,2<br><br>----------------------------------------------------------------------<br>Physical device information<br>----------------------------------------------------------------------<br>   Channel #0:<br>      Transfer Speed                   : SATA 1.5 Gb/s<br>      Device #1<br>         Device is a Hard drive<br>         State                         : Online<br>         Transfer Speed                : SATA 1.5 Gb/s<br>         Vendor                        : GB0250C8<br>         Model                         : 045<br>         Firmware                      : HPG6<br>         Serial number                 : 9SF0RKMW<br>         Size                          : 238418 MB<br>         Write Cache                   : Enabled (write-back)<br>         FRU                           : none<br>         S.M.A.R.T.                    : No<br>      Device #2<br>         Device is a Hard drive<br>         State                         : Online<br>         Transfer Speed                : SATA 1.5 Gb/s<br>         Vendor                        : GB0250C8<br>         Model                         : 045<br>         Firmware                      : HPG6<br>         Serial number                 : 9SF0RLNW<br>         Size                          : 238418 MB<br>         Write Cache                   : Enabled (write-back)<br>         FRU                           : none<br>         S.M.A.R.T.                    : Yes<br><br>Command completed successfully.<br>Controllers found: 1<br><br>Logical drive Task:<br>   Logical drive                  : 1<br>   Current operation              : Verify<br>   Status                         : In Progress<br>   Percentage complete            : 42<br><br><br><br>On Wed, Feb 2, 2011 at 7:14 PM, Erick B. <erickbee@gmail.com> wrote:<br>> Right, I am familiar with the IBM fw issue with these type of errors.<br>><br>> I just found out, that there was a RTMT alert raised for<br>> hardwarefailure on one of the drives (S.M.A.R.T) so going replace that<br>> HD when the server became froze sometimes (this error didn't happen<br>> all the time).<br>><br>> Thanks for the feedback, as always Wes.<br>><br>> On Wed, Feb 2, 2011 at 6:11 PM, Wes Sisk <wsisk@cisco.com> wrote:<br>>> This is similar but distinctly separate from CSCti52867.  In that<br>>> investigation we learned that linux marks a file system read only if disk<br>>> i/o is unresponsive even for very short amounts of time.  Under windows the<br>>> disk queues back up and eventually clear.  Under linux the filesystem is<br>>> re-mounted as readonly.<br>>><br>>> So far we know this indicates a delay in disk access.  In CSCti52867 with<br>>> IBM servers that was due to a specific issue on a specific hard drive.<br>>><br>>> Regards,<br>>> Wes<br>>><br>>><br>>> On 2/2/2011 6:45 PM, Erick B. wrote:<br>>>><br>>>> Anyone run into this?  TAC believes it is bad HD which were working<br>>>> on, and I found previous discussion mentioning bug id CSCsm25875<br>>>> maybe. But just checking here incase anyone else has ran into this.<br>>>><br>>>> The server is a CUCMBE with drives with firmware version HPG6 so is<br>>>> higher then the FW issue.<br>>>><br>>>> CUCM version is 7.0.2.20000-5<br>>>><br>>>> What happens is server is running, then phones stop working, and the<br>>>> web pages don't respond, and only a few commands work on SSH CLI such<br>>>> as show hardware, show status.<br>>>><br>>>> If we try a utils system restart from CLI, it fails, and saids<br>>>> appliance failed to restart. So only way to get it back running is to<br>>>> pull the power.<br>>>><br>>>> There are no core files found.<br>>>><br>>>> When you log in via SSH, see this....<br>>>><br>>>> Last login:<br>>>><br>>>> java.io.FileNotFoundException: /var/log/active/platform/log/cli.bin<br>>>> (Read-only file system)<br>>>>         at java.io.RandomAccessFile.open(Native Method)<br>>>>         at java.io.RandomAccessFile.<init>(RandomAccessFile.java:212)<br>>>>         at<br>>>> com.cisco.iptplatform.fappend.ciscoRollingFileAppender.restoreIndex(ciscoRollingFileAppender.java:100)<br>>>>         at<br>>>> com.cisco.iptplatform.fappend.ciscoRollingFileAppender.setFile(ciscoRollingFileAppender.java:43)<br>>>>         at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)<br>>>>         at<br>>>> sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)<br>>>>         at<br>>>> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)<br>>>>         at java.lang.reflect.Method.invoke(Method.java:585)<br>>>>         at<br>>>> org.apache.log4j.config.PropertySetter.setProperty(PropertySetter.java:196)<br>>>>         at<br>>>> org.apache.log4j.config.PropertySetter.setProperty(PropertySetter.java:155)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.setParameter(DOMConfigurator.java:530)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.parseAppender(DOMConfigurator.java:182)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.findAppenderByName(DOMConfigurator.java:140)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.findAppenderByReference(DOMConfigurator.java:153)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.parseChildrenOfLoggerElement(DOMConfigurator.java:415)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.parseRoot(DOMConfigurator.java:384)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.parse(DOMConfigurator.java:783)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.doConfigure(DOMConfigurator.java:666)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.doConfigure(DOMConfigurator.java:616)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.doConfigure(DOMConfigurator.java:584)<br>>>>         at<br>>>> org.apache.log4j.xml.DOMConfigurator.configure(DOMConfigurator.java:687)<br>>>>         at sdMain.main(sdMain.java:511)<br>>>> java.lang.NullPointerException<br>>>>         at<br>>>> com.cisco.iptplatform.fappend.ciscoRollingFileAppender.updateIndex(ciscoRollingFileAppender.java:117)<br>>>>         at<br>>>> com.cisco.iptplatform.fappend.ciscoRollingFileAppender.nextFileName(ciscoRollingFileAppender.java:92)<br>>>>         at<br>>>> com.cisco.iptplatform.fappend.ciscoRollingFileAppender.append(ciscoRollingFileAppender.java:74)<br>>>>         at<br>>>> org.apache.log4j.AppenderSkeleton.doAppend(AppenderSkeleton.java:221)<br>>>>         at<br>>>> org.apache.log4j.helpers.AppenderAttachableImpl.appendLoopOnAppenders(AppenderAttachableImpl.java:57)<br>>>>         at org.apache.log4j.Category.callAppenders(Category.java:187)<br>>>>         at org.apache.log4j.Category.forcedLog(Category.java:372)<br>>>>         at org.apache.log4j.Category.info(Category.java:674)<br>>>>         at sdMain.main(sdMain.java:525)<br>>>> log4j:ERROR No output stream or file set for the appender named [CLI_LOG].<br>>>><br>>>><br>>>> Thanks<br>>>> _______________________________________________<br>>>> cisco-voip mailing list<br>>>> cisco-voip@puck.nether.net<br>>>> https://puck.nether.net/mailman/listinfo/cisco-voip<br>>><br>><br><br>_______________________________________________<br>cisco-voip mailing list<br>cisco-voip@puck.nether.net<br>https://puck.nether.net/mailman/listinfo/cisco-voip<br></div></body></html>