<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">
Hi Daniel,
<div><br>
</div>
<div>Great find!</div>
<div><br>
</div>
<div>For the document:</div>
<div><a href="http://www.cisco.com/c/en/us/support/docs/voice-unified-communications/unified-communications-manager-callmanager/46806-cm-crashes-and-shutdowns.html">http://www.cisco.com/c/en/us/support/docs/voice-unified-communications/unified-communications-manager-callmanager/46806-cm-crashes-and-shutdowns.html</a></div>
<div><br>
</div>
<div>The initialization process and timers have changed *significantly* since 4.x. Some examples include:</div>
<div>CSCsj76788    cp-system request to remove initialization timers<br>
</div>
<div>“... remove the initialization timers that are started during CUCM initialization.  These timer would previously cause a system restart under certain circumstance…”</div>
<div><br>
</div>
<div>Still, there is a global maximum timeout. Individual Daemons must report start and successful initiation by that time.</div>
<div><br>
</div>
<div>Historically behavior like you discuss was triggered by service parameters being missing or having incorrect values. This may be a problem with connection to the database ( CSCsc72748 ) or problem with the contents of the database. Other problems include
 another process grabbing one of the TCP or UDP ports required by the ccm process.</div>
<div><br>
</div>
<div>ccm had many issues retrieving initialization information from the database in early linux versions. refinements to informix and in memory database (IMDB) have helped significantly.</div>
<div><br>
</div>
<div>-Wes</div>
<div><br>
</div>
<div><br>
<div>
<div>On May 21, 2014, at 9:33 AM, Daniel Pagan <<a href="mailto:dpagan@fidelus.com">dpagan@fidelus.com</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div>
<div lang="EN-US" link="#0563C1" vlink="#954F72" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px;">
<div class="WordSection1" style="page: WordSection1;">
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
Folks:<o:p></o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
CUCM ES 8.6.2.24122-1 appears to be creating an issue where CallManager heartbeat fails to increment upon startup and the condition that must be met is very specific. On a problematic node, SDL traces show the following error exactly one hour after the start
 of the CCM service:<o:p></o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<b><i><span style="color: rgb(192, 0, 0);">AppError  ||||||Local send blocked: SignalName: Start, DestPID:<span class="Apple-converted-space"> </span><span style="background-color: yellow; background-position: initial initial; background-repeat: initial initial;">SNRD</span>[1:100:61:1]<o:p></o:p></span></i></b></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<b><i><span style="color: rgb(192, 0, 0);"> </span></i></b></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
This error is followed by the SDL trace printing an error stating CallManager exceeded the permitted time for initialization and will restart the application. The CCM application restarts and additional SDL traces are printed showing the standard creation of
 critical processes – one hour later the same “Local send blocked” error is printed regarding the SNRD process.<o:p></o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
I saw the<span class="Apple-converted-space"> </span><b>DestPID: SNRD</b><span class="Apple-converted-space"> </span>error, went to a completely different,<span class="Apple-converted-space"> </span><b>non-problematic</b><span class="Apple-converted-space"> </span>lab
 environment where 8.6.2.24122-1 is installed, created a single Remote Destination Profile, and then restarted the standalone node in order to force the creation of SNRD. CallManager heartbeats are now failing to increment in that environment and found another
 “Local send blocked” error regarding SNRD. Removing the single Remote Destination Profile from the standalone environment and rebooting the node resolves the problem. Re-inserting it again followed by a reboot recreates it, making SNRD the obvious culprit
 here.<o:p></o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
I currently have a TAC case open where they’re attempting to recreate the problem. It seems no public facing defects are created for this.<span style="color: rgb(31, 73, 125);"> </span>Just wanted to give you folks a heads up.<o:p></o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
Related to this, can someone tell me if this document, specifally the section describing MMManInit and process creation, is still accurate? If so, then what I fail to see in SDL traces is a<span class="Apple-converted-space"> </span><b>InitDone</b><span class="Apple-converted-space"> </span>signal
 from SNRD to MMManInit during the 60 minutes between CCM startup and initialization timeout.<span style="color: rgb(31, 73, 125);"><o:p></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
- Daniel<o:p></o:p></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;">
<o:p> </o:p></div>
</div>
_______________________________________________<br>
cisco-voip mailing list<br>
<a href="mailto:cisco-voip@puck.nether.net" style="color: rgb(149, 79, 114); text-decoration: underline;">cisco-voip@puck.nether.net</a><br>
<a href="https://puck.nether.net/mailman/listinfo/cisco-voip" style="color: rgb(149, 79, 114); text-decoration: underline;">https://puck.nether.net/mailman/listinfo/cisco-voip</a></div>
</div>
</div>
<br>
</div>
</body>
</html>