<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body dir="auto">
<div>
<div><span style="background-color: rgba(255, 255, 255, 0);">Nick,</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><br>
</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);">Each time time you have one of these DB replication issues, have you always been able to tie it into a WAN event? The reason I ask is because you may be having these issues regardless of WAN, although
 once or twice it has lined up with a WAN event.</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><br>
</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);">Do me a flavor; send me the output of:</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><br>
</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);">- <i>utils diagnose test</i></span></div>
<div><i style="background-color: rgba(255, 255, 255, 0);">- utils ntp server list</i></div>
<div><i style="background-color: rgba(255, 255, 255, 0);">- utils dbreplication runtimestate</i></div>
<div><i style="background-color: rgba(255, 255, 255, 0);">- show network cluster</i></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><i>- </i><span style="margin: 0px; padding: 0px; border: 0px; line-height: inherit; vertical-align: baseline; -webkit-overflow-scrolling: touch;"><i>run sql select name,description,nodeid from processnode</i></span></span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><br>
</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);">That is a lot of output, so you may want to throw it in a spreadsheet or something instead of inline to this email. All of this syntax should be ran from the CLI of the CUCM publisher.</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><br>
</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);">Thanks,</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);"><br>
</span></div>
<div><span style="background-color: rgba(255, 255, 255, 0);">Ryan</span></div>
<br>
Sent from my iPad</div>
<div><br>
On Apr 20, 2016, at 1:08 PM, Nick Barnett <<a href="mailto:nicksbarnett@gmail.com">nicksbarnett@gmail.com</a>> wrote:<br>
<br>
</div>
<blockquote type="cite">
<div>
<div dir="ltr">Thanks Ryan.
<div><br>
</div>
<div>We have 3 CCM and 1 TFTP node in each of our two data centers. The main data center is here, and that is where our DRS sftp server (and publisher) is located. Nothing is using DNS right now, all of the servers are entered into CUCM as IP addresses... this
 cluster has been around for years. It was upgraded from 7.BeforeMyTime to 8.6 to 10.0.</div>
<div><br>
</div>
<div><br>
</div>
</div>
<div class="gmail_extra"><br>
<div class="gmail_quote">On Wed, Apr 20, 2016 at 11:54 AM, Ryan Huff <span dir="ltr">
<<a href="mailto:ryanhuff@outlook.com" target="_blank">ryanhuff@outlook.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="auto">
<div>Hi Nick.</div>
<div><br>
</div>
<div>Let me ask you a few things;</div>
<div><br>
</div>
<div>- How is the cluster laid out (how many nodes in the cluster and what nodes are in which DC)?</div>
<div><br>
</div>
<div>- Are you using DNS and if so, where is the DNS server located and do you have redundant DNS in both DCs?</div>
<div><br>
</div>
<div>- Where is your DRS server in relation to the cluster publisher (same DC or no)?<br>
<br>
Thanks,
<div><br>
</div>
<div>Ryan</div>
</div>
<div>
<div class="h5">
<div><br>
On Apr 20, 2016, at 11:09 AM, Nick Barnett <<a href="mailto:nicksbarnett@gmail.com" target="_blank">nicksbarnett@gmail.com</a>> wrote:<br>
<br>
</div>
<blockquote type="cite">
<div>
<div dir="ltr">I'm wondering how many others have had as many issues with db replication? It seems that any time we lose a connection to our 2nd data center (even a 2 minute MPLS planned maintenance outage causes the issue), our database synchronization has
 errors.  After a WAN blip, within an hour or so, I get a message from RTMT about a subscriber being in "blocked" state:
<div><br>
</div>
<div>
<p>%[AppID=Cisco Database Layer Monitor][ClusterID=ProdVoiceCluster][NodeID=XXXXXXX1]: A change notification client is busy (blocked). If the change notification client continues to be blocked for 10 minutes, the system automatically clears the block and change
 notification should resume successfully."</p>
<p><br>
</p>
<p>After that, if I run utils dbreplication status, it will have errors... so then I run the "repair all" option and it fixes it. Then I'm good for a few weeks until something else happens that starts the whole cycle over.</p>
<p>Something else that happens after a WAN blip is that DRS begins to fail, so we have to restart the master DRS and the subsequent DRS services on the subs. Am I doing something wrong? Is this normal?</p>
<p>I'm on CUCM 10.0.1.12900-2.  </p>
<p>Thanks,<br>
Nick</p>
</div>
</div>
</div>
</blockquote>
</div>
</div>
<blockquote type="cite">
<div><span>_______________________________________________</span><br>
<span>cisco-voip mailing list</span><br>
<span><a href="mailto:cisco-voip@puck.nether.net" target="_blank">cisco-voip@puck.nether.net</a></span><br>
<span><a href="https://puck.nether.net/mailman/listinfo/cisco-voip" target="_blank">https://puck.nether.net/mailman/listinfo/cisco-voip</a></span><br>
</div>
</blockquote>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</blockquote>
</body>
</html>