<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.EmailStyle18
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle19
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:#1F497D;}
span.EmailStyle21
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:#1F497D;}
span.EmailStyle22
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal"><span style="color:#1F497D">I have wondered for some time if one of these mega cloud datacenters goes down hard and they actually have to fail over, would any cloud even have the capacity to handle a full DC shutdown and failover? My bet
 is if one of these cloud datacenters fails, you will have a hard time getting a VM on any other cloud provider as everyone starts DRing at the same time.
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><o:p> </o:p></span></p>
<div>
<table class="MsoNormalTable" border="0" cellspacing="0" cellpadding="0" style="border-collapse:collapse">
<tbody>
<tr>
<td valign="top" style="padding:0in 5.4pt 0in 5.4pt"></td>
</tr>
</tbody>
</table>
<p class="MsoNormal" style="line-height:106%"><span style="color:#1F497D"><o:p> </o:p></span></p>
</div>
<p class="MsoNormal"><span style="color:#1F497D"><o:p> </o:p></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b>From:</b> Outages-discussion <outages-discussion-bounces@outages.org>
<b>On Behalf Of </b>Mike Christian<br>
<b>Sent:</b> Wednesday, September 12, 2018 1:33 PM<br>
<b>To:</b> aosgood@Streamline-Solutions.net<br>
<b>Cc:</b> outages-discussion@outages.org<br>
<b>Subject:</b> Re: [Outages-discussion] Outages-discussion] Azure Postmortem<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">This is actually an interesting description.  Not knowing anything about their internals, I can hypothesize a scenario:<span style="font-size:12.0pt"><o:p></o:p></span></p>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Way back in the long long ago, an emergency shutdown involved a flush to disk, with just enough battery to accomplish that, then a clean power down.  This process wouldn’t need to consider the state of cooling infrastructure or whatever
 buffer was in place.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Now make that a more sophisticated process that pauses writes, flushes the async replication queues, and initiates an automatic switchover to an unaffected site.  Great stuff.  But how long does that take, and what are the implications
 around temperature management?<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I’ve been through similar scenarios, but have never seen actual equipment damage.  Something is certainly new here.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt">MikeC<o:p></o:p></p>
<div id="AppleMailSignature">
<p class="MsoNormal">Sent from my iPhone<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
On Sep 12, 2018, at 11:41 AM, Aaron D. Osgood <<a href="mailto:AOsgood@Streamline-Solutions.net">AOsgood@Streamline-Solutions.net</a>> wrote:<o:p></o:p></p>
</div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p class="MsoNormal"><span style="color:#1F497D">Perhaps that is “Lawyer-Speak” for “The damned place caught fire”</span><o:p></o:p></p>
<p class="MsoNormal"><span style="color:#1F497D"> </span><o:p></o:p></p>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:black"> </span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:black">Aaron D. Osgood<br>
<br>
Streamline Communications L.L.C<br>
<br>
274 E. Eau Gallie Blvd. #332<br>
Indian Harbour Beach, FL 32937<br>
<br>
TEL: 207-518-8455<br>
MOBILE: 207-831-5829<br>
GTalk: aaron.osgood<br>
</span><a href="mailto:AOsgood@Streamline-Solutions.net"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:blue">AOsgood@Streamline-Solutions.net</span></a><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:black"><br>
</span><a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__www.streamline-2Dsolutions.net_&d=DwMFAg&c=RoP1YumCXCgaWHvlZYR8PZh8Bv7qIrMUB65eapI_JnE&r=nhYp4LFzcyp8kP7IBZ0FPKGMvhBKzuMvV2Tq5P57e3Y&m=h6PvbEWlm5-2pcHcdCEl95Lm-L8TkZ54pI0DDxPmO2M&s=2To-iOKsc3Lckqa3LLa72stCu1-BWBLEDTLKZ7KmfnA&e="><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:blue">www.Streamline-Solutions.net</span></a><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:black"><br>
<br>
<br>
<br>
Introducing Efficiency to Business since 1986 </span><o:p></o:p></p>
</div>
<p class="MsoNormal"><span style="color:#1F497D"> </span><o:p></o:p></p>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif"> Outages-discussion [<a href="mailto:outages-discussion-bounces@outages.org">mailto:outages-discussion-bounces@outages.org</a>]
<b>On Behalf Of </b>Steve Mikulasik<br>
<b>Sent:</b> September 12, 2018 13:22<br>
<b>To:</b> <a href="mailto:outages-discussion@outages.org">outages-discussion@outages.org</a><br>
<b>Subject:</b> [Outages-discussion] Azure Postmortem</span><o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"> <o:p></o:p></p>
<p class="MsoNormal">MS made a statement about what took them down, sounds like they have some facility upgrades to do
<a href="https://urldefense.proofpoint.com/v2/url?u=https-3A__azure.microsoft.com_en-2Dus_status_history_&d=DwMFAg&c=RoP1YumCXCgaWHvlZYR8PZh8Bv7qIrMUB65eapI_JnE&r=nhYp4LFzcyp8kP7IBZ0FPKGMvhBKzuMvV2Tq5P57e3Y&m=h6PvbEWlm5-2pcHcdCEl95Lm-L8TkZ54pI0DDxPmO2M&s=U4UOUYvC-y8uF641JWafXARONGcbdj1YnTAQ-JTY3_c&e=">
https://azure.microsoft.com/en-us/status/history/</a><o:p></o:p></p>
<p class="MsoNormal"> <o:p></o:p></p>
<table class="MsoNormalTable" border="0" cellspacing="0" cellpadding="0" style="border-collapse:collapse">
<tbody>
<tr>
<td valign="top" style="padding:0in 5.4pt 0in 5.4pt">
<p class="MsoNormal"><strong><span style="font-family:"Calibri",sans-serif">Summary of impact:</span></strong> In the early morning of September 4, 2018, high energy storms hit southern Texas in the vicinity of Microsoft Azure’s South Central US region. Multiple
 Azure datacenters in the region saw voltage sags and swells across the utility feeds. At 08:42 UTC, lightning caused electrical activity on the utility supply, which caused significant voltage swells.  These swells triggered a portion of one Azure datacenter
 to transfer from utility power to generator power. Additionally, these power swells shutdown the datacenter’s mechanical cooling systems despite having surge suppressors in place. Initially, the datacenter was able to maintain its operational temperatures
 through a load dependent thermal buffer that was designed within the cooling system. However, once this thermal buffer was depleted the datacenter temperature exceeded safe operational thresholds, and an automated shutdown of devices was initiated. This shutdown
 mechanism is intended to preserve infrastructure and data integrity, but in this instance, temperatures increased so quickly in parts of the datacenter that some hardware was damaged before it could shut down. A significant number of storage servers were damaged,
 as well as a small number of network devices and power units.<br>
While storms were still active in the area, onsite teams took a series of actions to prevent further damage – including transferring the rest of the datacenter to generators thereby stabilizing the power supply. To initiate the recovery of infrastructure, the
 first step was to recover the Azure Software Load Balancers (SLBs) for storage scale units. SLB services are critical in the Azure networking stack, managing the routing of both customer and platform service traffic. The second step was to recover the storage
 servers and the data on these servers. This involved replacing failed infrastructure components, migrating customer data from the damaged servers to healthy servers, and validating that none of the recovered data was corrupted. This process took time due to
 the number of servers damaged, and the need to work carefully to maintain customer data integrity above all else. The decision was made to work towards recovery of data and not fail over to another datacenter, since a fail over would have resulted in limited
 data loss due to the asynchronous nature of geo replication.<br>
Despite onsite redundancies, there are scenarios in which a datacenter cooling failure can impact customer workloads in the affected datacenter. Unfortunately, this particular set of issues also caused a cascading impact to services outside of the region, as
 described below.<o:p></o:p></p>
</td>
</tr>
</tbody>
</table>
<p class="MsoNormal" style="line-height:105%"> <o:p></o:p></p>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</blockquote>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Times New Roman",serif">_______________________________________________<br>
Outages-discussion mailing list<br>
<a href="mailto:Outages-discussion@outages.org">Outages-discussion@outages.org</a><br>
<a href="https://urldefense.proofpoint.com/v2/url?u=https-3A__puck.nether.net_mailman_listinfo_outages-2Ddiscussion&d=DwICAg&c=RoP1YumCXCgaWHvlZYR8PZh8Bv7qIrMUB65eapI_JnE&r=nhYp4LFzcyp8kP7IBZ0FPKGMvhBKzuMvV2Tq5P57e3Y&m=h6PvbEWlm5-2pcHcdCEl95Lm-L8TkZ54pI0DDxPmO2M&s=dho5g6FOVez-8kH4BhbLdB1Apd1nPg6FVAq5LWR5uSI&e=">https://urldefense.proofpoint.com/v2/url?u=https-3A__puck.nether.net_mailman_listinfo_outages-2Ddiscussion&d=DwICAg&c=RoP1YumCXCgaWHvlZYR8PZh8Bv7qIrMUB65eapI_JnE&r=nhYp4LFzcyp8kP7IBZ0FPKGMvhBKzuMvV2Tq5P57e3Y&m=h6PvbEWlm5-2pcHcdCEl95Lm-L8TkZ54pI0DDxPmO2M&s=dho5g6FOVez-8kH4BhbLdB1Apd1nPg6FVAq5LWR5uSI&e=</a><o:p></o:p></span></p>
</div>
</blockquote>
</div>
</div>
</body>
</html>