!clu #2307 Allow transition from unreachable to reachable

* Replace unreachable Set with Reachability table * Unreachable members stay in member Set * Downing a live member was moved it to the unreachable Set, and then removed from there by the leader. That will not work when flipping back to reachable, so a Down member must be detected as unreachable before beeing removed. Similar to Exiting. Member shuts down itself if it sees itself as Down. * Flip back to reachable when failure detector monitors it as available again * ReachableMember event * Can't ignore gossip from aggregated unreachable (see SurviveNetworkInstabilitySpec) * Make use of ReachableMember event in cluster router * End heartbeat when acknowledged, EndHeartbeatAck * Remove nr-of-end-heartbeats from conf * Full reachability info in JMX cluster status * Don't use interval after unreachable for AccrualFailureDetector history * Add QuarantinedEvent to remoting, used for Reachability.Terminated * Prune reachability table when all reachable * Update documentation * Performance testing and optimizations
2013-08-27 15:14:53 +02:00 · 2013-08-27 15:14:53 +02:00 · dc9fe4f19c
commit dc9fe4f19c
parent beba5d9f76
43 changed files with 2425 additions and 1169 deletions
--- a/akka-cluster/src/main/protobuf/ClusterMessages.proto
+++ b/akka-cluster/src/main/protobuf/ClusterMessages.proto
@ -69,6 +69,11 @@ message Welcome {
 * Sends an Address
 */
 /**
 * EndHeartbeatAck
 * Sends an Address
 */
 /**
 * HeartbeatRequest
 * Sends an Address
@ -114,9 +119,34 @@ message Gossip {
 message GossipOverview {
  /* This is the address indexes for the nodes that have seen this gossip */
  repeated int32 seen = 1;
-  repeated Member unreachable = 2;
+  repeated ObserverReachability observerReachability = 2;
 }
 /**
 * Reachability
 */
 message ObserverReachability {
  required int32 addressIndex = 1;
  required int64 version = 4;
  repeated SubjectReachability subjectReachability = 2;
 }
 message SubjectReachability {
  required int32 addressIndex = 1;
  required ReachabilityStatus status = 3;
  required int64 version = 4;
 }
 /**
 * Reachability status
 */
 enum ReachabilityStatus {
  Reachable = 0;
  Unreachable = 1;
  Terminated = 2;
 }
 /**
 * Member
 */
--- a/akka-cluster/src/main/resources/reference.conf
+++ b/akka-cluster/src/main/resources/reference.conf
@ -128,11 +128,6 @@ akka {
      # i.e. each node will be monitored by this number of other nodes.
      monitored-by-nr-of-members = 5
      # When a node stops sending heartbeats to another node it will end that
      # with this number of EndHeartbeat messages, which will remove the
      # monitoring from the failure detector.
      nr-of-end-heartbeats = 8
      # When no expected heartbeat message has been received an explicit
      # heartbeat request is sent to the node that should emit heartbeats.
      heartbeat-request {
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterDaemon.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterDaemon.scala
@ -15,6 +15,7 @@ import akka.cluster.MemberStatus._
 import akka.cluster.ClusterEvent._
 import akka.dispatch.{ UnboundedMessageQueueSemantics, RequiresMessageQueue }
 import scala.collection.breakOut
 import akka.remote.QuarantinedEvent
 /**
 * Base trait for all cluster messages. All ClusterMessage's are serializable.
@ -264,13 +265,16 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
      Some(scheduler.schedule(PeriodicTasksInitialDelay.max(d), d, self, PublishStatsTick))
  }
-  override def preStart(): Unit =
+  override def preStart(): Unit = {
    context.system.eventStream.subscribe(self, classOf[QuarantinedEvent])
    if (SeedNodes.isEmpty)
      logInfo("No seed-nodes configured, manual cluster join required")
    else
      self ! JoinSeedNodes(SeedNodes)
  }
  override def postStop(): Unit = {
    context.system.eventStream.unsubscribe(self)
    gossipTask.cancel()
    failureDetectorReaperTask.cancel()
    leaderActionsTask.cancel()
@ -323,6 +327,7 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
    case ClusterUserAction.Leave(address) ⇒ leaving(address)
    case SendGossipTo(address)            ⇒ sendGossipTo(address)
    case msg: SubscriptionMessage         ⇒ publisher forward msg
    case QuarantinedEvent(address, uid)   ⇒ quarantined(UniqueAddress(address, uid))
    case ClusterUserAction.JoinTo(address) ⇒
      logInfo("Trying to join [{}] when already part of a cluster, ignoring", address)
    case JoinSeedNodes(seedNodes) ⇒
@ -419,12 +424,11 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
        selfAddress.system, node.address.system)
    else {
      val localMembers = latestGossip.members
      val localUnreachable = latestGossip.overview.unreachable
      // check by address without uid to make sure that node with same host:port is not allowed
      // to join until previous node with that host:port has been removed from the cluster
      val alreadyMember = localMembers.exists(_.address == node.address)
-      val isUnreachable = localUnreachable.exists(_.address == node.address)
+      val isUnreachable = !latestGossip.overview.reachability.isReachable(node)
      if (alreadyMember)
        logInfo("Existing member [{}] is trying to join, ignoring", node)
@ -488,14 +492,13 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
  }
  /**
-   * This method is called when a member sees itself as Exiting.
+   * This method is called when a member sees itself as Exiting or Down.
   */
  def shutdown(): Unit = cluster.shutdown()
  /**
-   * State transition to DOW.
+   * State transition to DOWN.
-   * The node to DOWN is removed from the `members` set and put in the `unreachable` set (if not already there)
+   * Its status is set to DOWN. The node is also removed from the `seen` table.
   * and its status is set to DOWN. The node is also removed from the `seen` table.
   *
   * The node will eventually be removed by the leader, and only after removal a new node with same address can
   * join the cluster through the normal joining procedure.
@ -505,46 +508,50 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
    val localMembers = localGossip.members
    val localOverview = localGossip.overview
    val localSeen = localOverview.seen
-    val localUnreachableMembers = localOverview.unreachable
+    val localReachability = localOverview.reachability
-    // 1. check if the node to DOWN is in the `members` set
+    // check if the node to DOWN is in the `members` set
-    val downedMember: Option[Member] =
+    localMembers.collectFirst { case m if m.address == address ⇒ m.copy(status = Down) } match {
      localMembers.collectFirst { case m if m.address == address ⇒ m.copy(status = Down) }
    val newMembers = downedMember match {
      case Some(m) ⇒
-        logInfo("Marking node [{}] as [{}]", m.address, Down)
+        if (localReachability.isReachable(m.uniqueAddress))
-        localMembers - m
+          logInfo("Marking node [{}] as [{}]", m.address, Down)
-      case None ⇒ localMembers
+        else
          logInfo("Marking unreachable node [{}] as [{}]", m.address, Down)
        // replace member (changed status)
        val newMembers = localMembers - m + m
        // remove nodes marked as DOWN from the `seen` table
        val newSeen = localSeen - m.uniqueAddress
        // update gossip overview
        val newOverview = localOverview copy (seen = newSeen)
        val newGossip = localGossip copy (members = newMembers, overview = newOverview) // update gossip
        updateLatestGossip(newGossip)
        publish(latestGossip)
      case None ⇒
        logInfo("Ignoring down of unknown node [{}] as [{}]", address)
    }
-    // 2. check if the node to DOWN is in the `unreachable` set
+  }
    val newUnreachableMembers =
      localUnreachableMembers.map { member ⇒
        // no need to DOWN members already DOWN
        if (member.address == address && member.status != Down) {
          logInfo("Marking unreachable node [{}] as [{}]", member.address, Down)
          member copy (status = Down)
        } else member
      }
-    // 3. add the newly DOWNED members from the `members` (in step 1.) to the `newUnreachableMembers` set.
+  def quarantined(node: UniqueAddress): Unit = {
-    val newUnreachablePlusNewlyDownedMembers = newUnreachableMembers ++ downedMember
+    val localGossip = latestGossip
-
+    if (localGossip.hasMember(node)) {
-    // 4. remove nodes marked as DOWN from the `seen` table
+      val newReachability = latestGossip.overview.reachability.terminated(selfUniqueAddress, node)
-    val newSeen = localSeen -- newUnreachablePlusNewlyDownedMembers.collect { case m if m.status == Down ⇒ m.uniqueAddress }
+      val newOverview = localGossip.overview copy (reachability = newReachability)
-
+      val newGossip = localGossip copy (overview = newOverview)
-    // update gossip overview
+      updateLatestGossip(newGossip)
-    val newOverview = localOverview copy (seen = newSeen, unreachable = newUnreachablePlusNewlyDownedMembers)
+      log.warning("Cluster Node [{}] - Marking node as TERMINATED [{}], due to quarantine",
-    val newGossip = localGossip copy (overview = newOverview, members = newMembers) // update gossip
+        selfAddress, node.address)
-    updateLatestGossip(newGossip)
+      publish(latestGossip)
-
+      downing(node.address)
-    publish(latestGossip)
+    }
  }
  def receiveGossipStatus(status: GossipStatus): Unit = {
    val from = status.from
-    if (latestGossip.overview.unreachable.exists(_.uniqueAddress == from))
+    if (!latestGossip.overview.reachability.isReachable(selfUniqueAddress, from))
      logInfo("Ignoring received gossip status from unreachable [{}] ", from)
    else if (latestGossip.members.forall(_.uniqueAddress != from))
      log.debug("Cluster Node [{}] - Ignoring received gossip status from unknown [{}]", selfAddress, from)
@ -578,10 +585,10 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
    if (envelope.to != selfUniqueAddress) {
      logInfo("Ignoring received gossip intended for someone else, from [{}] to [{}]", from.address, envelope.to)
      Ignored
-    } else if (remoteGossip.overview.unreachable.exists(_.address == selfAddress)) {
+    } else if (!remoteGossip.overview.reachability.isReachable(selfUniqueAddress)) {
      logInfo("Ignoring received gossip with myself as unreachable, from [{}]", from.address)
      Ignored
-    } else if (localGossip.overview.unreachable.exists(_.uniqueAddress == from)) {
+    } else if (!localGossip.overview.reachability.isReachable(selfUniqueAddress, from)) {
      logInfo("Ignoring received gossip from unreachable [{}] ", from)
      Ignored
    } else if (localGossip.members.forall(_.uniqueAddress != from)) {
@ -634,7 +641,8 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
      publish(latestGossip)
-      if (latestGossip.member(selfUniqueAddress).status == Exiting)
+      val selfStatus = latestGossip.member(selfUniqueAddress).status
      if (selfStatus == Exiting || selfStatus == Down)
        shutdown()
      else if (talkback) {
        // send back gossip to sender when sender had different view, i.e. merge, or sender had
@ -653,23 +661,26 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
  def gossip(): Unit = {
    log.debug("Cluster Node [{}] - Initiating new round of gossip", selfAddress)
-    if (!isSingletonCluster && isAvailable) {
+    if (!isSingletonCluster) {
      val localGossip = latestGossip
      val preferredGossipTargets: Vector[UniqueAddress] =
        if (ThreadLocalRandom.current.nextDouble() < GossipDifferentViewProbability) { // If it's time to try to gossip to some nodes with a different view
          // gossip to a random alive member with preference to a member with older gossip version
-          localGossip.members.collect { case m if !localGossip.seenByNode(m.uniqueAddress) ⇒ m.uniqueAddress }(breakOut)
+          localGossip.members.collect {
-        } else Vector.empty[UniqueAddress]
+            case m if !localGossip.seenByNode(m.uniqueAddress) && validNodeForGossip(m.uniqueAddress) ⇒
              m.uniqueAddress
          }(breakOut)
        } else Vector.empty
      if (preferredGossipTargets.nonEmpty) {
-        val peer = selectRandomNode(preferredGossipTargets filterNot (_ == selfUniqueAddress))
+        val peer = selectRandomNode(preferredGossipTargets)
        // send full gossip because it has different view
        peer foreach gossipTo
      } else {
        // Fall back to localGossip; important to not accidentally use `map` of the SortedSet, since the original order is not preserved)
        val peer = selectRandomNode(localGossip.members.toIndexedSeq.collect {
-          case m if m.uniqueAddress != selfUniqueAddress ⇒ m.uniqueAddress
+          case m if validNodeForGossip(m.uniqueAddress) ⇒ m.uniqueAddress
        })
        peer foreach { node ⇒
          if (localGossip.seenByNode(node)) gossipStatusTo(node)
@ -684,8 +695,8 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
   * assigning partitions etc.
   */
  def leaderActions(): Unit =
-    if (latestGossip.isLeader(selfUniqueAddress) && isAvailable) {
+    if (latestGossip.isLeader(selfUniqueAddress)) {
-      // only run the leader actions if we are the LEADER and available
+      // only run the leader actions if we are the LEADER
      if (AutoDown)
        leaderAutoDownActions()
@ -712,7 +723,6 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
    val localMembers = localGossip.members
    val localOverview = localGossip.overview
    val localSeen = localOverview.seen
    val localUnreachableMembers = localOverview.unreachable
    val hasPartionHandoffCompletedSuccessfully: Boolean = {
      // TODO implement partion handoff and a check if it is completed - now just returns TRUE - e.g. has completed successfully
@ -726,9 +736,11 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
    }
    def isJoiningToUp(m: Member): Boolean = m.status == Joining && enoughMembers
-    val (removedUnreachable, newUnreachable) = localUnreachableMembers partition { m ⇒
+    val removedUnreachable = for {
-      Gossip.removeUnreachableWithMemberStatus(m.status)
+      node ← localOverview.reachability.allUnreachableOrTerminated
-    }
+      m = localGossip.member(node)
      if Gossip.removeUnreachableWithMemberStatus(m.status)
    } yield m
    val changedMembers = localMembers collect {
      var upNumber = 0
@ -758,12 +770,15 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
      // handle changes
      // replace changed members
-      val newMembers = localMembers -- changedMembers ++ changedMembers
+      val newMembers = changedMembers ++ localMembers -- removedUnreachable
      // removing REMOVED nodes from the `seen` table
-      val newSeen = localSeen -- removedUnreachable.map(_.uniqueAddress)
+      val removed = removedUnreachable.map(_.uniqueAddress)
-      val newOverview = localOverview copy (seen = newSeen, unreachable = newUnreachable) // update gossip overview
+      val newSeen = localSeen -- removed
-      val newGossip = localGossip copy (members = newMembers, overview = newOverview) // update gossip
+      // removing REMOVED nodes from the `reachability` table
      val newReachability = localOverview.reachability.remove(removed)
      val newOverview = localOverview copy (seen = newSeen, reachability = newReachability)
      val newGossip = localGossip copy (members = newMembers, overview = newOverview)
      updateLatestGossip(newGossip)
@ -802,25 +817,27 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
   */
  def leaderAutoDownActions(): Unit = {
    val localGossip = latestGossip
    val localMembers = localGossip.members
    val localOverview = localGossip.overview
    val localSeen = localOverview.seen
    val localUnreachableMembers = localOverview.unreachable
-    val changedUnreachableMembers = localUnreachableMembers collect {
+    val changedUnreachableMembers = for {
-      case m if !Gossip.convergenceSkipUnreachableWithMemberStatus(m.status) ⇒ m copy (status = Down)
+      node ← localOverview.reachability.allUnreachableOrTerminated
-    }
+      m = localGossip.member(node)
      if m.status != Removed && !Gossip.convergenceSkipUnreachableWithMemberStatus(m.status)
    } yield m.copy(status = Down)
    if (changedUnreachableMembers.nonEmpty) {
      // handle changes
      // replace changed unreachable
-      val newUnreachableMembers = localUnreachableMembers -- changedUnreachableMembers ++ changedUnreachableMembers
+      val newMembers = localMembers -- changedUnreachableMembers ++ changedUnreachableMembers
      // removing nodes marked as Down/Exiting from the `seen` table
      val newSeen = localSeen -- changedUnreachableMembers.map(_.uniqueAddress)
-      val newOverview = localOverview copy (seen = newSeen, unreachable = newUnreachableMembers) // update gossip overview
+      val newOverview = localOverview copy (seen = newSeen) // update gossip overview
-      val newGossip = localGossip copy (overview = newOverview) // update gossip
+      val newGossip = localGossip copy (members = newMembers, overview = newOverview) // update gossip
      updateLatestGossip(newGossip)
@ -834,39 +851,54 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
  }
  /**
-   * Reaps the unreachable members (moves them to the `unreachable` list in the cluster overview) according to the failure detector's verdict.
+   * Reaps the unreachable members according to the failure detector's verdict.
   */
  def reapUnreachableMembers(): Unit = {
-    if (!isSingletonCluster && isAvailable) {
+    if (!isSingletonCluster) {
-      // only scrutinize if we are a non-singleton cluster and available
+      // only scrutinize if we are a non-singleton cluster
      val localGossip = latestGossip
      val localOverview = localGossip.overview
      val localMembers = localGossip.members
      val localUnreachableMembers = localGossip.overview.unreachable
      val newlyDetectedUnreachableMembers = localMembers filterNot { member ⇒
-        member.uniqueAddress == selfUniqueAddress || failureDetector.isAvailable(member.address)
+        member.uniqueAddress == selfUniqueAddress ||
          localOverview.reachability.status(selfUniqueAddress, member.uniqueAddress) == Reachability.Unreachable ||
          localOverview.reachability.status(selfUniqueAddress, member.uniqueAddress) == Reachability.Terminated ||
          failureDetector.isAvailable(member.address)
      }
-      if (newlyDetectedUnreachableMembers.nonEmpty) {
+      val newlyDetectedReachableMembers = localOverview.reachability.allUnreachableFrom(selfUniqueAddress) collect {
        case node if node != selfUniqueAddress && failureDetector.isAvailable(node.address) ⇒
          localGossip.member(node)
      }
-        val newMembers = localMembers -- newlyDetectedUnreachableMembers
+      if (newlyDetectedUnreachableMembers.nonEmpty || newlyDetectedReachableMembers.nonEmpty) {
        val newUnreachableMembers = localUnreachableMembers ++ newlyDetectedUnreachableMembers
-        val newOverview = localOverview copy (unreachable = newUnreachableMembers)
+        val newReachability1 = (localOverview.reachability /: newlyDetectedUnreachableMembers) {
-        val newGossip = localGossip copy (overview = newOverview, members = newMembers)
+          (reachability, m) ⇒ reachability.unreachable(selfUniqueAddress, m.uniqueAddress)
        }
        val newReachability2 = (newReachability1 /: newlyDetectedReachableMembers) {
          (reachability, m) ⇒ reachability.reachable(selfUniqueAddress, m.uniqueAddress)
        }
-        updateLatestGossip(newGossip)
+        if (newReachability2 ne localOverview.reachability) {
          val newOverview = localOverview copy (reachability = newReachability2)
          val newGossip = localGossip copy (overview = newOverview)
-        val (exiting, nonExiting) = newlyDetectedUnreachableMembers.partition(_.status == Exiting)
+          updateLatestGossip(newGossip)
        if (nonExiting.nonEmpty)
          log.error("Cluster Node [{}] - Marking node(s) as UNREACHABLE [{}]", selfAddress, nonExiting.mkString(", "))
        if (exiting.nonEmpty)
          logInfo("Marking exiting node(s) as UNREACHABLE [{}]. This is expected and they will be removed.",
            exiting.mkString(", "))
-        publish(latestGossip)
+          val (exiting, nonExiting) = newlyDetectedUnreachableMembers.partition(_.status == Exiting)
          if (nonExiting.nonEmpty)
            log.warning("Cluster Node [{}] - Marking node(s) as UNREACHABLE [{}]", selfAddress, nonExiting.mkString(", "))
          if (exiting.nonEmpty)
            logInfo("Marking exiting node(s) as UNREACHABLE [{}]. This is expected and they will be removed.",
              exiting.mkString(", "))
          if (newlyDetectedReachableMembers.nonEmpty)
            logInfo("Marking node(s) as REACHABLE [{}]", newlyDetectedReachableMembers.mkString(", "))
          publish(latestGossip)
        }
      }
    }
  }
@ -877,8 +909,6 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
  def isSingletonCluster: Boolean = latestGossip.isSingletonCluster
  def isAvailable: Boolean = !latestGossip.isUnreachable(selfUniqueAddress)
  // needed for tests
  def sendGossipTo(address: Address): Unit = {
    latestGossip.members.foreach(m ⇒
@ -906,7 +936,8 @@ private[cluster] class ClusterCoreDaemon(publisher: ActorRef) extends Actor with
      clusterCore(node.address) ! GossipStatus(selfUniqueAddress, latestGossip.version)
  def validNodeForGossip(node: UniqueAddress): Boolean =
-    (node != selfUniqueAddress && latestGossip.members.exists(_.uniqueAddress == node))
+    (node != selfUniqueAddress && latestGossip.hasMember(node) &&
      latestGossip.overview.reachability.isReachable(node))
  def updateLatestGossip(newGossip: Gossip): Unit = {
    // Updating the vclock version for the changes
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterEvent.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterEvent.scala
@ -10,7 +10,6 @@ import akka.actor.{ Actor, ActorLogging, ActorRef, Address }
 import akka.cluster.ClusterEvent._
 import akka.cluster.MemberStatus._
 import akka.event.EventStream
 import akka.actor.AddressTerminated
 import akka.dispatch.{ UnboundedMessageQueueSemantics, RequiresMessageQueue }
 /**
@ -144,10 +143,23 @@ object ClusterEvent {
    def getLeader: Address = leader orNull
  }
  /**
   * Marker interface to facilitate subscription of
   * both [[UnreachableMember]] and [[ReachableMember]].
   */
  sealed trait ReachabilityEvent extends ClusterDomainEvent
  /**
   * A member is considered as unreachable by the failure detector.
   */
-  case class UnreachableMember(member: Member) extends ClusterDomainEvent
+  case class UnreachableMember(member: Member) extends ReachabilityEvent
  /**
   * A member is considered as reachable by the failure detector
   * after having been unreachable.
   * @see [[UnreachableMember]]
   */
  case class ReachableMember(member: Member) extends ReachabilityEvent
  /**
   * Current snapshot of cluster node metrics. Published to subscribers.
@ -166,6 +178,11 @@ object ClusterEvent {
   */
  private[cluster] case class SeenChanged(convergence: Boolean, seenBy: Set[Address]) extends ClusterDomainEvent
  /**
   * INTERNAL API
   */
  private[cluster] case class ReachabilityChanged(reachability: Reachability) extends ClusterDomainEvent
  /**
   * INTERNAL API
   */
@ -179,10 +196,24 @@ object ClusterEvent {
  private[cluster] def diffUnreachable(oldGossip: Gossip, newGossip: Gossip): immutable.Seq[UnreachableMember] =
    if (newGossip eq oldGossip) Nil
    else {
-      val newUnreachable = newGossip.overview.unreachable -- oldGossip.overview.unreachable
+      val oldUnreachableNodes = oldGossip.overview.reachability.allUnreachableOrTerminated
-      val unreachableEvents = newUnreachable map UnreachableMember
+      (newGossip.overview.reachability.allUnreachableOrTerminated.collect {
        case node if !oldUnreachableNodes.contains(node) ⇒
          UnreachableMember(newGossip.member(node))
      })(collection.breakOut)
    }
  /**
   * INTERNAL API
   */
  private[cluster] def diffReachable(oldGossip: Gossip, newGossip: Gossip): immutable.Seq[ReachableMember] =
    if (newGossip eq oldGossip) Nil
    else {
      (oldGossip.overview.reachability.allUnreachable.collect {
        case node if newGossip.hasMember(node) && newGossip.overview.reachability.isReachable(node) ⇒
          ReachableMember(newGossip.member(node))
      })(collection.breakOut)
      immutable.Seq.empty ++ unreachableEvents
    }
  /**
@ -202,10 +233,7 @@ object ClusterEvent {
        // no events for other transitions
      }
-      val allNewUnreachable = newGossip.overview.unreachable -- oldGossip.overview.unreachable
+      val removedMembers = oldGossip.members -- newGossip.members
      val removedMembers = (oldGossip.members -- newGossip.members -- newGossip.overview.unreachable) ++
        (oldGossip.overview.unreachable -- newGossip.overview.unreachable)
      val removedEvents = removedMembers.map(m ⇒ MemberRemoved(m.copy(status = Removed), m.status))
      (new VectorBuilder[MemberEvent]() ++= memberEvents ++= removedEvents).result()
@ -243,6 +271,14 @@ object ClusterEvent {
        List(SeenChanged(newConvergence, newSeenBy.map(_.address)))
      else Nil
    }
  /**
   * INTERNAL API
   */
  private[cluster] def diffReachability(oldGossip: Gossip, newGossip: Gossip): immutable.Seq[ReachabilityChanged] =
    if (newGossip.overview.reachability eq oldGossip.overview.reachability) Nil
    else List(ReachabilityChanged(newGossip.overview.reachability))
 }
 /**
@ -283,7 +319,7 @@ private[cluster] final class ClusterDomainEventPublisher extends Actor with Acto
  def publishCurrentClusterState(receiver: Option[ActorRef]): Unit = {
    val state = CurrentClusterState(
      members = latestGossip.members,
-      unreachable = latestGossip.overview.unreachable,
+      unreachable = latestGossip.overview.reachability.allUnreachableOrTerminated map latestGossip.member,
      seenBy = latestGossip.seenBy.map(_.address),
      leader = latestGossip.leader.map(_.address),
      roleLeaderMap = latestGossip.allRoles.map(r ⇒ r -> latestGossip.roleLeader(r).map(_.address))(collection.breakOut))
@ -307,13 +343,14 @@ private[cluster] final class ClusterDomainEventPublisher extends Actor with Acto
    val oldGossip = latestGossip
    // keep the latestGossip to be sent to new subscribers
    latestGossip = newGossip
    // first publish the diffUnreachable between the last two gossips
    diffUnreachable(oldGossip, newGossip) foreach publish
    diffReachable(oldGossip, newGossip) foreach publish
    diffMemberEvents(oldGossip, newGossip) foreach publish
    diffLeader(oldGossip, newGossip) foreach publish
    diffRolesLeader(oldGossip, newGossip) foreach publish
    // publish internal SeenState for testing purposes
    diffSeen(oldGossip, newGossip) foreach publish
    diffReachability(oldGossip, newGossip) foreach publish
  }
  def publishInternalStats(currentStats: CurrentInternalStats): Unit = publish(currentStats)
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterHeartbeat.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterHeartbeat.scala
@ -26,6 +26,12 @@ private[akka] object ClusterHeartbeatReceiver {
   * this node.
   */
  case class EndHeartbeat(from: Address) extends ClusterMessage
  /**
   * Acknowledgment that `EndHeartbeat` was received and heartbeating
   * can stop.
   */
  case class EndHeartbeatAck(from: Address) extends ClusterMessage
 }
 /**
@ -39,10 +45,13 @@ private[cluster] final class ClusterHeartbeatReceiver extends Actor with ActorLo
  import ClusterHeartbeatReceiver._
  val failureDetector = Cluster(context.system).failureDetector
  val selfEndHeartbeatAck = EndHeartbeatAck(Cluster(context.system).selfAddress)
  def receive = {
-    case Heartbeat(from)    ⇒ failureDetector heartbeat from
+    case Heartbeat(from) ⇒ failureDetector heartbeat from
-    case EndHeartbeat(from) ⇒ failureDetector remove from
+    case EndHeartbeat(from) ⇒
      failureDetector remove from
      sender ! selfEndHeartbeatAck
  }
 }
@ -103,7 +112,6 @@ private[cluster] final class ClusterHeartbeatSender extends Actor with ActorLogg
  override def preStart(): Unit = {
    cluster.subscribe(self, classOf[MemberEvent])
    cluster.subscribe(self, classOf[UnreachableMember])
  }
  override def postStop(): Unit = {
@ -126,7 +134,6 @@ private[cluster] final class ClusterHeartbeatSender extends Actor with ActorLogg
  def receive = {
    case HeartbeatTick                ⇒ heartbeat()
    case MemberUp(m)                  ⇒ addMember(m)
    case UnreachableMember(m)         ⇒ removeMember(m)
    case MemberRemoved(m, _)          ⇒ removeMember(m)
    case s: CurrentClusterState       ⇒ reset(s)
    case MemberExited(m)              ⇒ memberExited(m)
@ -134,6 +141,7 @@ private[cluster] final class ClusterHeartbeatSender extends Actor with ActorLogg
    case HeartbeatRequest(from)       ⇒ addHeartbeatRequest(from)
    case SendHeartbeatRequest(to)     ⇒ sendHeartbeatRequest(to)
    case ExpectedFirstHeartbeat(from) ⇒ triggerFirstHeartbeat(from)
    case EndHeartbeatAck(from)        ⇒ ackEndHeartbeat(from)
  }
  def reset(snapshot: CurrentClusterState): Unit =
@ -183,15 +191,12 @@ private[cluster] final class ClusterHeartbeatSender extends Actor with ActorLogg
      heartbeatReceiver(to) ! selfHeartbeat
    }
-    // When sending heartbeats to a node is stopped a few `EndHeartbeat` messages is
+    // When sending heartbeats to a node is stopped a `EndHeartbeat` messages are
-    // sent to notify it that no more heartbeats will be sent.
+    // sent to notify it that no more heartbeats will be sent. This will continue
-    for ((to, count) ← state.ending) {
+    // until `EndHeartbeatAck` is received.
    for (to ← state.ending) {
      log.debug("Cluster Node [{}] - EndHeartbeat to [{}]", cluster.selfAddress, to)
      heartbeatReceiver(to) ! selfEndHeartbeat
      if (count == NumberOfEndHeartbeats)
        state = state.removeEnding(to)
      else
        state = state.increaseEndingCount(to)
    }
    // request heartbeats from expected sender node if no heartbeat messages has been received
@ -202,6 +207,10 @@ private[cluster] final class ClusterHeartbeatSender extends Actor with ActorLogg
  }
  def ackEndHeartbeat(from: Address): Unit = {
    state.removeEnding(from)
  }
 }
 /**
@ -225,7 +234,7 @@ private[cluster] object ClusterHeartbeatSenderState {
    val curr = ring.myReceivers
    // start ending process for nodes not selected any more
    // abort ending process for nodes that have been selected again
-    val end = old.ending ++ (old.current -- curr).map(_ -> 0) -- curr
+    val end = old.ending ++ (old.current -- curr) -- curr
    old.copy(ring = ring, current = curr, ending = end, heartbeatRequest = old.heartbeatRequest -- curr)
  }
@ -243,14 +252,14 @@ private[cluster] object ClusterHeartbeatSenderState {
 private[cluster] case class ClusterHeartbeatSenderState private (
  ring: HeartbeatNodeRing,
  current: Set[Address] = Set.empty,
-  ending: Map[Address, Int] = Map.empty,
+  ending: Set[Address] = Set.empty,
  heartbeatRequest: Map[Address, Deadline] = Map.empty) {
  // TODO can be disabled as optimization
  assertInvariants()
  private def assertInvariants(): Unit = {
-    val currentAndEnding = current.intersect(ending.keySet)
+    val currentAndEnding = current.intersect(ending)
    require(currentAndEnding.isEmpty,
      s"Same nodes in current and ending not allowed, got [${currentAndEnding}]")
@ -282,7 +291,7 @@ private[cluster] case class ClusterHeartbeatSenderState private (
  private def removeHeartbeatRequest(address: Address): ClusterHeartbeatSenderState = {
    if (heartbeatRequest contains address)
-      copy(heartbeatRequest = heartbeatRequest - address, ending = ending + (address -> 0))
+      copy(heartbeatRequest = heartbeatRequest - address, ending = ending + address)
    else this
  }
@ -298,13 +307,11 @@ private[cluster] case class ClusterHeartbeatSenderState private (
    val overdue = heartbeatRequest collect { case (address, deadline) if deadline.isOverdue ⇒ address }
    if (overdue.isEmpty) this
    else
-      copy(ending = ending ++ overdue.map(_ -> 0), heartbeatRequest = heartbeatRequest -- overdue)
+      copy(ending = ending ++ overdue, heartbeatRequest = heartbeatRequest -- overdue)
  }
  def removeEnding(a: Address): ClusterHeartbeatSenderState = copy(ending = ending - a)
  def increaseEndingCount(a: Address): ClusterHeartbeatSenderState = copy(ending = ending + (a -> (ending(a) + 1)))
 }
 /**
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterJmx.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterJmx.scala
@ -35,13 +35,45 @@ trait ClusterNodeMBean {
  def getUnreachable: String
  /*
-   * String that will list all nodes in the node ring as follows:
+   * JSON format of the status of all nodes in the cluster as follows:
   * {{{
-   * Members:
+   * {
-   *         Member(address = akka://system0@localhost:5550, status = Up)
+   *   "self-address": "akka://system@host1:2552",
-   *         Member(address = akka://system1@localhost:5551, status = Up)
+   *   "members": [
-   * Unreachable:
+   *     {
-   *         Member(address = akka://system2@localhost:5553, status = Down)
+   *       "address": "akka://system@host1:2552",
   *       "status": "Up"
   *     },
   *     {
   *       "address": "akka://system@host2:2552",
   *       "status": "Up"
   *     },
   *     {
   *       "address": "akka://system@host3:2552",
   *       "status": "Down"
   *     },
   *     {
   *       "address": "akka://system@host4:2552",
   *       "status": "Joining"
   *     }
   *   ],
   *   "unreachable": [
   *     {
   *       "node": "akka://system@host2:2552",
   *       "observed-by": [
   *         "akka://system@host1:2552",
   *         "akka://system@host3:2552"
   *       ]
   *     },
   *     {
   *       "node": "akka://system@host3:2552",
   *       "observed-by": [
   *         "akka://system@host1:2552",
   *         "akka://system@host2:2552"
   *       ]
   *     }
   *   ]
   * }
   * }}}
   */
  def getClusterStatus: String
@ -102,9 +134,33 @@ private[akka] class ClusterJmx(cluster: Cluster, log: LoggingAdapter) {
      // JMX attributes (bean-style)
      def getClusterStatus: String = {
-        val unreachable = clusterView.unreachableMembers
+        val members = clusterView.members.toSeq.sorted(Member.ordering).map { m ⇒
-        "\nMembers:\n\t" + clusterView.members.mkString("\n\t") +
+          s"""{
-          { if (unreachable.nonEmpty) "\nUnreachable:\n\t" + unreachable.mkString("\n\t") else "" }
+              |      "address": "${m.address}",
              |      "status": "${m.status}"
              |    }""".stripMargin
        } mkString (",\n    ")
        val unreachable = clusterView.reachability.observersGroupedByUnreachable.toSeq.sortBy(_._1).map {
          case (subject, observers) ⇒
            s"""{
              |      "node": "${subject.address}",
              |      "observed-by": [
              |        ${observers.toSeq.sorted.map(_.address).mkString("\"", "\",\n        \"", "\"")}
              |      ]
              |    }""".stripMargin
        } mkString (",\n")
        s"""{
        |  "self-address": "${clusterView.selfAddress}",
        |  "members": [
        |    ${members}
        |  ],
        |  "unreachable": [
        |    ${unreachable}
        |  ]
        |}
        |""".stripMargin
      }
      def getMembers: String =
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterMetricsCollector.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterMetricsCollector.scala
@ -78,7 +78,7 @@ private[cluster] class ClusterMetricsCollector(publisher: ActorRef) extends Acto
  override def preStart(): Unit = {
    cluster.subscribe(self, classOf[MemberEvent])
-    cluster.subscribe(self, classOf[UnreachableMember])
+    cluster.subscribe(self, classOf[ReachabilityEvent])
    logInfo("Metrics collection has started successfully")
  }
@ -91,6 +91,7 @@ private[cluster] class ClusterMetricsCollector(publisher: ActorRef) extends Acto
    case MemberRemoved(m, _)        ⇒ removeMember(m)
    case MemberExited(m)            ⇒ removeMember(m)
    case UnreachableMember(m)       ⇒ removeMember(m)
    case ReachableMember(m)         ⇒ if (m.status == Up) addMember(m)
    case _: MemberEvent             ⇒ // not interested in other types of MemberEvent
  }
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterReadView.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterReadView.scala
@ -26,6 +26,9 @@ private[akka] class ClusterReadView(cluster: Cluster) extends Closeable {
  @volatile
  private var state: CurrentClusterState = CurrentClusterState()
  @volatile
  private var _reachability: Reachability = Reachability.empty
  /**
   * Current internal cluster stats, updated periodically via event bus.
   */
@ -50,15 +53,22 @@ private[akka] class ClusterReadView(cluster: Cluster) extends Closeable {
        case e: ClusterDomainEvent ⇒ e match {
          case SeenChanged(convergence, seenBy) ⇒
            state = state.copy(seenBy = seenBy)
          case ReachabilityChanged(reachability) ⇒
            _reachability = reachability
          case MemberRemoved(member, _) ⇒
            state = state.copy(members = state.members - member, unreachable = state.unreachable - member)
          case UnreachableMember(member) ⇒
            // replace current member with new member (might have different status, only address is used in equals)
-            state = state.copy(members = state.members - member, unreachable = state.unreachable - member + member)
+            state = state.copy(unreachable = state.unreachable - member + member)
          case ReachableMember(member) ⇒
            state = state.copy(unreachable = state.unreachable - member)
          case event: MemberEvent ⇒
            // replace current member with new member (might have different status, only address is used in equals)
            val newUnreachable =
              if (state.unreachable.contains(event.member)) state.unreachable - event.member + event.member
              else state.unreachable
            state = state.copy(members = state.members - event.member + event.member,
-              unreachable = state.unreachable - event.member)
+              unreachable = newUnreachable)
          case LeaderChanged(leader) ⇒
            state = state.copy(leader = leader)
          case RoleLeaderChanged(role, leader) ⇒
@ -73,7 +83,7 @@ private[akka] class ClusterReadView(cluster: Cluster) extends Closeable {
  def self: Member = {
    import cluster.selfUniqueAddress
-    state.members.find(_.uniqueAddress == selfUniqueAddress).orElse(state.unreachable.find(_.uniqueAddress == selfUniqueAddress)).
+    state.members.find(_.uniqueAddress == selfUniqueAddress).
      getOrElse(Member(selfUniqueAddress, cluster.selfRoles).copy(status = MemberStatus.Removed))
  }
@ -127,6 +137,8 @@ private[akka] class ClusterReadView(cluster: Cluster) extends Closeable {
      myself.status != MemberStatus.Removed
  }
  def reachability: Reachability = _reachability
  /**
   * Current cluster metrics.
   */
--- a/akka-cluster/src/main/scala/akka/cluster/ClusterSettings.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/ClusterSettings.scala
@ -34,9 +34,6 @@ final class ClusterSettings(val config: Config, val systemName: String) {
  val HeartbeatRequestTimeToLive: FiniteDuration = {
    Duration(FailureDetectorConfig.getMilliseconds("heartbeat-request.time-to-live"), MILLISECONDS)
  } requiring (_ > Duration.Zero, "failure-detector.heartbeat-request.time-to-live > 0")
  val NumberOfEndHeartbeats: Int = {
    FailureDetectorConfig.getInt("nr-of-end-heartbeats")
  } requiring (_ > 0, "failure-detector.nr-of-end-heartbeats must be > 0")
  val MonitoredByNrOfMembers: Int = {
    FailureDetectorConfig.getInt("monitored-by-nr-of-members")
  } requiring (_ > 0, "failure-detector.monitored-by-nr-of-members must be > 0")
--- a/akka-cluster/src/main/scala/akka/cluster/Gossip.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/Gossip.scala
@ -67,24 +67,25 @@ private[cluster] case class Gossip(
  assertInvariants()
  private def assertInvariants(): Unit = {
    val unreachableAndLive = members.intersect(overview.unreachable)
    if (unreachableAndLive.nonEmpty)
      throw new IllegalArgumentException("Same nodes in both members and unreachable is not allowed, got [%s]"
        format unreachableAndLive.mkString(", "))
-    val allowedLiveMemberStatus: Set[MemberStatus] = Set(Joining, Up, Leaving, Exiting)
+    if (members.exists(_.status == Removed))
-    def hasNotAllowedLiveMemberStatus(m: Member) = !allowedLiveMemberStatus(m.status)
+      throw new IllegalArgumentException(s"Live members must have status [${Removed}], " +
-    if (members exists hasNotAllowedLiveMemberStatus)
+        s"got [${members.filter(_.status == Removed)}]")
      throw new IllegalArgumentException("Live members must have status [%s], got [%s]"
        format (allowedLiveMemberStatus.mkString(", "),
          (members filter hasNotAllowedLiveMemberStatus).mkString(", ")))
-    val seenButNotMember = overview.seen -- members.map(_.uniqueAddress) -- overview.unreachable.map(_.uniqueAddress)
+    val inReachabilityButNotMember = overview.reachability.allObservers -- members.map(_.uniqueAddress)
    if (inReachabilityButNotMember.nonEmpty)
      throw new IllegalArgumentException("Nodes not part of cluster in reachability table, got [%s]"
        format inReachabilityButNotMember.mkString(", "))
    val seenButNotMember = overview.seen -- members.map(_.uniqueAddress)
    if (seenButNotMember.nonEmpty)
      throw new IllegalArgumentException("Nodes not part of cluster have marked the Gossip as seen, got [%s]"
        format seenButNotMember.mkString(", "))
  }
  @transient private lazy val membersMap: Map[UniqueAddress, Member] =
    members.map(m ⇒ m.uniqueAddress -> m)(collection.breakOut)
  /**
   * Increments the version for this 'Node'.
   */
@ -138,17 +139,17 @@ private[cluster] case class Gossip(
    // 1. merge vector clocks
    val mergedVClock = this.version merge that.version
-    // 2. merge unreachable by selecting the single Member with highest MemberStatus out of the Member groups
+    // 2. merge members by selecting the single Member with highest MemberStatus out of the Member groups
-    val mergedUnreachable = Member.pickHighestPriority(this.overview.unreachable, that.overview.unreachable)
+    val mergedMembers = Gossip.emptyMembers ++ Member.pickHighestPriority(this.members, that.members)
-    // 3. merge members by selecting the single Member with highest MemberStatus out of the Member groups,
+    // 3. merge reachability table by picking records with highest version
-    //    and exclude unreachable
+    val mergedReachability = this.overview.reachability.merge(mergedMembers.map(_.uniqueAddress),
-    val mergedMembers = Gossip.emptyMembers ++ Member.pickHighestPriority(this.members, that.members).filterNot(mergedUnreachable.contains)
+      that.overview.reachability)
    // 4. Nobody can have seen this new gossip yet
    val mergedSeen = Set.empty[UniqueAddress]
-    Gossip(mergedMembers, GossipOverview(mergedSeen, mergedUnreachable), mergedVClock)
+    Gossip(mergedMembers, GossipOverview(mergedSeen, mergedReachability), mergedVClock)
  }
  /**
@ -165,7 +166,8 @@ private[cluster] case class Gossip(
    // When that is done we check that all members with a convergence
    // status is in the seen table and has the latest vector clock
    // version
-    overview.unreachable.forall(m ⇒ Gossip.convergenceSkipUnreachableWithMemberStatus(m.status)) &&
+    val unreachable = overview.reachability.allUnreachableOrTerminated map member
    unreachable.forall(m ⇒ Gossip.convergenceSkipUnreachableWithMemberStatus(m.status)) &&
      !members.exists(m ⇒ Gossip.convergenceMemberStatus(m.status) && !seenByNode(m.uniqueAddress))
  }
@ -176,34 +178,28 @@ private[cluster] case class Gossip(
  def roleLeader(role: String): Option[UniqueAddress] = leaderOf(members.filter(_.hasRole(role)))
  private def leaderOf(mbrs: immutable.SortedSet[Member]): Option[UniqueAddress] = {
-    if (mbrs.isEmpty) None
+    val reachableMembers =
-    else mbrs.find(m ⇒ Gossip.leaderMemberStatus(m.status)).
+      if (overview.reachability.isAllReachable) mbrs
-      orElse(Some(mbrs.min(Member.leaderStatusOrdering))).map(_.uniqueAddress)
+      else mbrs.filter(m ⇒ overview.reachability.isReachable(m.uniqueAddress))
    if (reachableMembers.isEmpty) None
    else reachableMembers.find(m ⇒ Gossip.leaderMemberStatus(m.status)).
      orElse(Some(reachableMembers.min(Member.leaderStatusOrdering))).map(_.uniqueAddress)
  }
  def allRoles: Set[String] = members.flatMap(_.roles)
  def isSingletonCluster: Boolean = members.size == 1
  /**
   * Returns true if the node is in the unreachable set
   */
  def isUnreachable(node: UniqueAddress): Boolean =
    overview.unreachable exists { _.uniqueAddress == node }
  def member(node: UniqueAddress): Member = {
-    members.find(_.uniqueAddress == node).orElse(overview.unreachable.find(_.uniqueAddress == node)).
+    membersMap.getOrElse(node,
-      getOrElse(Member.removed(node)) // placeholder for removed member
+      Member.removed(node)) // placeholder for removed member
  }
  def hasMember(node: UniqueAddress): Boolean = membersMap.contains(node)
  def youngestMember: Member = {
    require(members.nonEmpty, "No youngest when no members")
-    def maxByUpNumber(mbrs: Iterable[Member]): Member =
+    members.maxBy(m ⇒ if (m.upNumber == Int.MaxValue) 0 else m.upNumber)
      mbrs.maxBy(m ⇒ if (m.upNumber == Int.MaxValue) 0 else m.upNumber)
    if (overview.unreachable.isEmpty)
      maxByUpNumber(members)
    else
      maxByUpNumber(members ++ overview.unreachable)
  }
  override def toString =
@ -217,10 +213,10 @@ private[cluster] case class Gossip(
@SerialVersionUID(1L)
 private[cluster] case class GossipOverview(
  seen: Set[UniqueAddress] = Set.empty,
-  unreachable: Set[Member] = Set.empty) {
+  reachability: Reachability = Reachability.empty) {
  override def toString =
-    s"GossipOverview(unreachable = [${unreachable.mkString(", ")}], seen = [${seen.mkString(", ")}])"
+    s"GossipOverview(reachability = [$reachability], seen = [${seen.mkString(", ")}])"
 }
 /**
--- a/akka-cluster/src/main/scala/akka/cluster/Member.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/Member.scala
@ -213,10 +213,9 @@ object MemberStatus {
 */
@SerialVersionUID(1L)
 private[cluster] case class UniqueAddress(address: Address, uid: Int) extends Ordered[UniqueAddress] {
-  @transient
+  override def hashCode = uid
  override lazy val hashCode = scala.util.hashing.MurmurHash3.productHash(this)
-  override def compare(that: UniqueAddress): Int = {
+  def compare(that: UniqueAddress): Int = {
    val result = Member.addressOrdering.compare(this.address, that.address)
    if (result == 0) if (this.uid < that.uid) -1 else if (this.uid == that.uid) 0 else 1
    else result
--- a/akka-cluster/src/main/scala/akka/cluster/Reachability.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/Reachability.scala
@ -0,0 +1,294 @@
 /**
 * Copyright (C) 2009-2013 Typesafe Inc. <http://www.typesafe.com>
 */
 package akka.cluster
 import scala.annotation.tailrec
 import scala.collection.immutable
 import scala.collection.breakOut
 import akka.actor.Address
 /**
 * INTERNAL API
 */
 private[cluster] object Reachability {
  val empty = new Reachability(Vector.empty, Map.empty)
  def apply(records: immutable.IndexedSeq[Record], versions: Map[UniqueAddress, Long]): Reachability =
    new Reachability(records, versions)
  def create(records: immutable.Seq[Record], versions: Map[UniqueAddress, Long]): Reachability = records match {
    case r: immutable.IndexedSeq[Record] ⇒ apply(r, versions)
    case _                               ⇒ apply(records.toVector, versions)
  }
  @SerialVersionUID(1L)
  case class Record(observer: UniqueAddress, subject: UniqueAddress, status: ReachabilityStatus, version: Long)
  sealed trait ReachabilityStatus
  @SerialVersionUID(1L) case object Reachable extends ReachabilityStatus
  @SerialVersionUID(1L) case object Unreachable extends ReachabilityStatus
  @SerialVersionUID(1L) case object Terminated extends ReachabilityStatus
 }
 /**
 * INTERNAL API
 *
 * Immutable data structure that holds the reachability status of subject nodes as seen
 * from observer nodes. Failure detector for the subject nodes exist on the
 * observer nodes. Changes (reachable, unreachable, terminated) are only performed
 * by observer nodes to its own records. Each change bumps the version number of the
 * record, and thereby it is always possible to determine which record is newest when
 * merging two instances.
 *
 * Aggregated status of a subject node is defined as (in this order):
 * - Terminated if any observer node considers it as Terminated
 * - Unreachable if any observer node considers it as Unreachable
 * - Reachable otherwise, i.e. no observer node considers it as Unreachable
 */
@SerialVersionUID(1L)
 private[cluster] class Reachability private (
  val records: immutable.IndexedSeq[Reachability.Record],
  val versions: Map[UniqueAddress, Long]) extends Serializable {
  import Reachability._
  private class Cache {
    val (observerRowsMap, allUnreachable, allTerminated) = {
      if (records.isEmpty) {
        val observerRowsMap = Map.empty[UniqueAddress, Map[UniqueAddress, Reachability.Record]]
        val allTerminated = Set.empty[UniqueAddress]
        val allUnreachable = Set.empty[UniqueAddress]
        (observerRowsMap, allUnreachable, allTerminated)
      } else {
        val mapBuilder = scala.collection.mutable.Map.empty[UniqueAddress, Map[UniqueAddress, Reachability.Record]]
        import scala.collection.mutable.SetBuilder
        val terminatedBuilder = new SetBuilder[UniqueAddress, Set[UniqueAddress]](Set.empty)
        val unreachableBuilder = new SetBuilder[UniqueAddress, Set[UniqueAddress]](Set.empty)
        records foreach { r ⇒
          val m = mapBuilder.get(r.observer) match {
            case None    ⇒ Map(r.subject -> r)
            case Some(m) ⇒ m.updated(r.subject, r)
          }
          mapBuilder += (r.observer -> m)
          if (r.status == Unreachable) unreachableBuilder += r.subject
          else if (r.status == Terminated) terminatedBuilder += r.subject
        }
        val observerRowsMap: Map[UniqueAddress, Map[UniqueAddress, Reachability.Record]] = mapBuilder.toMap
        val allTerminated: Set[UniqueAddress] = terminatedBuilder.result()
        val allUnreachable: Set[UniqueAddress] = unreachableBuilder.result() -- allTerminated
        (observerRowsMap, allUnreachable, allTerminated)
      }
    }
    val allUnreachableOrTerminated: Set[UniqueAddress] =
      if (allTerminated.isEmpty) allUnreachable
      else allUnreachable ++ allTerminated
  }
  @transient private lazy val cache = new Cache
  private def observerRows(observer: UniqueAddress): Option[Map[UniqueAddress, Reachability.Record]] =
    cache.observerRowsMap.get(observer)
  def unreachable(observer: UniqueAddress, subject: UniqueAddress): Reachability =
    change(observer, subject, Unreachable)
  def reachable(observer: UniqueAddress, subject: UniqueAddress): Reachability =
    change(observer, subject, Reachable)
  def terminated(observer: UniqueAddress, subject: UniqueAddress): Reachability =
    change(observer, subject, Terminated)
  private def currentVersion(observer: UniqueAddress): Long = versions.get(observer) match {
    case None    ⇒ 0
    case Some(v) ⇒ v
  }
  private def nextVersion(observer: UniqueAddress): Long = currentVersion(observer) + 1
  private def change(observer: UniqueAddress, subject: UniqueAddress, status: ReachabilityStatus): Reachability = {
    val v = nextVersion(observer)
    val newVersions = versions.updated(observer, v)
    val newRecord = Record(observer, subject, status, v)
    observerRows(observer) match {
      case None if status == Reachable ⇒ this
      case None ⇒
        new Reachability(records :+ newRecord, newVersions)
      case Some(oldObserverRows) ⇒
        oldObserverRows.get(subject) match {
          case None ⇒
            if (status == Reachable && oldObserverRows.forall { case (_, r) ⇒ r.status == Reachable }) {
              // all Reachable, prune by removing the records of the observer, and bump the version
              new Reachability(records.filterNot(_.observer == observer), newVersions)
            } else
              new Reachability(records :+ newRecord, newVersions)
          case Some(oldRecord) ⇒
            if (oldRecord.status == Terminated || oldRecord.status == status)
              this
            else {
              if (status == Reachable && oldObserverRows.forall { case (_, r) ⇒ r.status == Reachable || r.subject == subject }) {
                // all Reachable, prune by removing the records of the observer, and bump the version
                new Reachability(records.filterNot(_.observer == observer), newVersions)
              } else {
                val newRecords = records.updated(records.indexOf(oldRecord), newRecord)
                new Reachability(newRecords, newVersions)
              }
            }
        }
    }
  }
  def merge(allowed: immutable.Set[UniqueAddress], other: Reachability): Reachability = {
    val recordBuilder = new immutable.VectorBuilder[Record]
    recordBuilder.sizeHint(math.max(this.records.size, other.records.size))
    var newVersions = versions
    allowed foreach { observer ⇒
      val observerVersion1 = this.currentVersion(observer)
      val observerVersion2 = other.currentVersion(observer)
      (this.observerRows(observer), other.observerRows(observer)) match {
        case (None, None) ⇒
        case (Some(rows1), Some(rows2)) ⇒
          mergeObserverRows(rows1, rows2, observerVersion1, observerVersion2, recordBuilder)
        case (Some(rows1), None) ⇒
          recordBuilder ++= rows1.collect { case (_, r) if r.version > observerVersion2 ⇒ r }
        case (None, Some(rows2)) ⇒
          recordBuilder ++= rows2.collect { case (_, r) if r.version > observerVersion1 ⇒ r }
      }
      if (observerVersion2 > observerVersion1)
        newVersions += (observer -> observerVersion2)
    }
    new Reachability(recordBuilder.result(), newVersions)
  }
  private def mergeObserverRows(
    rows1: Map[UniqueAddress, Reachability.Record], rows2: Map[UniqueAddress, Reachability.Record],
    observerVersion1: Long, observerVersion2: Long,
    recordBuilder: immutable.VectorBuilder[Record]): Unit = {
    val allSubjects = rows1.keySet ++ rows2.keySet
    allSubjects foreach { subject ⇒
      (rows1.get(subject), rows2.get(subject)) match {
        case (Some(r1), Some(r2)) ⇒
          recordBuilder += (if (r1.version > r2.version) r1 else r2)
        case (Some(r1), None) ⇒
          if (r1.version > observerVersion2)
            recordBuilder += r1
        case (None, Some(r2)) ⇒
          if (r2.version > observerVersion1)
            recordBuilder += r2
        case (None, None) ⇒
          throw new IllegalStateException(s"Unexpected [$subject]")
      }
    }
  }
  def remove(nodes: Iterable[UniqueAddress]): Reachability = {
    val nodesSet = nodes.to[immutable.HashSet]
    val newRecords = records.filterNot(r ⇒ nodesSet(r.observer) || nodesSet(r.subject))
    if (newRecords.size == records.size) this
    else {
      val newVersions = versions -- nodes
      Reachability(newRecords, newVersions)
    }
  }
  def status(observer: UniqueAddress, subject: UniqueAddress): ReachabilityStatus =
    observerRows(observer) match {
      case None ⇒ Reachable
      case Some(observerRows) ⇒ observerRows.get(subject) match {
        case None         ⇒ Reachable
        case Some(record) ⇒ record.status
      }
    }
  def status(node: UniqueAddress): ReachabilityStatus =
    if (cache.allTerminated(node)) Terminated
    else if (cache.allUnreachable(node)) Unreachable
    else Reachable
  def isReachable(node: UniqueAddress): Boolean = isAllReachable || !allUnreachableOrTerminated.contains(node)
  def isReachable(observer: UniqueAddress, subject: UniqueAddress): Boolean =
    status(observer, subject) == Reachable
  def isAllReachable: Boolean = records.isEmpty
  /**
   * Doesn't include terminated
   */
  def allUnreachable: Set[UniqueAddress] = cache.allUnreachable
  def allUnreachableOrTerminated: Set[UniqueAddress] = cache.allUnreachableOrTerminated
  /**
   * Doesn't include terminated
   */
  def allUnreachableFrom(observer: UniqueAddress): Set[UniqueAddress] =
    observerRows(observer) match {
      case None ⇒ Set.empty
      case Some(observerRows) ⇒
        observerRows.collect {
          case (subject, record) if record.status == Unreachable ⇒ subject
        }(breakOut)
    }
  def observersGroupedByUnreachable: Map[UniqueAddress, Set[UniqueAddress]] = {
    records.groupBy(_.subject).collect {
      case (subject, records) if records.exists(_.status == Unreachable) ⇒
        val observers: Set[UniqueAddress] =
          records.collect { case r if r.status == Unreachable ⇒ r.observer }(breakOut)
        (subject -> observers)
    }
  }
  def allObservers: Set[UniqueAddress] = versions.keySet
  def recordsFrom(observer: UniqueAddress): immutable.IndexedSeq[Record] = {
    observerRows(observer) match {
      case None       ⇒ Vector.empty
      case Some(rows) ⇒ rows.valuesIterator.toVector
    }
  }
  // only used for testing
  override def hashCode: Int = versions.hashCode
  // only used for testing
  override def equals(obj: Any): Boolean = obj match {
    case other: Reachability ⇒
      records.size == other.records.size && versions == versions &&
        cache.observerRowsMap == other.cache.observerRowsMap
    case _ ⇒ false
  }
  override def toString: String = {
    val rows = for {
      observer ← versions.keys.toSeq.sorted
      rowsOption = observerRows(observer)
      if rowsOption.isDefined // compilation err for subject <- rowsOption
      rows = rowsOption.get
      subject ← rows.keys.toSeq.sorted
    } yield {
      val record = rows(subject)
      val aggregated = status(subject)
      s"${observer.address} -> ${subject.address}: ${record.status} [$aggregated] (${record.version})"
      ""
    }
    rows.mkString(", ")
  }
 }
--- a/akka-cluster/src/main/scala/akka/cluster/protobuf/ClusterMessageSerializer.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/protobuf/ClusterMessageSerializer.scala
@ -44,6 +44,7 @@ class ClusterMessageSerializer(val system: ExtendedActorSystem) extends Serializ
    classOf[InternalClusterAction.InitJoinNack] -> (bytes ⇒ InternalClusterAction.InitJoinNack(addressFromBinary(bytes))),
    classOf[ClusterHeartbeatReceiver.Heartbeat] -> (bytes ⇒ ClusterHeartbeatReceiver.Heartbeat(addressFromBinary(bytes))),
    classOf[ClusterHeartbeatReceiver.EndHeartbeat] -> (bytes ⇒ ClusterHeartbeatReceiver.EndHeartbeat(addressFromBinary(bytes))),
    classOf[ClusterHeartbeatReceiver.EndHeartbeatAck] -> (bytes ⇒ ClusterHeartbeatReceiver.EndHeartbeatAck(addressFromBinary(bytes))),
    classOf[ClusterHeartbeatSender.HeartbeatRequest] -> (bytes ⇒ ClusterHeartbeatSender.HeartbeatRequest(addressFromBinary(bytes))),
    classOf[GossipStatus] -> gossipStatusFromBinary,
    classOf[GossipEnvelope] -> gossipEnvelopeFromBinary,
@ -67,6 +68,7 @@ class ClusterMessageSerializer(val system: ExtendedActorSystem) extends Serializ
      case InternalClusterAction.InitJoinAck(address) ⇒ addressToProto(address).toByteArray
      case InternalClusterAction.InitJoinNack(address) ⇒ addressToProto(address).toByteArray
      case ClusterHeartbeatReceiver.EndHeartbeat(from) ⇒ addressToProto(from).toByteArray
      case ClusterHeartbeatReceiver.EndHeartbeatAck(from) ⇒ addressToProto(from).toByteArray
      case ClusterHeartbeatSender.HeartbeatRequest(from) ⇒ addressToProto(from).toByteArray
      case _ ⇒ throw new IllegalArgumentException(s"Can't serialize object of type ${obj.getClass}")
    }
@ -132,6 +134,13 @@ class ClusterMessageSerializer(val system: ExtendedActorSystem) extends Serializ
  private val memberStatusFromInt = memberStatusToInt.map { case (a, b) ⇒ (b, a) }
  private val reachabilityStatusToInt = scala.collection.immutable.HashMap[Reachability.ReachabilityStatus, Int](
    Reachability.Reachable -> msg.ReachabilityStatus.Reachable_VALUE,
    Reachability.Unreachable -> msg.ReachabilityStatus.Unreachable_VALUE,
    Reachability.Terminated -> msg.ReachabilityStatus.Terminated_VALUE)
  private val reachabilityStatusFromInt = reachabilityStatusToInt.map { case (a, b) ⇒ (b, a) }
  private def mapWithErrorMessage[T](map: Map[T, Int], value: T, unknown: String): Int = map.get(value) match {
    case Some(x) ⇒ x
    case _       ⇒ throw new IllegalArgumentException(s"Unknown ${unknown} [${value}] in cluster message")
@ -139,8 +148,8 @@ class ClusterMessageSerializer(val system: ExtendedActorSystem) extends Serializ
  private def gossipToProto(gossip: Gossip): msg.Gossip = {
    import scala.collection.breakOut
-    val allMembers = (gossip.members.iterator ++ gossip.overview.unreachable.iterator).toIndexedSeq
+    val allMembers = gossip.members.toVector
-    val allAddresses: Vector[UniqueAddress] = allMembers.map(_.uniqueAddress)(breakOut)
+    val allAddresses: Vector[UniqueAddress] = allMembers.map(_.uniqueAddress)
    val addressMapping = allAddresses.zipWithIndex.toMap
    val allRoles = allMembers.foldLeft(Set.empty[String])((acc, m) ⇒ acc ++ m.roles).to[Vector]
    val roleMapping = allRoles.zipWithIndex.toMap
@ -154,11 +163,21 @@ class ClusterMessageSerializer(val system: ExtendedActorSystem) extends Serializ
      msg.Member(mapUniqueAddress(member.uniqueAddress), member.upNumber,
        msg.MemberStatus.valueOf(memberStatusToInt(member.status)), member.roles.map(mapRole)(breakOut))
-    val unreachable: Vector[msg.Member] = gossip.overview.unreachable.map(memberToProto)(breakOut)
+    def reachabilityToProto(reachability: Reachability): Vector[msg.ObserverReachability] = {
      reachability.versions.map {
        case (observer, version) ⇒
          val subjectReachability = reachability.recordsFrom(observer).map(r ⇒
            msg.SubjectReachability(mapUniqueAddress(r.subject),
              msg.ReachabilityStatus.valueOf(reachabilityStatusToInt(r.status)), r.version))
          msg.ObserverReachability(mapUniqueAddress(observer), version, subjectReachability)
      }(breakOut)
    }
    val reachability = reachabilityToProto(gossip.overview.reachability)
    val members: Vector[msg.Member] = gossip.members.map(memberToProto)(breakOut)
    val seen: Vector[Int] = gossip.overview.seen.map(mapUniqueAddress)(breakOut)
-    val overview = msg.GossipOverview(seen, unreachable)
+    val overview = msg.GossipOverview(seen, reachability)
    msg.Gossip(allAddresses.map(uniqueAddressToProto),
      allRoles, allHashes, members, overview, vectorClockToProto(gossip.version, hashMapping))
@ -192,14 +211,31 @@ class ClusterMessageSerializer(val system: ExtendedActorSystem) extends Serializ
    val roleMapping = gossip.allRoles
    val hashMapping = gossip.allHashes
    def reachabilityFromProto(observerReachability: immutable.Seq[msg.ObserverReachability]): Reachability = {
      val recordBuilder = new immutable.VectorBuilder[Reachability.Record]
      val versionsBuilder = new scala.collection.mutable.MapBuilder[UniqueAddress, Long, Map[UniqueAddress, Long]](Map.empty)
      for (o ← observerReachability) {
        val observer = addressMapping(o.addressIndex)
        versionsBuilder += ((observer, o.version))
        for (s ← o.subjectReachability) {
          val subject = addressMapping(s.addressIndex)
          val record = Reachability.Record(observer, subject, reachabilityStatusFromInt(s.status), s.version)
          recordBuilder += record
        }
      }
      Reachability.create(recordBuilder.result(), versionsBuilder.result())
    }
    def memberFromProto(member: msg.Member) =
      new Member(addressMapping(member.addressIndex), member.upNumber, memberStatusFromInt(member.status.id),
        member.rolesIndexes.map(roleMapping)(breakOut))
    val members: immutable.SortedSet[Member] = gossip.members.map(memberFromProto)(breakOut)
-    val unreachable: immutable.Set[Member] = gossip.overview.unreachable.map(memberFromProto)(breakOut)
+
    val reachability = reachabilityFromProto(gossip.overview.observerReachability)
    val seen: Set[UniqueAddress] = gossip.overview.seen.map(addressMapping)(breakOut)
-    val overview = GossipOverview(seen, unreachable)
+    val overview = GossipOverview(seen, reachability)
    Gossip(members, overview, vectorClockFromProto(gossip.version, hashMapping))
  }
--- a/akka-cluster/src/main/scala/akka/cluster/routing/ClusterRouterConfig.scala
+++ b/akka-cluster/src/main/scala/akka/cluster/routing/ClusterRouterConfig.scala
@ -274,7 +274,7 @@ private[akka] class ClusterRouterActor(override val supervisorStrategy: Supervis
  // re-subscribe when restart
  override def preStart(): Unit = {
    cluster.subscribe(self, classOf[MemberEvent])
-    cluster.subscribe(self, classOf[UnreachableMember])
+    cluster.subscribe(self, classOf[ReachabilityEvent])
  }
  override def postStop(): Unit = cluster.unsubscribe(self)
@ -289,6 +289,13 @@ private[akka] class ClusterRouterActor(override val supervisorStrategy: Supervis
  def fullAddress(actorRef: ActorRef): Address = routeeProvider.fullAddress(actorRef)
  def registerRoutees(member: Member) = {
    routeeProvider.nodes += member.address
    // createRoutees will create routees based on
    // totalInstances and maxInstancesPerNode
    routeeProvider.createRoutees()
  }
  def unregisterRoutees(member: Member) = {
    val address = member.address
    routeeProvider.nodes -= address
@ -309,17 +316,18 @@ private[akka] class ClusterRouterActor(override val supervisorStrategy: Supervis
      routeeProvider.createRoutees()
    case m: MemberEvent if routeeProvider.isAvailable(m.member) ⇒
-      routeeProvider.nodes += m.member.address
+      registerRoutees(m.member)
      // createRoutees will create routees based on
      // totalInstances and maxInstancesPerNode
      routeeProvider.createRoutees()
    case other: MemberEvent ⇒
      // other events means that it is no longer interesting, such as
-      // MemberJoined, MemberLeft, MemberExited, MemberRemoved
+      // MemberExited, MemberRemoved
      unregisterRoutees(other.member)
    case UnreachableMember(m) ⇒
      unregisterRoutees(m)
    case ReachableMember(m) ⇒
      if (routeeProvider.isAvailable(m))
        registerRoutees(m)
  }
 }
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/ClientDowningNodeThatIsUpSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/ClientDowningNodeThatIsUpSpec.scala
@ -4,6 +4,7 @@
 package akka.cluster
 import com.typesafe.config.ConfigFactory
 import scala.concurrent.duration._
 import akka.remote.testkit.MultiNodeConfig
 import akka.remote.testkit.MultiNodeSpec
 import akka.testkit._
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/ClusterAccrualFailureDetectorSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/ClusterAccrualFailureDetectorSpec.scala
@ -6,6 +6,7 @@ package akka.cluster
 import com.typesafe.config.ConfigFactory
 import akka.remote.testkit.MultiNodeConfig
 import akka.remote.testkit.MultiNodeSpec
 import akka.remote.transport.ThrottlerTransportAdapter.Direction
 import scala.concurrent.duration._
 import akka.testkit._
@ -17,6 +18,8 @@ object ClusterAccrualFailureDetectorMultiJvmSpec extends MultiNodeConfig {
  commonConfig(debugConfig(on = false).
    withFallback(ConfigFactory.parseString("akka.cluster.failure-detector.threshold = 4")).
    withFallback(MultiNodeClusterSpec.clusterConfig))
  testTransport(on = true)
 }
 class ClusterAccrualFailureDetectorMultiJvmNode1 extends ClusterAccrualFailureDetectorSpec
@ -44,6 +47,47 @@ abstract class ClusterAccrualFailureDetectorSpec
      enterBarrier("after-1")
    }
    "mark node as 'unavailable' when network partition and then back to 'available' when partition is healed" taggedAs
      LongRunningTest in {
        runOn(first) {
          testConductor.blackhole(first, second, Direction.Both).await
        }
        enterBarrier("broken")
        runOn(first) {
          // detect failure...
          awaitCond(!cluster.failureDetector.isAvailable(second), 15.seconds)
          // other connections still ok
          cluster.failureDetector.isAvailable(third) must be(true)
        }
        runOn(second) {
          // detect failure...
          awaitCond(!cluster.failureDetector.isAvailable(first), 15.seconds)
          // other connections still ok
          cluster.failureDetector.isAvailable(third) must be(true)
        }
        enterBarrier("partitioned")
        runOn(first) {
          testConductor.passThrough(first, second, Direction.Both).await
        }
        enterBarrier("repaired")
        runOn(first, third) {
          awaitCond(cluster.failureDetector.isAvailable(second), 15.seconds)
        }
        runOn(second) {
          awaitCond(cluster.failureDetector.isAvailable(first), 15.seconds)
        }
        enterBarrier("after-2")
      }
    "mark node as 'unavailable' if a node in the cluster is shut down (and its heartbeats stops)" taggedAs LongRunningTest in {
      runOn(first) {
        testConductor.exit(third, 0).await
@ -59,7 +103,7 @@ abstract class ClusterAccrualFailureDetectorSpec
        cluster.failureDetector.isAvailable(second) must be(true)
      }
-      enterBarrier("after-2")
+      enterBarrier("after-3")
    }
  }
 }
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/ClusterDeathWatchSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/ClusterDeathWatchSpec.scala
@ -71,7 +71,7 @@ abstract class ClusterDeathWatchSpec
  }
  "An actor watching a remote actor in the cluster" must {
-    "receive Terminated when watched node becomes Down" taggedAs LongRunningTest in within(20 seconds) {
+    "receive Terminated when watched node becomes Down/Removed" taggedAs LongRunningTest in within(20 seconds) {
      awaitClusterUp(first, second, third, fourth)
      enterBarrier("cluster-up")
@ -103,10 +103,10 @@ abstract class ClusterDeathWatchSpec
        enterBarrier("second-terminated")
        markNodeAsUnavailable(third)
        awaitAssert(clusterView.members.map(_.address) must not contain (address(third)))
        awaitAssert(clusterView.unreachableMembers.map(_.address) must contain(address(third)))
        cluster.down(third)
        // removed
        awaitAssert(clusterView.members.map(_.address) must not contain (address(third)))
        awaitAssert(clusterView.unreachableMembers.map(_.address) must not contain (address(third)))
        expectMsg(path3)
        enterBarrier("third-terminated")
@ -119,10 +119,10 @@ abstract class ClusterDeathWatchSpec
        enterBarrier("watch-established")
        runOn(third) {
          markNodeAsUnavailable(second)
          awaitAssert(clusterView.members.map(_.address) must not contain (address(second)))
          awaitAssert(clusterView.unreachableMembers.map(_.address) must contain(address(second)))
          cluster.down(second)
          // removed
          awaitAssert(clusterView.members.map(_.address) must not contain (address(second)))
          awaitAssert(clusterView.unreachableMembers.map(_.address) must not contain (address(second)))
        }
        enterBarrier("second-terminated")
@ -194,11 +194,11 @@ abstract class ClusterDeathWatchSpec
      runOn(fourth) {
        markNodeAsUnavailable(fifth)
        awaitAssert(clusterView.members.map(_.address) must not contain (address(fifth)))
        awaitAssert(clusterView.unreachableMembers.map(_.address) must contain(address(fifth)))
        cluster.down(fifth)
        // removed
        awaitAssert(clusterView.unreachableMembers.map(_.address) must not contain (address(fifth)))
        awaitAssert(clusterView.members.map(_.address) must not contain (address(fifth)))
      }
      enterBarrier("fifth-terminated")
@ -226,11 +226,11 @@ abstract class ClusterDeathWatchSpec
        enterBarrier("hello-deployed")
        markNodeAsUnavailable(first)
        awaitAssert(clusterView.members.map(_.address) must not contain (address(first)))
        awaitAssert(clusterView.unreachableMembers.map(_.address) must contain(address(first)))
        cluster.down(first)
        // removed
        awaitAssert(clusterView.unreachableMembers.map(_.address) must not contain (address(first)))
        awaitAssert(clusterView.members.map(_.address) must not contain (address(first)))
        expectTerminated(hello)
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/ConvergenceSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/ConvergenceSpec.scala
@ -70,12 +70,11 @@ abstract class ConvergenceSpec(multiNodeConfig: ConvergenceMultiNodeConfig)
        within(28 seconds) {
          // third becomes unreachable
          awaitAssert(clusterView.unreachableMembers.size must be(1))
          awaitAssert(clusterView.members.size must be(2))
          awaitAssert(clusterView.members.map(_.status) must be(Set(MemberStatus.Up)))
          awaitSeenSameState(first, second)
          // still one unreachable
          clusterView.unreachableMembers.size must be(1)
          clusterView.unreachableMembers.head.address must be(thirdAddress)
          clusterView.members.size must be(3)
        }
      }
@ -96,7 +95,7 @@ abstract class ConvergenceSpec(multiNodeConfig: ConvergenceMultiNodeConfig)
      runOn(first, second, fourth) {
        for (n ← 1 to 5) {
-          awaitAssert(clusterView.members.size must be(2))
+          awaitAssert(clusterView.members.size must be(3))
          awaitSeenSameState(first, second, fourth)
          memberStatus(first) must be(Some(MemberStatus.Up))
          memberStatus(second) must be(Some(MemberStatus.Up))
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/MBeanSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/MBeanSpec.scala
@ -95,8 +95,9 @@ abstract class MBeanSpec
      enterBarrier("after-4")
    }
-    "support down" taggedAs LongRunningTest in within(20 seconds) {
+    val fourthAddress = address(fourth)
-      val fourthAddress = address(fourth)
+
    "format cluster status as JSON with full reachability info" taggedAs LongRunningTest in within(30 seconds) {
      runOn(first) {
        testConductor.exit(fourth, 0).await
      }
@ -104,11 +105,62 @@ abstract class MBeanSpec
      runOn(first, second, third) {
        awaitAssert(mbeanServer.getAttribute(mbeanName, "Unreachable") must be(fourthAddress.toString))
-        val expectedMembers = Seq(first, second, third).sorted.map(address(_)).mkString(",")
+        val expectedMembers = Seq(first, second, third, fourth).sorted.map(address(_)).mkString(",")
        awaitAssert(mbeanServer.getAttribute(mbeanName, "Members") must be(expectedMembers))
      }
      enterBarrier("fourth-unreachable")
      runOn(first) {
        val sortedNodes = Vector(first, second, third, fourth).sorted.map(address(_))
        val unreachableObservedBy = Vector(first, second, third).sorted.map(address(_))
        val expectedJson =
          s"""{
             |  "self-address": "${address(first)}",
             |  "members": [
             |    {
             |      "address": "${sortedNodes(0)}",
             |      "status": "Up"
             |    },
             |    {
             |      "address": "${sortedNodes(1)}",
             |      "status": "Up"
             |    },
             |    {
             |      "address": "${sortedNodes(2)}",
             |      "status": "Up"
             |    },
             |    {
             |      "address": "${sortedNodes(3)}",
             |      "status": "Up"
             |    }
             |  ],
             |  "unreachable": [
             |    {
             |      "node": "${address(fourth)}",
             |      "observed-by": [
             |        "${unreachableObservedBy(0)}",
             |        "${unreachableObservedBy(1)}",
             |        "${unreachableObservedBy(2)}"
             |      ]
             |    }
             |  ]
             |}
             |""".stripMargin
        // awaitAssert to make sure that all nodes detects unreachable
        within(5.seconds) {
          awaitAssert(mbeanServer.getAttribute(mbeanName, "ClusterStatus") must be(expectedJson))
        }
      }
      enterBarrier("after-5")
    }
    "support down" taggedAs LongRunningTest in within(20 seconds) {
      // fourth unreachable in previous step
      runOn(second) {
        mbeanServer.invoke(mbeanName, "down", Array(fourthAddress.toString), Array("java.lang.String"))
      }
@ -120,7 +172,7 @@ abstract class MBeanSpec
        awaitAssert(mbeanServer.getAttribute(mbeanName, "Unreachable") must be(""))
      }
-      enterBarrier("after-5")
+      enterBarrier("after-6")
    }
    "support leave" taggedAs LongRunningTest in within(20 seconds) {
@ -142,7 +194,7 @@ abstract class MBeanSpec
        })
      }
-      enterBarrier("after-6")
+      enterBarrier("after-7")
    }
  }
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/MultiNodeClusterSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/MultiNodeClusterSpec.scala
@ -38,12 +38,13 @@ object MultiNodeClusterSpec {
      jmx.enabled                         = off
      gossip-interval                     = 200 ms
      leader-actions-interval             = 200 ms
-      unreachable-nodes-reaper-interval   = 200 ms
+      unreachable-nodes-reaper-interval   = 500 ms
      periodic-tasks-initial-delay        = 300 ms
      publish-stats-interval              = 0 s # always, when it happens
-      failure-detector.heartbeat-interval = 400 ms
+      failure-detector.heartbeat-interval = 500 ms
    }
    akka.loglevel = INFO
    akka.log-dead-letters = off
    akka.log-dead-letters-during-shutdown = off
    akka.remote.log-remote-lifecycle-events = off
    akka.loggers = ["akka.testkit.TestEventListener"]
@ -114,8 +115,10 @@ trait MultiNodeClusterSpec extends Suite with STMultiNodeSpec with WatchedByCoro
        classOf[InternalClusterAction.Tick],
        classOf[akka.actor.PoisonPill],
        classOf[akka.dispatch.sysmsg.DeathWatchNotification],
-        akka.remote.transport.AssociationHandle.Disassociated.getClass,
+        classOf[akka.remote.transport.AssociationHandle.Disassociated],
-        akka.remote.transport.ActorTransportAdapter.DisassociateUnderlying.getClass,
+        //        akka.remote.transport.AssociationHandle.Disassociated.getClass,
        classOf[akka.remote.transport.ActorTransportAdapter.DisassociateUnderlying],
        //        akka.remote.transport.ActorTransportAdapter.DisassociateUnderlying.getClass,
        classOf[akka.remote.transport.AssociationHandle.InboundPayload])(sys)
    }
@ -125,6 +128,10 @@ trait MultiNodeClusterSpec extends Suite with STMultiNodeSpec with WatchedByCoro
    if (!sys.log.isDebugEnabled)
      sys.eventStream.publish(Mute(EventFilter.error(pattern = ".*Marking.* as UNREACHABLE.*")))
  def muteMarkingAsReachable(sys: ActorSystem = system): Unit =
    if (!sys.log.isDebugEnabled)
      sys.eventStream.publish(Mute(EventFilter.info(pattern = ".*Marking.* as REACHABLE.*")))
  override def afterAll(): Unit = {
    if (!log.isDebugEnabled) {
      muteDeadLetters()()
@ -292,7 +299,8 @@ trait MultiNodeClusterSpec extends Suite with STMultiNodeSpec with WatchedByCoro
    }
  }
-  def awaitAllReachable(): Unit = awaitAssert(clusterView.unreachableMembers.isEmpty)
+  def awaitAllReachable(): Unit =
    awaitAssert(clusterView.unreachableMembers must be(Set.empty))
  /**
   * Wait until the specified nodes have seen the same gossip overview.
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/SplitBrainSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/SplitBrainSpec.scala
@ -68,7 +68,6 @@ abstract class SplitBrainSpec(multiNodeConfig: SplitBrainMultiNodeConfig)
    }
    "detect network partition and mark nodes on other side as unreachable and form new cluster" taggedAs LongRunningTest in within(30 seconds) {
      val thirdAddress = address(third)
      enterBarrier("before-split")
      runOn(first) {
@ -79,20 +78,15 @@ abstract class SplitBrainSpec(multiNodeConfig: SplitBrainMultiNodeConfig)
      }
      enterBarrier("after-split")
      runOn(side1.last) {
        for (role ← side2) markNodeAsUnavailable(role)
      }
      runOn(side2.last) {
        for (role ← side1) markNodeAsUnavailable(role)
      }
      runOn(side1: _*) {
        for (role ← side2) markNodeAsUnavailable(role)
        // auto-down = on
        awaitMembersUp(side1.size, side2.toSet map address)
        assertLeader(side1: _*)
      }
      runOn(side2: _*) {
        for (role ← side1) markNodeAsUnavailable(role)
        // auto-down = on
        awaitMembersUp(side2.size, side1.toSet map address)
        assertLeader(side2: _*)
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/StressSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/StressSpec.scala
@ -109,7 +109,7 @@ private[cluster] object StressMultiJvmSpec extends MultiNodeConfig {
      # by tree-width (number of children for each actor) and
      # tree-levels, total number of actors can be calculated by
      # (width * math.pow(width, levels) - 1) / (width - 1)
-      tree-width = 5
+      tree-width = 4
      tree-levels = 4
      report-metrics-interval = 10s
      # scale convergence within timeouts with this factor
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/SurviveNetworkInstabilitySpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/SurviveNetworkInstabilitySpec.scala
@ -0,0 +1,338 @@
 /**
 *  Copyright (C) 2009-2013 Typesafe Inc. <http://www.typesafe.com>
 */
 package akka.cluster
 import com.typesafe.config.ConfigFactory
 import akka.remote.testkit.MultiNodeConfig
 import akka.remote.testkit.MultiNodeSpec
 import akka.remote.transport.ThrottlerTransportAdapter.Direction
 import scala.concurrent.duration._
 import akka.testkit._
 import akka.testkit.TestEvent._
 import scala.concurrent.forkjoin.ThreadLocalRandom
 import akka.remote.testconductor.RoleName
 import akka.actor.Props
 import akka.actor.Actor
 import scala.util.control.NoStackTrace
 import akka.remote.QuarantinedEvent
 import akka.actor.ExtendedActorSystem
 import akka.remote.RemoteActorRefProvider
 import akka.actor.ActorRef
 import akka.dispatch.sysmsg.Failed
 object SurviveNetworkInstabilityMultiJvmSpec extends MultiNodeConfig {
  val first = role("first")
  val second = role("second")
  val third = role("third")
  val fourth = role("fourth")
  val fifth = role("fifth")
  val sixth = role("sixth")
  val seventh = role("seventh")
  val eighth = role("eighth")
  commonConfig(debugConfig(on = false).withFallback(
    ConfigFactory.parseString("akka.remote.system-message-buffer-size=20")).
    withFallback(MultiNodeClusterSpec.clusterConfig))
  testTransport(on = true)
  deployOn(second, """"/parent/*" {
      remote = "@third@"
    }""")
  class Parent extends Actor {
    def receive = {
      case p: Props ⇒ sender ! context.actorOf(p)
    }
  }
  class RemoteChild extends Actor {
    import context.dispatcher
    context.system.scheduler.scheduleOnce(500.millis, self, "boom")
    def receive = {
      case "boom" ⇒ throw new SimulatedException
      case x      ⇒ sender ! x
    }
  }
  class SimulatedException extends RuntimeException("Simulated") with NoStackTrace
 }
 class SurviveNetworkInstabilityMultiJvmNode1 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode2 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode3 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode4 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode5 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode6 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode7 extends SurviveNetworkInstabilitySpec
 class SurviveNetworkInstabilityMultiJvmNode8 extends SurviveNetworkInstabilitySpec
 abstract class SurviveNetworkInstabilitySpec
  extends MultiNodeSpec(SurviveNetworkInstabilityMultiJvmSpec)
  with MultiNodeClusterSpec
  with ImplicitSender {
  import SurviveNetworkInstabilityMultiJvmSpec._
  //  muteMarkingAsUnreachable()
  //  muteMarkingAsReachable()
  override def expectedTestDuration = 3.minutes
  def assertUnreachable(subjects: RoleName*): Unit = {
    val expected = subjects.toSet map address
    awaitAssert(clusterView.unreachableMembers.map(_.address) must be(expected))
  }
  "A network partition tolerant cluster" must {
    "reach initial convergence" taggedAs LongRunningTest in {
      awaitClusterUp(first, second, third, fourth, fifth)
      enterBarrier("after-1")
    }
    "heal after a broken pair" taggedAs LongRunningTest in within(30.seconds) {
      runOn(first) {
        testConductor.blackhole(first, second, Direction.Both).await
      }
      enterBarrier("blackhole-2")
      runOn(first) { assertUnreachable(second) }
      runOn(second) { assertUnreachable(first) }
      runOn(third, fourth, fifth) {
        assertUnreachable(first, second)
      }
      enterBarrier("unreachable-2")
      runOn(first) {
        testConductor.passThrough(first, second, Direction.Both).await
      }
      enterBarrier("repair-2")
      // This test illustrates why we can't ignore gossip from unreachable aggregated
      // status. If all third, fourth, and fifth has been infected by first and second
      // unreachable they must accept gossip from first and second when their
      // broken connection has healed, otherwise they will be isolated forever.
      awaitAllReachable()
      enterBarrier("after-2")
    }
    "heal after one isolated node" taggedAs LongRunningTest in within(30.seconds) {
      val others = Vector(second, third, fourth, fifth)
      runOn(first) {
        for (other ← others) {
          testConductor.blackhole(first, other, Direction.Both).await
        }
      }
      enterBarrier("blackhole-3")
      runOn(first) { assertUnreachable(others: _*) }
      runOn(others: _*) {
        assertUnreachable(first)
      }
      enterBarrier("unreachable-3")
      runOn(first) {
        for (other ← others) {
          testConductor.passThrough(first, other, Direction.Both).await
        }
      }
      enterBarrier("repair-3")
      awaitAllReachable()
      enterBarrier("after-3")
    }
    "heal two isolated islands" taggedAs LongRunningTest in within(30.seconds) {
      val island1 = Vector(first, second)
      val island2 = Vector(third, fourth, fifth)
      runOn(first) {
        // split the cluster in two parts (first, second) / (third, fourth, fifth)
        for (role1 ← island1; role2 ← island2) {
          testConductor.blackhole(role1, role2, Direction.Both).await
        }
      }
      enterBarrier("blackhole-4")
      runOn(island1: _*) {
        assertUnreachable(island2: _*)
      }
      runOn(island2: _*) {
        assertUnreachable(island1: _*)
      }
      enterBarrier("unreachable-4")
      runOn(first) {
        for (role1 ← island1; role2 ← island2) {
          testConductor.passThrough(role1, role2, Direction.Both).await
        }
      }
      enterBarrier("repair-4")
      awaitAllReachable()
      enterBarrier("after-4")
    }
    "heal after unreachable when ring is changed" taggedAs LongRunningTest in within(45.seconds) {
      val joining = Vector(sixth, seventh)
      val others = Vector(second, third, fourth, fifth)
      runOn(first) {
        for (role1 ← (joining :+ first); role2 ← others) {
          testConductor.blackhole(role1, role2, Direction.Both).await
        }
      }
      enterBarrier("blackhole-5")
      runOn(first) { assertUnreachable(others: _*) }
      runOn(others: _*) { assertUnreachable(first) }
      enterBarrier("unreachable-5")
      runOn(joining: _*) {
        cluster.join(first)
        // let them join and stabilize heartbeating
        Thread.sleep(5000)
      }
      enterBarrier("joined-5")
      runOn((joining :+ first): _*) { assertUnreachable(others: _*) }
      // others doesn't know about the joining nodes yet, no gossip passed through
      runOn(others: _*) { assertUnreachable(first) }
      enterBarrier("more-unreachable-5")
      runOn(first) {
        for (role1 ← (joining :+ first); role2 ← others) {
          testConductor.passThrough(role1, role2, Direction.Both).await
        }
      }
      enterBarrier("repair-5")
      runOn((joining ++ others): _*) {
        awaitAllReachable()
        // eighth not joined yet
        awaitMembersUp(roles.size - 1)
      }
      enterBarrier("after-5")
    }
    "down and remove quarantined node" taggedAs LongRunningTest in within(45.seconds) {
      val others = Vector(first, third, fourth, fifth, sixth, seventh)
      runOn(second) {
        val sysMsgBufferSize = system.asInstanceOf[ExtendedActorSystem].provider.asInstanceOf[RemoteActorRefProvider].
          remoteSettings.SysMsgBufferSize
        val parent = system.actorOf(Props[Parent], "parent")
        // fill up the system message redeliver buffer with many failing actors
        for (_ ← 1 to sysMsgBufferSize + 1) {
          // remote deployment to third
          parent ! Props[RemoteChild]
          val child = expectMsgType[ActorRef]
          child ! "hello"
          expectMsg("hello")
          lastSender.path.address must be(address(third))
        }
      }
      runOn(third) {
        // undelivered system messages in RemoteChild on third should trigger QuarantinedEvent
        system.eventStream.subscribe(testActor, classOf[QuarantinedEvent])
        // after quarantined it will drop the Failed messages to deadLetters
        muteDeadLetters(classOf[Failed])(system)
      }
      enterBarrier("children-deployed")
      runOn(first) {
        for (role ← others)
          testConductor.blackhole(second, role, Direction.Send).await
      }
      enterBarrier("blackhole-6")
      runOn(third) {
        // undelivered system messages in RemoteChild on third should trigger QuarantinedEvent
        within(10.seconds) {
          expectMsgType[QuarantinedEvent].address must be(address(second))
        }
        system.eventStream.unsubscribe(testActor, classOf[QuarantinedEvent])
      }
      enterBarrier("quarantined")
      runOn(others: _*) {
        // second should be removed because of quarantine
        awaitAssert(clusterView.members.map(_.address) must not contain (address(second)))
      }
      enterBarrier("after-6")
    }
    "continue and move Joining to Up after downing of one half" taggedAs LongRunningTest in within(45.seconds) {
      // note that second is already removed in previous step
      val side1 = Vector(first, third, fourth)
      val side1AfterJoin = side1 :+ eighth
      val side2 = Vector(fifth, sixth, seventh)
      runOn(first) {
        for (role1 ← side1AfterJoin; role2 ← side2) {
          testConductor.blackhole(role1, role2, Direction.Both).await
        }
      }
      enterBarrier("blackhole-7")
      runOn(side1: _*) { assertUnreachable(side2: _*) }
      runOn(side2: _*) { assertUnreachable(side1: _*) }
      enterBarrier("unreachable-7")
      runOn(eighth) {
        cluster.join(third)
      }
      runOn(fourth) {
        for (role2 ← side2) {
          cluster.down(role2)
        }
      }
      enterBarrier("downed-7")
      runOn(side1AfterJoin: _*) {
        // side2 removed
        val expected = (side1AfterJoin map address).toSet
        awaitAssert(clusterView.members.map(_.address) must be(expected))
        awaitAssert(clusterView.members.collectFirst { case m if m.address == address(eighth) ⇒ m.status } must be(
          Some(MemberStatus.Up)))
      }
      enterBarrier("side2-removed")
      runOn(first) {
        for (role1 ← side1AfterJoin; role2 ← side2) {
          testConductor.passThrough(role1, role2, Direction.Both).await
        }
      }
      enterBarrier("repair-7")
      // side2 should not detect side1 as reachable again
      Thread.sleep(10000)
      runOn(side1AfterJoin: _*) {
        val expected = (side1AfterJoin map address).toSet
        clusterView.members.map(_.address) must be(expected)
      }
      runOn(side2: _*) {
        val expected = ((side2 ++ side1) map address).toSet
        clusterView.members.map(_.address) must be(expected)
        assertUnreachable(side1: _*)
      }
      enterBarrier("after-7")
    }
  }
 }
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/UnreachableNodeJoinsAgainSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/UnreachableNodeJoinsAgainSpec.scala
@ -91,8 +91,6 @@ abstract class UnreachableNodeJoinsAgainSpec
          awaitAssert {
            val members = clusterView.members
            clusterView.unreachableMembers.size must be(roles.size - 1)
            members.size must be(1)
            members.map(_.status) must be(Set(MemberStatus.Up))
          }
          clusterView.unreachableMembers.map(_.address) must be((allButVictim map address).toSet)
        }
@ -105,13 +103,12 @@ abstract class UnreachableNodeJoinsAgainSpec
          awaitAssert {
            val members = clusterView.members
            clusterView.unreachableMembers.size must be(1)
            members.size must be(roles.size - 1)
            members.map(_.status) must be(Set(MemberStatus.Up))
          }
          awaitSeenSameState(allButVictim map address: _*)
          // still one unreachable
          clusterView.unreachableMembers.size must be(1)
          clusterView.unreachableMembers.head.address must be(node(victim).address)
          clusterView.unreachableMembers.head.status must be(MemberStatus.Up)
        }
      }
@ -123,10 +120,12 @@ abstract class UnreachableNodeJoinsAgainSpec
        cluster down victim
      }
-      runOn(allBut(victim): _*) {
+      val allButVictim = allBut(victim, roles)
-        awaitMembersUp(roles.size - 1, Set(victim))
+      runOn(allButVictim: _*) {
        // eventually removed
        awaitMembersUp(roles.size - 1, Set(victim))
        awaitAssert(clusterView.unreachableMembers must be(Set.empty), 15 seconds)
        awaitAssert(clusterView.members.map(_.address) must be((allButVictim map address).toSet))
      }
--- a/akka-cluster/src/multi-jvm/scala/akka/cluster/routing/ClusterRoundRobinRoutedActorSpec.scala
+++ b/akka-cluster/src/multi-jvm/scala/akka/cluster/routing/ClusterRoundRobinRoutedActorSpec.scala
@ -21,6 +21,7 @@ import akka.routing.RoundRobinRouter
 import akka.routing.RoutedActorRef
 import akka.routing.RouterRoutees
 import akka.testkit._
 import akka.remote.transport.ThrottlerTransportAdapter.Direction
 object ClusterRoundRobinRoutedActorMultiJvmSpec extends MultiNodeConfig {
@ -86,6 +87,8 @@ object ClusterRoundRobinRoutedActorMultiJvmSpec extends MultiNodeConfig {
  nodeConfig(first, second)(ConfigFactory.parseString("""akka.cluster.roles =["a", "c"]"""))
  nodeConfig(third)(ConfigFactory.parseString("""akka.cluster.roles =["b", "c"]"""))
  testTransport(on = true)
 }
 class ClusterRoundRobinRoutedActorMultiJvmNode1 extends ClusterRoundRobinRoutedActorSpec
@ -300,6 +303,31 @@ abstract class ClusterRoundRobinRoutedActorSpec extends MultiNodeSpec(ClusterRou
      enterBarrier("after-8")
    }
    "remove routees for unreachable nodes, and add when reachable again" taggedAs LongRunningTest in within(30.seconds) {
      // myservice is already running
      def routees = currentRoutees(router4)
      def routeeAddresses = (routees map fullAddress).toSet
      runOn(first) {
        // 4 nodes, 1 routee on each node
        awaitAssert(currentRoutees(router4).size must be(4))
        testConductor.blackhole(first, second, Direction.Both).await
        awaitAssert(routees.size must be(3))
        routeeAddresses must not contain (address(second))
        testConductor.passThrough(first, second, Direction.Both).await
        awaitAssert(routees.size must be(4))
        routeeAddresses must contain(address(second))
      }
      enterBarrier("after-9")
    }
    "deploy programatically defined routees to other node when a node becomes down" taggedAs LongRunningTest in {
      muteMarkingAsUnreachable()
@ -313,7 +341,7 @@ abstract class ClusterRoundRobinRoutedActorSpec extends MultiNodeSpec(ClusterRou
        val downRoutee = routees.find(_.path.address == downAddress).get
        cluster.down(downAddress)
-        expectMsgType[Terminated].actor must be(downRoutee)
+        expectMsgType[Terminated](15.seconds).actor must be(downRoutee)
        awaitAssert {
          routeeAddresses must contain(notUsedAddress)
          routeeAddresses must not contain (downAddress)
@ -330,7 +358,7 @@ abstract class ClusterRoundRobinRoutedActorSpec extends MultiNodeSpec(ClusterRou
        replies.values.sum must be(iterationCount)
      }
-      enterBarrier("after-9")
+      enterBarrier("after-10")
    }
  }
--- a/akka-cluster/src/test/scala/akka/cluster/ClusterConfigSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/ClusterConfigSpec.scala
@ -30,7 +30,6 @@ class ClusterConfigSpec extends AkkaSpec {
      PeriodicTasksInitialDelay must be(1 seconds)
      GossipInterval must be(1 second)
      HeartbeatInterval must be(1 second)
      NumberOfEndHeartbeats must be(8)
      MonitoredByNrOfMembers must be(5)
      HeartbeatRequestDelay must be(10 seconds)
      HeartbeatExpectedResponseAfter must be(3 seconds)
--- a/akka-cluster/src/test/scala/akka/cluster/ClusterDomainEventSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/ClusterDomainEventSpec.scala
@ -65,13 +65,33 @@ class ClusterDomainEventSpec extends WordSpec with MustMatchers {
    }
    "be produced for members in unreachable" in {
-      val g1 = Gossip(members = SortedSet(aUp, bUp), overview = GossipOverview(unreachable = Set(cUp, eUp)))
+      val reachability1 = Reachability.empty.
-      val g2 = Gossip(members = SortedSet(aUp), overview = GossipOverview(unreachable = Set(cUp, bDown, eDown)))
+        unreachable(aUp.uniqueAddress, cUp.uniqueAddress).
        unreachable(aUp.uniqueAddress, eUp.uniqueAddress)
      val g1 = Gossip(members = SortedSet(aUp, bUp, cUp, eUp), overview = GossipOverview(reachability = reachability1))
      val reachability2 = reachability1.
        unreachable(aUp.uniqueAddress, bDown.uniqueAddress)
      val g2 = Gossip(members = SortedSet(aUp, cUp, bDown, eDown), overview = GossipOverview(reachability = reachability2))
      diffUnreachable(g1, g2) must be(Seq(UnreachableMember(bDown)))
      diffSeen(g1, g2) must be(Seq.empty)
    }
    "be produced for members becoming reachable after unreachable" in {
      val reachability1 = Reachability.empty.
        unreachable(aUp.uniqueAddress, cUp.uniqueAddress).reachable(aUp.uniqueAddress, cUp.uniqueAddress).
        unreachable(aUp.uniqueAddress, eUp.uniqueAddress).
        unreachable(aUp.uniqueAddress, bUp.uniqueAddress)
      val g1 = Gossip(members = SortedSet(aUp, bUp, cUp, eUp), overview = GossipOverview(reachability = reachability1))
      val reachability2 = reachability1.
        unreachable(aUp.uniqueAddress, cUp.uniqueAddress).
        reachable(aUp.uniqueAddress, bUp.uniqueAddress)
      val g2 = Gossip(members = SortedSet(aUp, cUp, bUp, eUp), overview = GossipOverview(reachability = reachability2))
      diffUnreachable(g1, g2) must be(Seq(UnreachableMember(cUp)))
      diffReachable(g1, g2) must be(Seq(ReachableMember(bUp)))
    }
    "be produced for removed members" in {
      val (g1, _) = converge(Gossip(members = SortedSet(aUp, dExiting)))
      val (g2, s2) = converge(Gossip(members = SortedSet(aUp)))
--- a/akka-cluster/src/test/scala/akka/cluster/ClusterHeartbeatSenderStateSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/ClusterHeartbeatSenderStateSpec.scala
@ -40,7 +40,7 @@ class ClusterHeartbeatSenderStateSpec extends WordSpec with MustMatchers {
      val s = emptyState.addHeartbeatRequest(aa, Deadline.now - 30.seconds).removeOverdueHeartbeatRequest()
      s.heartbeatRequest must be(Map.empty)
      s.active must be(Set.empty)
-      s.ending must be(Map(aa -> 0))
+      s.ending must be(Set(aa))
    }
    "remove heartbeatRequest after reset" in {
@ -56,22 +56,22 @@ class ClusterHeartbeatSenderStateSpec extends WordSpec with MustMatchers {
    "remove heartbeatRequest after removeMember" in {
      val s = emptyState.addHeartbeatRequest(aa, Deadline.now + 30.seconds).reset(HashSet(aa, bb)).removeMember(aa)
      s.heartbeatRequest must be(Map.empty)
-      s.ending must be(Map(aa -> 0))
+      s.ending must be(Set(aa))
    }
    "remove from ending after addHeartbeatRequest" in {
      val s = emptyState.reset(HashSet(aa, bb)).removeMember(aa)
-      s.ending must be(Map(aa -> 0))
+      s.ending must be(Set(aa))
      val s2 = s.addHeartbeatRequest(aa, Deadline.now + 30.seconds)
      s2.heartbeatRequest.keySet must be(Set(aa))
-      s2.ending must be(Map.empty)
+      s2.ending must be(Set.empty)
    }
    "include nodes from reset in active set" in {
      val nodes = HashSet(aa, bb, cc)
      val s = emptyState.reset(nodes)
      s.current must be(nodes)
-      s.ending must be(Map.empty)
+      s.ending must be(Set.empty)
      s.active must be(nodes)
    }
@ -85,21 +85,21 @@ class ClusterHeartbeatSenderStateSpec extends WordSpec with MustMatchers {
    "move member to ending set when removing member" in {
      val nodes = HashSet(aa, bb, cc, dd, ee)
      val s = emptyState.reset(nodes)
-      s.ending must be(Map.empty)
+      s.ending must be(Set.empty)
      val included = s.current.head
      val s2 = s.removeMember(included)
-      s2.ending must be(Map(included -> 0))
+      s2.ending must be(Set(included))
      s2.current must not contain (included)
      val s3 = s2.addMember(included)
      s3.current must contain(included)
-      s3.ending.keySet must not contain (included)
+      s3.ending must not contain (included)
    }
-    "increase ending count correctly" in {
+    "remove ending correctly" in {
      val s = emptyState.reset(HashSet(aa)).removeMember(aa)
-      s.ending must be(Map(aa -> 0))
+      s.ending must be(Set(aa))
-      val s2 = s.increaseEndingCount(aa).increaseEndingCount(aa)
+      val s2 = s.removeEnding(aa)
-      s2.ending must be(Map(aa -> 2))
+      s2.ending must be(Set.empty)
    }
  }
--- a/akka-cluster/src/test/scala/akka/cluster/GossipSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/GossipSpec.scala
@ -47,40 +47,17 @@ class GossipSpec extends WordSpec with MustMatchers {
    }
-    "merge unreachable by status priority" in {
+    "merge unreachable" in {
-      val g1 = Gossip(members = Gossip.emptyMembers, overview = GossipOverview(unreachable = Set(a1, b1, c1, d1)))
+      val r1 = Reachability.empty.unreachable(b1.uniqueAddress, a1.uniqueAddress).unreachable(b1.uniqueAddress, c1.uniqueAddress)
-      val g2 = Gossip(members = Gossip.emptyMembers, overview = GossipOverview(unreachable = Set(a2, b2, c2, d2)))
+      val g1 = Gossip(members = SortedSet(a1, b1, c1), overview = GossipOverview(reachability = r1))
      val r2 = Reachability.empty.unreachable(a1.uniqueAddress, d1.uniqueAddress)
      val g2 = Gossip(members = SortedSet(a1, b1, c1, d1), overview = GossipOverview(reachability = r2))
      val merged1 = g1 merge g2
-      merged1.overview.unreachable must be(Set(a2, b2, c1, d2))
+      merged1.overview.reachability.allUnreachable must be(Set(a1.uniqueAddress, c1.uniqueAddress, d1.uniqueAddress))
      merged1.overview.unreachable.toSeq.sorted.map(_.status) must be(Seq(Up, Removed, Leaving, Removed))
      val merged2 = g2 merge g1
-      merged2.overview.unreachable must be(Set(a2, b2, c1, d2))
+      merged2.overview.reachability.allUnreachable must be(merged1.overview.reachability.allUnreachable)
      merged2.overview.unreachable.toSeq.sorted.map(_.status) must be(Seq(Up, Removed, Leaving, Removed))
    }
    "merge by excluding unreachable from members" in {
      val g1 = Gossip(members = SortedSet(a1, b1), overview = GossipOverview(unreachable = Set(c1, d1)))
      val g2 = Gossip(members = SortedSet(a2, c2), overview = GossipOverview(unreachable = Set(b2, d2)))
      val merged1 = g1 merge g2
      merged1.members must be(SortedSet(a2))
      merged1.members.toSeq.map(_.status) must be(Seq(Up))
      merged1.overview.unreachable must be(Set(b2, c1, d2))
      merged1.overview.unreachable.toSeq.sorted.map(_.status) must be(Seq(Removed, Leaving, Removed))
      val merged2 = g2 merge g1
      merged2.members must be(SortedSet(a2))
      merged2.members.toSeq.map(_.status) must be(Seq(Up))
      merged2.overview.unreachable must be(Set(b2, c1, d2))
      merged2.overview.unreachable.toSeq.sorted.map(_.status) must be(Seq(Removed, Leaving, Removed))
    }
    "not have node in both members and unreachable" in intercept[IllegalArgumentException] {
      Gossip(members = SortedSet(a1, b1), overview = GossipOverview(unreachable = Set(b2)))
    }
    "not have live members with wrong status" in intercept[IllegalArgumentException] {
@ -121,9 +98,11 @@ class GossipSpec extends WordSpec with MustMatchers {
    "know who is youngest" in {
      // a2 and e1 is Joining
-      val g1 = Gossip(members = SortedSet(a2, b1.copyUp(3)), overview = GossipOverview(unreachable = Set(e1)))
+      val g1 = Gossip(members = SortedSet(a2, b1.copyUp(3), e1), overview = GossipOverview(reachability =
        Reachability.empty.unreachable(a2.uniqueAddress, e1.uniqueAddress)))
      g1.youngestMember must be(b1)
-      val g2 = Gossip(members = SortedSet(a2), overview = GossipOverview(unreachable = Set(b1.copyUp(3), e1)))
+      val g2 = Gossip(members = SortedSet(a2, b1.copyUp(3), e1), overview = GossipOverview(reachability =
        Reachability.empty.unreachable(a2.uniqueAddress, b1.uniqueAddress).unreachable(a2.uniqueAddress, e1.uniqueAddress)))
      g2.youngestMember must be(b1)
      val g3 = Gossip(members = SortedSet(a2, b1.copyUp(3), e2.copyUp(4)))
      g3.youngestMember must be(e2)
--- a/akka-cluster/src/test/scala/akka/cluster/ReachabilityPerfSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/ReachabilityPerfSpec.scala
@ -0,0 +1,130 @@
 /**
 * Copyright (C) 2009-2013 Typesafe Inc. <http://www.typesafe.com>
 */
 package akka.cluster
 import org.scalatest.WordSpec
 import org.scalatest.matchers.ShouldMatchers
 import akka.actor.Address
@org.junit.runner.RunWith(classOf[org.scalatest.junit.JUnitRunner])
 class ReachabilityPerfSpec extends WordSpec with ShouldMatchers {
  val nodesSize = sys.props.get("akka.cluster.ReachabilityPerfSpec.nodesSize").getOrElse("250").toInt
  val iterations = sys.props.get("akka.cluster.ReachabilityPerfSpec.iterations").getOrElse("10000").toInt
  val address = Address("akka.tcp", "sys", "a", 2552)
  val node = Address("akka.tcp", "sys", "a", 2552)
  def createReachabilityOfSize(base: Reachability, size: Int): Reachability =
    (base /: (1 to size)) {
      case (r, i) ⇒
        val observer = UniqueAddress(address.copy(host = Some("node-" + i)), i)
        val j = if (i == size) 1 else i + 1
        val subject = UniqueAddress(address.copy(host = Some("node-" + j)), j)
        r.unreachable(observer, subject).reachable(observer, subject)
    }
  def addUnreachable(base: Reachability, count: Int): Reachability = {
    val observers = base.allObservers.take(count)
    val subjects = Stream.continually(base.allObservers).flatten.iterator
    (base /: observers) {
      case (r, o) ⇒
        (r /: (1 to 5)) { case (r, _) ⇒ r.unreachable(o, subjects.next()) }
    }
  }
  val reachability1 = createReachabilityOfSize(Reachability.empty, nodesSize)
  val reachability2 = createReachabilityOfSize(reachability1, nodesSize)
  val reachability3 = addUnreachable(reachability1, nodesSize / 2)
  val allowed = reachability1.allObservers
  def checkThunkFor(r1: Reachability, r2: Reachability, thunk: (Reachability, Reachability) ⇒ Unit, times: Int): Unit = {
    for (i ← 1 to times) {
      thunk(Reachability(r1.records, r1.versions), Reachability(r2.records, r2.versions))
    }
  }
  def checkThunkFor(r1: Reachability, thunk: Reachability ⇒ Unit, times: Int): Unit = {
    for (i ← 1 to times) {
      thunk(Reachability(r1.records, r1.versions))
    }
  }
  def merge(expectedRecords: Int)(r1: Reachability, r2: Reachability): Unit = {
    r1.merge(allowed, r2).records.size should be(expectedRecords)
  }
  def checkStatus(r1: Reachability): Unit = {
    val record = r1.records.head
    r1.status(record.observer, record.subject) should be(record.status)
  }
  def checkAggregatedStatus(r1: Reachability): Unit = {
    val record = r1.records.head
    r1.status(record.subject) should be(record.status)
  }
  def allUnreachableOrTerminated(r1: Reachability): Unit = {
    val record = r1.records.head
    r1.allUnreachableOrTerminated.isEmpty should be(false)
  }
  def allUnreachable(r1: Reachability): Unit = {
    val record = r1.records.head
    r1.allUnreachable.isEmpty should be(false)
  }
  def recordsFrom(r1: Reachability): Unit = {
    r1.allObservers.foreach { o ⇒
      r1.recordsFrom(o) should not be be(null)
    }
  }
  s"Reachability of size $nodesSize" must {
    s"do a warm up run, $iterations times" in {
      checkThunkFor(reachability1, reachability2, merge(0), iterations)
    }
    s"merge with same versions, $iterations times" in {
      checkThunkFor(reachability1, reachability1, merge(0), iterations)
    }
    s"merge with all older versions, $iterations times" in {
      checkThunkFor(reachability2, reachability1, merge(0), iterations)
    }
    s"merge with all newer versions, $iterations times" in {
      checkThunkFor(reachability1, reachability2, merge(0), iterations)
    }
    s"merge with half nodes unreachable, $iterations times" in {
      checkThunkFor(reachability1, reachability3, merge(5 * nodesSize / 2), iterations)
    }
    s"merge with half nodes unreachable opposite $iterations times" in {
      checkThunkFor(reachability3, reachability1, merge(5 * nodesSize / 2), iterations)
    }
    s"check status with half nodes unreachable, $iterations times" in {
      checkThunkFor(reachability3, checkStatus, iterations)
    }
    s"check aggregated reachability status with half nodes unreachable, $iterations times" in {
      checkThunkFor(reachability3, checkAggregatedStatus, iterations)
    }
    s"get allUnreachableOrTerminated with half nodes unreachable, $iterations times" in {
      checkThunkFor(reachability3, allUnreachableOrTerminated, iterations)
    }
    s"get allUnreachable with half nodes unreachable, $iterations times" in {
      checkThunkFor(reachability3, allUnreachable, iterations)
    }
    s"get recordsFrom with half nodes unreachable, $iterations times" in {
      checkThunkFor(reachability3, recordsFrom, iterations)
    }
  }
 }
--- a/akka-cluster/src/test/scala/akka/cluster/ReachabilitySpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/ReachabilitySpec.scala
@ -0,0 +1,192 @@
 /**
 *  Copyright (C) 2009-2013 Typesafe Inc. <http://www.typesafe.com>
 */
 package akka.cluster
 import org.scalatest.WordSpec
 import org.scalatest.matchers.MustMatchers
 import akka.actor.Address
@org.junit.runner.RunWith(classOf[org.scalatest.junit.JUnitRunner])
 class ReachabilitySpec extends WordSpec with MustMatchers {
  import Reachability.{ Reachable, Unreachable, Terminated, Record }
  val nodeA = UniqueAddress(Address("akka.tcp", "sys", "a", 2552), 1)
  val nodeB = UniqueAddress(Address("akka.tcp", "sys", "b", 2552), 2)
  val nodeC = UniqueAddress(Address("akka.tcp", "sys", "c", 2552), 3)
  val nodeD = UniqueAddress(Address("akka.tcp", "sys", "d", 2552), 4)
  val nodeE = UniqueAddress(Address("akka.tcp", "sys", "e", 2552), 5)
  "Reachability table" must {
    "be reachable when empty" in {
      val r = Reachability.empty
      r.isReachable(nodeA) must be(true)
      r.allUnreachable must be(Set.empty)
    }
    "be unreachable when one observed unreachable" in {
      val r = Reachability.empty.unreachable(nodeB, nodeA)
      r.isReachable(nodeA) must be(false)
      r.allUnreachable must be(Set(nodeA))
    }
    "not be reachable when terminated" in {
      val r = Reachability.empty.terminated(nodeB, nodeA)
      r.isReachable(nodeA) must be(false)
      // allUnreachable doesn't include terminated
      r.allUnreachable must be(Set.empty)
      r.allUnreachableOrTerminated must be(Set(nodeA))
    }
    "not change terminated entry" in {
      val r = Reachability.empty.terminated(nodeB, nodeA)
      r.reachable(nodeB, nodeA) must be theSameInstanceAs (r)
      r.unreachable(nodeB, nodeA) must be theSameInstanceAs (r)
    }
    "not change when same status" in {
      val r = Reachability.empty.unreachable(nodeB, nodeA)
      r.unreachable(nodeB, nodeA) must be theSameInstanceAs (r)
    }
    "be unreachable when some observed unreachable and others reachable" in {
      val r = Reachability.empty.unreachable(nodeB, nodeA).unreachable(nodeC, nodeA).reachable(nodeD, nodeA)
      r.isReachable(nodeA) must be(false)
    }
    "be reachable when all observed reachable again" in {
      val r = Reachability.empty.unreachable(nodeB, nodeA).unreachable(nodeC, nodeA).
        reachable(nodeB, nodeA).reachable(nodeC, nodeA).
        unreachable(nodeB, nodeC).unreachable(nodeC, nodeB)
      r.isReachable(nodeA) must be(true)
    }
    "be pruned when all records of an observer are Reachable" in {
      val r = Reachability.empty.
        unreachable(nodeB, nodeA).unreachable(nodeB, nodeC).
        unreachable(nodeD, nodeC).
        reachable(nodeB, nodeA).reachable(nodeB, nodeC)
      r.isReachable(nodeA) must be(true)
      r.isReachable(nodeC) must be(false)
      r.records must be(Vector(Record(nodeD, nodeC, Unreachable, 1L)))
      val r2 = r.unreachable(nodeB, nodeD).unreachable(nodeB, nodeE)
      r2.records.toSet must be(Set(
        Record(nodeD, nodeC, Unreachable, 1L),
        Record(nodeB, nodeD, Unreachable, 5L),
        Record(nodeB, nodeE, Unreachable, 6L)))
    }
    "have correct aggregated status" in {
      val records = Vector(
        Reachability.Record(nodeA, nodeB, Reachable, 2),
        Reachability.Record(nodeC, nodeB, Unreachable, 2),
        Reachability.Record(nodeA, nodeD, Unreachable, 3),
        Reachability.Record(nodeD, nodeB, Terminated, 4))
      val versions = Map(nodeA -> 3L, nodeC -> 3L, nodeD -> 4L)
      val r = Reachability(records, versions)
      r.status(nodeA) must be(Reachable)
      r.status(nodeB) must be(Terminated)
      r.status(nodeD) must be(Unreachable)
    }
    "have correct status for a mix of nodes" in {
      val r = Reachability.empty.
        unreachable(nodeB, nodeA).unreachable(nodeC, nodeA).unreachable(nodeD, nodeA).
        unreachable(nodeC, nodeB).reachable(nodeC, nodeB).unreachable(nodeD, nodeB).
        unreachable(nodeD, nodeC).reachable(nodeD, nodeC).
        reachable(nodeE, nodeD).
        unreachable(nodeA, nodeE).terminated(nodeB, nodeE)
      r.status(nodeB, nodeA) must be(Unreachable)
      r.status(nodeC, nodeA) must be(Unreachable)
      r.status(nodeD, nodeA) must be(Unreachable)
      r.status(nodeC, nodeB) must be(Reachable)
      r.status(nodeD, nodeB) must be(Unreachable)
      r.status(nodeA, nodeE) must be(Unreachable)
      r.status(nodeB, nodeE) must be(Terminated)
      r.isReachable(nodeA) must be(false)
      r.isReachable(nodeB) must be(false)
      r.isReachable(nodeC) must be(true)
      r.isReachable(nodeD) must be(true)
      r.isReachable(nodeE) must be(false)
      r.allUnreachable must be(Set(nodeA, nodeB))
      r.allUnreachableFrom(nodeA) must be(Set(nodeE))
      r.allUnreachableFrom(nodeB) must be(Set(nodeA))
      r.allUnreachableFrom(nodeC) must be(Set(nodeA))
      r.allUnreachableFrom(nodeD) must be(Set(nodeA, nodeB))
      r.observersGroupedByUnreachable must be(Map(
        nodeA -> Set(nodeB, nodeC, nodeD),
        nodeB -> Set(nodeD),
        nodeE -> Set(nodeA)))
    }
    "merge by picking latest version of each record" in {
      val r1 = Reachability.empty.unreachable(nodeB, nodeA).unreachable(nodeC, nodeD)
      val r2 = r1.reachable(nodeB, nodeA).unreachable(nodeD, nodeE).unreachable(nodeC, nodeA)
      val merged = r1.merge(Set(nodeA, nodeB, nodeC, nodeD, nodeE), r2)
      merged.status(nodeB, nodeA) must be(Reachable)
      merged.status(nodeC, nodeA) must be(Unreachable)
      merged.status(nodeC, nodeD) must be(Unreachable)
      merged.status(nodeD, nodeE) must be(Unreachable)
      merged.status(nodeE, nodeA) must be(Reachable)
      merged.isReachable(nodeA) must be(false)
      merged.isReachable(nodeD) must be(false)
      merged.isReachable(nodeE) must be(false)
      val merged2 = r2.merge(Set(nodeA, nodeB, nodeC, nodeD, nodeE), r1)
      merged2.records.toSet must be(merged.records.toSet)
    }
    "merge correctly after pruning" in {
      val r1 = Reachability.empty.unreachable(nodeB, nodeA).unreachable(nodeC, nodeD)
      val r2 = r1.unreachable(nodeA, nodeE)
      val r3 = r1.reachable(nodeB, nodeA) // nodeB pruned
      val merged = r2.merge(Set(nodeA, nodeB, nodeC, nodeD, nodeE), r3)
      merged.records.toSet must be(Set(
        Record(nodeA, nodeE, Unreachable, 1),
        Record(nodeC, nodeD, Unreachable, 1)))
      val merged3 = r3.merge(Set(nodeA, nodeB, nodeC, nodeD, nodeE), r2)
      merged3.records.toSet must be(merged.records.toSet)
    }
    "merge versions correctly" in {
      val r1 = Reachability(Vector.empty, Map(nodeA -> 3L, nodeB -> 5L, nodeC -> 7L))
      val r2 = Reachability(Vector.empty, Map(nodeA -> 6L, nodeB -> 2L, nodeD -> 1L))
      val merged = r1.merge(Set(nodeA, nodeB, nodeC, nodeD, nodeE), r2)
      val expected = Map(nodeA -> 6L, nodeB -> 5L, nodeC -> 7L, nodeD -> 1L)
      merged.versions must be(expected)
      val merged2 = r2.merge(Set(nodeA, nodeB, nodeC, nodeD, nodeE), r1)
      merged2.versions must be(expected)
    }
    "remove node" in {
      val r = Reachability.empty.
        unreachable(nodeB, nodeA).
        unreachable(nodeC, nodeD).
        unreachable(nodeB, nodeC).
        unreachable(nodeB, nodeE).
        remove(Set(nodeA, nodeB))
      r.status(nodeB, nodeA) must be(Reachable)
      r.status(nodeC, nodeD) must be(Unreachable)
      r.status(nodeB, nodeC) must be(Reachable)
      r.status(nodeB, nodeE) must be(Reachable)
    }
  }
 }
--- a/akka-cluster/src/test/scala/akka/cluster/protobuf/ClusterMessageSerializerSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/protobuf/ClusterMessageSerializerSpec.scala
@ -44,6 +44,7 @@ class ClusterMessageSerializerSpec extends AkkaSpec {
      checkSerialization(InternalClusterAction.InitJoinNack(address))
      checkSerialization(ClusterHeartbeatReceiver.Heartbeat(address))
      checkSerialization(ClusterHeartbeatReceiver.EndHeartbeat(address))
      checkSerialization(ClusterHeartbeatReceiver.EndHeartbeatAck(address))
      checkSerialization(ClusterHeartbeatSender.HeartbeatRequest(address))
      val node1 = VectorClock.Node("node1")
@ -52,7 +53,8 @@ class ClusterMessageSerializerSpec extends AkkaSpec {
      val node4 = VectorClock.Node("node4")
      val g1 = (Gossip(SortedSet(a1, b1, c1, d1)) :+ node1 :+ node2).seen(a1.uniqueAddress).seen(b1.uniqueAddress)
      val g2 = (g1 :+ node3 :+ node4).seen(a1.uniqueAddress).seen(c1.uniqueAddress)
-      val g3 = g2.copy(overview = g2.overview.copy(unreachable = Set(e1, f1)))
+      val reachability3 = Reachability.empty.unreachable(a1.uniqueAddress, e1.uniqueAddress).unreachable(b1.uniqueAddress, e1.uniqueAddress)
      val g3 = g2.copy(members = SortedSet(a1, b1, c1, d1, e1), overview = g2.overview.copy(reachability = reachability3))
      checkSerialization(GossipEnvelope(a1.uniqueAddress, uniqueAddress2, g1))
      checkSerialization(GossipEnvelope(a1.uniqueAddress, uniqueAddress2, g2))
      checkSerialization(GossipEnvelope(a1.uniqueAddress, uniqueAddress2, g3))
--- a/akka-cluster/src/test/scala/akka/cluster/routing/ClusterRouterSupervisorSpec.scala
+++ b/akka-cluster/src/test/scala/akka/cluster/routing/ClusterRouterSupervisorSpec.scala
@ -6,7 +6,6 @@ package akka.cluster.routing
 import akka.testkit._
 import akka.actor._
 import akka.routing.RoundRobinRouter
 import akka.cluster.routing.ClusterRouterConfig
 import akka.actor.OneForOneStrategy
 object ClusterRouterSupervisorSpec {
--- a/akka-docs/rst/common/cluster.rst
+++ b/akka-docs/rst/common/cluster.rst
@ -94,8 +94,8 @@ by all other nodes in the cluster. Convergence is implemented by passing a map f
 node to current state version during gossip. This information is referred to as the
 gossip overview. When all versions in the overview are equal there is convergence.
 Gossip convergence cannot occur while any nodes are ``unreachable``. The nodes need
-to be moved to the ``down`` or ``removed`` states (see the `Membership Lifecycle`_
+to become ``reachable`` again, or moved to the ``down`` and ``removed`` states 
-section below).
+(see the `Membership Lifecycle`_ section below).
 Failure Detector
@ -127,9 +127,17 @@ In a cluster each node is monitored by a few (default maximum 5) other nodes, an
 any of these detects the node as ``unreachable`` that information will spread to
 the rest of the cluster through the gossip. In other words, only one node needs to
 mark a node ``unreachable`` to have the rest of the cluster mark that node ``unreachable``.
-Right now there is no way for a node to come back from ``unreachable``. This is planned
+
-for the next release of Akka. It also means that the ``unreachable`` node needs to be moved
+The failure detector will also detect if the node becomes ``reachable`` again. When
-to the ``down`` or ``removed`` states (see the `Membership Lifecycle`_ section below).
+all nodes that monitored the ``unreachable`` node detects it as ``reachable`` again
 the cluster, after gossip dissemination, will consider it as ``reachable``. 
 If system messages cannot be delivered to a node it will be quarantined and then it
 cannot come back from ``unreachable``. This can happen if the there are too many
 unacknowledged system messages (e.g. watch, Terminated, remote actor deployment, 
 failures of actors supervised by remote parent). Then the node needs to be moved
 to the ``down`` or ``removed`` states (see the `Membership Lifecycle`_ section below)
 and the actor system must be restarted before it can join the cluster again.
 .. _The Phi Accrual Failure Detector: http://ddg.jaist.ac.jp/pub/HDY+04.pdf
@ -221,8 +229,8 @@ from the cluster, marking it as ``removed``.
 If a node is ``unreachable`` then gossip convergence is not possible and therefore
 any ``leader`` actions are also not possible (for instance, allowing a node to
 become a part of the cluster). To be able to move forward the state of the
-``unreachable`` nodes must be changed. Currently the only way forward is to mark the
+``unreachable`` nodes must be changed. It must become ``reachable`` again or marked
-node as ``down``. If the node is to join the cluster again the actor system must be
+as ``down``. If the node is to join the cluster again the actor system must be
 restarted and go through the joining process again. The cluster can, through the
 leader, also *auto-down* a node.
@ -292,8 +300,10 @@ Failure Detection and Unreachability
    causing the monitored node to be marked as unreachable
 - unreachable*
-    unreachable is not a real member state but more of a flag in addition
+    unreachable is not a real member states but more of a flag in addition
-    to the state signaling that the cluster is unable to talk to this node
+    to the state signaling that the cluster is unable to talk to this node,
    after beeing unreachable the failure detector may detect it as reachable
    again and thereby remove the flag
 Future Cluster Enhancements and Additions
@ -649,4 +659,3 @@ storage on top of the Akka Cluster as described in this document are:
 * Actor handoff
 * Actor rebalancing
 * Stateful actor replication
 * Node becoming ``reachable`` after it has been marked as ``unreachable``
--- a/akka-docs/rst/images/member-states.drawing
+++ b/akka-docs/rst/images/member-states.drawing
--- a/akka-docs/rst/images/member-states.png
+++ b/akka-docs/rst/images/member-states.png
--- a/akka-docs/rst/images/member-states.svg
+++ b/akka-docs/rst/images/member-states.svg
--- a/akka-docs/rst/java/cluster-usage.rst
+++ b/akka-docs/rst/java/cluster-usage.rst
@ -141,10 +141,10 @@ Automatic vs. Manual Downing
 When a member is considered by the failure detector to be unreachable the
 leader is not allowed to perform its duties, such as changing status of
-new joining members to 'Up'. The status of the unreachable member must be
+new joining members to 'Up'. The node must first become reachable again, or the
-changed to 'Down'. This can be performed automatically or manually. By
+status of the unreachable member must be changed to 'Down'. Changing status to 'Down'
-default it must be done manually, using using :ref:`cluster_jmx_java` or
+can be performed automatically or manually. By default it must be done manually, using 
-:ref:`cluster_command_line_java`.
+:ref:`cluster_jmx_java` or :ref:`cluster_command_line_java`.
 It can also be performed programatically with ``Cluster.get(system).down(address)``.
@ -194,10 +194,13 @@ receive ``MemberUp`` for that node, and other nodes.
 The events to track the life-cycle of members are:
 * ``ClusterEvent.MemberUp`` - A new member has joined the cluster and its status has been changed to ``Up``.
-* ``ClusterEvent.MemberExited`` - A member is leaving the cluster and its status has been changed to ``Exiting``.
+* ``ClusterEvent.MemberExited`` - A member is leaving the cluster and its status has been changed to ``Exiting``
  Note that the node might already have been shutdown when this event is published on another node.
 * ``ClusterEvent.MemberRemoved`` - Member completely removed from the cluster.
-* ``ClusterEvent.UnreachableMember`` - A member is considered as unreachable by the failure detector.
+* ``ClusterEvent.UnreachableMember`` - A member is considered as unreachable, detected by the failure detector
  of at least one other node.
 * ``ClusterEvent.ReachableMember`` - A member is considered as reachable again, after having been unreachable.
  All nodes that previously detected it as unreachable has detected it as reachable again.
 There are more types of change events, consult the API documentation
 of classes that extends ``akka.cluster.ClusterEvent.ClusterDomainEvent``
@ -324,6 +327,22 @@ See :ref:`cluster-client` in the contrib module.
 Failure Detector
 ^^^^^^^^^^^^^^^^
 In a cluster each node is monitored by a few (default maximum 5) other nodes, and when
 any of these detects the node as ``unreachable`` that information will spread to
 the rest of the cluster through the gossip. In other words, only one node needs to
 mark a node ``unreachable`` to have the rest of the cluster mark that node ``unreachable``.
 The failure detector will also detect if the node becomes ``reachable`` again. When
 all nodes that monitored the ``unreachable`` node detects it as ``reachable`` again
 the cluster, after gossip dissemination, will consider it as ``reachable``. 
 If system messages cannot be delivered to a node it will be quarantined and then it
 cannot come back from ``unreachable``. This can happen if the there are too many
 unacknowledged system messages (e.g. watch, Terminated, remote actor deployment, 
 failures of actors supervised by remote parent). Then the node needs to be moved
 to the ``down`` or ``removed`` states and the actor system must be restarted before
 it can join the cluster again.
 The nodes in the cluster monitor each other by sending heartbeats to detect if a node is
 unreachable from the rest of the cluster. The heartbeat arrival times is interpreted
 by an implementation of
@ -384,9 +403,10 @@ Cluster Aware Routers
 All :ref:`routers <routing-java>` can be made aware of member nodes in the cluster, i.e.
 deploying new routees or looking up routees on nodes in the cluster.
-When a node becomes unavailable or leaves the cluster the routees of that node are
+When a node becomes unreachable or leaves the cluster the routees of that node are
 automatically unregistered from the router. When new nodes join the cluster additional
-routees are added to the router, according to the configuration.
+routees are added to the router, according to the configuration. Routees are also added 
 when a node becomes reachable again, after having been unreachable.
 There are two distinct types of routers. 
--- a/akka-docs/rst/scala/cluster-usage.rst
+++ b/akka-docs/rst/scala/cluster-usage.rst
@ -134,10 +134,10 @@ Automatic vs. Manual Downing
 When a member is considered by the failure detector to be unreachable the
 leader is not allowed to perform its duties, such as changing status of
-new joining members to 'Up'. The status of the unreachable member must be
+new joining members to 'Up'. The node must first become reachable again, or the
-changed to 'Down'. This can be performed automatically or manually. By
+status of the unreachable member must be changed to 'Down'. Changing status to 'Down'
-default it must be done manually, using using :ref:`cluster_jmx_scala` or
+can be performed automatically or manually. By default it must be done manually, using
-:ref:`cluster_command_line_scala`.
+:ref:`cluster_jmx_scala` or :ref:`cluster_command_line_scala`.
 It can also be performed programatically with ``Cluster(system).down(address)``.
@ -187,10 +187,13 @@ receive ``MemberUp`` for that node, and other nodes.
 The events to track the life-cycle of members are:
 * ``ClusterEvent.MemberUp`` - A new member has joined the cluster and its status has been changed to ``Up``.
-* ``ClusterEvent.MemberExited`` - A member is leaving the cluster and its status has been changed to ``Exiting``.
+* ``ClusterEvent.MemberExited`` - A member is leaving the cluster and its status has been changed to ``Exiting``
  Note that the node might already have been shutdown when this event is published on another node.
 * ``ClusterEvent.MemberRemoved`` - Member completely removed from the cluster.
-* ``ClusterEvent.UnreachableMember`` - A member is considered as unreachable by the failure detector.
+* ``ClusterEvent.UnreachableMember`` - A member is considered as unreachable, detected by the failure detector
  of at least one other node.
 * ``ClusterEvent.ReachableMember`` - A member is considered as reachable again, after having been unreachable.
  All nodes that previously detected it as unreachable has detected it as reachable again.
 There are more types of change events, consult the API documentation
 of classes that extends ``akka.cluster.ClusterEvent.ClusterDomainEvent``
@ -312,6 +315,22 @@ See :ref:`cluster-client` in the contrib module.
 Failure Detector
 ^^^^^^^^^^^^^^^^
 In a cluster each node is monitored by a few (default maximum 5) other nodes, and when
 any of these detects the node as ``unreachable`` that information will spread to
 the rest of the cluster through the gossip. In other words, only one node needs to
 mark a node ``unreachable`` to have the rest of the cluster mark that node ``unreachable``.
 The failure detector will also detect if the node becomes ``reachable`` again. When
 all nodes that monitored the ``unreachable`` node detects it as ``reachable`` again
 the cluster, after gossip dissemination, will consider it as ``reachable``. 
 If system messages cannot be delivered to a node it will be quarantined and then it
 cannot come back from ``unreachable``. This can happen if the there are too many
 unacknowledged system messages (e.g. watch, Terminated, remote actor deployment, 
 failures of actors supervised by remote parent). Then the node needs to be moved
 to the ``down`` or ``removed`` states and the actor system must be restarted before
 it can join the cluster again.
 The nodes in the cluster monitor each other by sending heartbeats to detect if a node is
 unreachable from the rest of the cluster. The heartbeat arrival times is interpreted
 by an implementation of
@ -375,9 +394,10 @@ Cluster Aware Routers
 All :ref:`routers <routing-scala>` can be made aware of member nodes in the cluster, i.e.
 deploying new routees or looking up routees on nodes in the cluster.
-When a node becomes unavailable or leaves the cluster the routees of that node are
+When a node becomes unreachable or leaves the cluster the routees of that node are
 automatically unregistered from the router. When new nodes join the cluster additional
-routees are added to the router, according to the configuration.
+routees are added to the router, according to the configuration. Routees are also added 
 when a node becomes reachable again, after having been unreachable.
 There are two distinct types of routers. 
--- a/akka-remote/src/main/scala/akka/remote/PhiAccrualFailureDetector.scala
+++ b/akka-remote/src/main/scala/akka/remote/PhiAccrualFailureDetector.scala
@ -100,7 +100,9 @@ class PhiAccrualFailureDetector(
  private val state = new AtomicReference[State](State(history = firstHeartbeat, timestamp = None))
-  override def isAvailable: Boolean = phi < threshold
+  override def isAvailable: Boolean = isAvailable(clock())
  private def isAvailable(timestamp: Long): Boolean = phi(timestamp) < threshold
  override def isMonitoring: Boolean = state.get.timestamp.nonEmpty
@ -118,7 +120,9 @@ class PhiAccrualFailureDetector(
      case Some(latestTimestamp) ⇒
        // this is a known connection
        val interval = timestamp - latestTimestamp
-        oldState.history :+ interval
+        // don't use the first heartbeat after failure for the history, since a long pause will skew the stats
        if (isAvailable(timestamp)) oldState.history :+ interval
        else oldState.history
    }
    val newState = oldState.copy(history = newHistory, timestamp = Some(timestamp)) // record new timestamp
@ -133,13 +137,15 @@ class PhiAccrualFailureDetector(
   * If a connection does not have any records in failure detector then it is
   * considered healthy.
   */
-  def phi: Double = {
+  def phi: Double = phi(clock())
  private def phi(timestamp: Long): Double = {
    val oldState = state.get
    val oldTimestamp = oldState.timestamp
    if (oldTimestamp.isEmpty) 0.0 // treat unmanaged connections, e.g. with zero heartbeats, as healthy connections
    else {
-      val timeDiff = clock() - oldTimestamp.get
+      val timeDiff = timestamp - oldTimestamp.get
      val history = oldState.history
      val mean = history.mean
--- a/akka-remote/src/main/scala/akka/remote/Remoting.scala
+++ b/akka-remote/src/main/scala/akka/remote/Remoting.scala
@ -400,10 +400,8 @@ private[remote] class EndpointManager(conf: Config, log: LoggingAdapter) extends
      case HopelessAssociation(localAddress, remoteAddress, Some(uid), _) ⇒
        settings.QuarantineDuration match {
          case d: FiniteDuration ⇒
            log.warning("Association to [{}] having UID [{}] is irrecoverably failed. UID is now quarantined and all " +
              "messages to this UID will be delivered to dead letters. Remote actorsystem must be restarted to recover " +
              "from this situation.", remoteAddress, uid)
            endpoints.markAsQuarantined(remoteAddress, uid, Deadline.now + d)
            eventPublisher.notifyListeners(QuarantinedEvent(remoteAddress, uid))
          case _ ⇒ // disabled
        }
        context.system.eventStream.publish(AddressTerminated(remoteAddress))
@ -488,9 +486,8 @@ private[remote] class EndpointManager(conf: Config, log: LoggingAdapter) extends
            case Some(endpoint) ⇒ context.stop(endpoint)
            case _              ⇒ // nothing to stop
          }
          log.info("Address [{}] is now quarantined, all messages to this address will be delivered to dead letters.",
            address)
          endpoints.markAsQuarantined(address, uid, Deadline.now + d)
          eventPublisher.notifyListeners(QuarantinedEvent(address, uid))
        case _ ⇒ // Ignore
      }
--- a/akka-remote/src/main/scala/akka/remote/RemotingLifecycleEvent.scala
+++ b/akka-remote/src/main/scala/akka/remote/RemotingLifecycleEvent.scala
@ -78,6 +78,15 @@ final case class RemotingErrorEvent(cause: Throwable) extends RemotingLifecycleE
  override def toString: String = s"Remoting error: [${cause.getMessage}] [${Logging.stackTraceFor(cause)}]"
 }
@SerialVersionUID(1L)
 case class QuarantinedEvent(address: Address, uid: Int) extends RemotingLifecycleEvent {
  override def logLevel: Logging.LogLevel = Logging.WarningLevel
  override val toString: String =
    s"Association to [$address] having UID [$uid] is irrecoverably failed. UID is now quarantined and all " +
      "messages to this UID will be delivered to dead letters. Remote actorsystem must be restarted to recover " +
      "from this situation."
 }
 /**
 * INTERNAL API
 */
--- a/akka-remote/src/test/scala/akka/remote/AccrualFailureDetectorSpec.scala
+++ b/akka-remote/src/test/scala/akka/remote/AccrualFailureDetectorSpec.scala
@ -26,7 +26,7 @@ class AccrualFailureDetectorSpec extends AkkaSpec("akka.loglevel = INFO") {
    def createFailureDetector(
      threshold: Double = 8.0,
      maxSampleSize: Int = 1000,
-      minStdDeviation: FiniteDuration = 10.millis,
+      minStdDeviation: FiniteDuration = 100.millis,
      acceptableLostDuration: FiniteDuration = Duration.Zero,
      firstHeartbeatEstimate: FiniteDuration = 1.second,
      clock: Clock = FailureDetector.defaultClock) =
@ -120,19 +120,21 @@ class AccrualFailureDetectorSpec extends AkkaSpec("akka.loglevel = INFO") {
    }
    "mark node as available if it starts heartbeat again after being marked dead due to detection of failure" in {
-      val timeInterval = List[Long](0, 1000, 100, 1100, 7000, 100, 1000, 100, 100)
+      // 1000 regular intervals, 5 minute pause, and then a short pause again that should trigger unreachable again
-      val fd = createFailureDetector(threshold = 3, clock = fakeTimeGenerator(timeInterval))
+      val regularIntervals = 0L +: Vector.fill(999)(1000L)
      val timeIntervals = regularIntervals :+ (5 * 60 * 1000L) :+ 100L :+ 900L :+ 100L :+ 7000L :+ 100L :+ 900L :+ 100L :+ 900L
      val fd = createFailureDetector(threshold = 8, acceptableLostDuration = 3.seconds, clock = fakeTimeGenerator(timeIntervals))
-      fd.heartbeat() //0
+      for (_ ← 0 until 1000) fd.heartbeat()
-      fd.heartbeat() //1000
+      fd.isAvailable must be(false) // after the long pause
-      fd.heartbeat() //1100
+      fd.heartbeat()
-      fd.isAvailable must be(true) //1200
+      fd.isAvailable must be(true)
-      fd.isAvailable must be(false) //8200
+      fd.heartbeat()
-      fd.heartbeat() //8300
+      fd.isAvailable must be(false) // after the 7 seconds pause
-      fd.heartbeat() //9300
+      fd.heartbeat()
-      fd.heartbeat() //9400
+      fd.isAvailable must be(true)
-
+      fd.heartbeat()
-      fd.isAvailable must be(true) //9500
+      fd.isAvailable must be(true)
    }
    "accept some configured missing heartbeats" in {
@ -164,7 +166,7 @@ class AccrualFailureDetectorSpec extends AkkaSpec("akka.loglevel = INFO") {
    }
    "use maxSampleSize heartbeats" in {
-      val timeInterval = List[Long](0, 100, 100, 100, 100, 600, 1000, 1000, 1000, 1000, 1000)
+      val timeInterval = List[Long](0, 100, 100, 100, 100, 600, 500, 500, 500, 500, 500)
      val fd = createFailureDetector(maxSampleSize = 3, clock = fakeTimeGenerator(timeInterval))
      // 100 ms interval
@ -173,12 +175,12 @@ class AccrualFailureDetectorSpec extends AkkaSpec("akka.loglevel = INFO") {
      fd.heartbeat() //200
      fd.heartbeat() //300
      val phi1 = fd.phi //400
-      // 1000 ms interval, should become same phi when 100 ms intervals have been dropped
+      // 500 ms interval, should become same phi when 100 ms intervals have been dropped
      fd.heartbeat() //1000
      fd.heartbeat() //1500
      fd.heartbeat() //2000
-      fd.heartbeat() //3000
+      fd.heartbeat() //2500
-      fd.heartbeat() //4000
+      val phi2 = fd.phi //3000
      val phi2 = fd.phi //5000
      phi2 must be(phi1.plusOrMinus(0.001))
    }
@ -211,7 +213,7 @@ class AccrualFailureDetectorSpec extends AkkaSpec("akka.loglevel = INFO") {
      val history5 = history4 :+ 80
      history5.mean must be(103.333333 plusOrMinus 0.00001)
      history5.variance must be(688.88888889 plusOrMinus 0.00001)
    }
  }
 }