网站下线的教训,顺便问问大家是如何保证网站高度可用的?

作者 jw2013 所属板块 学习资料
网站down了一天。原来跑`mix deps.get`一直挂在那里毫无输出和反应,debug起来也很麻烦。 后来Eric说了个Mix的http tracing选项: `elixir -e ":inets_trace.enable(:max, 'trace.txt', :httpc)" -S mix deps.get` 会把http的trace输出到trace.txt,有了这个debug就容易多了。然后Jose看了log一眼就猜出是环境变量的问题(http代理被设成了错误的值)才导致`mix deps.get`一直连不上Amazon S3。也不知道什么时候被设上去的。可能是最近安装别的软件的时候被改的? 感觉这种问题要是没mix的log也很难查出来。这次一是学到了Mix的http log,二是以后遇到这种问题先把旧版本能用的代码重新部署了,怎么也比网站下线好。这次重新部署旧版本太慢了,应该先部署完能用的旧版本(让网站上线)再去debug新版本的问题的。这回主次还是没分明。 请问大家在工作中是如何保证服务高度可用的?来说说大家的经验和经历吧。 点名要求 [@nodemore](/users/41) 和 Kabie 回答
3 回复
  • bareilles 发表
    哪方面的高度可用? 中心思想就是多复制减少单一失败点。
  • developerworks 发表
    换Linode好了.
  • jw2013 发表
    [@developerworks](/users/38) 您这高富帅在用Linode?