2017年3月6日 Linux.

秩序的混乱

由罗恩Breault

R.Breault2017blog

什么比尝试root更令人沮丧地导致一个在大型多过程服务器上运行的应用程序的问题?当该服务器运行OpenStack时,如何执行相同,对于生成隐藏日志令人乐恶?现在想象当应用程序可能跨越100个服务器并迁移到100个服务器并以自己的虚拟机运行虚拟化时,这同样的挑战!云操作员的生活有时可以令人讨厌。

谢天谢地,如果你负责跑步风河钛云,你有一些不可思议的强大和智能的工具,使你的工作更容易和更有效。

除了我在过去的文章中提到的丰富特性(精心策划的补丁、在服务中的版本到版本升级、网络故障排除),Titanium Cloud还提供了一个集成的、预先配置的基于开源的日志分析样例工具麋鹿堆栈(弹性搜索,LogstashKibana).

生产云跨越数十到数百个节点——而且还在不断增长。每个节点都会不断地生成系统日志的实时流,从调试和错误消息到安全通知和信息更新。有些日志是由主机操作系统生成的,有些是由系统服务(如数据库、webserver)生成的;其他许多是由OpenStack (Nova, Cinder, Keystone, Ceph等)组成的各种项目生成的。如果没有某种形式的专家系统,试图追踪影响云服务的特定问题简直就像大海捞针!根据集群的大小及其工作负载,所有这些节点上可能存在成千上万的日志。要找到问题的根源,通常需要逐个文件搜索每个节点上的日志,因为一个问题往往会对其他服务器产生影响。问题从何而来?在什么时间?持续了多久? Which problems are simply “noise”- secondary issues resulting from the root cause issue – and which point to the original problem?

ELK工具的示例版本捆绑在钛云SDK中,交付给所有钛云客户。运行一个简单的脚本,运营商可以选择将elk安装到专用的裸机服务器上,或者它可以轻松地部署到VM本身中。安装和设置后,ELK接收,整合,分类,过滤器和对每个服务器中的所有日志进行排序,实时,7×24在后台。

使用互动和直观的麋鹿GUI,运营商调查问题具有各种可视化来帮助概念化所收集的所有复杂数据。ELK为其用户提供了丰富的选项,可帮助分析数据,在特定节点,设备上放大特定的时间段,或查找特定关键词。事实上,有很多不同和强大的方法可以使用ELK调查问题,即系统具有自己的“仪表板”定义设施。这让用户根据需要创建和保存自定义搜索条件。为了进一步帮助运营商,钛云的麋鹿采用一套手工制作的仪表板来预配置,风河团队的感觉是新的钛云装置的完美开始。对于真正需要这些工具的人来说,这是一个暗室里的亮光!

orderfromchaos

将ELK看作是您的虚拟助手,它可以在几分钟而不是几小时内帮助您找出系统问题的根源;在你最需要的时候,它能给你带来秩序。语言本身并不能传达这个精心设计、备受尊敬的工具的全部威力和易用性。Reach out to Wind River today and schedule a demo of ELK for Titanium Cloud and see for yourself如何帮助您的业务!

以前的名字里有什么?关键基础设施中的虚拟化新应用程序
下一个英特尔推动自动驾驶和工业市场的创新