彩票之家首页

  • <tr id='8poFiC'><strong id='8poFiC'></strong><small id='8poFiC'></small><button id='8poFiC'></button><li id='8poFiC'><noscript id='8poFiC'><big id='8poFiC'></big><dt id='8poFiC'></dt></noscript></li></tr><ol id='8poFiC'><option id='8poFiC'><table id='8poFiC'><blockquote id='8poFiC'><tbody id='8poFiC'></tbody></blockquote></table></option></ol><u id='8poFiC'></u><kbd id='8poFiC'><kbd id='8poFiC'></kbd></kbd>

    <code id='8poFiC'><strong id='8poFiC'></strong></code>

    <fieldset id='8poFiC'></fieldset>
          <span id='8poFiC'></span>

              <ins id='8poFiC'></ins>
              <acronym id='8poFiC'><em id='8poFiC'></em><td id='8poFiC'><div id='8poFiC'></div></td></acronym><address id='8poFiC'><big id='8poFiC'><big id='8poFiC'></big><legend id='8poFiC'></legend></big></address>

              <i id='8poFiC'><div id='8poFiC'><ins id='8poFiC'></ins></div></i>
              <i id='8poFiC'></i>
            1. <dl id='8poFiC'></dl>
              1. <blockquote id='8poFiC'><q id='8poFiC'><noscript id='8poFiC'></noscript><dt id='8poFiC'></dt></q></blockquote><noframes id='8poFiC'><i id='8poFiC'></i>

                行业动态

                了解最新公司动态及行业资讯

                当前位置:首页>新闻中心>行业动态
                全部 4017 公司动态 881 行业动态 3136

                阿里云弹性计算团队如何利用人工智能运维自动◣化,实现云上服务器无人值守

                时间:2022-05-07   访问量:1978

                云原生时代,企业IT运维面临架构复杂、业务需求多样化、运维数据海量等挑战。已成为企业数字化转型的迫切需求。

                9月26日,阿里巴巴高级技术专家滕胜波在“GOPS全球运◥维大会”上发表了题为“云服务器无人值守与自助服务”的主题演讲,分享了阿里云弹性计算团队如何利用人工智能。智能技术实现自动▃化运维,实现云端≡服务器无人值守,帮助用户降低云服务器实例管理复杂度,保障实例服务稳定高效运行。本文是根据滕胜波的讲话改编的。

                本文内容结构㊣:

                1、为什么云服务器需要无人值守?

                2、阿里巴巴云无人值守自助实战

                3、无人值守背后的数据和AI

                1、为什么云服务器需要无人值守?

                运维是一种服务,既包括基础设施№软件服务,也包括人工服务。服务的对象是企业中使用基础设施的业务团队,而云计算IaaS是●一种运维服务,而服务的对象已经开发为使用云服务的开发人员和╱运营团队。随着云计算的广泛实施,大多数企业已经迁移到云端。目前,有超过100万用户的业务在阿里云平台上运行,阿里云平台』服务的用户也越来越多。

                随着平台用户的扩大,我们发现平台用户在运维ECS实例时普遍面临三个痛点:

                (1)后台通信成本高,为什么我的实例有问题?

                (2)手工处理时间长,为什么这个问题这么久没有解决?

                (3)客户端操作不透明,问题好像解决了,但是你刚刚做了什么?

                为此,我们需要在客服人员上投入巨资,让用户的问题得到高效的解决。为了避免用户规模扩大带来的客户端运维成本线性增加,我们开始使用人工≡智能技术赋能用户运维管理。当无人零∏售、无人驾驶成为趋势时,我们相信未来云端服务器也将无人值守。

                运维项目服务巡检报告_it运维服务流程图_服务器运维技术

                事实上,阿里云弹性计算产品推出十年,积累了很多ECS实例运维管理经验和卐异常“行为”规则。因此,依托机●器学习的数据驱动特性,我们通过对异常“行为”数据的分析,为云端服务器搭建无人值守架构,推出一系列自助服务,实现自诊断、自愈合、自优化和自运维帮助用户降低ECS实例管理的复杂度,从而保证实例服务的稳定高效运行。

                2、无人值守自助实战

                image.png

                云计算IaaS的运维可以分为服务端运维和客户端运维。服务端运维是云平台的运维工作,通常用户看不到,主要涉及基础设施、基础产品和上层管控。三个层次,包括机房和物理设备的运维、资源虚拟化、资源调度、热迁移。随着用户规模的扩大,这些运维任务会越来越复杂。用户侧运维工作对用户是可见的,主要是用户对ECS实例的修改和自动化,包括扩容、重启、监控、客服、

                我们搭建的云服务器无人值守架构,为阿里云平台用户提供了一系列的自助服务。从广义上讲,阿里云的自助服务包括四个维度:ECS实例本身、实例生命周期管理、系统管Ψ 理与自动化、市场与生态,如下图所示。

                image.png

                服务器运维技术_运维项目服务巡检报告_it运维服务流程图

                图:广⊙义的自助服务

                狭义的阿里云自助服务是为用户实现ECS实例的诊断、修复、推荐等功能。当天,阿里云自助提供了实例诊断工具、实例优化推荐、自动修复工具、最佳模板推荐、ECS事件自动化等一系列自助工具服务器运维技术,覆盖了80%的常见ECS问题,将平均问题解决时间从几小时缩短到几分钟。全程无需客服人员人工参与,不存在隐私泄露风险。云上的服务器是无人值守的。未来服务器运维技术,随着AI+数据的不断驱动,ECS实例的诊断和修复会越来越精准。

                ECS实例智能诊断

                根据平台统计,用户在使用ECS实例时主要面临四类问题:

                (1)无法远程访问实例

                (2)实例无法启动/停止

                服务器运维技术_运维项目服务巡检报告_it运维服务流程图

                (3)实例性能异常

                (4)扩盘不生效

                因此,在智能诊断能力方面,我们涵◣盖了ECS系统服务、磁盘健康服务、网络健康服务、Guest OS系统配置等维度。用户可以一键完成实例的智能健康诊断。

                ECS实例自动修复

                智能诊断ω完成后,我们还将为用户提供ECS实例的自动修复解决方案。前者定位问题后,自动修复可在1-3分钟内解决问题,主要完成ECS系统服务修复、网络问题修复ω 和磁盘修复。.

                仅仅实施自动化修复是不够的,我们认为自动化修复还应该是透明和合规的。我们通过运维编排服务OOS提供自动化引擎,通过云助手命令提供内部执行能力。运维编排服务OOS+云助手命令共同帮助用户完成自动修复;同时开源运维编排服务OOS+云助手命令。代码,使所有修复逻辑对用户】可见;所有修复操作也可以通过ECS实例镜像、快照、数据备份进行回滚;所有权限都可以通过阿里云RAM角色控制来控制,

                it运维服务流程图_服务器运维技术_运维项目服务巡检报告

                3、无人值守背后的AI和数据能力

                使我们能够实现智█能诊断和自动修复的,是冰山下的强大技术支撑——AI+数据。依托底层数据中心,完成了物理机数据、虚拟化数据、网络数据、控制□面数据、内部数据等数据的采集、清洗、分析和模型构建;再加上AI算法的不断优化,我①们构建了用户画像、决策树、预测推荐模型等,确保□ 异常诊断和自动修复更加精准高效。

                image.png

                目前,在整个ECS自助服务架构中,控制监控中心主要依靠日志服务的实时监控、中间件监控、API请求监控、控制台监控和自诊◣断数据,实现问题预警和通过机器学习引擎进行处理,进而驱动运维编排服务OOS,实现问题的自动修复。

                image.png

                通过这种AI驱动的自助服∴务架构,目前阿里云ECS实时内存异常感知准确率超过70%,实现预测链路延迟控制在100s以内;此外,整合专家经验、案例库和知识库,构建强大√的诊断决策树,为加快问题定位和修复提供有力依据。

                近两年,阿里云弹性计算团队不断投入异常行为数据集的建设。未来计划将其演化为阿里巴巴集团异常预测的“数据集”并开源,希望对行业异常预测的发展有所帮助。贡献更大的价值。

                上一篇:【干货】运维工程师的职责和前景点解剖

                下一篇:服务机器人应用技术员:为机器人装上聪明的“大脑”送餐(组图)

                发表评论:

                评论记录:

                未查询到任何数据!

                在线咨询

                点击这里给我发消息 售前咨询专员

                点击这里给我发消息 售后服务专员

                在线咨询

                免费通话

                24小时免费咨询

                请输入您的联系电话,座机请加区号

                免费通话

                微信扫一◤扫

                微信联系
                返回顶部