背景介绍
中文权威指南
- http://www.ansible.com.cn/
推荐资料
- http://galaxy.ansible.com
- https://galaxy.ansible.com/explore#/
- http://github.com/
- http://ansible.com.cn/
- https://github.com/ansible/ansible
- https://github.com/ansible/ansible-examples
# 关于运维背景知识
# 运维自动化发展历程
类比
# 企业应用场景分析
Dev开发环境
使用者:程序员
功能:程序员开发软件,测试BUG的环境
管理者:程序员
测试环境
使用者:QA测试工程师
功能:测试经过Dev环境测试通过的软件的功能
管理者:运维
说明:测试环境往往有多套,测试环境满足测试功能即可,不宜过多
1、测试人员希望测试环境有多套,公司的产品多产品线并发,即多个版本,意味着多个版本同步测试
2、通常测试环境有多少套和产品线数量保持一样
发布环境:代码发布机,有些公司为堡垒机(安全屏障)
使用者:运维
功能:发布代码至生产环境
管理者:运维(有经验)
发布机:往往需要有2台(主备)
生产环境
使用者:运维,少数情况开放权限给核心开发人员,极少数公司将权限完全
开放给开发人员并其维护
功能:对用户提供公司产品的服务
管理者:只能是运维
生产环境服务器数量:一般比较多,且应用非常重要。往往需要自动工具协助部署配置应用
灰度环境(生产环境的一部分)
使用者:运维
功能:在全量发布代码前将代码的功能面向少量精准用户发布的环境,可基
于主机或用户执行灰度发布
案例:共100台生产服务器,先发布其中的10台服务器,这10台服务器就是灰度服务器
管理者:运维
灰度环境:往往该版本功能变更较大,为保险起见特意先让一部分用户优化体验该功能,
待这部分用户使用没有重大问题的时候,再全量发布至所有服务器
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
# 程序发布
程序发布要求:
不能导致系统故障或造成系统完全不可用
不能影响用户体验
预发布验证:
新版本的代码先发布到服务器(跟线上环境配置完全相同,只是未接入到调度器)
灰度发布:
基于主机,用户,业务
发布路径:
/webapp/tuangou
/webapp/tuangou-1.1
/webapp/tuangou-1.2
发布过程:在调度器上下线一批主机(标记为maintanance状态) --> 关闭服务 -->
部署新版本的应用程序 --> 启动服务 --> 在调度器上启用这一批服务器
自动化灰度发布:脚本、发布平台
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2
3
4
5
6
7
8
9
10
11
12
13
14
# 常用自动化运维工具
Ansible
python
不需要部署agent,基于ssh
中小型应用环境
- 由于是基于ssh,那么机器过多,执行效率低,适合300+左右的机器的企业使用
Saltstack
python
需要部署agent
执行效率高
Puppet
ruby
功能强大,配置复杂,重型
适合大型环境
Fabric
python
不需要部署agent
Chef
- ruby
Cfengine
func
# Ansible简介
Michael DeHaan( Cobbler 与 Func 作者)
名称来自《安德的游戏》中跨越时空的即时通信工具
2012-03-09,发布0.0.1版,2015-10-17,Red Hat宣布收购
官网:https://www.ansible.com/
官方文档:https://docs.ansible.com/
# 企业级自动化运维工具应用实战
公司计划在年底做一次大型市场促销活动,全面冲刺下交易额,为明年的上市做准备。 公司要求各业务组对年底大促做准备,运维部要求所有业务容量进行三倍的扩容,并搭建出多套环境可以共开发和测试人员做测试,运维老大为了在年底有所表现,要求运维部门同学尽快实现,当你接到这个任务时,有没有更快的解决方案?
临时使用阿里云等环境,搭建临时服务器
# Ansible特性
- 模块化:调用特定的模块,完成特定任务,1000+
- Paramiko(基于python对ssh的实现),PyYAML,Jinja2(模板语言)三个关键模块
- 支持自定义模块
- 基于Python语言实现
- 部署简单,基于python和SSH(默认已安装),agentless
- 安全,基于OpenSSH
- 支持playbook编排任务,使用role实现多个playbook的组合
- 幂等性:一个任务执行1遍和执行n遍效果一样,不因重复执行带来意外情况
- 无需代理不依赖PKI(无需ssl)
- 可使用任何编程语言写模块
- YAML格式,编排任务,支持丰富的数据结构
- 较强大的多层解决方案
# Ansible架构
ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。
ansible是基于模块工作的,本身没有批量部署的能力,真正具有批量部署的是ansible所运行的模块,ansible只是提供一种框架,主要包括
- connection plugins:连接插件,负责和被监控端实现通信
- host inventory:配置文件,定义操作的主机
- 各种模块核心模块、command模块、自定义模块
- 借助于插件完成记录日志邮件等功能
- playbook:剧本执行多个任务时,非必需可以让节点一次性运行多个任务
# Ansible工作原理
# 主要组成
ANSIBLE PLAYBOOKS
- 任务剧本,任务集
- 编排定义Ansible任务集的配置文件,由Ansible顺序依次执行,通常是JSON格式的YML文件
INVENTORY
- Ansible管理主机的清单 /etc/anaible/hosts
MODULES
- Ansible执行命令的功能模块,多数为内置核心模块,也可自定义
PLUGINS
- 模块功能的补充,如连接类型插件、循环插件、变量插件、过滤插件等
- 该功能不常用
API
- 供第三方程序调用的应用程序编程接口
ANSIBLE
- 组合INVENTORY、API、MODULES、PLUGINS的绿框
- 可理解为是ansible命令工具,其为核心执行工具
# 执行命令来源
- USER,普通用户,即SYSTEM ADMINISTRATOR
- CMDB(配置管理数据库) API 调用
- PUBLIC/PRIVATE CLOUD API调用 (公有私有云的API接口调用)
- USER-> Ansible Playbook -> Ansibile
# 利用ansible实现管理的方式
Ad-Hoc
- 即ansible单条命令
- 主要用于临时命令使用场景
Ansible-playbook
- 主要用于长期规划好的,大型项目的场景
- 需要有前期的规划过程
- 执行过程
- 将已有编排好的任务集写入Ansible-Playbook
- 通过ansible-playbook命令分拆任务集至逐条ansible命令,按预定规则逐条执行
# Ansible主要操作对象
- HOSTS主机
- NETWORKING网络设备
# 注意事项
ansible不是服务,不会一直启动,只是需要的时候启动
主控端
- 执行ansible的主机一般称为主控端,中控,master或堡垒机
- 主控端Python版本需要2.6或以上
- windows不能做为主控端
被控端
- 被控端Python版本小于2.4需要安装python-simplejson
- 被控端如开启SELinux需要安装libselinux-python
Last Updated: 2022/05/22, 13:02:53