伴随着 DevOps 在近些年的火爆,围绕 xOps 产生了很多概念,诸如 DevSecOps,AIOps,MLOps,ChatOps 等等,当然还有今天讲述的主角 GitOps。
人们在 xOps 这条造词之路上越走越远,也从“一环”(Ops)到了“二环”(DevOps,AIOps,ChatOps 等)再到了“三环”(DevSecOps,DevBizOps GitSecOps 等),“四环”在等待大家一起创造修建。
诚然,“造词运动”产生的概念让人们目不暇接,每一个点都意味着有新东西出来,让本来就不够用的脑容量更加捉襟见肘,唯有“躺平”以应对。但是,就算“躺平”也要在“躺平”之前吃点“干货”,要不就算躺不废,也得被躺饿死。GitOps 便是“躺平”之前的最佳能量棒。
GitOps 这个词出现于 2017 年,是由 Weaveworks 公司根据多年云计算基础设施和应用程序管理经验而提出的一个概念。可以看出 GitOps 是非常年轻的,它的出现与云计算的大力推进有关,也可以大胆、准确点说与云原生有关。
现如今,没听过云原生都不好意思跟别人交流,不知道云原生都没法跟别人说组织在上云。云原生概念的提出在 2013 年,经过了这几年的演进,成立了发展势头火爆的 CNCF(Cloud Native Computing Foundation)基金会,也对与云原生的定义,有了一个大家都接受的定义:
云原生技术使企业能够在现代动态环境中构建和运行可扩展的应用程序,如公有云、私有云和混合云。容器、服务网格、微服务、不可变的基础设施和声明式 API 是云原生的典型技术。
注:Cloud native technologies empower organizations to build and run scalable applications in modern, dynamic environments such as public, private, and hybrid clouds. Containers, service meshes, microservices, immutable infrastructure, and declarative APIs exemplify this approach.
关于云原生的更多内容,在这儿不多赘述,大家可以查看 CNCF 官网。云原生应用程序的部署是我们重点讨论的,因为它与 GitOps 密切相关。
一般情况下可以使用下面的持续交付系统(示意图)来完成云原生应用程序的部署与交付。
上述模式属于“push”模式,我称之为“一杆子到底梭哈型”(流程从左到右走到底),这是一种很常用的模式,很容易实现一键式部署。但是也存在一些问题:
简而言之,就是没法保证仓库清单(包括配置仓库和镜像仓库)和集群侧的实际情况相一致,集群侧的实际情况没法准确地在集群侧体现出来。长此以往,很容易发生“配置漂移”(所想不等于所得,且见下文)及安全合规问题。
注:从上图看,编码、构建、镜像打包等都在极狐 GitLab 上完成,所谓 All in JiHu GitLab and One-stop shop DevOps platform。
然而,“山重水复疑无路,柳暗花明又一村”。云原生的其中一个自带属性:声明式是解决这个问题的关键点,关于声明式的理解以及解题思路可以查看如下示意图:
声明式系统有个特点:能够帮我们自动完成应用程序(或基础设施系统)的描述状态和实际状态的自动同步,保证两者能保持一致。比如,应用部署清单里面应用程序是一个副本(replicas=1),那么集群侧应用程序就会是一个 pod。借助于这个特点,上述“push”模型的问题可以做如下解答:
既然声明式系统可以用文件清单来描述(典型如 yaml 文件),那么既然是文件就可以存储到极狐 GitLab 上(发挥了版本控制系统的功能)。开发人员或者运维人员想修改某些内容(应用程序属性、基础设施配置)的时候,只需要修改文件清单即可(修改完毕提 MR,方便 Review),此时这个变更就会被自动同步至集群侧。所以现在只需要找一个方法能够自动实现这种变更监听和变更自动同步即可,而这正是今天的主角 GitOps 要做的事情。
前面铺垫了这么多,GitOps 终于出现了,关于 GitOps 有这么几个特性:
使用 GitOps,上述的“push”模型就变为了下面的“pull”模型:
“Pull” 模型的关键就是:单一可信源(如极狐 GitLab)与 Kubernetes 集群的集成,当可信源侧的文件清单发生变更的时候,集群侧能够及时捕捉到此变更,从而完成变更清单的部署。而极狐 GitLab Kubernetes Agent 正是为了解决这个问题而诞生的。极狐 GitLab Kubernetes Agent 有两部分组成:位于集群侧的极狐 GitLab Kubernetes Agent(agentk)和位于极狐 GitLab 侧的极狐 GitLab Kubernetes Agent Server(GitLab-KAS),能够很好的完成上述的 GitOps Workflow。也敬请期待后续的专文解析与实战。
GitOps 的实践需要基础设施即代码(Infrastructure as Code,简称 IaC)、Merge Request(MRs)、CI/CD 三叉戟的组合拳。
基础设施即代码是一种基于使用软件开发实践来进行基础设施自动化管理的方法。它强调通过一致的、可重复的程序来对基础设施系统进行修改。当需要对基础设施进行修改时,只需要修改于基础设施相关的代码即可,随后会有自动化来测试这些变更并最终将这些变更应用到基础设施系统中。
GitOps 的重要特性之一就是:一切皆代码。以 Git 为单一可信源,所有与软件开发相关流程中的代码(包括基础设施代码、应用程序源码、配置等)都会存储在 Git 仓库中。
极狐 GitLab 很好的与基础设施即代码中的瑞士军刀——Terraform 做了集成,可以方便的完成云基础设施的自动化管理。所有管理过程都是通过合并请求(Merge Request)来完成的,当需要对基础设施作某些变更时,只需要修改代码,并提交 MR,在所有的修改都被审查和批准后,代码可以被合并到主分支上。一旦代码变化被合并,所有的变化将被部署到生产中。详细操作和结果可以查看公众号如何借助极狐GitLab和Terraform以代码形式构建基础设施?
当开发或者运维想要对系统(基础设施或者应用程序)做出某些变更时,需要提一个 Merge Request,这是一种让多人、多团队进行协作的方式,能更好的对变更进行评审(Review),提前评估变更的必要性、准确性、安全性等,从而降低变更给系统带来的风险。对系统所有的变更发起点都是代码变更,这样就使安全审计变得简单,因为一切皆代码,所见即所得,评审、审批都在仓库系统中,对于所有人员都是透明可见的,透明度也会增强团队成员之间的信任度和协作性。
当 MR 创建审核完毕,后续的变更需要 CI/CD 自动化的流程去完成系统的变更。自动化的流程减少了人为的手动干预,减少了人员误操作所带来的风险,同时能够节省时间,在大规模使用场景中,是非常重要的一环。
GitOps 让所有变更的发起和应用都聚焦在极狐 GitLab 仓库中,开启了云原生时代基础设施管理和应用程序持续交付的新篇章,它能够带来以下好处:
变更的更新和回滚都是通过极狐 GitLab 的 Merge Request 来进行,可能是一个命令就能完成,简单高效。
所有人员可以通过极狐 GitLab 进行有效的协作,那些邮件、ticket 满天飞的日子也将不复存在。极狐 GitLab 是 大家都熟悉的平台,再也不用在不同工具、平台间来回切换来完成系统的变更,大家的学习成本减少了,能更好的关注在业务本身。毕竟安安静静写代码、搞技术是每个人梦寐以求的。
对于新入职的员工来讲,通过阅读极狐 GitLab 仓库代码,可以快速熟悉业务、环境等内容,并用相应代码快速搭建起开发环境,从而快速融入团队,贡献自己的力量。人员培养成本降低了,工作体验提升了,对于公司来讲,做到了“降本增效”。GitOps 充分体现了以人文本的理念。
一切操作都是在极狐 GitLab 的仓库上,不用再给不同人员赋予不同系统的不同权限,保证了系统的安全性,同时可以在极狐 GitLab 上通过仓库的鉴权和授权模式严格控制不同人员的不同操作权限。同时,一切变更都是自动化进行,手动操作的减少,会大大降低误操作带来的风险。
一切操作(哪个人员在何时做了什么操作)都在极狐 GitLab 上一目了然(通过 MR,comment 等)。所谓所见即所得,也让合规审计变得高效、容易。
GitOps 用着爽,但是依旧面临一些挑战,诸如:
极狐 GitLab 提供了一个用户体验良好的协作平台,但是使用平台的是人,协作是人与人之间、人与平台之间的协作,良好的协作需要每个人都去遵守协作流程和纪律,(诸如任何变更都应该提 MR 然后 Review 最后自动化 Apply 流程,不要手动操作,哪怕几秒能完成的小变更)。从而建立起良好的协作文化。随着公司规模的扩大,异地跨区域的协作变得越来越多,这一块儿是一个挑战,需要每一个人都参与进去,遵守流程和纪律,逐步培养出良好的协作文化。
一切皆代码,意味着用户名、密码、证书、token 等敏感信息也要存储到极狐 GitLab 仓库中,而这是兵家之大忌。不幸中之大幸就是:极狐 GitLab 和 Vault 有着完美的结合,能够很好的解决这个问题。关于这部分后续我们会有专门的文章分析并实践。敬请期待。
一切变更的发起、执行都在极狐 GitLab 上,也就意味着需要建立行之有效的 Git Workflow,而这在现如今多云、混合云等基础设施,采用为服务的应用程序来说是个很大的挑战。而这需要大量的测试、运行来逐步建立并完善。
GitOps 只是初始形态,它一定是发展演进的,这发展的方向就是安全+标准。
安全是一个重要的话题,在企业加速上云的浪潮中,安全已经被越来越过的企业和组织所关心。GitOps 是能带来酸爽的体验,但是安全是其必须重视并实践的一环,只有重视、融入安全的 GitOps 才是真正的 GitOps,也即 GitSecOps。
为了推动 GitSecOps 更好的发展,2021 年 5 月 26 日,在中国信息通信研究院(简称:中国信通院)主办的云原生产业大会上,在云计算开源产业联盟(OSCAR)的指导下,极狐信息技术(湖北)有限公司(简称:极狐(GitLab))与云原生计算基金会(CNCF)联合发起并成立 “开源 GitOps 产业联盟” (Open GitOps Industry Alliance,简称:OGA 联盟)。同时,为支持开源 GitOps 技术的社区推广、产业落地、技术孵化,打造开源开放的 GitOps 产业生态,中国信通院、CNCF 和极狐(GitLab)三方依托 OGA 联盟,共同成立 OGA 产业发展社区(简称:OGA 社区)。
OGA 会围绕技术标准制定、开发者和社区生态搭建、数字人才培养、开源产、学、研推进等方面展开相应的工作,极狐(GitLab)诚挚的邀请各相关单位能够加入 OGA,以开源的方式共同推进 OGA 的发展。关于 OGA 更多的内容,可以查看新闻速递 | 极狐(GitLab)携手CNCF成立“开源GitOps产业联盟” 推动中国开源生态发展。