技术支持工作管理涉及到如下几个方面:
客户关系管理是进行有效工单管理的必要基石。
我们服务客户是中国大陆境内所有订购了gitlab企业版和旗舰版的客户。
客户关系管理包括:
客户信息
客户所属组织信息
字段名 | 字段类型 | 备注 |
---|---|---|
客户名称 | String | |
与订阅license相关的email | String | 非其他个人email,用于唯一标识用户 |
客户所属的组织(公司)名称 | String | |
客户电话 | String |
字段名 | 字段类型 | 备注 |
---|---|---|
组织(公司)名称 | String | |
订阅等级(licence级别) | String | 可选字段:旗舰版、专业版、旗舰版 - SaaS、专业版 - SaaS、Expire、Hold、Community |
账户类型 | String | 可选字段:Reseller、Customer、Former customer、 Prospect |
是否有ATM | Boolean | 是否安排了技术支持经理 |
技术客户经理 | String | 该组织如果没有ATM则为空 |
技术客户管理项目Id | String | 该组织如果没有ATM则为空 |
license席位 | Integer | |
license到期日 | Date |
工单系统与客户关系管理系统对接支持两种方式:
SLA(Service Level Agreement),是支持团队处理工单时,对工单响应时间的一种承诺。
SLA响应时间的确定由工单的影响等级决定。技术支持团队将根据不同影响级别,提供不同的响应时效支持:
影响级别 | SLA响应时间 | 工作时间 | 提交方式 |
---|---|---|---|
紧急情况 | 30 分钟 | 24x7 | 在极狐(GitLab)支持门户新建一张工单。 或发送邮件至emergency-support@gitlab.cn对紧急事件支持。 |
高级影响 | 4 小时 | 12x5 | 在极狐(GitLab)支持门户新建一张工单。 |
中级影响 | 8 小时 | 12x5 | 在极狐(GitLab)支持门户新建一张工单。 |
低级影响 | 24 小时 | 12x5 | 在极狐(GitLab)支持门户新建一张工单。 |
工作时间说明如下: 12x5:周一至周五,北京时间上午9点至晚上9点。 24x7:周一至周日,一天24小时。
影响等级的定义
极狐GitLab根据SaaS版和自助管理版的不同,对影响等级分别进行了定义。
SaaS版 - 影响等级定义
紧急 - 极狐GitLab SaaS平台不可用。可以提交紧急工单,我们的值班支持工程师将在30分钟内响应。例如:极狐GitLab对所有用户显示502错误。
高级 - 极狐GitLab Saas平台的性能严重下降对业务产生重大影响。重要的极狐GitLab功能不可用或速度极慢,没有可接受的解决方法。例如:SaaS上的共享 CI 创建报错且未成功完成,并且软件发布过程受到严重影响。
中级 - 某些原因阻止了极狐GitLab Saas平台的正常运行,对业务造成了一定影响。重要的极狐GitLab功能不可用或有所减慢,但是可能有一些解决方法。极狐GitLab Saas平台运行的功能有一些较小的损失。例如:一个已知的漏洞会影响极狐GitLab Saas平台的使用,但是有一种变通方法已被成功用作临时解决方案。
低级 - 类似于文档问题、具体使用问题,对业务的影响很小或没有。要求提供信息、增强功能,但对极狐GitLab Saas平台的操作没有影响。极狐GitLab Saas平台仍正常运行,并且不会妨碍工作。例如:有关LDAP对接问题。
自助管理版 - 影响等级定义
紧急: 生产环境中的GitLab JH服务器或集群不可用,或根本无法运行。可以提交紧急工单,我们的值班支持工程师将在30分钟内响应。例如:GitLab JH对所有用户显示502错误。
高级: GitLab JH性能严重下降对业务产生重大影响。重要的GitLab JH功能不可用或速度极慢,没有可接受的解决方法。例如:CI 创建报错且未成功完成,并且软件发布过程受到严重影响。
中级: 某些原因阻止了GitLab JH的正常运行,对业务造成了一定影响。重要的GitLab JH功能不可用或有所减慢,但是可能有一些解决方法。GitLab JH运行的功能有一些较小的损失。例如:一个已知的漏洞会影响GitLab JH的使用,但是有一种变通方法已被成功用作临时解决方案。
低级: 类似文档或部署的问题,对业务的影响很小或没有。要求提供信息、增强功能,但对GitLab JH的操作没有影响。GitLab JH的生产环境仍在运行,并且不会妨碍工作。例如:有关启用ElasticSearch的问题。
工单的模板分为2类,共4种:
名称 | key | 展示形式 | 是否必填字段 | 备注 |
---|---|---|---|---|
主题 | subject | 单行文本框 | 是 | |
描述 | description | 多行文本框 | 是 | 简述问题 |
附件 | attachments | 文件上传组件 | 否 | 提供相关日志和系统信息 |
公司名称 | company_name | 单行文本框 | 是 | |
自助管理版客户订阅类型 | self_manged_subscription | 单选下拉框 | 是 | 可选类型:旗舰版客户、专业版客户、试用客户 |
版本号 | version | 单行文本框 | 是 | 极狐GitLab的版本,eg: V 15.0.1 JH |
安装方式 | Install_method | 单选下拉框 | 是 | 可选类型:Omnibus、Docker、Kubernetes、源码(source) |
自助管理版问题类型 | problem_type_of_self_managed_gitlab_jh | 单选下拉框 | 是 | 可选类型:安装问题(Omnibus、Geo HA,Kubernetes、AWS、GCP, Azure)、GitlabRunner问题、升级、数据迁移和导入导出项目和实例问题、身份验证问题(LDAP、SAML、SSO、用户账号)、性能问题或报错、配置(GitLab.rb、Gitlab Pages、管理员面板)问题、CI/CD问题(配置、ci yml、runners、Auto DevOps、测试、部署、容器注册)、监控问题(日志、Prometheus、grafana、Tracing)、安全问题、项目管理问题、其他 |
影响等级 | impact_level | 单选下拉框 | 是 | 可选类型:紧急、高级、中级、低级 |
与订阅相关的邮箱(隐藏字段) | 单行文本框 | 是 | 必须是在CRM中能够查到的邮箱,否则影响工单的SLA定义 |
名称 | key | 展示形式 | 是否必填字段 | 备注 |
---|---|---|---|---|
主题 | subject | 单行文本框 | 是 | |
描述 | description | 多行文本框 | 是 | 简述问题 |
附件 | attachments | 文件上传组件 | 否 | 提供相关日志和系统信息 |
影响等级 | impact_level | 单选下拉框 | 是 | 可选类型:紧急、高级、中级、低级 |
与订阅相关的邮箱(隐藏字段) | 单行文本框 | 是 | 必须是在CRM中能够查到的邮箱,否则影响工单的SLA定义 |
名称 | key | 展示形式 | 是否必填字段 | 备注 |
---|---|---|---|---|
主题 | subject | 单行文本框 | 是 | |
描述 | description | 多行文本框 | 是 | 简述问题 |
附件 | attachments | 文件上传组件 | 否 | |
JihuLab.com服务订阅类型 | jihulab.com_subscribe_type | 单选下拉框 | 是 | 可选类型:SaaS旗舰版客户、SaaS专业版客户 |
JihuLab.com用户名 | jihulab.com_username | 单行文本框 | 是 | |
JihuLab.com注册邮箱 | jihulab.com_registry_email | 单行文本框 | 是 | 该邮箱未必与提交工单的邮箱一致,因此需要单独提供 |
JihuLab.com项目或组的完整路径 | project_or_group_url | 单行文本框 | 是 | eg: https://jihulab.com/gitlab-cn |
JihuLab.com问题类型 | problem_type | 单选下拉框 | 是 | 可选类型:导入和导出项目和组、GitlabRunner问题、身份验证问题(LDAP、SAML、SSO、用户账号)、性能问题或报错、CI/CD问题(配置、ci yml、runners、Auto DevOps、测试、部署、容器注册)、安全问题、项目管理问题、项目的CI分钟数问题、紧急安全事件、其他 |
影响等级 | impact_level | 单选下拉框 | 是 | 可选类型:紧急、高级、中级、低级 |
与订阅相关的邮箱(隐藏字段) | 单行文本框 | 是 | 必须是在CRM中能够查到的邮箱,否则影响工单的SLA定义 |
名称 | key | 展示形式 | 是否必填字段 | 备注 |
---|---|---|---|---|
主题 | subject | 单行文本框 | 是 | |
描述 | description | 多行文本框 | 是 | 简述问题 |
附件 | attachments | 文件上传组件 | 否 | |
JihuLab.com服务订阅类型 | jihulab.com_subscribe_type | 单选下拉框 | 是 | 可选类型:SaaS旗舰版客户、SaaS专业版客户 |
JihuLab.com账户问题类型 | account_issues | 单选下拉框 | 是 | 可选类型:双因子验证[账户恢复]、没有收到注册确认邮件、忘记密码、无法登录、JihuLab.com上其他账户问题 |
JihuLab.com用户名 | jihulab.com_username | 单行文本框 | 是 | |
JihuLab.com注册邮箱 | jihulab.com_registry_email | 单行文本框 | 是 | 该邮箱未必与提交工单的邮箱一致,因此需要单独提供 |
影响等级 | impact_level | 单选下拉框 | 是 | 可选类型:紧急、高级、中级、低级 |
与订阅相关的邮箱(隐藏字段) | 单行文本框 | 是 | 必须是在CRM中能够查到的邮箱,否则影响工单的SLA定义 |
每个工单都可以具有0到多个标签,目的是便于根据不同情况分类整理,进入不同处理队列。
标签分类 | 标签名 | 备注 |
---|---|---|
基于订阅级别标签 | 专业版、旗舰版、专业版_SaaS、旗舰版_SaaS | 表明当前工单所属的订阅级别和平台 |
sla已正确分配 | sla_enable | 有该标签的说明,已经正确添加SLA |
SLA响应级别标志 | 标准SLA、高级SLA | 目前仅支持高级SLA,代表对旗舰版和专业版客户的SLA |
没有正确关联到组织 | need_org | 没有正确关联到组织,则不会有SLA,需要流程和人手处理 |
仅要求体验的工单 | prospect、trial | 不设定SLA承诺,有余力时处理 |
超过1周无回复的工单自动关闭 | no_reply_auto_close | 当技术支持完成最后回复后,客户已超过1周无任何回复,系统再经过两次自动提醒后,会自动关闭该工单 |
已经向久无回复的客户发送回复提醒 | no_reply_notification | 可通过宏:客户未响应 触发 |
标签名 | 标签功能 | 时间节点 |
---|---|---|
no_reply_auto_close | 当技术支持完成最后回复后,客户已超过1周无任何回复,系统再经过两次自动提醒后,该工单会自动标记为“已关闭”,并通知客户原因。 | 7天无回复 |
csat-survey-sent | 对已解决问题的客户发起客户满意度调查 | 例如:对已解决工单,自动发送客户满意度调查 |
breach-notification | 当一个工单快接近breach 就在slack 提醒 | SLA超时前的30min |
标签分类 | 标签名 | 触发条件 |
---|---|---|
在支持团队slack的#support_ticket频道中通知工单被创建或更新了 | Slack_support_live_notify | 工单创建或更新时 |
不同类型的工单应当进入不同的工作队列,以便支持人员分类处理。
这里采用标签过滤产生视图的方式,将工单处理流程分为3个工作队列:
进入该队列条件:具有 need_org标签的工单
该队列主要职责:
进入该队列条件:具有基于订阅级别标签的工单(如专业版、旗舰版)。
该队列是解决工单问题的主要队列。
处理方式按照工单的一般流程进行。
进入该队列的条件: 具有trial、prospect标签的工单
该队列对trial、prospect标签的工单,提供技术支持,但不保证SLA。
宏是用来将多项操作结合在一起,一次点击即可完成所有预设动作的功能。
宏名称 | 宏功能 |
---|---|
客户未响应 | 当客户较长时间没有回复时,触发回复客户如下内容:“您好,我们的技术支持工程师已尝试就此问题联系您,但我们尚未收到您的回复。如需进一步帮助,请告诉我们。谢谢。”并追加标签:no_reply_notification |
解决工单,结束语 | 当处理完工单问题时,触发回复客户如下内容:“很高兴解决您的问题。我将为您把工单标记为已解决。感谢您使用极狐GitLab技术支持服务。”,并将工单状态置为“已解决” |
link_doc(待实现) | 自动填写工单回复,并附注文档链接 |
help (待实现) | 当遇到自己无法解决的工单时,自动发送Slack消息向团队求助并关联工单链接 |
一旦旗舰版、专业版级别客户的系统出现紧急情况时,技术支持团队会进入全员备战状态。
紧急情况的定义:极狐GitLab实例不可用或完全不可用, 影响业务正常运行
响应时间:30min内
工作时间: 7 * 24h
提交方式:页面表单、邮件
第一响应人: 每人担任一周,全部技术支持团队内轮转
第二响应人:由上周的第一响应人负责,能够更好的衔接遗留问题;每人担任一周,全部技术支持团队内轮转
当第一响应人不够快时,会触发紧急事件事态升级策略,提醒团队并随着时间推移逐级上报。
当收到紧急事件告警后:
5分钟后,如果第一响应人尚未acknowledge告警,则会通知第二响应人,
5分钟后,如果第二响应人未acknowledge告警,则会通知技术支持经理。
分类 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期日 |
---|---|---|---|---|---|---|---|
一般工单处理人 | 全员待命 | 全员待命 | 全员待命 | 全员待命 | 全员待命 | 休息 | 休息 |
紧急事件第一响应人 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人值班 | 一人值班 |
紧急事件第二响应人 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人待命,每周轮转 | 一人值班 | 一人值班 |
采用Slack作为技术支持团队的即时交流平台,将技术支持的相关系统与人员整合在一起。
channel | 描述 |
---|---|
#customer_success | 讨论工单和客户问题 |
#saas_ticket | SaaS版相关工单创建或更新提醒 |
#support_ticket | 自助管理版相关工单创建或更新提醒 |
工单系统由多个子系统配合运作。包括如下:
SFDC是极狐GitLab采用的销售管理系统。它负责将SaaS、self managed上的付费客户信息(公司、客户信息、产品类型SaaS/Self managed)同步给Udesk和工单门户系统。
Udesk是极狐GitLab采用的工单处理系统。它负责支撑support和SRE团队技术人员,管理和协作解决Saas上的工单。
Support Portal是极狐GitLab自研的工单门户系统。它负责为客户提供提交和管理历史工单的入口。
PagerDuty是极狐GitLab采用的告警服务系统。它在技术支持团队中负责对工单事件的提醒。
Slack是极狐GitLab采用的内部IM沟通平台。它负责对Support和SRE团队全员进行工单事件的广播。
步骤描述:
工单系统的流程分三大类:
客户基本信息维护流程包括:
本节将Udesk中最重要的工单处理流程做一介绍。
当新工单被创建后,第一个必要动作是接单。点击“接单”按钮完成接单。接单后,slack channel中会有相应的通知,周知当前工单已经有人进行跟进了。
工单的回复操作如下图所示,回复时请注意:1. 确保选择“工单SDK”tab页;2.提交前,复核回复消息,是否有错别字、拼音未转换未文字等情况;3. 语气措辞是否有礼有节、问题描述是否有理有据。
当客户有新的问题时,slack channel中会有相应的通知,提醒技术支持人员进行回复。
处于“SLA队列”中的工单,都包含了工单处理时间SLA的承诺,即承诺在一定时间内给予客户回复。否则系统将进行工单的逾期提醒。
SLA状态:
工单新创建、或工单有新回复后,工单SLA会处于如下状态:
该示例中,表示紧急工单的首次回复SLA为30分钟,离客户创建工单,已经过了1分钟,需再29分钟内响应工单,才能保证SLA达成。
工单一旦由技术支持或SRE工程师回复后,工单SLA会处于如下状态:
该示例中,表示紧急工单的首次回复于客户创建工单后的第4分钟予以回复,该SLA计时自动停止,同时说明此次回复的SLA已达成。
slack会对工单即将逾期,进行预警提醒。
有时客户会将工单的问题的影响等级预设的太高,这时技术支持工程师可将影响等级调整为较低的等级,并想客户进行回复说明,从而将SLA的承诺时长调整到合理的范围。
当工单没有找到对应的公司时,会分配到首次响应队列中,并打上need_org的标志,这种情况系统无法判断是否为符合支持标准的工单。请技术支持工程师在收到工单后,与Chris取得联系,人工判断该工单是否需要支持,由chris将工单分配给对应公司产生SLA后,按照普通工单处理流程处理。