运维故障处理微信工具

从去年开始团队内部一直在使用微信群的方式通知以及处理故障,整体使用情况还不错,但是在数据统计以及使用规范上还有有所欠缺,最近决定开发一款微信产品来替代目前团队内部故障处理

在一个故障的处理中最难的部分是信息的交流,中间的噪声太多,信息一级一级的传递后容易变质,这款产品上线也主要为打通此环节间问题。

先来看一下一个常规的故障处理流程
guzhang-flow.png

一个常规故障思路表
guzhang-demo.png

下面来看一下设计的产品的原型,此产品的内部代号是故障GO

故障GO产品以微信企业号形式开发,企业号推送的一个标签即为内容为一个故障,底部三个按钮分别为 创建故障当前故障使用帮助
guzhang-go-index.png

  • 创建故障,只要是有权限进到此产品的人员都可以创建,再创建时只需要填写标题及描述,创建故障后将给全员推动信息
  • 当前故障,点击后将返回还没有结束的故障
  • 使用帮助,就是一个静态页面

当点击推送的信息后即进入此故障,点击后前先选择自己的角色。
guzhang-go-role.png

  • 值班:负责监控相关数据的上报
  • 运维:负责故障的处理
  • 研发:负责故障的处理
  • 客服:负责用户数据的收集
  • 运营:负责故障的处理
  • 浏览:主要是高管督办

    在一个故障的详情内部范围三个大模块,1、概览,2、操作、3交流

    1、角色选择后将进入故障的概览页面,主要体现:
    guzhang-go-default.png

    • 故障的概要信息,影响,评级,状态
    • 故障的时间信息,持续时常,各处理角色的参与时间
    • 故障的监控信息,是有有监控发生异常
    • 玩家的反馈信息,是否有用户反馈以及用户的详情

    2、选择不同的角色进入后将看到不同的操作界面,操作界面整体设计以按钮为主
    guzhang-go-action1.png
    guzhang-go-action2.png

    • 值班以图片上传为主,主要将上传各检控的数据信息
    • 客服以用户数据收集为主,反馈接收到的消息
    • 运维/研发/运营以故障处理为主,确认/忽略以及解决某故障

3、交流模块主要为时间轴功能,可以看到一个故障从开始到结束的中间各个环境的数据信息,其次也起到各角色交流作用
guzhang-go-comm.png

此工具定位为沟通以及现场信息整合,对于时候的分析我们还有一套更全面的故障系统进行反思分析。

此产品预计整体开发周期预计5人天,目前开始开发中。