职位描述:
1.负责自建机房的各项管理维护工作;
2.负责服务器的选型选配、采购、安装、上架等运维工作;
3.负责公司容器使用的相关工作;
4.负责公司高性能计算集群的实施及维护;
5.负责各种内部系统的运维工作;
6.负责其他与IT相关事宜。
职位要求:
1. 熟悉自建机房管理:有2个以上的标准自建机房建设和管理经验,对自建机房或IDC机房结构、设备、环境、管理较为熟悉,可提供自建机房的方案设计和配合实施建设。并可通过自动化监控巡检方式对机房的冷却(温度湿度)、电力、设备状态、安防等做到自动化预警并及时故障处理;
2. 服务器、网络设备、PC设备、办公周边设备选型采购与管理:
熟练掌握常用的DELL、IBM、HP、HUAWEI、浪潮等常见服务器的熟练部署配置使用、掌握底层硬件监控、有实际的故障处理经验;
熟练掌握常用的CISCO、HUAWEI、Hillstone、飞塔等网络设备包括但不限于防火墙、交换机、路由器、负载均衡等设备的熟练部署配置使用、掌握底层硬件监控、有实际的故障处理经验。要求最低掌握CCNA或HCNA的二层三层交换配置(包括但不限于VLAN、VXLAN、Trunk、HSRP或VRRP、ACL)、2.5层MPLS、三层路由配置(包括但不限于常用路由协议、源地址路由、策略路由、ISP路由)、四七层应用配置、NAT/PAT配置、策略配置、IPsecVPN、IKEVPN、SCVPN等配置;
可根据实际工作需求分析对内部员工使用电脑以及办公周边设备(包含打印机、扫描仪、投影仪、远程会议、远程办公、内部无线AC/AP等)进行选配、采购、安装部署、维护、故障分析处理、除尘等。对办公电脑操作系统、办公软件的安装并要求可定制化快速安装;
3. 熟练使用包括但不限于Shell、Python、Golang等任意两种常见的程序语言和框架独立或结合类似Ansible等工具编写运维自动化相关程序和接口;
4. 监控系统与业务日志分析:
熟练掌握常见监控系统Promethues+Grafana、Zabbix(+Grafana)、OpenFalcon等的Standalonge和分布式部署安装、优化使用,Promethues+Grafana优先;
熟练掌握除监控系统自带的或第三方已有的监控模块外, 可根据业务需求通过程序或脚本语言编写监控收集脚本以及Web/TCP Socket接口来结合监控系统自定义收集获取被监控项的数据(包含网络设备监控);
熟练使用监控结合服务的经验,可以通过基本的服务类监控和自动化处理,做到服务的自动故障切换与服务降级与常规自愈;
熟练使用脚本或程序语言结合ELK、Graylog或其他日志系统对业务相关日志进行收集分析。并可需求扩展编写接口与业务系统对接为业务提供日志相关的参考数据;
5. 操作系统安装、部署、调优、故障处理:
对常见的Debian、CentOS、Windows等服务器系统的安装(自动化、远程)部署、根据监控和实际需求对操作系统内核调优、生产时的故障处理、安全防御配置(有被实际攻击、渗透并成功处理防御经验)等;
6. 熟练使用LVS、Nginx(Tengine、OpenResty)、HAPorxy、Redis(Standalone/Cluster)、MQ任意两种(ActiveMQ|RabbitMQ|Kafka)、LizardFS、 ZooKeeper、Jenkins、GitLab、Confluence、Jira常用中间件、缓存服务、工具等的部署配置、调优、业务监控、故障处理等;
7. 熟练使用阿里云、腾讯云、华为云等任意两种公有云的常用服务模块使用并可通过公有云接口监控所有与云服务相关的业务数据;
8. 熟练掌握MySQL(MariaDB)、SQL Server数据库的安装部署、调优、监控、故障处理、数据备份(包含本地和远程实时或定时同步)、多节点数据同步(MySQLMHA、MyCat、MySQL主主、主从、一主多从、多主一从、主从从 | SQL Server镜像同步、订阅发布、常用第三方等);
9. 熟练掌握虚拟化(VMware ESXi | VCenter | VSAN | VSWITCH)、以及K8S、Docker、Docker Swarm等容器技术的安装部署、监控、调优、故障处理;
10. 熟练使用配置中心并可根据业务方需求定制编写配置并实施多节点自动化发布、回滚、灰度等业务部署方案;
11. 熟悉网络攻防,在业务开展中不可避免的被恶意攻击如DDOS类 CC类等,有实际成功防御300G+DDOS攻击、5M+CC攻击经验者优先;
12. 有超强的责任心,能积极主动发现问题,解决问题。
13. 专科及以上学历,5年以上运维经验。
14. 熟悉高性能计算方案者优先。
15. 有金融行业从业经验者优先。