职业经历
工作经历
2021年04月 — 3000年01月
技术,运维/技术支持,运维工程师
1.负责多个城市交通项⽬运维,主要包括:业务需求、等保、监控、⾼可⽤等⼯作内容; 2.内部运维体系建设,主要包括:⽇志系统(EFK)、CICD(gitops)、分布式存储(CEPH)的落地, 以及环境使⽤规范; 3.沉淀内部技术、基于 ansible 编写离线⾃动化部署基础环境脚本,提效 300%; 4.开发⾃检报告应⽤,⽤于获取现场离线环境运⾏状态信息,提前预知问题;
2020年02月 — 2022年04月
技术,运维/技术支持,运维工程师
1.负责主业务“啄医⽣”线上环境维护 k8s、ceph、redis、MongoDB; 2.参与业务架构设计、优化、改造,⽣产环境业务 k8s 容器化; 3.参与少量 python 项⽬开发; 4.内部业务容器化落地,
2018年11月 — 2020年08月
技术,运维/技术支持,运维工程师
1.维护主业务⼩程序 saas 平台的的腾讯云环境,以及 200台客户服务器; 2.线下测试环境(kvm 平台)和线上⽣产环境(腾讯云)管理维护; 3.容器化(kubernetes)现有业务⽣产环境落地,并实现⾃动扩容; 4.编写⽇常所⽤ shell/python 脚本实现⼀些任务⾃动化; 5.线上线下 CI/CD 持续集成落地; 6.建⽴运维规范,整理审批流程,明确责任,编写运维⼿册等;
教育经历
2017年06月 — 2021年01月
项目经历
—
项⽬描述:原业务部署⽅式为服务器上同是存在 docker-compose、ceph、k8s,经常⼀台服务器出问题导致 整个业务中断⽆法使⽤使⽤,并且并且没有⽇志系统,排查问题很艰难,于是将 ceph 存储拆分出来,整体 业务迁移⾄ k8s,并搭建⽇志系统。 技术栈:kubernetes,ceph,python,django,mysql 职责内容:搭建 ceph 存储集群 引⽤ istio 服务治理⼯具,来实现服务与服务之间的通信管理和治理以及灰度发布 使⽤ DaemonSet+nodeSelector,将 GPU 任务调度器部署在带 GPU 的服务器上 搭建 EFK ⽇志系统来完成⽇志收集 搭建 kube-prometheus 监控系统,添加⾃定义监控(gpu,ceph,redis,MongoDB)
TA 的技能服务
该人才共 4 项技能服务,可在 技能服务 中搜索「李松涛」查看。