職位描述
職位描述: 作為運維工程師,你將負責智算中心的日常維護與監(jiān)控工作,確保系統(tǒng)的穩(wěn)定、高效運行。你需要及時發(fā)現并解決系統(tǒng)故障,持續(xù)優(yōu)化系統(tǒng)性能,并為其他技術團隊提供支持。崗位職責:?負責智算中心的日常運維工作,包括系統(tǒng)監(jiān)控、故障排查和性能優(yōu)化?使用集群管理工具和監(jiān)控工具(如Kubernetes、Prometheus)確保系統(tǒng)高效運行?與開發(fā)和硬件團隊合作,持續(xù)改進系統(tǒng)運維流程,提升系統(tǒng)穩(wěn)定性和響應速度?負責系統(tǒng)的安全管理,定期更新和維護系統(tǒng)軟件?根據需要撰寫運維文檔,確保團隊成員了解系統(tǒng)運維情況職位要求:?具備計算機科學、信息技術或相關領域的學位?熟悉常用的運維工具和系統(tǒng)管理方法,有集群管理經驗者優(yōu)先?具備Linux系統(tǒng)、網絡管理和存儲系統(tǒng)的運維經驗?優(yōu)秀的故障排查能力和問題解決能力?具備較強的責任心和團隊合作精神公司簡介: 上海麗蟾科技作為NVIDIA中國首批NCP,致力于成為行業(yè)的領導者。我們管理團隊由來自全球500強IT企業(yè)的資深專家組成,具備深厚的行業(yè)經驗和全球視野。 我們正在打造一個先進的智算平臺,為客戶提供業(yè)界優(yōu)質的NCP服務,涵蓋智算中心的規(guī)劃、部署、運營及AI人才培養(yǎng)等全方位解決方案。 我們高度重視創(chuàng)新與學習,專注于引領未來科技發(fā)展。 我們誠邀有志于GPU、IB、AI等前沿技術的年輕人才加入,尤其歡迎有志于在AI領域發(fā)展的學生,不限專業(yè),只要你具備強烈的學習熱情和堅定的承諾,上海麗蟾科技將為你提供廣闊的發(fā)展平臺,與我們共同推動技術變革,走向全球。
企業(yè)介紹
上海信弘(ZENTEK)是 NVIDIA 公司在中國的精英級合作伙伴。信弘是一家致力于構建“產業(yè)賦能”創(chuàng)新資源體系的高科技企業(yè)。我們專注于數據中心級計算加速解決方案,提供人工智能、數字孿生領域數字化轉型服務的公司。我們?yōu)榻炭蒲小⒏呖萍肌⒃O計、互聯(lián)網、金融等客戶提供基于 GPU 架構的軟硬件產品專業(yè)服務。從咨詢規(guī)劃、測試選型、到部署實施并提供后續(xù)的運營維護。總部位于上海徐匯區(qū),在北京、深圳、成都、重慶和美國設有分支機構。