職位描述
職位描述:
l 研究大數據、無人車、圖像處理、人工智能前沿技術,改進現有系統的服務和運維架構,提升系統可靠性和可運維性
l 負責和參與百度大數據基礎架構平臺、百度公司無人車項目的監控、資源管理、核心數據流管理等自動化運維系平臺的建設并保證高可靠
l 負責百度大數據平臺的設計和開發:數據傳輸、作業調度、數據倉庫、數據處理、在線數據服務
l 負責高并發、大存儲的數據系統,實時計算處理系統的運維研發
| 建設和完善百度的大數據生態,服務百度核心業務;優化提速數據平臺的ETL過程,保證數據處理時效性,提升用戶體驗;
職位要求:
| 計算機相關專業本科以上學歷,2年及以上互聯網從業經驗
l 精通Linux/Unix環境,至少熟悉一種編程語言(PHP/Python/Java)
| 熟悉業界主要的分布式海量日志采集、聚合、傳輸的系統,有 Flume、Scribe、Chukwa、Kafka等實踐經驗
l 熟悉業界分布式存儲系統,熟練掌握file/kv/table/object中的任意一種
| 熟悉業界分布式計算系統,熟練掌握 mapreduce/spark/storm中的任意一種,有Map Reduce、Spark、Hive或其他并行計算的實踐經驗
l 強烈責任感,對生產環境服務高可用有敬畏之心 ,良好的團隊合作意識
| 獨立思考,善于主動發現問題,能夠系統化的分析問題和解決問題
| 良好的自驅力,持續學習,追求極致,能夠承受一定的工作壓力
加分項:
| 具備分布式海量日志采集、聚合、傳輸的運維實踐經驗
l 具備數據流監控自動化運維經驗
l 熟悉數據倉庫的ETL的開發和數據建模
l 有大型互聯網/IT公司 存儲/mapreduce/spark/storm的開發、測試、運維、應用工作經驗,熟悉源碼尤佳
企業介紹
百度,全球最大的中文搜索引擎、最大的中文網站。2000年1月創立于北京中關村。
百度擁有數千名研發工程師,這是中國乃至全球最為優秀的技術團隊,這支隊伍掌握著世界上最為先進的搜索引擎技術,使百度成為中國掌握世界尖端科學核心技術的中國高科技企業,也使中國成為美國、俄羅斯、和韓國之外,全球僅有的4個擁有搜索引擎核心技術的國家之一。
從創立之初,百度便將“讓人們最便捷地獲取信息,找到所求”作為自己的使命,成立以來,公司秉承“以用戶為導向”的理念,不斷堅持技術創新,致力于為用戶提供“簡單,可依賴”的互聯網搜索產品及服務,其中包括:以網絡搜索為主的功能性搜索,以貼吧為主的社區搜索,針對各區域、行業所需的垂直搜索,Mp3搜索,以及門戶頻道、IM等,全面覆蓋了中文網絡世界所有的搜索需求,根據第三方權威數據,百度在中國的搜索份額超過80%。