資料中心及雲端基礎架構及服務編排架構師
地點
Japan
公司簡介
ByteBridge 是廣受信賴的IT服務創新者,包括資料中心、企業IT和統一通訊。 ByteBridge 由一支充滿熱情、敬業的專家團隊創立,旨在透過技術賦能,協助客戶成功。我們致力於彌合技術差距,幫助企業實現願景,並在全球擴展業務。迄今為止, ByteBridge 已獲得一些世界領先的國際公司的信賴。
職位概述
我們正在尋找一位專業的資料中心和雲端基礎架構及服務編排架構師,負責設計和實作服務編排層,以便在我們多區域雲端基礎架構之上部署和管理各種工作負載。該職位專注於創建智慧編排系統,以實現應用程式、資料庫、AI/ML 服務以及其他雲端服務的自動化部署、擴展和管理。
主要職責:
- 服務編排平台設計
- 設計全面的服務編排平台,實現工作負載的自動化部署與管理
- 建構具有自助服務功能的 API 驅動的服務配置系統
- 設計多租戶服務隔離與資源分配框架
- 建立服務生命週期管理系統,包括部署、擴充、更新和退役
- 工作負載編排架構
-
針對不同的工作負載類型設計編排系統:
- 虛擬機器配置和管理
- 使用 Kubernetes 進行容器編排
- 資料庫服務部署(SQL、NoSQL、分散式資料庫)
- 訊息佇列服務(Kafka、RabbitMQ、Apache Pulsar)
- GPU加速的AI/ML服務與模型推理平台
- 類似於 AWS Bedrock 的大型語言模型 (LLM) 微調和推理服務
-
針對不同的工作負載類型設計編排系統:
- AI/ML 服務編排
- 為模型訓練、驗證和部署建置 AI/ML 管道編排
- 設計用於分散式訓練的 GPU 資源調度和分配系統
- 建立具有自動擴展和負載平衡功能的模型服務基礎設施
- 設計 MLOps 平台以實現 ML 模型的持續整合和部署
- 建立具有動態擴展和成本優化的 LLM 推理服務
- 服務發現與集成
- 設計用於微服務通訊的服務網格架構
- 架構 API 網關和服務代理解決方案
- 建立服務發現、設定管理和機密管理系統
- 設計服務間通訊模式與協議
- 自動化和 DevOps 集成
- 設計與服務編排平台整合的 CI/CD 管道
- 為聲明式服務管理建立 GitOps 工作流程
- 創建基於策略的治理和合規自動化
- 設計成本管理和資源最佳化自動化
所需的資格
- 經驗豐富
- 12 年以上分散式系統與服務編排經驗
- 擁有 8 年以上容器編排平台(Kubernetes、Docker Swarm)使用經驗
- 6年以上雲端原生應用架構與微服務經驗
- 5年以上 AI/ML 基礎架構與模型部署系統經驗
- 服務編排專業知識
- Kubernetes:Kubernetes 架構、自訂資源、營運商和生態系統工具的專家級知識
- 容器技術:深入了解 Docker、containerd、容器網路和存儲
- 服務網格:具有 Istio、Linkerd 或 Consul Connect 經驗
- API 設計:精通 REST、GraphQL 和 gRPC API 設計和實現
- 工作流程編排:具有 Apache Airflow、Temporal 或類似工作流程引擎的經驗
- 人工智慧/機器學習和數據服務
- ML 編排:具有 Kubeflow、MLflow 或類似 ML 管道平台的經驗
- GPU 運算:了解 CUDA、分散式訓練框架(PyTorch、TensorFlow)
- 模型服務:具有模型推理平台(TensorFlow Serving、TorchServe、NVIDIA Triton)的經驗
- LLM 基礎架構:了解大型語言模型部署、微調和推理最佳化
- 資料平台:具備大數據編排經驗(Apache Spark、Flink、Kafka)
- 雲端原生技術
- DevOps 工具:熟練使用 Jenkins、GitLab CI、ArgoCD 或類似的 CI/CD 平台
- 基礎設施即程式碼:具有與 Terraform、Pulumi 或 CloudFormation 整合的經驗
- 監控和可觀察性:了解 Prometheus、Jaeger、Fluentd 和雲端原生監控堆疊
- 安全性:了解容器安全性、RBAC、網路策略和機密管理
- 程式設計和自動化
- 語言:精通 Go、Python 或 Java,用於建立編排工具和運算符
- 腳本:精通 Bash、Python 等自動化和整合腳本
- 資料庫技術:具有協調各種資料庫類型(PostgreSQL、MongoDB、Elasticsearch、Redis)的經驗
- 訊息佇列:深入了解 Kafka 生態系統、RabbitMQ 和事件驅動架構
- 首選資格
- 擁有建構平台即服務 (PaaS) 或基礎設施即服務 (IaaS) 產品的經驗
- 了解無伺服器運算平台和函數即服務 (FaaS)
- 具有邊緣運算和分散式雲端編排經驗
- 認證:CKA、CKAD、CKS(Kubernetes)或相關雲端平台認證
- 擁有 FinOps 和雲端成本優化經驗
- 教育與認證
- 計算機科學、軟體工程或相關領域的學士學位
- 分散式系統或相關領域碩士學位優先
- Kubernetes、雲端平台或 DevOps 實務的產業認證
- 關鍵能力
- 強大的軟體工程和系統設計技能
- 深入理解分散式系統模式與微服務架構
- 優秀的解決複雜編排挑戰的能力
- 具備敏捷開發實務與跨職能團隊協作經驗
- 具備較強的技術架構討論溝通能力
- 工作環境
- 與基礎架構和應用程式團隊緊密合作的協作環境
- 有機會接觸尖端的 AI/ML 和雲端原生技術
- 快節奏的環境,著重自動化和自助服務功能
- 定期與客戶技術團隊互動並收集需求