Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Upgrade to Pro — share decks privately, control downloads, hide ads and more …

コンテナ研修(Kubernetes編)【MIXI 23新卒技術研修】

コンテナ研修(Kubernetes編)【MIXI 23新卒技術研修】

23新卒技術研修で実施しコンテナ研修(Kubernetes編)の講義資料です。

動画:https://youtu.be/Dk0isJQ6a80

こちらは後編になります。前編はこちら:https://speakerdeck.com/mixi_engineers/2023-container-training-number-01

※ハンズオン環境は提供していないので、ハンズオンを実際に試していただくことはできません。

資料の利用について
公開している資料は勉強会や企業の研修などで自由にご利用頂いて大丈夫ですが、以下の形での利用だけご遠慮ください。
・受講者から参加費や授業料などを集める形での利用(会場費や飲食費など勉強会運営に必要な実費を集めるのは問題ありません)
・出典を削除または改変しての利用

MIXI ENGINEERS

April 25, 2023
Tweet

More Decks by MIXI ENGINEERS

Other Decks in Technology

Transcript

  1. アジェンダ
 - コンテナオーケストレーション / Kubernetes と 
 - Google Kubernetes

    Engine (GKE) と 
 - パブリッククラウドにおける コンテナオーケストレーションツール 
 - Kubernetes コントローラーを理解しよう 
 - Kubernetes リソース(オブジェクト) を理解しよう 
 - Kubernetes にアプリをデプロイしよう 
 - カスタムコントローラー / Managed Prometheus を使って見よう

  2. Kubernetes と ?
 - Google Borg と呼 れる実行基盤がある 
 -

    これを元にした OSS で、Google や CNCF といった 団体が管理、メンテナンスしている
 - Borg コンテナオーケストレーションツール 
 - ホストマシンを意識せずに、効率よくコンテナ(アプリ ケーション)を配置したい
 - 耐障害性を考えると、ホストマシンを意識しないよう にしたい
 - Google で そ 考えを元にBorgが開発され、運 用されている
 - Google 技術が OSS になり、一般的に使われ るようになった
 - そ 他: Colossus、Andromeda、Zanzibar...
 コンテナランタイム上 

  3. どうしてコンテナオーケストレーションツール?
 - Borg 論文によるメリット 以下 
 - リソース管理、障害へ 処理を隠してエンジニアをアプリケーション開発に集中させる
 -

    高い信頼性と可用性を保つ
 - 数万台オーダー マシンでワークロードを効率的に実行させる
 - リソース管理を隠す
 - YAML ファイルを使ってあらゆるリソースを表現することができる
 - Kubernetes kube-scheduler を使ってコンテナを指定したノードへ効率よく配置することができる
 - 障害へ 処理
 - ノードに障害が発生した際、コンテナ 自動的に回復する
 - 信頼性、可用性
 - Kubernetes etcd と呼 れる分散ストレージを使って状態を管理している
 - マルチマスター構成にすることでSPOF(単一障害点)を減らすことができる
 - Borg 99.999% 可用性を維持している 
 - 数万台オーダー マシンでワークロードを効率的に実行させる 
 - スケジューラー 実装次第で効率よく配置できる
 - Gmail、Google Docs、検索、BigTableなどで使われている(らしい) 

  4. Google Kubernetes Engine (GKE) と 
 - Google Kuberntes Engine

    (GKE) マネージド Kubernetes サービス 一つ
 - Kubernetes コントロールプレーン部分 定期的なアップデートや、コントローラーを提供してくれる 
 - ノード 可用性などを気にせずにKubernetes 恩恵を受けることができる
 - クラスタネットワーキングや、ノード カスタマイズがある程度柔軟で あるが・・・ 
 - アップデートなど 面倒を見る必要 ある
 - ワーカーノード 効率的な活用 自分たちでやる必要がある
 - 最近で そ レベル 面倒を見てくれる GKE Autopliot もある
 - しかし構成が柔軟に変更できないなど 制約もある
 - Pod単位 課金になる
 - 今回 Standard と呼 れる方を扱います 

  5. Kubernetes を簡単に理解する
 - nginx コンテナを3つ起動する...とする
 - Pod
 - コンテナをまとめた単位
 -

    Pod 中で複数 コンテナが起動することもある
 - ReplicaSet
 - Pod 集合体
 - 規定された Pod 数を保つように管理している
 - Deployment
 - ReplicaSet を管理している
 - 指定された構成や ReplicaSet 自体 アップデート を担う
 - リソースをどこに作って、誰がコンテナを作る? 
 ReplicaSet
 Deployment

  6. Kubernetes を簡単に理解する
 - Node に対して Master / Worker という役割を与 える


    - Node: 実際 Kubernetesクラスタが動作するマシ ン
 - Master: Kubernetesを司るコントロールプレーンと して指定されたノード
 - kube-apiserver Kubernetes を制御するAPI サーバー
 - リソース 登録や状態 登録を行う
 - kube-scheduler
 - Node に対してPod(コンテナ類)を割り当てるスケ ジューラー
 - Node 空き状況を見ていい感じに Pod をスケ ジュールする
 
 ReplicaSet
 Deployment

  7. Kubernetes を簡単に理解する
 - kube-controller-manager
 - Kubernetes にビルトインされたリソースを監視、管 理するコントローラー
 - 例え

    、
 - コンテナ(Deployment, Pod, ReplicaSet)
 - ネットワーク(Service)
 - ボリューム(Volume)
 - これらが登録された際に、状態を見て指定されたオ ブジェクトを作る(=リコンサイルする)
 - コントローラーが実際にオブジェクトを作るフロー を見てみる

  8. Kubernetes コントローラーを理解する
 - Deployment Controller が Deployment
 リソース 作成を検知 


    - Deployment Controller が ReplicaSet 
 リソースを作成
 - ReplicaSet Controller が ReplicaSet リソース 作成を検知
 - ReplicaSet Controller が Pod リソースを作成
 - 削除時 逆
 - オブジェクト 追加や削除を Reconcile Loop で行う
 
 

  9. コンテナオーケストレーションツール
 フルマネージド型
 自由度
 ECS Fargate
 ECS EC2
 EKS Fargate
 EKS

    EC2
 フルマネージド型
 自由度
 Cloud Run
 GKE Autopilot
 GKE Standard
 ECS Anywhere
 EKS on Outposts 
 自社環境で動作
 Anthos GKE On-prem
 Cloud Run
 for Anthos
 AWS
 Google Cloud
 Kubernetes
 Kubernetes

  10. Kubernetesリソースを理解しよう
 apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deployment labels: app:

    nginx spec: replicas: 3 selector: matchLabels: app: nginx template: metadata: labels: app: nginx spec: containers: - name: nginx image: nginx:1.14.2 ports: - containerPort: 80 Deployment
 Controller
 PodとReplicaSetを理想的な 状態に保つ

  11. どんなPodがデプロイされている か?
 NAMESPACE NAME READY STATUS RESTARTS AGE kube-system anetd-4zvx5

    1/1 Running 0 3h48m kube-system anetd-8s48b 1/1 Running 0 3h48m kube-system anetd-sknbr 1/1 Running 0 3h48m kube-system antrea-controller-horizontal-autoscaler-6fb4bf7847-hdfjc 1/1 Running 0 3h53m kube-system event-exporter-gke-857959888b-2nlk6 2/2 Running 0 3h53m kube-system fluentbit-gke-8mfwg 2/2 Running 0 3h48m kube-system fluentbit-gke-cj8q7 2/2 Running 0 3h48m kube-system fluentbit-gke-fwr8t 2/2 Running 0 3h48m kube-system gke-metadata-server-dk8kd 1/1 Running 0 3h48m kube-system gke-metadata-server-l8qql 1/1 Running 0 3h48m kube-system gke-metadata-server-v5ppl 1/1 Running 0 3h48m kube-system gke-metrics-agent-bb9tj 1/1 Running 0 3h48m kube-system gke-metrics-agent-brb7t 1/1 Running 0 3h48m kube-system gke-metrics-agent-qdvtz 1/1 Running 0 3h48m kube-system konnectivity-agent-579787d677-c77vn 1/1 Running 0 3h47m kube-system konnectivity-agent-579787d677-jxftl 1/1 Running 0 3h47m kube-system konnectivity-agent-579787d677-ltnf4 1/1 Running 0 3h53m kube-system konnectivity-agent-autoscaler-7d9fbfd578-bltmc 1/1 Running 0 3h53m kube-system kube-dns-7d5998784c-sx2tx 4/4 Running 0 3h53m kube-system kube-dns-7d5998784c-xmcl9 4/4 Running 0 3h53m kube-system kube-dns-autoscaler-9f89698b6-llcs8 1/1 Running 0 3h53m kube-system l7-default-backend-6dc845c45d-fn7qc 1/1 Running 0 3h53m kube-system metrics-server-v0.5.2-6bf845b67f-fmfqk 2/2 Running 0 3h47m kube-system netd-5vz4m 1/1 Running 0 3h48m kube-system netd-9j52l 1/1 Running 0 3h48m kube-system netd-qjk8b 1/1 Running 0 3h48m kube-system pdcsi-node-c56tf 2/2 Running 0 3h48m kube-system pdcsi-node-qzkkw 2/2 Running 0 3h48m kube-system pdcsi-node-x42ns 2/2 Running 0 3h48m
  12. Kubernetesリソースを理解しよう
 apiVersion: v1 kind: Service metadata: name: my-service spec: selector:

    app: MyApp ports: - protocol: TCP port: 80 targetPort: 9376 Service
 Controller
 Podを外部に公開するため コントローラー

  13. どんなServiceがデプロイされている か?
 $ kubectl get svc --all-namespaces NAMESPACE NAME TYPE

    CLUSTER-IP EXTERNAL-IP PORT(S) AGE default kubernetes ClusterIP 10.112.0.1 <none> 443/TCP 23h kube-system default-http-backend NodePort 10.112.12.179 <none> 80:31114/TCP 23h kube-system kube-dns ClusterIP 10.112.0.10 <none> 53/UDP,53/TCP 23h kube-system metrics-server ClusterIP 10.112.2.112 <none> 443/TCP 23h
  14. Kubernetesリソース(オブジェクト) を理解しよう
 - Kubernetes リソース、オブジェクト、 API 分類について理解した 
 - Cluster

    Resource と Namespaced Resource
 - Kubernetes コントローラー 役割について、コマンドを使いながら理解した 
 - Deployment
 - Service
 
 

  15. Kubernetesリソース(オブジェクト) を理解しよう
 - GKE -> Kubernetes
 - Network Endpoint =

    Pod
 - Network Endpoint Group = Service
 - 負荷分散 (LB / ロードバランサ) = Ingress
 - https://medium.com/google-cloud-jp/neg-%E 3%81%A8%E3%81%AF%E4%BD%95%E3%81% 8B-cc1e2bbc979e

  16. Kubernetes リソース: Ingress
 - Service に対して、さらに外部から アクセスを 管理するリソース
 - Serviceそ

    も Kubernetes クラスタ内部 ネットワークを管理するも 
 - type: LoadBalancer を使うと Pod へ L2 でア クセスさせることができる 
 - Ingress L7 をカバーする
 - ロードバランサー 設定などができる(ざっくり) 
 - パスベースでどこへルーティングする
 - TLS 証明書を設定する

  17. Kubernetes リソース: Gateway (Beta)
 - Ingress をさらに拡張したリソース 
 - Ingress

    で アノテーション ラベルベースで やっていたことを API レベルでサポート
 - 証明書 設定
 - HTTP 以外 プロトコル 柔軟なサポート
 - TCP / UDP から HTTP / HTTPS まで
 - Kubernetes RBAC を利用した柔軟な権限管理
 - Google Kubernetes Engine で サポート
 - シングルクラスタ、マルチクラスタ サポート
 - HTTPRoute サポート
 - TCPRoute など 未実装
 - マネージド証明書 サポート(一部)
 - フルで利用可能になる まだ時間がかかる
 https://gateway-api.sigs.k8s.io/
  18. Kubernetes リソース: Secret
 - パスワードなどを管理するオブジェクト こと 
 - Pod 環境変数や、コンテナイメージに機密情報

    を書き込まないようにするため も 
 - Secretを作ってコンテナ 環境変数として参照さ せる(他もできる)
 - 初期状態で 暗号化 されていない 
 - Kubernetes RBACを使ってアクセス制御をした り...
 - Secretをクラスタ/マニフェスト単位で暗号化する ツールを使う
 - Secret管理を外部 キーマネジメントシステムに やらせる
 - 今回 暗号化されていないまま使います 

  19. 実際にデプロイしてみよう
 $ kubectl apply -f namespace.yaml
 $ kubectl apply -f

    secret.yaml
 $ kubectl apply -f deployment.yaml
 $ kubectl get deployment -n namespace
 $ kubectl get pod -n my-namespace
 

  20. Kubernetesリソース(オブジェクト) を理解しよう
 - Deploymentを変更したとき、ど ように ReplicaSet, Podが作成される かを観察してみ る
 -

    Deployment デプロイ戦略
 - RollingUpdate (デフォルト)
 - ローリングアップデートされていく 
 - Recreate
 - Podを全部停止して、作り直す 
 - https://kubernetes.io/ja/docs/concepts/workl oads/controllers/deployment/
 

  21. 環境変数を足してDeploymentが新しいReplicaSetを作るところを見る
 1. Deploymentに環境変数を足す --- a/kubernetes/deployment.yaml +++ b/kubernetes/deployment.yaml @@ -37,6 +37,8

    @@ spec: secretKeyRef: name: secret key: password + - name: HELLO + value: HOGEHOGE livenessProbe: httpGet: path: /liveness 2. applyする kubectl apply -f deployment.yaml このとき、別窓で kubectl get replicaset -w -n my-namespace しておく
  22. Kubernetesリソース(オブジェクト) を理解しよう
 - kubectlを使ってアプリケーションをデプロイした 
 - Deployment
 - Service
 -

    Ingress
 - Exercise
 - Deployment アップデート戦略について調べる
 - Deployment以外 Pod コントローラーについて調べてみる
 - Service タイプについて詳しく調べてみる
 
 

  23. いろいろなOperator / Custom Controller
 - cert-manager
 - Kubernetes リソースとして証明書 発行や管理が出来る

    Custom Controller
 - Prometheus Operator
 - メトリクス収集に必要な Prometheus デプロイや Kubernetes リソースと監視 紐付けが出来る Operator
 - Google Cloud Managed Service for Prometheus
 - Google Cloud で利用できるマネージド Prometheus
 - Grafana Operator
 - Grafana デプロイが簡単にできるOperator
 - Config Connector (Google Kubernetes Engine)
 - Kubernetes リソースとして Google Cloud リソースを管理出来る Operator
 
 

  24. Prometheus と 
 - Prometheus 色々なメトリクスを収集するアプ リケーション
 - Exporter というメトリクスを書き出すサーバーか

    ら、定期的にメトリクスを収集
 - Prometheus 持つストレージか、好きなストレー ジに書き出してメトリクスを保存
 - PromQL という言語を使ってクエリして、
 アラートやグラフを書き出す
 - 時系列 DB をスケール/マネージドにさせるため に、色々な派生プロダクトが存在する 
 - VictoriaMetrics
 - New Relic Remote Write
 - Grafana Cloud
 - https://prometheus.io/
 
 

  25. Google Cloud Managed Service for Prometheus 
 - Prometheus を実用するに

    考えることが 
 たくさんある
 - Prometheus 管理
 - データ 保存先(可用性)
 - 保存期間
 - Exporter 設定管理
 - Google Cloud がマネージドにしてくれる が Google Cloud Managed Service for Prometheus
 - インフラ管理者 マネージド Prometheus を GKE クラスタで有効にするだけで良い 
 - アプリケーション開発者 Prometheus
 メトリクスを出すことに集中すれ 良い 
 - ダッシュボードも Google Cloud で見れる
 - 料金に注意

  26. カスタムコントローラー Managed Prometheus を使って見よう
 - サービス メトリクスやアラートを行う Prometheus というアプリケーションについて理解した 


    - Google Cloud Managed Service for Prometheus を GKE クラスタで使ってみた 
 - ノード メトリクスを収集する Node Exporter を使って、GKE クラスタ メモリ利用率を Google Cloud Monitoring で見た
 - Exercise
 - クラスタ ノード メモリ利用率を取る PromQL を書いてみよう
 - プロダクト アプリケーション メトリクスを Prometheus で取る方法を調べてみよう
 
 

  27. metrics-server
 - Kubernetes Pod や Node メトリクスを収集できる API サーバー
 -

    https://github.com/kubernetes-sigs/metrics-server
 - kube-apiserver に 搭載されていない で自前で導入する必要がある 
 - Google Kubernetes Engine で 標準でインストールされている
 - Cloud Monitoring と 連携もオプションで可能(今回 有効済み)
 - オンプレなどで これを Prometheus などで取得してGrafanaで見る、みたいなことをする
 - kubectl top などを叩くと metrics-server から 情報を得られる