NỘI DUNG

Vertical Pod Autoscaler là gì? Ưu nhược điểm và cách sử dụng VPA

Hưng Nguyễn

Đã kiểm duyệt nội dung

Ngày đăng:21/04/2026

Lượt xem

Quy trình sản xuất nội dung

Theo dõi Vietnix

Đánh giá

[esi kkstarratings cache="private" ttl="3"]

Theo dõi trên

Vertical Pod Autoscaler (VPA) là một thành phần trong Kubernetes dùng để tự động điều chỉnh request và limit CPU, memory cho Pod dựa trên mức sử dụng tài nguyên thực tế theo thời gian. Từ kinh nghiệm tối ưu cluster chạy lâu dài, mình thấy VPA đặc biệt hữu ích để “rightsizing” những workload khó scale ngang hoặc hay bị đặt sai request/limit. Trong bài viết này, mình sẽ giúp bạn hiểu rõ hơn cách VPA hoạt động, các chế độ cập nhật, ưu nhược điểm và từng bước cài đặt, sử dụng sao cho an toàn trong môi trường production.

Những điểm chính

Quan điểm của mình: Với các cluster chạy lâu dài, VPA nên được xem là công cụ mặc định để rightsizing tài nguyên trước khi tính chuyện nâng node hay scale thêm pod, vì nếu request/limit đặt sai thì mọi chiến lược autoscaling phía sau đều kém hiệu quả.
Khái niệm: Hiểu rõ Vertical Pod Autoscaler (VPA) là công cụ tự động điều chỉnh tài nguyên, giúp bạn tối ưu hóa việc phân bổ CPU/memory, tránh lãng phí và các lỗi hệ thống phổ biến.
Cách thức hoạt động: Nắm vững cơ chế hoạt động qua ba thành phần chính, giúp bạn hiểu rõ cách VPA tự động thu thập dữ liệu, đưa ra khuyến nghị và áp dụng thay đổi tài nguyên một cách chính xác.
Các thành phần chính: Nắm vững vai trò của Recommender, Updater và Admission Controller, giúp bạn hiểu rõ kiến trúc của VPA và cách chúng phối hợp để tự động hóa việc điều chỉnh tài nguyên.
Các chế độ cập nhật: Tìm hiểu về các chế độ cập nhật khác nhau, giúp bạn lựa chọn phương pháp phù hợp để cân bằng giữa việc tối ưu hóa tài nguyên và đảm bảo tính sẵn sàng của ứng dụng.
Ưu và nhược điểm: Đánh giá được các ưu điểm về tối ưu hóa tài nguyên và các nhược điểm về khả năng gây gián đoạn dịch vụ, giúp bạn đưa ra quyết định triển khai phù hợp với yêu cầu của hệ thống.
So sánh với HPA: Phân biệt rõ ràng sự khác biệt giữa VPA (co giãn theo chiều dọc) và HPA (co giãn theo chiều ngang), giúp bạn lựa chọn đúng chiến lược autoscaling phù hợp với từng loại ứng dụng.
Cách cài đặt và sử dụng: Nắm vững các bước cài đặt và cấu hình cơ bản, giúp bạn có thể tự mình triển khai VPA và bắt đầu tối ưu hóa tài nguyên cho các ứng dụng của mình.
Các phương pháp thực hành tốt nhất: Nắm được các phương pháp hay nhất khi triển khai, giúp bạn áp dụng VPA một cách an toàn, hiệu quả và kết hợp tốt với các công cụ autoscaling khác trong hệ sinh thái Kubernetes.
Giới thiệu Vietnix: Biết thêm Vietnix là nhà cung cấp Enterprise Cloud mạnh mẽ, giúp bạn có một nền tảng hạ tầng đáng tin cậy để triển khai mọi chiến lược Autoscaling Kubernetes.
Câu hỏi thường gặp: Giải đáp các thắc mắc liên quan đến Vertical Pod Autoscaler.

Vertical Pod Autoscaler là gì?

Vertical Pod Autoscaler (VPA) là thành phần Kubernetes tự động điều chỉnh yêu cầu và giới hạn tài nguyên CPU, memory cho các Pod dựa trên mức sử dụng thực tế. VPA tập trung điều chỉnh tài nguyên cho Pod hiện có bằng cách tối ưu hóa tài nguyên cá nhân để giảm lãng phí, tránh OOMKilled hoặc throttling, đồng thời cải thiện scheduling và tiết kiệm chi phí.

Vertical Pod Autoscaler tự động điều chỉnh CPU và memory cho Pod dựa trên mức sử dụng thực tế

VPA áp dụng cho workload controller như Deployment, StatefulSet, DaemonSet (chỉ recommendation), không hỗ trợ standalone Pod, với API stable autoscaling.k8s.io/v1 từ Kubernetes 1.23+. Trên GKE, VPA tích hợp node quota, historical data và hỗ trợ Multidimensional scaling với HPA. VPA chỉ quản lý CPU/memory, tôn trọng resourcePolicy (minAllowed/maxAllowed) và LimitRange cluster.

Để khai thác tối đa hiệu quả của Vertical Pod Autoscaler, hạ tầng triển khai cũng đóng vai trò rất quan trọng. Vietnix cung cấp giải pháp Enterprise Cloud với tài nguyên linh hoạt, hiệu năng cao và khả năng mở rộng tối ưu, giúp bạn dễ dàng triển khai Kubernetes cũng như các cơ chế autoscaling như VPA một cách ổn định, tiết kiệm chi phí và phù hợp cho môi trường production.

Cách thức hoạt động của Vertical Pod Autoscaler

Vertical Pod Autoscaler hoạt động qua vòng lặp tự động: thu thập metrics, phân tích recommendation, cập nhật Pod hiện tại và áp dụng cho Pod mới, đảm bảo tài nguyên CPU/memory luôn phù hợp với sử dụng thực tế.

Thu thập và phân tích metrics: VPA Recommender định kỳ truy vấn Metrics Server qua metrics.k8s.io API để thu thập dữ liệu sử dụng CPU/memory hiện tại và lịch sử của các Pod mục tiêu, được xác định thông qua targetRef.spec.selector (Deployment/StatefulSet). Dựa trên dữ liệu này, Recommender phân tích xu hướng sử dụng theo thời gian, các đỉnh tải (peak), độ biến thiên và sự kiện OOMKilled, từ đó tính toán bộ giá trị gồm target recommendation (tài nguyên tối ưu cho mức tải điển hình), lower bound (ngưỡng tối thiểu) và upper bound (ngưỡng tối đa), rồi ghi lại vào trường .status.recommendation của VPA CRD.
Giám sát và cập nhật pod hiện tại: Updater liên tục đối chiếu requests/limits hiện tại của Pod với recommendation đã tính toán. Khi độ lệch vượt quá ngưỡng threshold được cấu hình và phù hợp với updatePolicy, Updater sẽ thực hiện evict Pod hoặc cập nhật in-place (trên Kubernetes 1.34+). Trong quá trình này, Updater tuân thủ PodDisruptionBudget để hạn chế gián đoạn, phối hợp với Cluster Autoscaler khi cần điều chỉnh năng lực node và sử dụng cơ chế recreate như phương án dự phòng nếu cập nhật in-place không khả thi, giúp trạng thái tài nguyên của Pod dần tiệm cận với recommendation.
Áp dụng tài nguyên cho pod mới: Admission Controller vận hành như một mutating webhook, can thiệp vào yêu cầu tạo Pod mới từ các sự kiện deployment, post-evict hoặc scaling nếu Pod thuộc phạm vi một VPA đang cấu hình để chèn (inject) giá trị target recommendation vào requests/limits trước khi Pod được khởi chạy. Pod mới vì vậy bắt đầu chạy với cấu hình CPU/memory đã được điều chỉnh, chỉ áp dụng cho các trường controlledResources, đồng thời vẫn tuân thủ đầy đủ các ràng buộc từ resourcePolicy (minAllowed/maxAllowed) và LimitRange của cluster.

Cách thức hoạt động của Vertical Pod Autoscaler

Thành phần chính của Vertical Pod Autoscaler

Recommender
Updater
Admission Controller

Recommender

Bộ Recommender định kỳ truy vấn Metrics Server qua metrics.k8s.io API để thu thập dữ liệu sử dụng CPU và memory cả hiện tại lẫn lịch sử của các Pod target, được xác định qua targetRef.spec.selector từ Deployment hoặc StatefulSet.

Dựa trên dữ liệu thu thập, bộ phận phân tích chi tiết xu hướng sử dụng theo thời gian, peak usage, độ biến thiên, các sự kiện OOMKilled cùng các vấn đề tài nguyên khác, từ đó tính toán target recommendation (tài nguyên tối ưu), lower bound (mức tối thiểu khả dụng) và upper bound (mức tối đa hợp lý). Kết quả khuyến nghị được lưu trữ trong trường .status.recommendation của VPA CRD, cung cấp nền tảng dữ liệu cho các thành phần khác sử dụng.

Updater

Bộ Updater liên tục giám sát các VPA objects và so sánh requests/limits hiện tại của Pod với recommendation từ Recommender, kích hoạt hành động khi chênh lệch vượt quá threshold được cấu hình và updatePolicy cho phép.

Bộ phận thực hiện evict Pod hoặc update in-place (từ Kubernetes 1.34+), đồng thời tôn trọng PodDisruptionBudget để giảm thiểu gián đoạn dịch vụ, thông báo trước cho Cluster Autoscaler và fallback sang recreate nếu in-place không khả dụng. Quá trình đảm bảo tài nguyên Pod được đồng bộ hóa kịp thời với khuyến nghị, tạo điều kiện cho Admission Controller xử lý Pod mới.

Admission Controller

Admission Controller vận hành dưới dạng mutating webhook, can thiệp vào mọi yêu cầu tạo Pod mới từ initial deployment, post-eviction hoặc scaling nếu Pod thuộc target VPA.

Bộ phận truy xuất target recommendation từ .status.recommendation để ghi đè requests/limits trước khi Pod được khởi chạy, chỉ áp dụng cho controlledResources (CPU/memory) và tuân thủ nghiêm ngặt resourcePolicy bao gồm minAllowed/maxAllowed cùng LimitRange của cluster. Pod mới luôn khởi động với tài nguyên được tối ưu hóa ngay từ đầu, hoàn thiện vòng lặp tự động của VPA.

Các thành phần chính của Vertical Pod Autoscaler

Các chế độ cập nhật tài nguyên

VPA hỗ trợ 4 chế độ cập nhật qua updatePolicy.updateMode để kiểm soát cách áp dụng recommendation.

Chế độ tắt (Off): VPA Recommender vẫn phân tích sử dụng tài nguyên và tạo recommendation, nhưng không tự động áp dụng cho Pod. Recommendation chỉ lưu trong .status.recommendation của VPA object, xem qua kubectl describe vpa để kiểm tra thủ công trước khi quyết định triển khai.
Chế độ ban đầu (Initial): VPA chỉ áp dụng recommendation vào requests/limits khi Pod được tạo lần đầu tiên. Pod đang chạy không bị thay đổi dù recommendation cập nhật sau đó, phù hợp cho workload cần ổn định sau deployment ban đầu.
Chế độ tái tạo (Recreate): Updater evict Pod khi requests/limits lệch recommendation vượt threshold theo updatePolicy. Workload controller (Deployment/StatefulSet) tạo Pod thay thế, Admission Controller áp dụng recommendation mới cho Pod mới trước khi chạy.
Chế độ kết hợp (InPlaceOrRecreate): VPA ưu tiên update requests/limits in-place mà không restart Pod (Kubernetes 1.34+ sử dụng Resize Container Resources In-Place). Fallback evict/recreate nếu in-place không khả dụng (node capacity, resource type), giảm gián đoạn tối đa so với Recreate thuần.
Chế độ tự động (Auto – Deprecated): Auto mode đã deprecated từ VPA 1.4.0, hiện hoạt động như alias của Recreate. Khuyến nghị dùng Recreate cho eviction hoặc InPlaceOrRecreate cho in-place với fallback.

Ưu nhược điểm của Vertical Pod Autoscaler

Ưu điểm

Tối ưu chi phí và ổn định: VPA điều chỉnh requests/limits phù hợp tránh overprovision/underprovision, giảm OOMKilled/throttling và lãng phí tài nguyên dẫn đến tiết kiệm chi phí.
Sử dụng cluster hiệu quả: Pod nhận đúng tài nguyên cần thiết cải thiện scheduling lên node phù hợp, tối ưu hóa sử dụng node cluster.
Loại bỏ benchmarking thủ công: VPA tự động phân tích historical data thay thế việc đo benchmark tốn thời gian để xác định CPU/memory requests.
Giảm thời gian bảo trì: Tự động điều chỉnh requests theo thời gian mà không cần can thiệp thủ công, hỗ trợ workload thay đổi liên tục.
Tích hợp GKE nâng cao: Xem xét node size/quota, thông báo Cluster Autoscaler, sử dụng historical data trước activation, chạy control plane-managed.

Nhược điểm

Không tương thích trực tiếp HPA: Cần multidimensional Pod autoscaling để kết hợp VPA (rightsizing) với HPA (scale số Pod), tránh xung đột scaling.
Không hỗ trợ JVM workload: Thiếu visibility memory usage thực tế của JVM dẫn đến recommendation không chính xác.
Phụ thuộc historical data ngắn hạn: Sử dụng metrics vài giờ/ngày, không nắm bắt xu hướng dài hạn hoặc seasonal patterns.
Yêu cầu workload controller: Không hỗ trợ standalone Pod, cần Deployment/StatefulSet/ReplicaSet để recreate Pod sau evict.
Gián đoạn khi recreate: Evict Pod gây downtime, InPlaceOrRecreate fallback recreate nếu node capacity không đủ.

So sánh HPA với VPA

Horizontal Pod Autoscaler (HPA) và Vertical Pod Autoscaler (VPA) là cơ chế autoscaling của Kubernetes, cùng mục tiêu điều chỉnh tài nguyên dựa trên metrics sử dụng thực tế để cải thiện hiệu quả vận hành ứng dụng, nhưng mỗi cơ chế áp dụng một hướng scale khác nhau. Dưới đây là bảng so sánh sự khác biệt giữa hai cơ chế này:

Đặc điểm	HPA (Horizontal Pod Autoscaler)	VPA (Vertical Pod Autoscaler)
Phương pháp scale	Mở rộng theo chiều ngang bằng cách tăng hoặc giảm số lượng Pod replica trong Deployment/StatefulSet.	Mở rộng theo chiều dọc bằng cách điều chỉnh CPU/memory requests/limits của Pod hiện có.
Mục tiêu chính	Xử lý biến động lưu lượng/tải công việc bằng thay đổi số Pod để phân tán tải.	Tối ưu phân bổ tài nguyên (rightsizing) để tránh overprovision/underprovision, giảm waste và OOM/throttling.
Metrics sử dụng	CPU, memory (trên một số implementation) và custom/external metrics qua Metrics Server và APIs liên quan.	CPU/memory hiện tại và lịch sử của Pod từ Metrics Server, không xem xét network/I/O.
Cách thức hoạt động	Điều chỉnh trường replicas của Deployment/StatefulSet dựa trên target utilization và rules autoscaling.	Recommender tính recommendation → Updater evict/update Pod → Admission Controller inject requests/limits mới cho Pod tạo lại.
Ứng dụng phù hợp	Web/app stateless, microservice có lưu lượng biến động cần khả năng scale-out nhanh.	Workload cần điều chỉnh kích thước tài nguyên chính xác như database, service có tải không đồng đều, job chạy lâu.
Khả năng kết hợp	Không nên dùng chung với VPA trên cùng CPU/memory nếu không qua multidimensional autoscaling, dễ gây xung đột quyết định scale.	Có thể kết hợp với HPA thông qua multidimensional Pod autoscaling trên GKE hoặc dùng ở chế độ recommendation-only.
Mức độ gián đoạn	Tạo/xóa Pod mới khi scale, thường gây thay đổi nhẹ về traffic routing.	Có thể evict/recreate Pod (Recreate) hoặc update in-place (InPlaceOrRecreate), chịu ràng buộc PodDisruptionBudget.
Yêu cầu kỹ thuật	Cần Metrics Server và workload controller (Deployment, StatefulSet…) để quản lý replicas.	Cần Metrics Server, VerticalPodAutoscaler CRD và workload controller; không hỗ trợ standalone Pod.

Theo kinh nghiệm của mình, HPA phù hợp với hệ thống cần scale nhanh theo traffic, còn VPA phù hợp để tối ưu tài nguyên cho workload ổn định. Nếu dùng cả hai, nên cấu hình cẩn thận (hoặc dùng VPA dạng recommendation) để tránh xung đột và đạt hiệu quả tốt nhất.

Hướng dẫn cài đặt và sử dụng VPA

Bước 1: Chuẩn bị môi trường và cài đặt VPA
Bước 2: Tạo workload và khai báo VerticalPodAutoscaler
Bước 3: Kiểm tra khuyến nghị và vận hành VPA

Bước 1: Chuẩn bị môi trường và cài đặt VPA

Trước tiên, bạn cần đảm bảo cụm Kubernetes đã cài Metrics Server để cung cấp số liệu CPU/memory qua API metrics.k8s.io, đây là nguồn dữ liệu bắt buộc cho VPA Recommender phân tích và tạo recommendation.
Bạn cần cài đặt Vertical Pod Autoscaler từ repo kubernetes/autoscaler (bao gồm CRD VerticalPodAutoscaler, Recommender, Updater, Admission Controller) theo hướng dẫn installation trong tài liệu chính thức hoặc README GitHub.
Tiếp đó, bạn phải xác nhận workload được quản lý bởi Deployment, StatefulSet, ReplicaSet hoặc ReplicationController, vì VPA yêu cầu controller để tái tạo Pod sau evict và không hỗ trợ standalone Pod.

Bước 2: Tạo workload và khai báo VerticalPodAutoscaler

Bạn cần tạo Deployment/StatefulSet cho ứng dụng (ví dụ NGINX) với spec.selector và nhãn metadata.labels/template.metadata.labels trùng khớp, có thể chưa khai báo cụ thể CPU/memory requests/limits nếu muốn để VPA đề xuất từ đầu.
Kỹ sư Kubernetes phải định nghĩa resource VerticalPodAutoscaler với spec.targetRef trỏ đến workload (apiVersion, kind, name) và cấu hình updatePolicy.updateMode (thường bắt đầu với Off để chỉ lấy recommendation, sau đó chuyển sang Recreate hoặc InPlaceOrRecreate khi đã kiểm chứng).

Bước 3: Kiểm tra khuyến nghị và vận hành VPA

Bạn sử dụng lệnh kubectl describe vpa <tên-vpa> để kiểm tra trường status.recommendation, trong đó chứa các giá trị CPU/memory được đề xuất (target, lower, upper) cho từng container, làm cơ sở điều chỉnh tài nguyên.
Tùy chiến lược, đội ngũ kỹ thuật có thể cập nhật thủ công manifest Deployment/StatefulSet theo recommendation (khi dùng chế độ Off/Initial) hoặc chuyển sang Recreate/InPlaceOrRecreate để VPA tự động evict/update Pod và áp dụng requests/limits mới, đồng thời trên GKE có thể tận dụng tích hợp với Cluster Autoscaler và Autopilot để tối ưu tài nguyên node.

Thực hành triển khai Vertical Pod Autoscaler

Áp dụng VPA cho workload quan trọng
Thiết lập chính sách và ngưỡng tài nguyên
Kết hợp với Cluster Autoscaler và Pod Disruption Budget
Tự động hóa tối ưu dung lượng tài nguyên

Áp dụng VPA cho workload quan trọng

Doanh nghiệp nên triển khai Vertical Pod Autoscaler cho các workload giữ vai trò trọng yếu trong hệ thống, đặc biệt là những ứng dụng có tải biến động như dịch vụ backend, xử lý giao dịch hoặc các thành phần stateful nhạy cảm về hiệu năng. Khi VPA được bật trên các workload này, tài nguyên CPU và bộ nhớ của Pod được điều chỉnh dựa trên mức sử dụng thực tế, giúp giảm rủi ro thiếu tài nguyên gây OOM hoặc throttling, đồng thời hạn chế tình trạng cấu hình quá dư thừa dẫn đến chi phí vận hành cao.

Thiết lập chính sách và ngưỡng tài nguyên

Người quản trị nên cấu hình resourcePolicy với các giới hạn minAllowed và maxAllowed để xác định khoảng tài nguyên CPU/memory mà VPA được phép đề xuất, qua đó tránh trường hợp khuyến nghị vượt ngoài khả năng hạ tầng hoặc ngân sách. Bên cạnh đó, việc kết hợp LimitRange và ResourceQuota ở cấp namespace cùng với VPA giúp xác lập biên tài nguyên tổng thể, trong khi VPA đảm nhận phần tinh chỉnh bên trong dựa trên dữ liệu sử dụng thực tế và các pattern tải đã được quan sát.

Kết hợp với Cluster Autoscaler và Pod Disruption Budget

Đội ngũ vận hành nên tích hợp VPA với Cluster Autoscaler hoặc các cơ chế tự động mở rộng node khác để đảm bảo cụm có đủ tài nguyên vật lý đáp ứng các Pod đã được điều chỉnh tăng tài nguyên bởi VPA. Đồng thời, Pod Disruption Budget cần được thiết lập cho các deployment quan trọng nhằm giới hạn số lượng Pod có thể bị evict cùng lúc bởi Updater, giúp duy trì mức độ sẵn sàng dịch vụ trong suốt quá trình thay đổi requests/limits.

Tự động hóa tối ưu dung lượng tài nguyên

Nhóm DevOps có thể bắt đầu với updateMode=Off ở môi trường thử nghiệm để quan sát recommendation, sau đó chuyển sang các chế độ Recreate hoặc InPlaceOrRecreate khi đã xác nhận khuyến nghị phù hợp, từ đó tự động hóa hoàn toàn quy trình tối ưu tài nguyên. Khi VPA hoạt động ổn định trong thời gian dài, việc kết hợp thêm hệ thống giám sát như Prometheus hoặc Grafana để theo dõi resource usage và recommendation cho phép đánh giá hiệu quả tiết kiệm chi phí, đồng thời tinh chỉnh thêm chính sách, ngưỡng hoặc tách nhỏ workload nếu có dấu hiệu quá tải hoặc sử dụng chưa tối ưu.

Thực hành triển khai Vertical Pod Autoscaler

Vietnix – Nền tảng Enterprise Cloud mạnh mẽ cho mọi chiến lược Autoscaling Kubernetes

Để triển khai hiệu quả các cơ chế autoscaling phức tạp như VPA và HPA, đòi hỏi một hạ tầng đám mây với hiệu năng tính toán cao, khả năng cung cấp tài nguyên linh hoạt và kết nối mạng đáng tin cậy. Vietnix cung cấp dịch vụ Enterprise Cloud Server hiệu suất vượt trội, lý tưởng để bạn xây dựng và vận hành các cụm Kubernetes. Với các tùy chọn cấu hình mạnh mẽ, bộ vi xử lý hiệu suất cao, ổ cứng NVMe siêu tốc và băng thông ổn định, Vietnix đảm bảo bạn có đủ tài nguyên để VPA hoạt động trơn tru, điều chỉnh requests/limits chính xác và giúp ứng dụng của bạn luôn được rightsizing. Liên hệ ngay!

Thông tin liên hệ:

Website: https://vietnix.vn/
Hotline: 1800 1093
Email: sales@vietnix.com.vn
Địa chỉ: 265 Hồng Lạc, Phường Bảy Hiền, Thành Phố Hồ Chí Minh

Câu hỏi thường gặp

VPA K8s là gì?

Vertical Pod Autoscaler (VPA) trong Kubernetes là cơ chế tự động điều chỉnh requests và limits tài nguyên CPU, bộ nhớ cho Pod dựa trên mức sử dụng thực tế, nhằm rightsizing tài nguyên để khớp với nhu cầu thực của workload. VPA được triển khai như một tài nguyên API VerticalPodAutoscaler và controller đi kèm, định kỳ phân tích historical metrics rồi cập nhật lại resource requests/limits của các Pod thuộc Deployment, StatefulSet hoặc tương tự để tránh overprovision/underprovision và tối ưu chi phí hạ tầng.

Autoscaling v2 là gì?

Autoscaling v2 là phiên bản API autoscaling/v2 dùng cho HorizontalPodAutoscaler trong Kubernetes, cho phép định nghĩa autoscaling dựa trên nhiều loại metrics cùng lúc như CPU, memory, custom metrics, external metrics thay vì chỉ một metric như các phiên bản cũ. Với autoscaling/v2, controller của HPA đánh giá từng metric, tính toán giá trị replica đề xuất cho mỗi metric rồi chọn mức scale cao nhất trong giới hạn min/max replica được cấu hình, từ đó điều chỉnh số Pod cho Deployment/StatefulSet linh hoạt và chính xác hơn theo nhiều chiều đo lường.

Làm thế nào để VPA biết được mức sử dụng CPU và memory của một Pod?

VPA Recommender thu thập các số liệu này từ Metrics Server. Metrics Server là một thành phần trong cụm Kubernetes, có nhiệm vụ thu thập các metrics sử dụng tài nguyên từ kubelet trên mỗi Node và cung cấp chúng thông qua API metrics.k8s.io, làm nguồn dữ liệu cho VPA.

Vertical Pod Autoscaler là một công cụ mạnh mẽ trong hệ sinh thái Kubernetes, giúp tự động hóa việc tối ưu hóa tài nguyên CPU và memory cho các Pod. Bằng cách rightsizing các ứng dụng dựa trên mức sử dụng thực tế, VPA không chỉ giúp giảm lãng phí tài nguyên và tiết kiệm chi phí mà còn tăng cường sự ổn định của hệ thống bằng cách ngăn chặn các lỗi OOMKilled.

Mọi người cũng xem:

THEO DÕI VÀ CẬP NHẬT CHỦ ĐỀ BẠN QUAN TÂM

Đăng ký ngay để nhận những thông tin mới nhất từ blog của chúng tôi. Đừng bỏ lỡ cơ hội truy cập kiến thức và tin tức hàng ngày

Đánh giá mức độ hữu ích của bài viết

Thất vọng

Chưa hữu ích

Bình thường

Hữu ích

Rất hữu ích

Hưng Nguyễn

Co-Founder

tại

Vietnix

Kết nối với mình qua

Tôi là Nguyễn Hưng (Bo) – Chuyên gia hệ thống, mạng và bảo mật với hơn 13 năm kinh nghiệm, đồng thời là Co-Founder của Vietnix, nhà cung cấp dịch vụ Hosting, VPS và điện toán đám mây hàng đầu tại Việt Nam. Với niềm đam mê chia sẻ kiến thức, tôi luôn nỗ lực mang đến những bài viết hữu ích cho cộng đồng yêu công nghệ.

Kết nối với mình qua