R là một ngôn ngữ lập trình nguồn mở, thường được sử dụng trong việc thực hiện phân tích dữ liệu và tính toán thống kê. R được hỗ trợ bởi R Foundation for Statistical Computing, đây là một ngôn ngữ ngày càng phổ biến và có thể mở rộng với một cộng đồng hoạt động tích cực. Ngôn ngữ R cung cấp nhiều package do người dùng tự tạo ra dành cho các lĩnh vực nghiên cứu cụ thể và từ đó giúp áp dụng trên nhiều lĩnh vực khác nhau. Bài viết này sẽ hướng dẫn cài đặt R trên Ubuntu 20.04.
Yêu cầu tiên quyết để có thể cài đặt R trên Ubuntu 20.04
Bạn cần có một máy chủ Ubuntu 20.04 với cầu hình tối thiểu 1GB RAM. Tài khoản người dùng non-root, được cấp quyền sudo
.
Nếu bạn chưa có máy chủ để cài đặt R, bạn có thể xem xét việc mua VPS tại Việt Nam từ Vietnix. Các gói VPS của Vietnix đều có cấu hình từ 1GB RAM trở lên, đảm bảo đáp ứng được yêu cầu cài đặt R.
Bên cạnh đó, VPS của Vietnix cũng hỗ trợ nhiều hệ điều hành khác nhau như Ubuntu, CentOS, Windows,… giúp bạn lựa chọn hệ điều hành phù hợp với nhu cầu sử dụng.
Ngay sau khi đăng ký và thanh toán, bạn sẽ được kích hoạt dịch vụ để bắt đầu sử dụng VPS ngay lập tức. Nếu bạn gặp bất kỳ vấn đề gì, đội ngũ kỹ thuật của Vietnix sẵn sàng hỗ trợ bạn 24/7 để đảm bảo hệ thống của bạn hoạt động ổn định và an toàn. Liên hệ ngay với Vietnix để được tư vấn chi tiết.
Các bước tiến hành
Bước 1: Cài đặt R
Phiển bản ổn định mới nhất của R không phải lúc nào cũng có sẵn từ kho chứa của Ubuntu, vì vậy bạn sẽ bắt đầu bằng cách thêm kho lưu trữ bên ngoài được vận hành và duy trì bởi CRAN vào kho chứa package trên Ubuntu của mình.
Lưu ý: CRAN duy trì các kho lưu trữ bên trong network của họ, nhưng không phải tất cả các kho lưu trữ bên ngoài đều đáng tin cậy. Nên bạn chỉ nên cài đặt từ nguồn uy tín.
Trước tiên, bạn hãy thêm khóa GPG có liên quan.
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9
Nhận được output như sau:
Output
Executing: /tmp/apt-key-gpghome.cul0ddtmN1/gpg.1.sh --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9
gpg: key 51716619E084DAB9: public key "Michael Rutter <marutter@gmail.com>" imported
gpg: Total number processed: 1
gpg: imported: 1
Sau khi đã có khóa đáng tin cậy, tiếp theo bạn hãy tiến hành thêm kho lưu trữ.
Lưu ý: Nếu bạn không sử dụng Ubuntu 20.04, bạn có thể tìm kho lưu trữ có liên quan từ danh sách R Project Ubuntu (https://cloud.r-project.org/bin/linux/ubuntu/), được đặt tên cho mỗi phiên bản phát hành. Trên Ubuntu 20.04 được gọi là Focal Fossa, và phiên bản mới nhất của R là 4.0.0. Do đó, quy ước đặt tên của kho lưu trữ bên dưới là focal-cran40
.
sudo add-apt-repository 'deb https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/'
Output tương tự như sau:
Output
...
Get:7 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ InRelease [3622 B]
Get:8 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ Packages [15.6 kB]
...
Chạy lệnh update
để có thể cập nhật phiên bản mới nhất của các package trong kho lưu trữ mới được thêm vào.
sudo apt update
Output tương tự dưới đây:
Output
...
Hit:5 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ InRelease
...
Nếu dòng trên xuất hiện trong output của từ lệnh update
, bạn đã thêm thành công kho lưu trữ mới. Điều này đảm bảo rằng, bạn sẽ không vô tình cài đặt nhầm phiên bản cũ hơn.
Tiến hành cài đặt R bằng lệnh sau:
sudo apt install r-base
Nếu được nhắc xác nhận cài đặt, bạn hãy nhấn y
để tiếp tục.
Tại thời điểm của bài viết này, phiên bản ổn định mới nhất của R từ CRAN là 4.0.1, được hiển thị khi bạn khởi động R.
Tiếp theo bạn sẽ tiến hành cài đặt một package mẫu cho tất cả user trên hệ thống. Bạn sẽ khởi động R với đặc quyền root để các thư viện sẽ tự động có sẵn cho tất cả người dùng. Ngoài ra, nếu bạn chạy lệnh R
mà không có sudo
thì thư viện cá nhân có thể sẽ được thiết lập cho user.
sudo -i R
Output
R version 4.0.0 (2020-04-24) -- "Arbor Day"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu (64-bit)
...
Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
>
Output như trên xác nhận rằng bạn đã cài đặt thành công R và có thể dùng shell để tương tác.
Bước 2: Cài đặt các packages của R từ CRAN
Một ưu điểm lớn của R là các package phụ trợ có sẵn rất phong phú. Để demo, tiếp theo bạn sẽ cài đặt txtplot
là một thư viện giúp xuất các biểu đồ ASCII bao gồm biểu đồ phân tán, biểu đồ đường, biểu đồ mật độ, acf và biểu đồ các thanh:
install.packages('txtplot')
Output sau đây cho biết nơi package sẽ được cài đặt.
Output
...
Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)
...
Đường dẫn toàn cục này khả dụng vì bạn đã chạy R với quyền root. Vị trí này sẽ cung cấp gói cho tất cả người dùng.
Sau khi đã cài đặt hoàn tất, bạn có thể tải thư viện txtplot
vào project của mình:
library('txtplot')
Nếu không có thông báo lỗi nào, thư viện đã được tải thành công. Bây giờ bạn thực hiện một ví dụ để thể hiện chức năng vẽ đồ thị cơ bản với các nhãn trục. Dữ liệu ví dụ được cung cấp bởi datasets
package của R, chứa tốc độ của ô tô và khoảng cách cần thiết để dừng lại dựa trên dữ liệu từ những năm 1920 (https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/cars.html):
txtplot(cars[,1], cars[,2], xlab = 'speed', ylab = 'distance')
Output
+----+-----------+------------+-----------+-----------+--+
120 + * +
| |
d 100 + * +
i | * * |
s 80 + * * +
t | * * * * |
a 60 + * * * * * +
n | * * * * * |
c 40 + * * * * * * * +
e | * * * * * * * |
20 + * * * * * +
| * * * |
0 +----+-----------+------------+-----------+-----------+--+
5 10 15 20 25
speed
Nếu bạn muốn tìm hiểu thêm về txtplot
, hãy sử dụng help(txtplot)
từ bên trong trình thông dịch của R.
Các precompiled packages có sẵn đều có thể được cài đặt từ CRAN với lệnh install.packages()
. Để tìm hiểu thêm về những các package có sẵn, bạn có thể tìm thấy danh sách các gói chính thức được sắp xếp theo tên thông qua Danh sách Gói CRAN có sẵn theo tên.
Để thoát khỏi R, bạn có thể gõ q()
. Bạn có thể nhấn n
khi được nhắc, trừ khi bạn muốn lưu lại hình ảnh không gian làm việc.
Khi đã cài đặt R, bạn có thể tìm hiểu thêm về cách thiết lập máy chủ Shiny để chuyển đổi code từ R của mình thành các trang web tương tác. Để biết thêm thông tin về cách cài đặt các gói R bằng cách tận dụng các công cụ khác nhau, bạn có thể đọc về cách cài đặt trực tiếp từ GitHub, BitBucket.
Ngoài ra, bạn cũng có thể tìm hiểu cách sử dụng Certbot (Standalone mode) để lấy chứng chỉ SSL cho ứng dụng web của bạn trên Ubuntu 20.04 và cấu hình BIND làm server DNS nội bộ trên Ubuntu 20.04 để đạt được tính bảo mật và an toàn cho trang web của bạn.
Lời kết
Hy vọng bài viết “Hướng dẫn cài đặt R trên Ubuntu 20.04” đã giúp bạn có kiến thức cơ bản về cách cài đặt R trên hệ điều hành Ubuntu 20.04. R là một ngôn ngữ lập trình và môi trường tính toán thống kê mạnh mẽ và phổ biến, đồng thời là công cụ hữu ích cho việc phân tích dữ liệu và thực hiện các công việc phân tích thống kê. Nếu bạn cần thêm hỗ trợ hoặc có bất kỳ câu hỏi nào hãy để lại bình luận bên dưới nhé, Vietnix sẽ hỗ trợ bạn nhanh chóng nhất.