Hi các em trong bài viết này, thầy giới thiệu tới các em ngôn ngữ lập trình R. Một ngôn ngữ thường được dùng trong xử lý, phân tích dữ liệu.
Các mục trong bài gồm : R là gì ? Ngôn ngữ lập trình R ứng dụng vào mục đích gì ? Cách bắt đầu để học lập trình với ngôn ngữ R
1.R là gì ?
R là một ngôn ngữ lập trình và môi trường phần mềm được thiết kế đặc biệt cho việc phân tích dữ liệu, thống kê, và trực quan hóa dữ liệu. Nó được phát triển vào năm 1993 bởi Ross Ihaka và Robert Gentleman tại Đại học Auckland, New Zealand, và hiện nay là một công cụ mã nguồn mở (open-source), miễn phí, được cộng đồng khoa học dữ liệu và thống kê sử dụng rộng rãi.
2. Ngôn ngữ lập trình R ứng dụng vào mục đích gì ?
a. Phân tích dữ liệu (Data Analysis)
- Mục đích: Xử lý, khám phá, và phân tích dữ liệu thô để tìm ra xu hướng, mô hình, hoặc thông tin hữu ích.
- Ứng dụng:
- Làm sạch dữ liệu (loại bỏ giá trị trống, chuẩn hóa định dạng).
- Tóm tắt dữ liệu (tính trung bình, trung vị, độ lệch chuẩn).
- Phân tích dữ liệu lớn trong kinh doanh, khoa học xã hội, hoặc y học.
- Ví dụ: Phân tích doanh số bán hàng của một công ty để dự đoán xu hướng tương lai.
b. Thống kê (Statistics)
- Mục đích: Thực hiện các phương pháp thống kê để kiểm tra giả thuyết, đánh giá dữ liệu, và đưa ra kết luận khoa học.
- Ứng dụng:
- Kiểm định thống kê (t-test, ANOVA).
- Mô hình hồi quy (linear regression, logistic regression).
- Phân tích chuỗi thời gian (time series analysis).
- Ví dụ: Nghiên cứu hiệu quả của một loại thuốc mới bằng cách so sánh nhóm thử nghiệm và nhóm đối chứng.
c. Trực quan hóa dữ liệu (Data Visualization)
- Mục đích: Biến dữ liệu thành các biểu đồ trực quan để dễ hiểu và truyền tải thông tin.
- Ứng dụng:
- Vẽ biểu đồ cột, đường, phân tán, hoặc bản đồ nhiệt bằng gói ggplot2.
- Tạo dashboard tương tác với shiny.
- Ví dụ: Vẽ biểu đồ thể hiện sự thay đổi nhiệt độ toàn cầu qua các năm.
d. Khoa học dữ liệu (Data Science)
- Mục đích: Là nền tảng cho các dự án khoa học dữ liệu, từ xử lý dữ liệu đến xây dựng mô hình dự đoán.
- Ứng dụng:
- Chuẩn bị dữ liệu cho machine learning (dùng gói như caret).
- Phân tích dữ liệu khám phá (EDA – Exploratory Data Analysis).
- Ví dụ: Dự đoán giá nhà dựa trên các yếu tố như diện tích, vị trí.
e. Nghiên cứu học thuật và khoa học (Academic & Scientific Research)
- Mục đích: Hỗ trợ các nhà nghiên cứu trong việc phân tích và trình bày kết quả.
- Ứng dụng:
- Sinh học: Phân tích dữ liệu gen (gói Bioconductor).
- Kinh tế: Mô hình hóa kinh tế lượng (econometrics).
- Tâm lý học: Phân tích khảo sát và thí nghiệm.
- Ví dụ: Phân tích dữ liệu khảo sát để đánh giá mức độ hài lòng của khách hàng.
f. Machine Learning (cơ bản)
- Mục đích: Triển khai các thuật toán học máy đơn giản, dù không mạnh bằng Python.
- Ứng dụng:
- Xây dựng mô hình phân loại (classification) hoặc hồi quy (regression) với gói caret hoặc tidymodels.
- Ứng dụng trong dự đoán hoặc phân cụm dữ liệu.
- Ví dụ: Dự đoán khách hàng có mua sản phẩm hay không dựa trên lịch sử mua sắm.
g. Báo cáo và tự động hóa (Reporting & Automation)
- Mục đích: Tạo báo cáo tự động hoặc tài liệu chuyên nghiệp từ dữ liệu.
- Ứng dụng:
- Dùng R Markdown để tạo báo cáo dạng PDF, HTML, hoặc Word.
- Tự động hóa quy trình phân tích dữ liệu định kỳ.
- Ví dụ: Tạo báo cáo hàng tháng về hiệu suất kinh doanh.
h. Các lĩnh vực đặc thù khác
- Y học và dịch tễ học: Phân tích dữ liệu lâm sàng, mô hình hóa sự lây lan của dịch bệnh.
- Tài chính: Đánh giá rủi ro, phân tích danh mục đầu tư.
- Môi trường: Theo dõi biến đổi khí hậu, phân tích chất lượng không khí.
3. Cách bắt đầu để học lập trình với ngôn ngữ R
Bước 1: Chuẩn bị môi trường học tập
- Cài đặt R:
- Tải R từ trang chủ CRAN (Comprehensive R Archive Network): https://cran.r-project.org/.
- Chọn phiên bản phù hợp với hệ điều hành (Windows, macOS, hoặc Linux) và cài đặt.
- Cài đặt RStudio:
- RStudio là một giao diện thân thiện giúp bạn viết code dễ dàng hơn. Tải miễn phí tại https://rstudio.com/products/rstudio/download/ (chọn phiên bản “RStudio Desktop – Free”).
- Sau khi cài, mở RStudio và nó sẽ tự động kết nối với R.
- Kiểm tra cài đặt:
- Mở RStudio, gõ print(“Hello, R!”) vào cửa sổ “Console” và nhấn Enter. Nếu thấy dòng chữ “Hello, R!” hiện ra, bạn đã sẵn sàng.
- Hình minh họa kết quả

Nhóm Zalo trao đổi ngoài giờ về AI : https://zalo.me/g/vwxtgq183