« Back to Glossary Index

Correlation Matrix

Uploaded by thanhhn

Ma trận tương quan (Correlation Matrix) là một bảng (ma trận) hình vuông dùng để trình bày hệ số tương quan giữa tất cả các cặp biến số trong một bộ dữ liệu. Đây là công cụ cơ bản và thiết yếu trong phân tích thống kê và khoa học dữ liệu để nhanh chóng đánh giá các mối quan hệ tuyến tính.

1. Cấu trúc và Bản chất

  • Bảng hình vuông: Ma trận có số hàng và số cột bằng nhau, mỗi hàng và cột đại diện cho một biến số (thuộc tính) trong tập dữ liệu.
  • Giá trị ô: Mỗi ô trong ma trận hiển thị hệ số tương quan (r) giữa biến ở hàng đó and biến ở cột đó.
  • Đường chéo chính: Các ô nằm trên đường chéo chính luôn có giá trị là 1 (hoặc 100%), vì chúng thể hiện mối tương quan của một biến với chính nó.
  • Đối xứng: Ma trận là đối xứng (ví dụ: mối tương quan giữa Biến A and Biến B luôn bằng mối tương quan giữa Biến B and Biến A). Do đó, người ta thường chỉ cần hiển thị một nửa ma trận (phần tam giác trên hoặc dưới) để tiết kiệm không gian.

2. Ý nghĩa của Hệ số Tương quan (r)

Hệ số tương quan (r, thường là hệ số Pearson) có giá trị nằm trong khoảng từ −1 đến 1, cho biết cả hướng and độ mạnh của mối quan hệ tuyến tính:

  • Hướng quan hệ: Dương (nếu r > 0), Âm (nếu r < 0).
  • Độ mạnh: Tuyệt đối (|r|=1), Rất mạnh (|r| > 0.8), Mạnh (0.6 < |r| < 0.8), Trung bình (0.4 < |r| < 0.6), Yếu (0.2 < |r| < 0.4), Rất yếu (|r| < 0.2).

Found this term helpful?

Support me on Ko-fi