Bộ đề 1

Câu 1

Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?

Câu 2

Phương pháp Bootstrap trong thống kê là gì?

Câu 3

Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?

Câu 4

Độ mạnh của một kiểm định thống kê (statistical power) thể hiện điều gì?

Câu 5

Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?

Câu 6

Sự khác biệt chính giữa kiểm định một phía (one-tailed test) và kiểm định hai phía (two-tailed test) là gì?

Câu 7

Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?

Câu 8

Trong kiểm định giả thuyết, sai lầm loại II (Type II error) được định nghĩa là gì?

Câu 9

Khi nào thì sử dụng kiểm định Mann-Whitney U test?

Câu 10

Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?

Câu 11

Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?

Câu 12

Phương pháp Monte Carlo là gì?

Câu 13

Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?

Câu 14

Mục đích chính của việc xây dựng khoảng tin cậy (confidence interval) là gì?

Câu 15

Trong phân tích thành phần chính (principal component analysis - PCA), mục tiêu chính là gì?

Câu 16

Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?

Câu 17

Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?

Câu 18

Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization/standardization) trước khi áp dụng các thuật toán học máy là gì?

Câu 19

Ý nghĩa của hệ số xác định (R-squared) trong hồi quy tuyến tính là gì?

Câu 20

Khi nào thì kiểm định phi tham số (non-parametric test) được ưu tiên sử dụng hơn so với kiểm định tham số (parametric test)?

Câu 21

Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) có đặc điểm gì?

Câu 22

Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) biểu thị điều gì?

Câu 23

Trong phân tích tương quan, tương quan âm (negative correlation) có nghĩa là gì?

Câu 24

Trong lý thuyết quyết định (decision theory), hàm tổn thất (loss function) biểu thị điều gì?

Câu 25

Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?

Câu 26

Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?

Câu 27

Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?

Câu 28

Kiểm định khi bình phương (Chi-square test) thường được sử dụng để làm gì?

Câu 29

Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là bao nhiêu?

Câu 30

Phương pháp K-means clustering hoạt động như thế nào?