1. Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?
A. Từ 0 đến 1.
B. Từ -1 đến 0.
C. Từ -∞ đến +∞.
D. Từ -1 đến +1.
2. Phương pháp Bootstrap trong thống kê là gì?
A. Một phương pháp kiểm định giả thuyết dựa trên phân phối chuẩn.
B. Một kỹ thuật lấy mẫu lại (resampling) để ước lượng phân phối của một thống kê.
C. Một phương pháp phân tích phương sai.
D. Một kỹ thuật giảm chiều dữ liệu.
3. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu liên quan (paired samples) và dữ liệu không tuân theo phân phối chuẩn.
C. Khi kiểm tra sự độc lập giữa hai biến định tính.
D. Khi phân tích phương sai.
4. Độ mạnh của một kiểm định thống kê (statistical power) thể hiện điều gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi H0 sai.
D. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
5. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?
A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Xác suất một sự kiện không xảy ra trước một thời điểm cụ thể.
C. Thời gian trung bình cho đến khi sự kiện xảy ra.
D. Tỷ lệ sự kiện xảy ra trong một khoảng thời gian nhất định.
6. Sự khác biệt chính giữa kiểm định một phía (one-tailed test) và kiểm định hai phía (two-tailed test) là gì?
A. Kiểm định một phía chỉ kiểm tra sự khác biệt theo một hướng cụ thể, trong khi kiểm định hai phía kiểm tra sự khác biệt theo cả hai hướng.
B. Kiểm định hai phía chỉ kiểm tra sự khác biệt theo một hướng cụ thể, trong khi kiểm định một phía kiểm tra sự khác biệt theo cả hai hướng.
C. Kiểm định một phía luôn có độ mạnh lớn hơn kiểm định hai phía.
D. Kiểm định hai phía luôn có độ mạnh lớn hơn kiểm định một phía.
7. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng vào các nhóm (cụm) sao cho các đối tượng trong cùng một cụm tương tự nhau hơn so với các đối tượng trong các cụm khác.
C. Giảm chiều dữ liệu.
D. Tìm các biến quan trọng nhất trong tập dữ liệu.
8. Trong kiểm định giả thuyết, sai lầm loại II (Type II error) được định nghĩa là gì?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 sai.
9. Khi nào thì sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu liên quan.
B. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự phù hợp của một phân phối lý thuyết.
D. Để phân tích phương sai.
10. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của quần thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi hai mẫu có kích thước bằng nhau.
11. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập không tương quan với nhau.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi biến phụ thuộc không tương quan với các biến độc lập.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
12. Phương pháp Monte Carlo là gì?
A. Một phương pháp kiểm định giả thuyết.
B. Một kỹ thuật mô phỏng sử dụng số ngẫu nhiên để giải quyết các bài toán.
C. Một phương pháp phân tích chuỗi thời gian.
D. Một kỹ thuật giảm chiều dữ liệu.
13. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn.
B. Phương sai.
C. Trung vị.
D. Khoảng biến thiên.
14. Mục đích chính của việc xây dựng khoảng tin cậy (confidence interval) là gì?
A. Để ước lượng một tham số của quần thể với một mức độ tin cậy nhất định.
B. Để kiểm định giả thuyết về một tham số của quần thể.
C. Để mô tả phân phối của dữ liệu mẫu.
D. Để giảm sai số loại I trong kiểm định giả thuyết.
15. Trong phân tích thành phần chính (principal component analysis – PCA), mục tiêu chính là gì?
A. Tìm các biến quan trọng nhất trong tập dữ liệu.
B. Giảm chiều dữ liệu bằng cách tìm các thành phần chính giải thích phần lớn phương sai.
C. Phân loại các đối tượng vào các nhóm khác nhau.
D. Dự đoán giá trị của một biến phụ thuộc.
16. Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ biến động của dữ liệu.
D. Sai số chuẩn của ước lượng.
17. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Phân tích phương sai.
D. Kiểm tra tính độc lập giữa hai biến định tính.
18. Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization/standardization) trước khi áp dụng các thuật toán học máy là gì?
A. Để giảm kích thước của tập dữ liệu.
B. Để đảm bảo rằng tất cả các biến có cùng thang đo, tránh ảnh hưởng của các biến có giá trị lớn hơn đến kết quả.
C. Để loại bỏ các giá trị ngoại lệ (outliers).
D. Để chuyển đổi dữ liệu thành dạng phù hợp với phân phối chuẩn.
19. Ý nghĩa của hệ số xác định (R-squared) trong hồi quy tuyến tính là gì?
A. Độ dốc của đường hồi quy.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa của các hệ số hồi quy.
20. Khi nào thì kiểm định phi tham số (non-parametric test) được ưu tiên sử dụng hơn so với kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi cần tính toán nhanh chóng.
21. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) có đặc điểm gì?
A. Là một biến liên tục.
B. Là một biến định tính có hai giá trị (binary).
C. Là một biến định tính có nhiều hơn hai giá trị.
D. Là một biến đếm (count variable).
22. Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) biểu thị điều gì?
A. Sự biến động ngẫu nhiên trong dữ liệu.
B. Sự biến động theo mùa trong dữ liệu.
C. Sự biến động dài hạn và có hệ thống trong dữ liệu.
D. Sự biến động ngắn hạn trong dữ liệu.
23. Trong phân tích tương quan, tương quan âm (negative correlation) có nghĩa là gì?
A. Khi một biến tăng, biến kia cũng tăng.
B. Khi một biến tăng, biến kia giảm.
C. Hai biến không liên quan đến nhau.
D. Hai biến có mối quan hệ phi tuyến tính.
24. Trong lý thuyết quyết định (decision theory), hàm tổn thất (loss function) biểu thị điều gì?
A. Lợi ích thu được từ một quyết định.
B. Chi phí hoặc hậu quả tiêu cực của một quyết định sai lầm.
C. Xác suất một sự kiện xảy ra.
D. Giá trị kỳ vọng của một quyết định.
25. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi H0 đúng.
B. Bác bỏ giả thuyết H0 khi H0 sai.
C. Chấp nhận giả thuyết H0 khi H0 sai.
D. Bác bỏ giả thuyết H0 khi H0 đúng.
26. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất giả thuyết H0 là đúng.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả còn cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Mức ý nghĩa của kiểm định.
27. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi so sánh trung bình của nhiều nhóm và có hai yếu tố ảnh hưởng đến biến phụ thuộc.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi kiểm tra sự phù hợp của một phân phối lý thuyết.
28. Kiểm định khi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế.
C. Ước lượng khoảng tin cậy cho trung bình.
D. Phân tích phương sai.
29. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là bao nhiêu?
A. 0.01
B. 0.05
C. 0.10
D. Tất cả các đáp án trên đều có thể, tùy thuộc vào bài toán.
30. Phương pháp K-means clustering hoạt động như thế nào?
A. Phân chia dữ liệu thành K cụm dựa trên khoảng cách đến các trung tâm cụm (centroids) được cập nhật liên tục.
B. Xây dựng một cây phân cấp để phân chia dữ liệu thành các cụm.
C. Tìm các cụm có mật độ cao trong dữ liệu.
D. Phân chia dữ liệu dựa trên các đường biên quyết định (decision boundaries).
31. Trong kiểm định giả thuyết, khi nào chúng ta bác bỏ giả thuyết H0?
A. Khi giá trị p lớn hơn mức ý nghĩa alpha.
B. Khi giá trị p bằng mức ý nghĩa alpha.
C. Khi giá trị p nhỏ hơn hoặc bằng mức ý nghĩa alpha.
D. Khi giá trị p lớn hơn 1.
32. Khi nào nên sử dụng kiểm định paired t-test (kiểm định t парный)?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của hai nhóm phụ thuộc (ví dụ: trước và sau can thiệp).
C. Khi so sánh trung bình của ba hoặc nhiều nhóm.
D. Khi kiểm tra tính độc lập giữa hai biến.
33. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. Kiểm tra sự khác biệt giữa trung bình của hai mẫu.
B. Kiểm tra sự phù hợp của một mẫu với một phân phối lý thuyết.
C. Kiểm tra tính độc lập giữa các biến định tính.
D. Kiểm tra phương sai của một tổng thể.
34. Kiểm định Chi-square được sử dụng để làm gì?
A. Kiểm tra sự khác biệt giữa trung bình của hai mẫu.
B. Kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế hoặc kiểm tra tính độc lập giữa các biến định tính.
C. Ước lượng khoảng tin cậy cho trung bình tổng thể.
D. Kiểm tra phương sai của một tổng thể.
35. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 đúng.
36. Khi nào thì kiểm định Mann-Whitney U test được ưu tiên hơn kiểm định t độc lập?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn (n > 30).
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có outliers.
D. Khi chúng ta muốn ước tính khoảng tin cậy.
37. Mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận H0 khi H0 sai.
C. Xác suất bác bỏ H0 khi H0 đúng (sai lầm loại I).
D. Xác suất chấp nhận H0 khi H0 đúng.
38. Trong kiểm định giả thuyết về tỷ lệ, thống kê kiểm định thường được sử dụng là gì?
A. t-statistic.
B. z-statistic.
C. Chi-square statistic.
D. F-statistic.
39. Trong hồi quy đa biến, hệ số hồi quy (regression coefficient) cho biết điều gì?
A. Mức độ liên kết giữa các biến độc lập.
B. Sự thay đổi trong biến phụ thuộc khi biến độc lập tương ứng tăng lên một đơn vị, giữ các biến độc lập khác không đổi.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của ước lượng.
40. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa (alpha) được chọn trước.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả còn cực đoan hơn) nếu H0 là đúng.
D. Xác suất mắc sai lầm loại II.
41. Điều gì xảy ra với khoảng tin cậy khi cỡ mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
42. Sự khác biệt chính giữa kiểm định t (t-test) và kiểm định z (z-test) là gì?
A. Kiểm định t chỉ dùng cho mẫu lớn, còn kiểm định z dùng cho mẫu nhỏ.
B. Kiểm định t sử dụng phương sai mẫu, còn kiểm định z sử dụng phương sai tổng thể (đã biết).
C. Kiểm định t chỉ dùng cho dữ liệu định tính, còn kiểm định z dùng cho dữ liệu định lượng.
D. Kiểm định t dùng để kiểm tra trung bình, còn kiểm định z dùng để kiểm tra phương sai.
43. Ý nghĩa của việc tính cỡ mẫu trước khi thực hiện nghiên cứu là gì?
A. Để đảm bảo rằng nghiên cứu có đủ sức mạnh để phát hiện ra một hiệu ứng có ý nghĩa nếu nó tồn tại.
B. Để giảm chi phí thực hiện nghiên cứu.
C. Để tăng khả năng mắc sai lầm loại I.
D. Để làm cho kết quả nghiên cứu dễ dàng được công bố hơn.
44. Trong kiểm định giả thuyết, sức mạnh của kiểm định (power of the test) là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi H0 sai.
D. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
45. Khi nào nên sử dụng kiểm định ANOVA (phân tích phương sai)?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của ba hoặc nhiều nhóm độc lập.
C. Khi kiểm tra mối quan hệ giữa hai biến định tính.
D. Khi ước tính khoảng tin cậy cho một trung bình.
46. Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của ước lượng.
47. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ H0 khi H0 đúng.
B. Chấp nhận H0 khi H0 đúng.
C. Bác bỏ H0 khi H0 sai.
D. Chấp nhận H0 khi H0 sai.
48. Phương pháp Bonferroni correction được sử dụng để làm gì?
A. Để tăng sức mạnh của kiểm định.
B. Để điều chỉnh mức ý nghĩa alpha khi thực hiện nhiều kiểm định cùng một lúc.
C. Để ước tính khoảng tin cậy chính xác hơn.
D. Để giảm cỡ mẫu cần thiết cho nghiên cứu.
49. Trong phân tích phương sai (ANOVA) hai yếu tố, điều gì được kiểm tra?
A. Ảnh hưởng của một biến độc lập duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai biến độc lập và tương tác giữa chúng lên biến phụ thuộc.
C. Sự khác biệt giữa hai biến phụ thuộc.
D. Mối quan hệ giữa hai biến định tính.
50. Trong kiểm định giả thuyết, một kết quả ‘không có ý nghĩa thống kê’ có nghĩa là gì?
A. Giả thuyết H0 chắc chắn là đúng.
B. Giả thuyết H0 chắc chắn là sai.
C. Không có đủ bằng chứng để bác bỏ giả thuyết H0.
D. Nghiên cứu đã được thực hiện không đúng cách.
51. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta chắc chắn 100% rằng tham số tổng thể nằm trong đó.
B. Một khoảng giá trị mà chúng ta ước tính tham số tổng thể nằm trong đó với một mức độ tin cậy nhất định.
C. Xác suất mà tham số tổng thể nằm trong một khoảng giá trị cụ thể.
D. Một giá trị duy nhất ước tính cho tham số tổng thể.
52. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn (n > 30).
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ: dữ liệu không tuân theo phân phối chuẩn).
D. Khi chúng ta muốn ước tính khoảng tin cậy.
53. Điều gì xảy ra với sức mạnh của kiểm định khi mức ý nghĩa alpha giảm xuống (ví dụ: từ 0.05 xuống 0.01)?
A. Sức mạnh của kiểm định tăng lên.
B. Sức mạnh của kiểm định giảm xuống.
C. Sức mạnh của kiểm định không thay đổi.
D. Sức mạnh của kiểm định trở nên không xác định.
54. Ý nghĩa của việc tăng cỡ mẫu trong kiểm định giả thuyết là gì?
A. Giảm khả năng mắc sai lầm loại I.
B. Tăng khả năng mắc sai lầm loại I.
C. Tăng sức mạnh kiểm định (khả năng bác bỏ H0 khi H0 sai).
D. Giảm mức ý nghĩa alpha.
55. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của một nhóm khác với các nhóm khác.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của các nhóm khác nhau.
56. Kiểm định một phía (one-tailed test) được sử dụng khi nào?
A. Khi chúng ta không có bất kỳ kỳ vọng nào về hướng của hiệu ứng.
B. Khi chúng ta quan tâm đến cả hai hướng của hiệu ứng (lớn hơn hoặc nhỏ hơn).
C. Khi chúng ta chỉ quan tâm đến một hướng của hiệu ứng (lớn hơn hoặc nhỏ hơn một giá trị cụ thể).
D. Khi chúng ta muốn kiểm tra sự khác biệt giữa hai mẫu.
57. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Sự khác biệt giữa hai biến.
B. Mức độ liên kết tuyến tính giữa hai biến.
C. Nguyên nhân và kết quả giữa hai biến.
D. Sự phân tán của dữ liệu.
58. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của hai nhóm phụ thuộc.
C. Khi so sánh trung bình của ba hoặc nhiều nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi kiểm tra tính độc lập giữa hai biến định tính.
59. Hệ quả của việc tăng mức ý nghĩa alpha (ví dụ: từ 0.05 lên 0.10) là gì?
A. Giảm khả năng mắc sai lầm loại I và loại II.
B. Tăng khả năng mắc sai lầm loại I và giảm khả năng mắc sai lầm loại II.
C. Giảm khả năng mắc sai lầm loại I và tăng khả năng mắc sai lầm loại II.
D. Không ảnh hưởng đến khả năng mắc sai lầm loại I và loại II.
60. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của hai nhóm phụ thuộc và dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của ba hoặc nhiều nhóm độc lập.
D. Khi kiểm tra tính độc lập giữa hai biến định tính.
61. Mục đích của việc chuẩn hóa dữ liệu (data normalization) trước khi thực hiện phân tích là gì?
A. Để loại bỏ outliers.
B. Để chuyển đổi dữ liệu về cùng một thang đo, giúp việc so sánh trở nên dễ dàng hơn.
C. Để đảm bảo dữ liệu tuân theo phân phối chuẩn.
D. Để giảm kích thước của tập dữ liệu.
62. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi tăng mức độ tin cậy (confidence level)?
A. Khoảng tin cậy trở nên hẹp hơn.
B. Khoảng tin cậy trở nên rộng hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi của khoảng tin cậy.
63. Chọn khẳng định đúng về kiểm định một phía (one-tailed test) và kiểm định hai phía (two-tailed test).
A. Kiểm định một phía luôn cho kết quả chính xác hơn kiểm định hai phía.
B. Kiểm định hai phía chỉ được sử dụng khi phương sai của quần thể đã biết.
C. Kiểm định một phía được sử dụng khi ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể.
D. Kiểm định hai phía có độ mạnh (power) lớn hơn kiểm định một phía.
64. Trong kiểm định χ² (Chi-square), kiểm định tính độc lập (test of independence) dùng để làm gì?
A. Kiểm tra xem một biến định tính có tuân theo một phân phối cụ thể hay không.
B. Kiểm tra xem hai biến định lượng có tương quan tuyến tính hay không.
C. Kiểm tra xem hai biến định tính có độc lập với nhau hay không.
D. Kiểm tra xem phương sai của hai quần thể có bằng nhau hay không.
65. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) gây ra vấn đề gì?
A. Làm cho các hệ số hồi quy trở nên không ổn định và khó giải thích.
B. Làm giảm độ chính xác của các dự báo.
C. Làm tăng sai số chuẩn của các hệ số hồi quy.
D. Tất cả các đáp án trên.
66. Trong hồi quy tuyến tính, hệ số R bình phương (R-squared) thể hiện điều gì?
A. Mức ý nghĩa của mô hình hồi quy.
B. Độ mạnh của mối quan hệ giữa các biến độc lập.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
D. Sai số chuẩn của các hệ số hồi quy.
67. Độ mạnh của kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ H0 khi H0 sai.
D. Xác suất chấp nhận H0 khi H0 đúng.
68. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Tập hợp các giá trị mà nếu giá trị thống kê kiểm định rơi vào đó, ta chấp nhận giả thuyết H0.
B. Tập hợp các giá trị mà nếu giá trị thống kê kiểm định rơi vào đó, ta bác bỏ giả thuyết H0.
C. Khoảng tin cậy của tham số.
D. Mức ý nghĩa của kiểm định.
69. Trong phân tích phương sai (ANOVA), giả định về tính thuần nhất của phương sai (homogeneity of variance) có nghĩa là gì?
A. Trung bình của tất cả các nhóm phải bằng nhau.
B. Phương sai của tất cả các nhóm phải bằng nhau.
C. Kích thước mẫu của tất cả các nhóm phải bằng nhau.
D. Dữ liệu phải tuân theo phân phối chuẩn.
70. Giá trị thống kê kiểm định (test statistic) được sử dụng để làm gì?
A. Để ước lượng tham số của quần thể.
B. Để đo lường mức độ phù hợp của mô hình.
C. Để xác định xem có đủ bằng chứng để bác bỏ giả thuyết H0 hay không.
D. Để tính toán khoảng tin cậy.
71. Kiểm định Durbin-Watson được sử dụng để kiểm tra vấn đề gì trong hồi quy tuyến tính?
A. Đa cộng tuyến (multicollinearity).
B. Phương sai sai số thay đổi (heteroscedasticity).
C. Tự tương quan (autocorrelation).
D. Tính dừng (stationarity).
72. Khi nào thì cần thực hiện kiểm định tính dừng (stationarity test) đối với chuỗi thời gian?
A. Khi muốn dự báo giá trị tương lai của chuỗi thời gian.
B. Khi muốn kiểm tra xem chuỗi thời gian có xu hướng (trend) hay không.
C. Khi muốn xây dựng mô hình ARIMA.
D. Tất cả các đáp án trên.
73. Khi nào thì nên sử dụng kiểm định Mann-Whitney U (Mann-Whitney U test) thay vì kiểm định t (t-test) độc lập?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn hơn 30.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có outliers.
D. Khi phương sai của hai quần thể bằng nhau.
74. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
75. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa (significance level) của kiểm định.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất mắc sai lầm loại II.
76. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa α (alpha) giảm?
A. Giá trị tới hạn giảm.
B. Giá trị tới hạn tăng.
C. Giá trị tới hạn không thay đổi.
D. Không thể xác định được sự thay đổi của giá trị tới hạn.
77. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được so sánh để kiểm định sự khác biệt giữa các nhóm?
A. Phương sai giữa các nhóm và phương sai trong mỗi nhóm.
B. Trung bình giữa các nhóm và trung bình trong mỗi nhóm.
C. Độ lệch chuẩn giữa các nhóm và độ lệch chuẩn trong mỗi nhóm.
D. Trung vị giữa các nhóm và trung vị trong mỗi nhóm.
78. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) có đặc điểm gì?
A. Là biến định lượng liên tục.
B. Là biến định tính có hai giá trị (binary).
C. Là biến định tính có nhiều hơn hai giá trị.
D. Có thể là biến định lượng hoặc định tính.
79. Trong phân tích tương quan (correlation analysis), hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ phi tuyến tính giữa hai biến.
B. Mối quan hệ nhân quả giữa hai biến.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Mức độ biến động của hai biến.
80. Trong phân tích ANOVA hai yếu tố (two-way ANOVA), điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố lên biến phụ thuộc, nhưng không kiểm tra tương tác.
C. Ảnh hưởng của hai yếu tố và tương tác giữa chúng lên biến phụ thuộc.
D. Ảnh hưởng của nhiều hơn hai yếu tố lên biến phụ thuộc.
81. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
82. Hệ quả của việc tăng cỡ mẫu (sample size) trong kiểm định giả thuyết là gì?
A. Giảm khả năng mắc sai lầm loại I.
B. Tăng khả năng mắc sai lầm loại II.
C. Tăng độ mạnh (power) của kiểm định.
D. Giảm mức ý nghĩa (significance level).
83. Mối quan hệ giữa mức ý nghĩa α (alpha) và sai lầm loại I trong kiểm định giả thuyết là gì?
A. α là xác suất mắc sai lầm loại II.
B. α là xác suất mắc sai lầm loại I.
C. α là 1 trừ xác suất mắc sai lầm loại I.
D. α không liên quan đến sai lầm loại I.
84. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai quần thể?
A. Khi kích thước mẫu lớn hơn 30.
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ.
D. Khi dữ liệu tuân theo phân phối nhị thức.
85. Mục đích của việc sử dụng kiểm định Bonferroni là gì?
A. Để tăng độ mạnh của kiểm định.
B. Để điều chỉnh mức ý nghĩa (alpha) khi thực hiện nhiều kiểm định đồng thời, giảm nguy cơ mắc sai lầm loại I.
C. Để kiểm tra tính thuần nhất của phương sai.
D. Để kiểm tra tính dừng của chuỗi thời gian.
86. Khi nào sử dụng kiểm định Wilcoxon signed-rank test?
A. So sánh hai mẫu độc lập không tuân theo phân phối chuẩn.
B. So sánh hai mẫu liên quan không tuân theo phân phối chuẩn.
C. So sánh hai mẫu độc lập tuân theo phân phối chuẩn.
D. So sánh hai mẫu liên quan tuân theo phân phối chuẩn.
87. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ H0 khi H0 đúng.
B. Chấp nhận H0 khi H0 đúng.
C. Bác bỏ H0 khi H0 sai.
D. Chấp nhận H0 khi H0 sai.
88. Khi nào thì nên sử dụng kiểm định Friedman?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của nhiều hơn hai mẫu độc lập.
C. Để so sánh trung bình của nhiều hơn hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của nhiều hơn hai mẫu liên quan.
89. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của nhiều hơn hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của nhiều hơn hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của nhiều hơn hai mẫu độc lập.
90. Ý nghĩa của việc thực hiện kiểm định hậu nghiệm (post-hoc test) sau khi ANOVA là gì?
A. Để xác định xem có ít nhất một cặp trung bình khác biệt đáng kể hay không.
B. Để xác định chính xác cặp trung bình nào khác biệt đáng kể so với các cặp còn lại.
C. Để điều chỉnh mức ý nghĩa α (alpha) cho phù hợp với số lượng so sánh.
D. Tất cả các đáp án trên.
91. Khoảng tin cậy 95% cho trung bình của một quần thể là (10, 14). Phát biểu nào sau đây là đúng?
A. Xác suất trung bình quần thể nằm trong khoảng (10, 14) là 95%.
B. 95% các mẫu sẽ có trung bình nằm trong khoảng (10, 14).
C. Chúng ta tin rằng với độ tin cậy 95%, trung bình quần thể nằm trong khoảng (10, 14).
D. Trung bình mẫu chắc chắn nằm trong khoảng (10, 14).
92. Kiểm định giả thuyết nào được sử dụng để kiểm tra xem có mối quan hệ giữa hai biến định tính hay không?
A. Kiểm định t.
B. Kiểm định z.
C. Kiểm định Chi-square về tính độc lập.
D. Kiểm định ANOVA.
93. Trong kiểm định ANOVA, giả thuyết null (H0) thường là gì?
A. Tất cả các trung bình quần thể đều bằng nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các phương sai quần thể đều bằng nhau.
D. Không có sự khác biệt giữa các nhóm.
94. Trong kiểm định giả thuyết về trung bình của một quần thể khi độ lệch chuẩn quần thể đã biết, ta sử dụng thống kê kiểm định nào?
A. t-statistic.
B. z-statistic.
C. Chi-square statistic.
D. F-statistic.
95. Khi thực hiện kiểm định t cho hai mẫu độc lập, điều gì cần được kiểm tra trước khi tiến hành kiểm định?
A. Sự độc lập của hai mẫu và tính chuẩn của dữ liệu.
B. Phương sai của hai mẫu phải bằng nhau.
C. Kích thước của hai mẫu phải bằng nhau.
D. Cả ba điều trên.
96. Ý nghĩa của thuật ngữ ‘bậc tự do’ (degrees of freedom) trong kiểm định t là gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng biến trong mô hình.
C. Số lượng giá trị độc lập có thể thay đổi trong tính toán thống kê.
D. Mức ý nghĩa (alpha) của kiểm định.
97. Sự khác biệt chính giữa kiểm định t độc lập và kiểm định t ghép cặp (paired t-test) là gì?
A. Kiểm định t độc lập sử dụng cho hai mẫu độc lập, trong khi kiểm định t ghép cặp sử dụng cho hai mẫu có liên quan (ví dụ: trước và sau).
B. Kiểm định t ghép cặp luôn cho kết quả chính xác hơn kiểm định t độc lập.
C. Kiểm định t độc lập chỉ sử dụng cho kích thước mẫu lớn.
D. Không có sự khác biệt giữa hai loại kiểm định này.
98. Trong phân tích phương sai (ANOVA), thống kê F được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm.
B. Tỷ lệ giữa phương sai trong các nhóm và phương sai giữa các nhóm.
C. Tổng phương sai giữa các nhóm.
D. Tổng phương sai trong các nhóm.
99. Khi nào thì sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để kiểm tra sự phù hợp của một phân phối với dữ liệu quan sát được.
C. Để ước lượng trung bình của một quần thể.
D. Để kiểm tra phương sai của một quần thể.
100. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất để giả thuyết H0 là đúng.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 đúng.
D. Xác suất mắc sai lầm loại II.
101. Khi thực hiện kiểm định giả thuyết, điều gì xảy ra nếu bạn tăng mức tin cậy?
A. Giảm kích thước mẫu cần thiết.
B. Tăng khả năng mắc lỗi loại I.
C. Tăng khả năng mắc lỗi loại II.
D. Giảm khả năng mắc lỗi loại II.
102. Giả sử bạn muốn kiểm tra xem tỷ lệ người hút thuốc lá trong một thành phố có khác 20% hay không. Bạn nên sử dụng kiểm định nào?
A. Kiểm định t một mẫu.
B. Kiểm định z một mẫu cho tỷ lệ.
C. Kiểm định chi bình phương.
D. Kiểm định F.
103. Mức ý nghĩa (alpha) thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.01, 0.05, 0.10.
B. 0.25, 0.50, 0.75.
C. 0.90, 0.95, 0.99.
D. 0.001, 0.005, 0.01.
104. Trong kiểm định giả thuyết, ‘sức mạnh của kiểm định’ (power of the test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
C. Xác suất không bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất bác bỏ giả thuyết H0 khi nó sai.
105. Thế nào là kiểm định một phía (one-tailed test) so với kiểm định hai phía (two-tailed test)?
A. Kiểm định một phía chỉ kiểm tra sự khác biệt theo một hướng cụ thể, trong khi kiểm định hai phía kiểm tra sự khác biệt theo cả hai hướng.
B. Kiểm định một phía luôn cho kết quả chính xác hơn kiểm định hai phía.
C. Kiểm định hai phía chỉ sử dụng mức ý nghĩa (alpha) bằng 0.05.
D. Không có sự khác biệt giữa hai loại kiểm định này.
106. Điều gì xảy ra với khoảng tin cậy khi tăng mức độ tin cậy (ví dụ, từ 95% lên 99%)?
A. Khoảng tin cậy trở nên hẹp hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên rộng hơn.
D. Không thể xác định.
107. Trong kiểm định giả thuyết, loại lỗi nào nghiêm trọng hơn: lỗi loại I hay lỗi loại II?
A. Lỗi loại I luôn nghiêm trọng hơn.
B. Lỗi loại II luôn nghiêm trọng hơn.
C. Mức độ nghiêm trọng phụ thuộc vào ngữ cảnh của vấn đề.
D. Cả hai loại lỗi đều có mức độ nghiêm trọng như nhau.
108. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi muốn so sánh trung bình của hai mẫu độc lập có phân phối chuẩn.
B. Khi muốn so sánh trung bình của hai mẫu phụ thuộc.
C. Khi muốn so sánh hai mẫu độc lập không tuân theo phân phối chuẩn.
D. Khi muốn so sánh nhiều hơn hai mẫu độc lập.
109. Trong kiểm định giả thuyết, nếu bạn giảm mức ý nghĩa (alpha), điều gì sẽ xảy ra với ‘vùng bác bỏ’ (rejection region)?
A. Vùng bác bỏ sẽ trở nên rộng hơn.
B. Vùng bác bỏ sẽ trở nên hẹp hơn.
C. Vùng bác bỏ sẽ không thay đổi.
D. Vùng bác bỏ sẽ dịch chuyển sang phải.
110. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để kiểm định trung bình của một mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi dữ liệu tuân theo phân phối chuẩn.
111. Khi nào sử dụng kiểm định ANOVA (Analysis of Variance)?
A. Để so sánh trung bình của hai nhóm.
B. Để so sánh phương sai của hai nhóm.
C. Để so sánh trung bình của ba nhóm trở lên.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
112. Điều gì sẽ xảy ra với giá trị p (p-value) nếu thống kê kiểm định (test statistic) càng lớn?
A. Giá trị p sẽ tăng lên.
B. Giá trị p sẽ giảm xuống.
C. Giá trị p sẽ không thay đổi.
D. Không thể xác định.
113. Nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha), bạn nên đưa ra kết luận gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận gì.
D. Thay đổi mức ý nghĩa (alpha).
114. Giả sử bạn muốn so sánh trung bình của hai quần thể độc lập với phương sai không bằng nhau và kích thước mẫu nhỏ. Bạn nên sử dụng kiểm định nào?
A. Kiểm định z hai mẫu.
B. Kiểm định t hai mẫu với phương sai bằng nhau.
C. Kiểm định t hai mẫu với phương sai không bằng nhau (Welch’s t-test).
D. Kiểm định paired t-test.
115. Trong kiểm định giả thuyết, việc chọn mức ý nghĩa (alpha) thấp hơn (ví dụ, 0.01 thay vì 0.05) có ảnh hưởng gì?
A. Làm tăng xác suất mắc sai lầm loại I.
B. Làm tăng xác suất mắc sai lầm loại II.
C. Làm giảm cả xác suất mắc sai lầm loại I và loại II.
D. Không ảnh hưởng đến xác suất mắc sai lầm.
116. Trong kiểm định giả thuyết, ý nghĩa của việc tăng kích thước mẫu là gì?
A. Làm tăng xác suất mắc sai lầm loại I.
B. Làm giảm sức mạnh của kiểm định.
C. Làm giảm xác suất mắc sai lầm loại II và tăng sức mạnh của kiểm định.
D. Không ảnh hưởng đến kết quả kiểm định.
117. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó sai.
C. Không bác bỏ giả thuyết H0 khi nó đúng.
D. Bác bỏ giả thuyết H0 khi nó sai.
118. Ý nghĩa của việc thiết lập giả thuyết không (H0) và giả thuyết đối (H1) trong kiểm định giả thuyết là gì?
A. Để chứng minh H0 là đúng.
B. Để chứng minh H1 là đúng.
C. Để xác định xem có đủ bằng chứng để bác bỏ H0 hay không.
D. Để chấp nhận cả H0 và H1.
119. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy biến mất.
120. Kiểm định Kolmogorov-Smirnov dùng để làm gì?
A. So sánh trung bình của hai mẫu.
B. So sánh phương sai của hai mẫu.
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Kiểm tra tính độc lập của hai biến.
121. Trong kiểm định giả thuyết, việc tăng mức ý nghĩa (alpha) sẽ ảnh hưởng như thế nào đến khả năng mắc sai lầm loại I và loại II?
A. Tăng khả năng mắc sai lầm loại I và giảm khả năng mắc sai lầm loại II.
B. Giảm khả năng mắc sai lầm loại I và tăng khả năng mắc sai lầm loại II.
C. Tăng cả khả năng mắc sai lầm loại I và loại II.
D. Giảm cả khả năng mắc sai lầm loại I và loại II.
122. Sức mạnh của kiểm định (power of a test) là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
123. Khi nào nên sử dụng kiểm định ANOVA (Analysis of Variance)?
A. Để so sánh trung bình của hai quần thể.
B. Để so sánh phương sai của hai quần thể.
C. Để so sánh trung bình của ba quần thể trở lên.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
124. Ý nghĩa của ‘bậc tự do’ (degrees of freedom) trong thống kê là gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng tham số cần ước lượng.
C. Số lượng giá trị trong tính toán cuối cùng của thống kê có thể thay đổi tự do.
D. Mức ý nghĩa của kiểm định.
125. Khi nào chúng ta sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu liên quan (paired samples) khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh phương sai của hai quần thể.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
126. Phân tích hậu nghiệm (post-hoc analysis) trong ANOVA được sử dụng để làm gì?
A. Để kiểm tra các giả định của ANOVA.
B. Để xác định cặp trung bình nào khác biệt đáng kể sau khi bác bỏ giả thuyết H0.
C. Để tính toán giá trị p.
D. Để tăng sức mạnh của kiểm định.
127. Hệ quả của việc tăng kích thước mẫu trong kiểm định giả thuyết là gì?
A. Tăng khả năng mắc sai lầm loại I.
B. Giảm khả năng mắc sai lầm loại II.
C. Tăng sức mạnh của kiểm định.
D. Tất cả các đáp án trên.
128. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. Để so sánh trung bình của hai quần thể.
B. Để kiểm tra sự phù hợp của một mẫu với một phân phối lý thuyết.
C. Để so sánh phương sai của hai quần thể.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
129. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
130. Mục đích chính của việc kiểm định giả thuyết là gì?
A. Đo lường độ tin cậy của dữ liệu mẫu.
B. Đưa ra quyết định về một tham số của quần thể dựa trên thông tin từ mẫu.
C. Xây dựng mô hình hồi quy tuyến tính.
D. Tính toán khoảng tin cậy cho trung bình mẫu.
131. Loại kiểm định nào được sử dụng để so sánh phương sai của hai quần thể?
A. Kiểm định t.
B. Kiểm định Chi-bình phương.
C. Kiểm định F.
D. Kiểm định Z.
132. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta chắc chắn rằng tham số quần thể nằm trong đó.
B. Một khoảng giá trị mà chúng ta ước lượng rằng tham số quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Một khoảng giá trị chứa tất cả các giá trị có thể của mẫu.
D. Một khoảng giá trị dùng để kiểm định giả thuyết.
133. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định về phân phối không được đáp ứng.
D. Khi phương sai của quần thể đã biết.
134. Khi nào chúng ta sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai quần thể.
B. Để kiểm tra sự độc lập giữa hai biến định tính.
C. Để kiểm tra phương sai của một quần thể.
D. Để kiểm tra sự phù hợp của một phân phối.
135. Trong kiểm định giả thuyết, thế nào là ‘vùng bác bỏ’ (rejection region)?
A. Vùng chứa các giá trị của thống kê kiểm định mà nếu thống kê rơi vào đó, chúng ta chấp nhận H0.
B. Vùng chứa các giá trị của thống kê kiểm định mà nếu thống kê rơi vào đó, chúng ta bác bỏ H0.
C. Vùng chứa các giá trị của tham số quần thể.
D. Vùng chứa tất cả các giá trị có thể của thống kê kiểm định.
136. Khi nào chúng ta sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối chuẩn.
137. Ý nghĩa của việc tính toán ‘kích thước ảnh hưởng’ (effect size) trong kiểm định giả thuyết là gì?
A. Để xác định mức ý nghĩa.
B. Để đo lường độ lớn của hiệu ứng hoặc sự khác biệt thực tế, không chỉ tính ý nghĩa thống kê.
C. Để giảm khả năng mắc sai lầm loại I.
D. Để tăng kích thước mẫu.
138. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Mức ý nghĩa của kiểm định.
139. Giá trị tới hạn (critical value) trong kiểm định giả thuyết là gì?
A. Giá trị của thống kê kiểm định.
B. Giá trị phân chia vùng bác bỏ và vùng chấp nhận giả thuyết H0.
C. Giá trị p.
D. Mức ý nghĩa.
140. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
A. β (beta).
B. σ (sigma).
C. α (alpha).
D. μ (mu).
141. Sai lầm loại II (Type II error) trong kiểm định giả thuyết được định nghĩa là gì?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
142. Trong kiểm định giả thuyết về tỷ lệ, thống kê kiểm định thường tuân theo phân phối nào?
A. Phân phối t.
B. Phân phối Chi-bình phương.
C. Phân phối Z (chuẩn).
D. Phân phối F.
143. Trong kiểm định Chi-bình phương, điều kiện nào cần được đáp ứng để kết quả kiểm định là hợp lệ?
A. Tất cả các tần số kỳ vọng phải lớn hơn 5.
B. Ít nhất 80% các tần số kỳ vọng phải lớn hơn 5, và không có tần số kỳ vọng nào nhỏ hơn 1.
C. Kích thước mẫu phải lớn hơn 30.
D. Dữ liệu phải tuân theo phân phối chuẩn.
144. Kiểm định một phía (one-tailed test) được sử dụng khi nào?
A. Khi chúng ta quan tâm đến sự khác biệt theo cả hai hướng (lớn hơn hoặc nhỏ hơn).
B. Khi chúng ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
C. Khi kích thước mẫu lớn.
D. Khi phương sai của quần thể đã biết.
145. Kiểm định Kruskal-Wallis test được sử dụng khi nào?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự tương quan giữa hai biến định lượng.
D. Để kiểm tra sự phù hợp của một mẫu với một phân phối lý thuyết.
146. Trong phân tích hồi quy, hệ số xác định (R-squared) thể hiện điều gì?
A. Mức độ phù hợp của mô hình hồi quy.
B. Mức độ tương quan giữa các biến độc lập.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
D. Sai số chuẩn của ước lượng.
147. Kiểm định Mann-Whitney U test được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu liên quan.
B. So sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Kiểm tra sự phù hợp của một mẫu với một phân phối lý thuyết.
148. Ưu điểm của việc sử dụng kiểm định phi tham số so với kiểm định tham số là gì?
A. Kiểm định phi tham số mạnh hơn kiểm định tham số.
B. Kiểm định phi tham số yêu cầu ít giả định hơn về dữ liệu.
C. Kiểm định phi tham số dễ tính toán hơn.
D. Kiểm định phi tham số luôn cho kết quả chính xác hơn.
149. Trong phân tích phương sai (ANOVA), yếu tố (factor) là gì?
A. Biến phụ thuộc.
B. Biến độc lập định tính.
C. Biến độc lập định lượng.
D. Sai số ngẫu nhiên.
150. Nếu giá trị p nhỏ hơn mức ý nghĩa (alpha), chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận.
D. Tăng kích thước mẫu.