1. Loại biểu đồ nào thường được sử dụng để hiển thị mối quan hệ giữa hai biến định lượng?
A. Biểu đồ cột (Bar chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ tán xạ (Scatter plot).
D. Biểu đồ hộp (Box plot).
2. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không thay đổi.
D. Không thể xác định.
3. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn.
B. Phương sai giữa các nhóm và phương sai trong mỗi nhóm.
C. Trung vị.
D. Khoảng tứ phân vị.
4. Phương pháp nào sau đây được sử dụng để làm mịn dữ liệu thời gian và loại bỏ nhiễu?
A. Hồi quy tuyến tính.
B. Trung bình động (Moving average).
C. Kiểm định Chi-square.
D. Phân tích phương sai (ANOVA).
5. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi H0 sai.
B. Bác bỏ giả thuyết H0 khi H0 đúng.
C. Chấp nhận giả thuyết H1 khi H1 sai.
D. Bác bỏ giả thuyết H1 khi H1 đúng.
6. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất thu được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Mức ý nghĩa α được chọn trước.
7. Trong phân tích thời gian, thành phần nào sau đây mô tả xu hướng dài hạn của chuỗi dữ liệu?
A. Tính mùa vụ (Seasonality).
B. Tính chu kỳ (Cyclicality).
C. Xu hướng (Trend).
D. Tính ngẫu nhiên (Randomness).
8. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của các nhóm khác nhau.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của các nhóm khác nhau.
9. Mức ý nghĩa (Significance level) α trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó sai.
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
10. Khi nào thì kiểm định Chi-square được sử dụng?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra sự độc lập giữa hai biến định tính.
C. Để ước lượng phương sai của quần thể.
D. Để phân tích phương sai giữa các nhóm.
11. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc có mối quan hệ tuyến tính với chính nó.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi mô hình không phù hợp với dữ liệu.
D. Khi phương sai của sai số thay đổi.
12. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối nhị thức.
13. Một nhà máy sản xuất bóng đèn tuyên bố rằng tuổi thọ trung bình của bóng đèn là 800 giờ với độ lệch chuẩn 50 giờ. Một người tiêu dùng mua 100 bóng đèn và thấy tuổi thọ trung bình là 790 giờ. Với mức ý nghĩa 5%, bạn có thể kết luận gì về tuyên bố của nhà máy?
A. Không có đủ bằng chứng để bác bỏ tuyên bố của nhà máy.
B. Có đủ bằng chứng để bác bỏ tuyên bố của nhà máy.
C. Cần thêm thông tin để đưa ra kết luận.
D. Tuyên bố của nhà máy chắc chắn đúng.
14. Một cửa hàng muốn xác định xem có sự khác biệt về doanh số bán hàng giữa các ngày trong tuần hay không. Họ thu thập dữ liệu doanh số bán hàng trong một tháng. Kiểm định nào phù hợp nhất để sử dụng?
A. Kiểm định t (t-test).
B. Kiểm định Chi-square.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
15. Khi so sánh phương sai của hai quần thể, kiểm định nào sau đây thường được sử dụng?
A. Kiểm định t (t-test).
B. Kiểm định z (z-test).
C. Kiểm định F.
D. Kiểm định Chi-square.
16. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi phương sai của quần thể đã biết.
17. Độ tin cậy (confidence level) của một khoảng tin cậy là gì?
A. Xác suất khoảng tin cậy chứa giá trị thực của tham số.
B. Xác suất giá trị thực của tham số nằm ngoài khoảng tin cậy.
C. Xác suất mắc sai lầm loại I.
D. Xác suất mắc sai lầm loại II.
18. Trong phân tích thời gian, phương pháp nào sau đây được sử dụng để dự báo giá trị tương lai dựa trên các giá trị quá khứ?
A. Hồi quy tuyến tính.
B. Trung bình động (Moving average).
C. Mô hình ARIMA.
D. Phân tích phương sai (ANOVA).
19. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm của họ. Họ lấy mẫu ngẫu nhiên 200 khách hàng và thấy rằng 160 người hài lòng. Hãy xây dựng khoảng tin cậy 95% cho tỷ lệ khách hàng hài lòng.
A. 0.75 ± 0.05
B. 0.80 ± 0.0566
C. 0.85 ± 0.06
D. 0.70 ± 0.04
20. Trong kiểm định giả thuyết, nếu giá trị p nhỏ hơn mức ý nghĩa α, chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận.
D. Tăng kích thước mẫu.
21. Trong phân tích hồi quy, sai số chuẩn của ước lượng (standard error of estimate) đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình.
C. Độ lệch trung bình của các điểm dữ liệu so với đường hồi quy.
D. Tỷ lệ phương sai được giải thích bởi mô hình.
22. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt về điểm trung bình của sinh viên giữa hai trường đại học hay không. Họ thu thập dữ liệu từ hai mẫu độc lập. Kiểm định nào phù hợp nhất để sử dụng?
A. Kiểm định Chi-square.
B. Kiểm định t cho hai mẫu độc lập.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
23. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu liên quan (paired samples) khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để phân tích phương sai giữa các nhóm.
24. Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?
A. 0 đến 1.
B. -1 đến 0.
C. -∞ đến +∞.
D. -1 đến +1.
25. Khi so sánh hai mẫu độc lập, kiểm định nào sau đây được sử dụng nếu dữ liệu không tuân theo phân phối chuẩn?
A. Kiểm định t (t-test).
B. Kiểm định z (z-test).
C. Kiểm định Mann-Whitney U.
D. Kiểm định Chi-square.
26. Sai lầm loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 sai.
27. Trong lý thuyết ước lượng, ước lượng điểm (point estimate) là gì?
A. Một khoảng giá trị mà tham số có thể nằm trong đó.
B. Một giá trị duy nhất được sử dụng để ước tính tham số.
C. Một phương pháp để kiểm định giả thuyết.
D. Một thước đo độ tin cậy của ước lượng.
28. Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
D. Mức độ phù hợp của mô hình.
29. Đại lượng ngẫu nhiên X tuân theo quy luật phân phối chuẩn N(μ, σ^2). Khoảng tin cậy đối xứng cho μ với độ tin cậy 95% được xác định như thế nào?
A. X ± 1.64 * (σ / √n)
B. X ± 2.575 * (σ / √n)
C. X ± 1.96 * (σ / √n)
D. X ± 2.33 * (σ / √n)
30. Trong phân tích hồi quy, R-squared (R^2) đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ mạnh mẽ của mối quan hệ giữa các biến.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình.
D. Sai số chuẩn của ước lượng.
31. Mức ý nghĩa (α) trong kiểm định giả thuyết thường được chọn là bao nhiêu?
A. 0.1
B. 0.001
C. 0.05
D. 0.5
32. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất mắc phải sai lầm loại I.
B. Xác suất bác bỏ giả thuyết H0 khi nó sai.
C. Xác suất thu được kết quả kiểm định (hoặc kết quả khắc nghiệt hơn) nếu H0 là đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
33. Kiểm định nào phù hợp để so sánh trung bình của ba nhóm độc lập trở lên?
A. Kiểm định t độc lập.
B. Kiểm định t ghép cặp.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
34. Sai lầm loại II xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
35. Trong kiểm định giả thuyết, điều gì xảy ra khi tăng kích thước mẫu?
A. Giảm ‘power’ của kiểm định.
B. Tăng ‘power’ của kiểm định.
C. Không ảnh hưởng đến ‘power’ của kiểm định.
D. Tăng khả năng mắc sai lầm loại I.
36. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta tin rằng chứa giá trị tham số dân số với một độ tin cậy nhất định.
B. Một khoảng giá trị mà chúng ta chắc chắn chứa giá trị tham số dân số.
C. Một khoảng giá trị được sử dụng để bác bỏ giả thuyết H0.
D. Một khoảng giá trị được sử dụng để tính toán giá trị p.
37. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn dân số đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn dân số đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn dân số chưa biết.
D. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn dân số chưa biết.
38. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ quan hệ tuyến tính giữa hai biến số.
C. Mức độ khác biệt giữa hai mẫu.
D. Mức độ phù hợp của mô hình hồi quy.
39. Trong kiểm định giả thuyết, ‘power’ của một kiểm định là gì?
A. Xác suất mắc phải sai lầm loại I.
B. Xác suất mắc phải sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
40. Nếu giá trị p là 0.03 và mức ý nghĩa là 0.05, quyết định nào sau đây là đúng?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không thể đưa ra kết luận.
D. Cần thêm thông tin để quyết định.
41. Thống kê kiểm định (test statistic) được sử dụng để làm gì trong kiểm định giả thuyết?
A. Để ước lượng tham số của dân số.
B. Để đo lường mức độ phù hợp của dữ liệu mẫu với giả thuyết H0.
C. Để xác định kích thước mẫu cần thiết.
D. Để tính toán giá trị p.
42. Trong kiểm định giả thuyết, khi nào chúng ta bác bỏ giả thuyết H0?
A. Khi giá trị p lớn hơn mức ý nghĩa (α).
B. Khi giá trị p nhỏ hơn hoặc bằng mức ý nghĩa (α).
C. Khi giá trị p bằng 0.
D. Khi giá trị p bằng 1.
43. Trong kiểm định Chi-bình phương về tính phù hợp (goodness-of-fit), giả thuyết H0 là gì?
A. Dữ liệu tuân theo một phân phối cụ thể.
B. Dữ liệu không tuân theo một phân phối cụ thể.
C. Dữ liệu có trung bình bằng một giá trị cụ thể.
D. Dữ liệu có phương sai bằng một giá trị cụ thể.
44. Trong phân tích hồi quy, sai số chuẩn (standard error) của hệ số hồi quy đo lường điều gì?
A. Độ lớn của hệ số hồi quy.
B. Độ lệch chuẩn của các giá trị dự đoán.
C. Độ chính xác của ước lượng hệ số hồi quy.
D. Mức độ phù hợp của mô hình hồi quy.
45. Mục đích của việc kiểm tra các giả định (assumptions) trước khi thực hiện một kiểm định thống kê là gì?
A. Để làm cho kết quả kiểm định có ý nghĩa thống kê.
B. Để đảm bảo rằng kết quả kiểm định là hợp lệ và đáng tin cậy.
C. Để giảm kích thước mẫu cần thiết.
D. Để đơn giản hóa quá trình tính toán.
46. Ý nghĩa của bậc tự do (degrees of freedom) trong kiểm định thống kê là gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng tham số được ước lượng từ dữ liệu mẫu.
C. Số lượng giá trị độc lập trong tính toán thống kê.
D. Mức ý nghĩa của kiểm định.
47. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy biến mất.
48. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trong các trung bình của các nhóm khác nhau.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của tất cả các nhóm đều khác nhau.
49. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn so sánh trung bình của hai mẫu.
50. Ý nghĩa của việc sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test) là gì?
A. Kiểm định một phía luôn chính xác hơn.
B. Kiểm định một phía có ‘power’ cao hơn nếu hướng của hiệu ứng đúng như dự đoán.
C. Kiểm định hai phía có ‘power’ cao hơn nếu hướng của hiệu ứng đúng như dự đoán.
D. Kiểm định một phía dễ thực hiện hơn.
51. Sự khác biệt chính giữa kiểm định z một mẫu và kiểm định t một mẫu là gì?
A. Kiểm định z một mẫu sử dụng độ lệch chuẩn mẫu, trong khi kiểm định t một mẫu sử dụng độ lệch chuẩn dân số.
B. Kiểm định z một mẫu sử dụng độ lệch chuẩn dân số đã biết, trong khi kiểm định t một mẫu sử dụng độ lệch chuẩn mẫu (ước lượng từ mẫu).
C. Kiểm định z một mẫu chỉ dùng cho dữ liệu định tính, trong khi kiểm định t một mẫu chỉ dùng cho dữ liệu định lượng.
D. Kiểm định z một mẫu dùng cho mẫu nhỏ, kiểm định t một mẫu dùng cho mẫu lớn.
52. Chọn phát biểu đúng về kiểm định Chi-bình phương (Chi-square test):
A. Kiểm định Chi-bình phương chỉ dùng cho biến định lượng.
B. Kiểm định Chi-bình phương dùng để so sánh trung bình của hai mẫu.
C. Kiểm định Chi-bình phương dùng để kiểm tra sự độc lập giữa hai biến định tính.
D. Kiểm định Chi-bình phương dùng để kiểm tra sự bằng nhau của phương sai.
53. Sự khác biệt chính giữa kiểm định t độc lập và kiểm định t ghép cặp là gì?
A. Kiểm định t độc lập so sánh hai mẫu liên quan, trong khi kiểm định t ghép cặp so sánh hai mẫu độc lập.
B. Kiểm định t độc lập so sánh hai mẫu độc lập, trong khi kiểm định t ghép cặp so sánh hai mẫu liên quan (ví dụ: trước và sau can thiệp).
C. Kiểm định t độc lập chỉ dùng cho mẫu lớn, trong khi kiểm định t ghép cặp chỉ dùng cho mẫu nhỏ.
D. Kiểm định t độc lập dùng độ lệch chuẩn dân số, kiểm định t ghép cặp dùng độ lệch chuẩn mẫu.
54. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó đúng.
D. Bác bỏ giả thuyết H0 khi nó sai.
55. Trong hồi quy tuyến tính, R-squared (hệ số xác định) cho biết điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ ý nghĩa thống kê của mô hình.
D. Sai số chuẩn của mô hình.
56. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?
A. Khi muốn so sánh trung bình của hai nhóm.
B. Khi muốn kiểm tra sự độc lập giữa hai biến định tính.
C. Khi muốn kiểm tra ảnh hưởng của hai yếu tố độc lập lên một biến phụ thuộc.
D. Khi muốn kiểm tra sự khác biệt về phương sai giữa các nhóm.
57. Trong phân tích phương sai (ANOVA), thống kê F được tính như thế nào?
A. Tổng bình phương giữa các nhóm chia cho tổng bình phương trong các nhóm.
B. Trung bình bình phương giữa các nhóm chia cho trung bình bình phương trong các nhóm.
C. Tổng bình phương trong các nhóm chia cho tổng bình phương giữa các nhóm.
D. Trung bình bình phương trong các nhóm chia cho trung bình bình phương giữa các nhóm.
58. Kiểm định giả thuyết một phía (one-tailed test) khác với kiểm định giả thuyết hai phía (two-tailed test) như thế nào?
A. Kiểm định một phía chỉ kiểm tra sự khác biệt theo một hướng cụ thể, trong khi kiểm định hai phía kiểm tra sự khác biệt theo cả hai hướng.
B. Kiểm định hai phía chỉ kiểm tra sự khác biệt theo một hướng cụ thể, trong khi kiểm định một phía kiểm tra sự khác biệt theo cả hai hướng.
C. Kiểm định một phía luôn cho kết quả chính xác hơn kiểm định hai phía.
D. Kiểm định hai phía luôn cho kết quả chính xác hơn kiểm định một phía.
59. Chọn phát biểu đúng về hệ số tương quan Pearson:
A. Hệ số tương quan Pearson đo lường mối quan hệ phi tuyến tính giữa hai biến.
B. Hệ số tương quan Pearson có giá trị từ 0 đến 1.
C. Hệ số tương quan Pearson đo lường mối quan hệ tuyến tính giữa hai biến.
D. Hệ số tương quan Pearson không thể âm.
60. Khi thực hiện kiểm định Chi-bình phương về tính độc lập, giả thuyết H0 là gì?
A. Hai biến có liên quan đến nhau.
B. Hai biến không có liên quan đến nhau.
C. Hai biến có phân phối giống nhau.
D. Hai biến có trung bình bằng nhau.
61. Nếu một biến ngẫu nhiên X có hàm mật độ xác suất f(x) = kx, 0 < x < 2, thì giá trị của k là bao nhiêu?
62. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi độ lệch chuẩn của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi muốn so sánh hai quần thể.
63. Độ lệch chuẩn là gì?
A. Bình phương của phương sai.
B. Căn bậc hai của phương sai.
C. Giá trị trung bình của biến ngẫu nhiên.
D. Một nửa của phương sai.
64. Biến ngẫu nhiên X tuân theo phân phối chuẩn với trung bình μ và độ lệch chuẩn σ. Khoảng tin cậy 95% cho X là gì?
A. [μ – σ, μ + σ]
B. [μ – 1.96σ, μ + 1.96σ]
C. [μ – 2.58σ, μ + 2.58σ]
D. [μ – 3σ, μ + 3σ]
65. Một hộp có 5 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên 2 bi. Xác suất để cả 2 bi đều đỏ là bao nhiêu?
A. 5/8
B. 25/64
C. 5/14
D. 10/56
66. Biến ngẫu nhiên liên tục X tuân theo phân phối đều trên đoạn [a, b]. Hàm mật độ xác suất f(x) được xác định như thế nào?
A. f(x) = 1/(b-a) nếu a ≤ x ≤ b, và f(x) = 0 nếu ngược lại.
B. f(x) = (x-a)/(b-a) nếu a ≤ x ≤ b, và f(x) = 0 nếu ngược lại.
C. f(x) = (b-x)/(b-a) nếu a ≤ x ≤ b, và f(x) = 0 nếu ngược lại.
D. f(x) = (b-a) nếu a ≤ x ≤ b, và f(x) = 0 nếu ngược lại.
67. Khi nào chúng ta bác bỏ giả thuyết H0 trong kiểm định giả thuyết?
A. Khi giá trị p lớn hơn mức ý nghĩa α.
B. Khi giá trị p nhỏ hơn hoặc bằng mức ý nghĩa α.
C. Khi giá trị p bằng 0.5.
D. Khi giá trị p bằng 1.
68. Lỗi loại II trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Chấp nhận giả thuyết H0 khi H0 sai.
D. Bác bỏ giả thuyết H0 khi H0 sai.
69. Cho X là biến ngẫu nhiên tuân theo phân phối Poisson với tham số λ. Tính P(X=0).
A. λ^0 / 0!
B. e^(-λ)
C. 1 – e^(-λ)
D. λ
70. Trong phân tích hồi quy tuyến tính, hệ số tương quan (r) đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Phương sai của sai số.
71. Biến ngẫu nhiên X tuân theo phân phối nhị thức B(n, p). Kỳ vọng E(X) bằng bao nhiêu?
72. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất quan sát được kết quả như hiện tại (hoặc cực đoan hơn) nếu H0 đúng.
C. Xác suất giả thuyết H1 là đúng.
D. Mức ý nghĩa của kiểm định.
73. Nếu hai biến ngẫu nhiên X và Y độc lập, thì Cov(X, Y) bằng bao nhiêu?
A. 1
B. 0
C. E(X)*E(Y)
D. Var(X) + Var(Y)
74. Điều kiện nào sau đây KHÔNG phải là điều kiện để một hàm số là hàm mật độ xác suất?
A. f(x) ≥ 0 với mọi x.
B. ∫f(x)dx = 1 (tích phân trên toàn bộ miền xác định).
C. f(x) ≤ 1 với mọi x.
D. f(x) là hàm liên tục.
75. Biến ngẫu nhiên X tuân theo phân phối chuẩn N(10, 4). Tính P(8 < X < 12).
A. 0.3413
B. 0.6826
C. 0.9544
D. 0.9973
76. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. So sánh phương sai của hai quần thể.
B. So sánh trung bình của hai quần thể.
C. So sánh trung bình của nhiều hơn hai quần thể.
D. Ước lượng phương sai của một quần thể.
77. Công thức nào sau đây là công thức tính kỳ vọng của biến ngẫu nhiên rời rạc X?
A. E(X) = ∫x*f(x) dx
B. E(X) = Σx*P(X=x)
C. E(X) = n*p
D. E(X) = ΣP(X=x)
78. Cho X và Y là hai biến ngẫu nhiên. Công thức nào sau đây đúng?
A. Var(X+Y) = Var(X) + Var(Y)
B. Var(X+Y) = Var(X) + Var(Y) + 2Cov(X, Y)
C. Var(X+Y) = Var(X) – Var(Y)
D. Var(X+Y) = Var(X)*Var(Y)
79. Điều kiện nào sau đây KHÔNG phải là giả định của mô hình hồi quy tuyến tính?
A. Sai số có phân phối chuẩn.
B. Phương sai của sai số là không đổi (homoscedasticity).
C. Sai số độc lập với nhau.
D. Các biến độc lập có tương quan với nhau.
80. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến ngẫu nhiên.
B. Mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình.
C. Xác suất xảy ra giá trị lớn nhất của biến ngẫu nhiên.
D. Giá trị nhỏ nhất mà biến ngẫu nhiên có thể nhận.
81. Trong thống kê suy diễn, khoảng tin cậy (confidence interval) được sử dụng để ước lượng điều gì?
A. Giá trị của một thống kê mẫu.
B. Giá trị của một tham số quần thể.
C. Kích thước mẫu cần thiết.
D. Mức ý nghĩa của kiểm định.
82. Hàm phân phối xác suất của một biến ngẫu nhiên liên tục có tính chất nào sau đây?
A. Luôn là một hàm giảm.
B. Luôn là một hàm không âm và không vượt quá 1.
C. Luôn là một hàm tăng và tiến đến 1 khi x tiến đến vô cùng.
D. Luôn là một hàm rời rạc.
83. Phân phối nào sau đây thường được sử dụng để mô hình hóa thời gian chờ đợi giữa các sự kiện?
A. Phân phối chuẩn.
B. Phân phối mũ (Exponential).
C. Phân phối Poisson.
D. Phân phối đều.
84. Một đồng xu được tung 3 lần. Xác suất để có ít nhất 2 mặt ngửa là bao nhiêu?
85. Kiểm định Chi-square được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra sự phù hợp của phân phối lý thuyết với dữ liệu thực tế.
C. Ước lượng tham số quần thể.
D. Phân tích hồi quy tuyến tính.
86. Hệ số xác định (R-squared) trong phân tích hồi quy tuyến tính thể hiện điều gì?
A. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Độ dốc của đường hồi quy.
C. Phương sai của sai số.
D. Mức ý nghĩa của mô hình.
87. Trong kiểm định giả thuyết, mức ý nghĩa (α) thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết H0 khi H0 đúng.
C. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
D. Xác suất chấp nhận giả thuyết H0 khi H0 sai.
88. Đại lượng ngẫu nhiên rời rạc là gì?
A. Đại lượng nhận giá trị trong một khoảng số thực.
B. Đại lượng có thể nhận một số hữu hạn giá trị hoặc vô hạn đếm được các giá trị.
C. Đại lượng luôn nhận giá trị nguyên dương.
D. Đại lượng có hàm mật độ xác suất liên tục.
89. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?
A. Tổng của các biến ngẫu nhiên độc lập có phân phối chuẩn.
B. Trung bình mẫu của một số lượng lớn các biến ngẫu nhiên độc lập có phân phối xấp xỉ chuẩn.
C. Phương sai của mẫu hội tụ về 0 khi kích thước mẫu tăng lên.
D. Phân phối của mẫu giống với phân phối của quần thể.
90. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối đều.
91. Khi nào thì sử dụng kiểm định Kruskal-Wallis test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của ba hoặc nhiều hơn các mẫu độc lập.
C. Khi so sánh ba hoặc nhiều hơn các mẫu độc lập mà dữ liệu không tuân theo phân phối chuẩn.
D. Khi so sánh ba hoặc nhiều hơn các mẫu có liên quan.
92. Trong kiểm định giả thuyết, khi nào thì sử dụng kiểm định Z một mẫu (one-sample Z test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của một mẫu với một giá trị đã biết, với phương sai quần thể đã biết.
C. Khi so sánh trung bình của một mẫu với một giá trị đã biết, với phương sai quần thể chưa biết.
D. Khi cỡ mẫu nhỏ hơn 30.
93. Khi nào nên sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi không có lý thuyết nào hỗ trợ.
B. Khi quan tâm đến sự khác biệt theo cả hai hướng.
C. Khi chỉ quan tâm đến sự khác biệt theo một hướng cụ thể.
D. Khi cỡ mẫu lớn hơn 30.
94. Sự khác biệt chính giữa kiểm định tham số và kiểm định phi tham số là gì?
A. Kiểm định tham số yêu cầu dữ liệu tuân theo một phân phối cụ thể, trong khi kiểm định phi tham số thì không.
B. Kiểm định phi tham số yêu cầu dữ liệu tuân theo một phân phối cụ thể, trong khi kiểm định tham số thì không.
C. Kiểm định tham số chỉ sử dụng cho dữ liệu định tính.
D. Kiểm định phi tham số chỉ sử dụng cho dữ liệu định lượng.
95. Hệ quả của việc tăng cỡ mẫu trong kiểm định giả thuyết là gì?
A. Giảm độ mạnh của kiểm định.
B. Tăng xác suất mắc sai lầm loại I.
C. Giảm xác suất mắc sai lầm loại II.
D. Không ảnh hưởng đến kết quả kiểm định.
96. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa (alpha) của kiểm định.
C. Xác suất mắc sai lầm loại II.
D. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
97. Khi nào thì sử dụng kiểm định t ghép cặp (paired t-test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu có liên quan (ví dụ: trước và sau can thiệp).
C. Khi kiểm định phương sai của một mẫu.
D. Khi cỡ mẫu lớn hơn 30.
98. Khi nào thì sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu có liên quan.
C. Khi so sánh hai mẫu có liên quan mà dữ liệu không tuân theo phân phối chuẩn.
D. Khi cỡ mẫu lớn hơn 30.
99. Trong phân tích phương sai (ANOVA), thống kê F được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong nội bộ nhóm.
B. Tỷ lệ giữa phương sai trong nội bộ nhóm và phương sai giữa các nhóm.
C. Hiệu giữa phương sai giữa các nhóm và phương sai trong nội bộ nhóm.
D. Tổng của phương sai giữa các nhóm và phương sai trong nội bộ nhóm.
100. Trong phân tích hồi quy bội, hệ số hồi quy riêng phần (partial regression coefficient) thể hiện điều gì?
A. Mức độ ảnh hưởng của một biến độc lập lên biến phụ thuộc, khi các biến độc lập khác được giữ không đổi.
B. Mức độ ảnh hưởng của tất cả các biến độc lập lên biến phụ thuộc.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
101. Trong phân tích hồi quy, ý nghĩa của hệ số chặn (intercept) là gì?
A. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
B. Độ dốc của đường hồi quy.
C. Mức độ mạnh yếu của mối quan hệ giữa các biến.
D. Sai số chuẩn của ước lượng.
102. Điều gì xảy ra với khoảng tin cậy khi tăng cỡ mẫu?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định.
103. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh yếu của mối quan hệ giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
104. Trong kiểm định giả thuyết, điều gì sẽ xảy ra nếu bạn tăng mức ý nghĩa (alpha)?
A. Giảm xác suất mắc sai lầm loại I.
B. Giảm xác suất mắc sai lầm loại II.
C. Tăng xác suất mắc sai lầm loại I.
D. Tăng xác suất mắc sai lầm loại II.
105. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Tất cả các phương sai của các nhóm đều bằng nhau.
C. Ít nhất một trung bình của một nhóm khác với các nhóm còn lại.
D. Tất cả các trung bình của các nhóm đều bằng nhau.
106. Trong kiểm định giả thuyết, điều gì xảy ra nếu bạn giảm mức ý nghĩa (alpha)?
A. Tăng xác suất mắc sai lầm loại I và giảm xác suất mắc sai lầm loại II.
B. Giảm xác suất mắc sai lầm loại I và tăng xác suất mắc sai lầm loại II.
C. Tăng cả xác suất mắc sai lầm loại I và loại II.
D. Giảm cả xác suất mắc sai lầm loại I và loại II.
107. Độ mạnh của kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ H0 khi H0 sai.
D. Xác suất không bác bỏ H0 khi H0 đúng.
108. Mối quan hệ giữa mức ý nghĩa (alpha) và sai lầm loại I trong kiểm định giả thuyết là gì?
A. Alpha là xác suất mắc sai lầm loại II.
B. Alpha là xác suất mắc sai lầm loại I.
C. Alpha và sai lầm loại I không liên quan đến nhau.
D. Alpha là 1 trừ xác suất mắc sai lầm loại I.
109. Giả sử bạn thực hiện kiểm định giả thuyết và nhận được giá trị p = 0.03. Nếu mức ý nghĩa alpha = 0.05, bạn nên đưa ra kết luận gì?
A. Bác bỏ giả thuyết H0.
B. Không bác bỏ giả thuyết H0.
C. Cần thêm thông tin để đưa ra kết luận.
D. Chấp nhận giả thuyết H0.
110. Khi thực hiện kiểm định giả thuyết về tỷ lệ của một quần thể, bạn sử dụng phân phối nào?
A. Phân phối t-Student.
B. Phân phối Chi-square.
C. Phân phối Z.
D. Phân phối F.
111. Trong kiểm định giả thuyết, sai lầm loại II xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Không bác bỏ giả thuyết H0 khi H0 đúng.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Không bác bỏ giả thuyết H0 khi H0 sai.
112. Khi nào thì sử dụng kiểm định t hai mẫu độc lập (independent samples t-test)?
A. Khi so sánh trung bình của hai mẫu có liên quan.
B. Khi so sánh trung bình của hai mẫu độc lập.
C. Khi so sánh phương sai của hai mẫu.
D. Khi cỡ mẫu lớn hơn 30.
113. Trong kiểm định giả thuyết về trung bình của một quần thể, khi nào thì sử dụng phân phối t-Student thay vì phân phối Z?
A. Khi phương sai của quần thể đã biết.
B. Khi cỡ mẫu lớn (n > 30).
C. Khi phương sai của quần thể chưa biết và cỡ mẫu nhỏ (n < 30).
D. Khi sử dụng kiểm định một phía.
114. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng mức độ tin cậy (confidence level)?
A. Độ rộng của khoảng tin cậy giảm.
B. Độ rộng của khoảng tin cậy tăng.
C. Độ rộng của khoảng tin cậy không đổi.
D. Không thể xác định.
115. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 sai.
B. Không bác bỏ giả thuyết H0 khi H0 đúng.
C. Bác bỏ giả thuyết H0 khi H0 đúng.
D. Không bác bỏ giả thuyết H0 khi H0 sai.
116. Kiểm định Chi-square thường được sử dụng để làm gì?
A. Kiểm định trung bình của một quần thể.
B. Kiểm định phương sai của một quần thể.
C. Kiểm định sự độc lập giữa hai biến định tính.
D. Kiểm định sự bằng nhau giữa hai trung bình.
117. Khi nào thì sử dụng kiểm định Mann-Whitney U test?
A. Khi so sánh trung bình của hai mẫu có liên quan.
B. Khi so sánh trung bình của hai mẫu độc lập.
C. Khi so sánh hai mẫu độc lập mà dữ liệu không tuân theo phân phối chuẩn.
D. Khi cỡ mẫu lớn hơn 30.
118. Ý nghĩa của việc tính toán khoảng tin cậy (confidence interval) là gì?
A. Ước lượng một giá trị duy nhất cho tham số quần thể.
B. Ước lượng một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Xác định giá trị p của kiểm định giả thuyết.
D. Tính toán độ lệch chuẩn của mẫu.
119. Nếu một kiểm định thống kê có độ mạnh (power) thấp, điều này có nghĩa là gì?
A. Kiểm định có khả năng cao mắc sai lầm loại I.
B. Kiểm định có khả năng cao mắc sai lầm loại II.
C. Kiểm định có khả năng cao bác bỏ H0 khi H0 đúng.
D. Kiểm định có khả năng cao bác bỏ H0 khi H0 sai.
120. Trong kiểm định giả thuyết, thuật ngữ ‘bậc tự do’ (degrees of freedom) đề cập đến điều gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng biến trong mẫu.
C. Số lượng thông tin độc lập có sẵn để ước lượng tham số.
D. Mức ý nghĩa của kiểm định.
121. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của các hệ số hồi quy.
D. Mức ý nghĩa của các hệ số hồi quy.
122. Sự khác biệt chính giữa kiểm định t một mẫu (one-sample t-test) và kiểm định t hai mẫu độc lập (independent samples t-test) là gì?
A. Kiểm định t một mẫu so sánh trung bình của một mẫu với một giá trị đã biết, trong khi kiểm định t hai mẫu độc lập so sánh trung bình của hai mẫu độc lập.
B. Kiểm định t một mẫu so sánh phương sai của một mẫu với một giá trị đã biết, trong khi kiểm định t hai mẫu độc lập so sánh phương sai của hai mẫu độc lập.
C. Kiểm định t một mẫu yêu cầu kích thước mẫu lớn hơn kiểm định t hai mẫu độc lập.
D. Kiểm định t hai mẫu độc lập yêu cầu dữ liệu tuân theo phân phối chuẩn, trong khi kiểm định t một mẫu thì không.
123. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Sự khác biệt giữa hai trung bình.
B. Mức độ liên kết tuyến tính giữa hai biến định lượng.
C. Mức độ biến thiên của một biến.
D. Mức độ phù hợp của một mô hình hồi quy.
124. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều bằng nhau.
B. Ít nhất một trung bình của một nhóm khác với các nhóm khác.
C. Phương sai của tất cả các nhóm đều bằng nhau.
D. Phương sai của ít nhất một nhóm khác với các nhóm khác.
125. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của tổng thể đã biết.
C. Khi độ lệch chuẩn của tổng thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu không tuân theo phân phối chuẩn.
126. Trong phân tích tương quan, hệ số tương quan Pearson (Pearson correlation coefficient) chỉ đo lường mối quan hệ nào?
A. Mối quan hệ phi tuyến tính.
B. Mối quan hệ nhân quả.
C. Mối quan hệ tuyến tính.
D. Mối quan hệ giữa các biến định tính.
127. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA) thay vì ANOVA một yếu tố (one-way ANOVA)?
A. Khi chỉ có một biến độc lập.
B. Khi có hai biến độc lập và ta muốn xem xét tác động của cả hai biến và tương tác giữa chúng.
C. Khi có hai biến phụ thuộc.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
128. Nếu một kiểm định thống kê có độ mạnh (power) là 0.8, điều này có nghĩa là gì?
A. Xác suất mắc sai lầm loại I là 0.8.
B. Xác suất mắc sai lầm loại II là 0.8.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai là 0.8.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng là 0.8.
129. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không thay đổi.
D. Không thể xác định.
130. Điều gì xảy ra với sai số chuẩn của trung bình (standard error of the mean) khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không thay đổi.
D. Không thể xác định.
131. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó sai.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó đúng.
D. Chấp nhận giả thuyết H0 khi nó sai.
132. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Mức ý nghĩa (alpha) của kiểm định.
D. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
133. Trong kiểm định giả thuyết, một kết quả ‘có ý nghĩa thống kê’ (statistically significant) có nghĩa là gì?
A. Kết quả chắc chắn đúng.
B. Kết quả quan trọng về mặt thực tế.
C. Kết quả không có khả năng xảy ra nếu giả thuyết H0 là đúng.
D. Kết quả có thể áp dụng cho mọi tình huống.
134. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
135. Trong hồi quy đa biến (multiple regression), hệ số hồi quy riêng phần (partial regression coefficient) biểu thị điều gì?
A. Mức độ tương quan giữa hai biến độc lập.
B. Sự thay đổi dự kiến của biến phụ thuộc khi một biến độc lập tăng một đơn vị, giữ các biến độc lập khác không đổi.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
D. Sai số chuẩn của các hệ số hồi quy.
136. Một nhà nghiên cứu muốn so sánh hiệu quả của một loại thuốc mới với một loại thuốc hiện có. Họ thu thập dữ liệu từ hai nhóm bệnh nhân độc lập. Kiểm định thống kê nào phù hợp nhất?
A. Kiểm định t ghép cặp (paired t-test).
B. Kiểm định t độc lập (independent t-test).
C. Kiểm định chi bình phương.
D. Phân tích phương sai (ANOVA).
137. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả dữ liệu mẫu.
B. Thu thập dữ liệu từ tổng thể.
C. Sử dụng dữ liệu mẫu để đưa ra kết luận về tổng thể.
D. Tính toán các thống kê mô tả.
138. Kiểm định chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Ước lượng khoảng tin cậy cho trung bình.
D. Phân tích phương sai (ANOVA).
139. Một nghiên cứu so sánh hiệu quả của 3 phương pháp điều trị khác nhau. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu?
A. Kiểm định t độc lập.
B. Kiểm định chi bình phương.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
140. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi ta muốn so sánh trung bình của hai nhóm.
141. Độ mạnh của kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
142. Trong kiểm định giả thuyết, điều gì sẽ xảy ra nếu chúng ta tăng mức ý nghĩa (alpha)?
A. Xác suất mắc sai lầm loại I giảm xuống.
B. Xác suất mắc sai lầm loại II giảm xuống.
C. Độ mạnh của kiểm định giảm xuống.
D. Không có tác động đến sai lầm loại I và loại II.
143. Một nhà nghiên cứu muốn kiểm tra xem có mối liên hệ giữa hút thuốc lá và mắc bệnh ung thư phổi hay không. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t độc lập.
B. Kiểm định chi bình phương.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
144. Trong kiểm định chi bình phương, bậc tự do (degrees of freedom) được tính như thế nào trong kiểm định tính độc lập?
A. (Số hàng – 1) + (Số cột – 1).
B. (Số hàng – 1) * (Số cột – 1).
C. Tổng số quan sát – 1.
D. Số hàng * Số cột.
145. Trong kiểm định giả thuyết, khi nào chúng ta có thể kết luận rằng có bằng chứng thống kê để ủng hộ giả thuyết H1?
A. Khi giá trị p lớn hơn mức ý nghĩa alpha.
B. Khi giá trị p nhỏ hơn mức ý nghĩa alpha.
C. Khi giá trị p bằng mức ý nghĩa alpha.
D. Không bao giờ.
146. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Sự thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
147. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là bao nhiêu?
A. 0.1
B. 0.01
C. 0.05
D. Tất cả các đáp án trên đều có thể.
148. Kiểm định một phía (one-tailed test) được sử dụng khi nào?
A. Khi ta không có bất kỳ kỳ vọng nào về hướng của hiệu ứng.
B. Khi ta quan tâm đến việc phát hiện hiệu ứng theo cả hai hướng (lớn hơn hoặc nhỏ hơn).
C. Khi ta chỉ quan tâm đến việc phát hiện hiệu ứng theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
D. Khi kích thước mẫu rất nhỏ.
149. Khoảng tin cậy (confidence interval) cho một tham số thể hiện điều gì?
A. Xác suất tham số đó là đúng.
B. Một khoảng giá trị mà chúng ta tin rằng tham số thực sự nằm trong đó, với một mức độ tin cậy nhất định.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa (alpha) của kiểm định.
150. Một nhà nghiên cứu thực hiện kiểm định giả thuyết với mức ý nghĩa alpha = 0.05 và thu được giá trị p = 0.03. Kết luận nào sau đây là đúng?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đủ bằng chứng để bác bỏ giả thuyết H0.
D. Cần tăng kích thước mẫu để đưa ra kết luận.