1. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn ước lượng các tham số của quần thể.
2. Khi nào thì nên sử dụng hồi quy logistic (logistic regression)?
A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính có hai giá trị.
C. Khi biến phụ thuộc là biến định tính có nhiều hơn hai giá trị.
D. Khi muốn dự đoán giá trị thời gian.
3. Trong thống kê, ‘phương sai’ (variance) đo lường điều gì?
A. Độ lệch trung bình của các giá trị so với trung bình.
B. Độ lệch chuẩn của các giá trị so với trung bình.
C. Mức độ phân tán của các giá trị so với trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
4. Khi nào thì nên sử dụng biểu đồ hộp (box plot)?
A. Để hiển thị tần số của các giá trị trong một tập dữ liệu.
B. Để so sánh phân phối của nhiều tập dữ liệu.
C. Để biểu diễn mối quan hệ giữa hai biến định lượng.
D. Để hiển thị xu hướng theo thời gian.
5. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để so sánh trung vị của hai nhóm độc lập.
C. Để so sánh trung bình của ba hoặc nhiều nhóm độc lập.
D. Để so sánh trung vị của ba hoặc nhiều nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
6. Trong kiểm định giả thuyết, ‘bậc tự do’ (degrees of freedom) ảnh hưởng đến điều gì?
A. Kích thước mẫu.
B. Hình dạng của phân phối t hoặc phân phối Chi-bình phương.
C. Mức ý nghĩa.
D. Giá trị p.
7. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai nhóm phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai nhóm độc lập.
8. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi-bình phương.
9. Phương pháp lấy mẫu nào đảm bảo mọi phần tử của quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu phân tầng (Stratified sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu theo cụm (Cluster sampling).
10. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Mức độ biến động của trung bình mẫu từ mẫu này sang mẫu khác.
D. Sai số do đo lường không chính xác.
11. Phương pháp nào sau đây được sử dụng để dự đoán giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập?
A. Kiểm định t.
B. Phân tích phương sai.
C. Hồi quy đa biến (Multiple regression).
D. Kiểm định Chi-bình phương.
12. Trong phân tích chuỗi thời gian (time series analysis), thành phần nào sau đây biểu thị xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (Seasonality).
B. Tính chu kỳ (Cyclicality).
C. Xu hướng (Trend).
D. Tính ngẫu nhiên (Randomness).
13. Trong thống kê suy luận, ý nghĩa của ‘mức ý nghĩa’ (alpha level) là gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất mắc lỗi loại I.
C. Xác suất chấp nhận giả thuyết null khi nó đúng.
D. Xác suất bác bỏ giả thuyết null khi nó sai.
14. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Bác bỏ giả thuyết null khi nó thực sự sai.
15. Trong kiểm định Chi-bình phương (Chi-square test), giả thuyết null thường phát biểu điều gì?
A. Có mối quan hệ giữa các biến.
B. Không có mối quan hệ giữa các biến.
C. Trung bình của các nhóm là khác nhau.
D. Phương sai của các nhóm là khác nhau.
16. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa các phương sai của các nhóm.
B. Sự khác biệt giữa các trung bình của các nhóm.
C. Mối quan hệ giữa hai biến định lượng.
D. Sự độc lập giữa hai biến định tính.
17. Thống kê mô tả (descriptive statistics) dùng để làm gì?
A. Đưa ra kết luận về quần thể dựa trên mẫu.
B. Mô tả và tóm tắt các đặc điểm chính của dữ liệu.
C. Dự đoán giá trị của biến trong tương lai.
D. Kiểm định giả thuyết về quần thể.
18. Mục đích chính của việc xây dựng khoảng tin cậy (confidence interval) là gì?
A. Ước lượng giá trị tham số của quần thể với một mức độ tin cậy nhất định.
B. Kiểm định giả thuyết về tham số của quần thể.
C. Đo lường mức độ phân tán của dữ liệu.
D. Xác định kích thước mẫu cần thiết.
19. Khi nào thì nên sử dụng lấy mẫu phân tầng (stratified sampling)?
A. Khi quần thể đồng nhất.
B. Khi muốn đảm bảo đại diện từ các nhóm con khác nhau trong quần thể.
C. Khi không có thông tin về quần thể.
D. Khi muốn tiết kiệm chi phí.
20. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
21. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm rất xa so với các giá trị còn lại trong tập dữ liệu.
D. Giá trị nằm giữa tập dữ liệu đã được sắp xếp.
22. Khi nào thì nên sử dụng biểu đồ phân tán (scatter plot)?
A. Để hiển thị tần số của các giá trị.
B. Để so sánh trung bình của các nhóm.
C. Để biểu diễn mối quan hệ giữa hai biến định lượng.
D. Để hiển thị xu hướng theo thời gian.
23. Giá trị trung vị (median) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm giữa tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
24. Trong phân tích tương quan (correlation analysis), hệ số tương quan Pearson đo lường điều gì?
A. Mức độ mạnh mẽ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
B. Mức độ khác biệt giữa hai nhóm.
C. Mức độ phân tán của dữ liệu.
D. Mức độ phù hợp của mô hình hồi quy.
25. Phân phối chuẩn (normal distribution) có đặc điểm gì?
A. Đối xứng và có một đỉnh duy nhất.
B. Không đối xứng và có nhiều đỉnh.
C. Luôn nằm trên trục hoành.
D. Luôn có giá trị trung bình bằng 0.
26. Phương pháp nào sau đây thường được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai nhóm độc lập?
A. Kiểm định t (t-test).
B. Kiểm định Chi-bình phương (Chi-square test).
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính (Linear regression).
27. Phương pháp nào sau đây được sử dụng để đánh giá độ tin cậy của một thang đo (scale) trong nghiên cứu?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Hệ số Cronbach’s alpha.
D. Kiểm định t.
28. Biến nào sau đây là biến định tính (qualitative variable)?
A. Chiều cao.
B. Cân nặng.
C. Màu sắc.
D. Nhiệt độ.
29. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất thu được kết quả quan sát hoặc kết quả cực đoan hơn nếu giả thuyết null là đúng.
D. Mức ý nghĩa thống kê được chọn trước.
30. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
31. Một nhà tiếp thị muốn phân khúc khách hàng dựa trên hành vi mua hàng của họ. Phương pháp nào sau đây phù hợp nhất?
A. Phân tích hồi quy (Regression analysis).
B. Phân tích cụm (Cluster analysis).
C. Phân tích phương sai (ANOVA).
D. Phân tích thành phần chính (Principal component analysis).
32. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi phương sai của các nhóm bằng nhau.
D. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
33. Trong thiết kế thử nghiệm, phương pháp nào giúp đảm bảo rằng các nhóm thử nghiệm là tương đương trước khi can thiệp?
A. Chọn mẫu ngẫu nhiên (Random sampling).
B. Phân nhóm ngẫu nhiên (Random assignment).
C. Kiểm soát các biến gây nhiễu (Controlling confounding variables).
D. Sử dụng nhóm đối chứng (Using a control group).
34. Một nhà kinh tế sử dụng mô hình ARIMA để dự báo GDP. Mô hình này thuộc loại phân tích nào?
A. Phân tích hồi quy (Regression analysis).
B. Phân tích chuỗi thời gian (Time series analysis).
C. Phân tích phương sai (ANOVA).
D. Phân tích thành phần chính (Principal component analysis).
35. Một công ty muốn dự báo doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp nào sau đây phù hợp nhất?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính (Linear regression).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Thống kê mô tả (Descriptive statistics).
36. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ lớn của tác động của biến độc lập lên biến phụ thuộc.
D. Hướng của mối quan hệ giữa biến độc lập và biến phụ thuộc.
37. Một công ty muốn đánh giá mức độ hài lòng của khách hàng về sản phẩm của mình. Thang đo nào sau đây phù hợp nhất để sử dụng?
A. Thang đo danh nghĩa (Nominal scale).
B. Thang đo thứ bậc (Ordinal scale).
C. Thang đo khoảng (Interval scale).
D. Thang đo tỷ lệ (Ratio scale).
38. Khi nào nên sử dụng biểu đồ hộp (boxplot)?
A. Để hiển thị tần số của các giá trị trong một tập dữ liệu.
B. Để so sánh trung bình của hai nhóm.
C. Để hiển thị sự phân bố và các giá trị ngoại lệ của một tập dữ liệu.
D. Để hiển thị mối quan hệ giữa hai biến liên tục.
39. Phương pháp nào thường được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc định lượng và một hoặc nhiều biến độc lập, trong đó có thể có cả biến định tính và định lượng?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính đa biến (Multiple linear regression).
D. Kiểm định Chi-bình phương (Chi-square test).
40. Trong thống kê, thuật ngữ ‘phương sai’ (variance) dùng để chỉ điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Độ lệch trung bình của các giá trị so với giá trị trung bình.
C. Bình phương độ lệch chuẩn, đo lường mức độ phân tán của dữ liệu.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong một tập dữ liệu.
41. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở mức 0.05. Điều này có nghĩa là gì?
A. Có 5% khả năng chấp nhận giả thuyết H0 khi nó sai.
B. Có 5% khả năng bác bỏ giả thuyết H0 khi nó đúng.
C. Có 95% khả năng chấp nhận giả thuyết H0 khi nó đúng.
D. Có 95% khả năng bác bỏ giả thuyết H0 khi nó sai.
42. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn (Normal distribution).
B. Phân phối nhị thức (Binomial distribution).
C. Phân phối Poisson (Poisson distribution).
D. Phân phối mũ (Exponential distribution).
43. Trong phân tích dữ liệu lớn (big data), kỹ thuật nào sau đây được sử dụng để khám phá các mẫu và mối quan hệ ẩn trong dữ liệu?
A. Thống kê mô tả (Descriptive statistics).
B. Khai phá dữ liệu (Data mining).
C. Kiểm định giả thuyết (Hypothesis testing).
D. Phân tích phương sai (ANOVA).
44. Một nhà nghiên cứu muốn xác định xem có mối liên hệ giữa việc hút thuốc và nguy cơ mắc bệnh ung thư phổi hay không. Nên sử dụng kiểm định nào?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Hồi quy tuyến tính (Linear regression).
45. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của một chuỗi thời gian?
A. Kiểm định t (t-test).
B. Kiểm định F (F-test).
C. Kiểm định Dickey-Fuller (Dickey-Fuller test).
D. Kiểm định Chi-bình phương (Chi-square test).
46. Trong phân tích dữ liệu, phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy (Regression analysis).
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal component analysis – PCA).
D. Phân tích tương quan (Correlation analysis).
47. Phương pháp nào sau đây được sử dụng để ước lượng các tham số của một tổng thể dựa trên dữ liệu mẫu?
A. Thống kê mô tả (Descriptive statistics).
B. Kiểm định giả thuyết (Hypothesis testing).
C. Ước lượng khoảng (Confidence interval).
D. Phân tích phương sai (ANOVA).
48. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa (significance level) của kiểm định.
C. Xác suất mắc sai lầm loại II.
D. Xác suất thu được kết quảExtreme như kết quả quan sát được (hoặc Extreme hơn) nếu giả thuyết H0 là đúng.
49. Trong thống kê mô tả, độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
50. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mối quan hệ nhân quả giữa hai biến.
C. Mức độ tuyến tính và hướng của mối quan hệ giữa hai biến định lượng.
D. Sự khác biệt giữa trung bình của hai mẫu.
51. Trong thống kê suy luận, khoảng tin cậy (confidence interval) cho biết điều gì?
A. Xác suất tham số của tổng thể nằm trong khoảng đó.
B. Một khoảng giá trị mà chúng ta tin rằng tham số của tổng thể có khả năng nằm trong đó với một mức độ tin cậy nhất định.
C. Giá trị trung bình của mẫu.
D. Độ lệch chuẩn của mẫu.
52. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra mối liên hệ giữa hai biến định tính.
53. Một nhà phân tích dữ liệu nhận thấy rằng dữ liệu của họ có nhiều giá trị ngoại lệ (outliers). Phương pháp nào sau đây có thể giúp giảm thiểu ảnh hưởng của các giá trị ngoại lệ này?
A. Sử dụng trung bình (mean) để đo lường xu hướng trung tâm.
B. Sử dụng độ lệch chuẩn (standard deviation) để đo lường độ phân tán.
C. Sử dụng trung vị (median) để đo lường xu hướng trung tâm.
D. Sử dụng phương sai (variance) để đo lường độ phân tán.
54. Trong kiểm định giả thuyết, sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
55. Một nhà quản lý muốn so sánh hiệu quả làm việc của nhân viên giữa hai phòng ban. Dữ liệu không tuân theo phân phối chuẩn. Nên sử dụng kiểm định nào?
A. Kiểm định t độc lập (Independent t-test).
B. Kiểm định ANOVA.
C. Kiểm định Mann-Whitney U (Mann-Whitney U test).
D. Kiểm định Chi-bình phương (Chi-square test).
56. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của ba nhóm trở lên?
A. Giá trị t (t-statistic).
B. Giá trị z (z-statistic).
C. Giá trị F (F-statistic).
D. Giá trị Chi-bình phương (Chi-square statistic).
57. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
58. Trong phân tích chuỗi thời gian (time series analysis), thành phần nào thể hiện sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
59. Khi tiến hành một cuộc khảo sát, loại lỗi nào xảy ra khi một số nhóm dân cư không được đại diện đầy đủ trong mẫu?
A. Lỗi chọn mẫu (Sampling error).
B. Lỗi không phản hồi (Non-response error).
C. Lỗi đo lường (Measurement error).
D. Lỗi thiên vị chọn mẫu (Selection bias).
60. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có một biến ngoại lệ trong dữ liệu.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
D. Khi kích thước mẫu quá nhỏ.
61. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Để làm cho dữ liệu dễ đọc hơn.
B. Để thay đổi phân phối của dữ liệu.
C. Để đưa các biến về cùng một thang đo, giúp so sánh và phân tích dễ dàng hơn.
D. Để loại bỏ các giá trị ngoại lệ.
62. Ý nghĩa của việc sử dụng kiểm định một đuôi (one-tailed test) so với kiểm định hai đuôi (two-tailed test) là gì?
A. Kiểm định một đuôi luôn cho kết quả chính xác hơn.
B. Kiểm định một đuôi chỉ được sử dụng khi kích thước mẫu lớn.
C. Kiểm định một đuôi được sử dụng khi chúng ta có một giả thuyết cụ thể về hướng của hiệu ứng.
D. Kiểm định hai đuôi được sử dụng khi chúng ta có một giả thuyết cụ thể về hướng của hiệu ứng.
63. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta tin rằng tham số của quần thể nằm trong đó với một mức độ tin cậy nhất định.
B. Xác suất mà tham số của quần thể nằm trong một khoảng giá trị nhất định.
C. Một điểm ước lượng duy nhất cho tham số của quần thể.
D. Sai số chuẩn của ước lượng.
64. Trong phân tích tương quan, hệ số tương quan bằng 0 có nghĩa là gì?
A. Có một mối quan hệ tuyến tính mạnh mẽ giữa hai biến.
B. Không có mối quan hệ tuyến tính giữa hai biến.
C. Có một mối quan hệ phi tuyến tính mạnh mẽ giữa hai biến.
D. Hai biến này hoàn toàn giống nhau.
65. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự đúng.
C. Chấp nhận giả thuyết null khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự sai.
66. Trong lý thuyết xác suất, biến cố độc lập là gì?
A. Hai biến cố không thể xảy ra cùng một lúc.
B. Xác suất xảy ra biến cố này ảnh hưởng đến xác suất xảy ra biến cố kia.
C. Xác suất xảy ra biến cố này không ảnh hưởng đến xác suất xảy ra biến cố kia.
D. Hai biến cố có xác suất xảy ra bằng nhau.
67. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết null là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Xác suất mắc sai lầm loại I.
68. Trong phân tích thành phần chính (Principal Component Analysis – PCA), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến số.
B. Giảm số lượng biến bằng cách tạo ra các biến mới không tương quan.
C. Tìm ra mối quan hệ nhân quả giữa các biến.
D. Phân loại các đối tượng vào các nhóm khác nhau.
69. Trong phân tích hồi quy, R-squared (hệ số xác định) cho biết điều gì?
A. Mức độ quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Sai số chuẩn của ước lượng.
D. Mức độ ý nghĩa thống kê của mô hình.
70. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của dữ liệu mẫu.
B. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
C. Phương sai của dữ liệu mẫu.
D. Phương sai của phân phối lấy mẫu của trung bình mẫu.
71. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến liên tục.
B. Biến định tính.
C. Biến thứ bậc.
D. Biến khoảng.
72. Khi nào thì nên sử dụng trung vị (median) thay vì trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi kích thước mẫu lớn.
D. Khi cần tính toán nhanh chóng.
73. Trong phân tích hồi quy Poisson, biến phụ thuộc là loại biến gì?
A. Biến liên tục.
B. Biến đếm.
C. Biến nhị phân.
D. Biến thứ bậc.
74. Trong thống kê, ‘phương sai’ (variance) được định nghĩa là gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Độ lệch chuẩn của một tập dữ liệu.
C. Bình phương độ lệch chuẩn của một tập dữ liệu.
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất trong một tập dữ liệu.
75. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị lớn nhất của dữ liệu.
D. Giá trị trung bình của dữ liệu.
76. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Khi so sánh trung bình của hai nhóm.
B. Khi kiểm tra xem một mẫu có tuân theo một phân phối xác định hay không.
C. Khi so sánh phương sai của hai nhóm.
D. Khi kiểm tra sự độc lập giữa hai biến định tính.
77. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai nhóm độc lập có phân phối chuẩn.
B. Để so sánh trung bình của hai nhóm phụ thuộc có phân phối chuẩn.
C. Để so sánh hai nhóm phụ thuộc không có phân phối chuẩn.
D. Để so sánh hai nhóm độc lập không có phân phối chuẩn.
78. Ưu điểm chính của việc sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) là gì?
A. Dễ thực hiện hơn so với các phương pháp lấy mẫu khác.
B. Đảm bảo tính đại diện của mẫu cho các nhóm con trong quần thể.
C. Giảm chi phí thu thập dữ liệu.
D. Loại bỏ hoàn toàn sai số lấy mẫu.
79. Kiểm định Chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Ước lượng tham số của một quần thể.
D. Dự đoán giá trị của một biến số.
80. Trong phân tích sự sống (survival analysis), hàm Kaplan-Meier dùng để làm gì?
A. Ước tính hàm sống (survival function).
B. So sánh trung bình thời gian sống giữa các nhóm.
C. Dự đoán thời gian sống của một cá nhân.
D. Xác định các yếu tố ảnh hưởng đến thời gian sống.
81. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả dữ liệu mẫu một cách chính xác.
B. Thu thập dữ liệu từ toàn bộ quần thể.
C. Đưa ra kết luận về quần thể dựa trên dữ liệu mẫu.
D. Tính toán các thống kê mô tả cho dữ liệu mẫu.
82. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của một biến số.
B. Mức độ quan hệ tuyến tính giữa hai biến số.
C. Mức độ quan hệ phi tuyến tính giữa hai biến số.
D. Mức độ ảnh hưởng của một biến số lên biến số khác.
83. Trong thống kê, thuật ngữ ‘bậc tự do’ (degrees of freedom) thường đề cập đến điều gì?
A. Số lượng biến trong một mô hình.
B. Số lượng quan sát trong một mẫu.
C. Số lượng giá trị trong tính toán cuối cùng có thể thay đổi tự do.
D. Mức ý nghĩa thống kê của một kiểm định.
84. Phương pháp nào sau đây thích hợp để so sánh trung bình của ba nhóm độc lập trở lên?
A. Kiểm định t độc lập.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương.
D. Hồi quy tuyến tính.
85. Khi nào nên sử dụng kiểm định Mann-Whitney U (Mann-Whitney U test)?
A. Khi so sánh trung bình của hai nhóm độc lập có phân phối chuẩn.
B. Khi so sánh trung bình của hai nhóm phụ thuộc có phân phối chuẩn.
C. Khi so sánh hai nhóm độc lập không có phân phối chuẩn.
D. Khi so sánh hai nhóm phụ thuộc không có phân phối chuẩn.
86. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) biểu thị điều gì?
A. Sự biến động ngẫu nhiên trong chuỗi thời gian.
B. Sự biến động theo mùa trong chuỗi thời gian.
C. Sự biến động dài hạn trong chuỗi thời gian.
D. Sự biến động ngắn hạn trong chuỗi thời gian.
87. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
B. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng 1 đơn vị.
C. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
D. Sai số chuẩn của ước lượng.
88. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Phương sai giữa các nhóm khác nhau.
89. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập có phân phối chuẩn.
B. Khi so sánh trung bình của ba nhóm độc lập trở lên có phân phối chuẩn.
C. Khi so sánh ba nhóm độc lập trở lên không có phân phối chuẩn.
D. Khi so sánh hai nhóm độc lập không có phân phối chuẩn.
90. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
B. Mối quan hệ phi tuyến tính mạnh mẽ giữa các biến độc lập.
C. Mối quan hệ tuyến tính mạnh mẽ giữa biến độc lập và biến phụ thuộc.
D. Sự thiếu dữ liệu trong mô hình.
91. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
A. Mỗi phần tử trong tổng thể có cơ hội được chọn khác nhau.
B. Mỗi phần tử trong tổng thể có cơ hội được chọn bằng nhau.
C. Chỉ các phần tử quan trọng mới được chọn.
D. Các phần tử được chọn theo một quy tắc nhất định.
92. Mục đích chính của thống kê mô tả (descriptive statistics) là gì?
A. Đưa ra kết luận về tổng thể dựa trên mẫu.
B. Mô tả và tóm tắt các đặc điểm của dữ liệu.
C. Kiểm định các giả thuyết thống kê.
D. Dự đoán các giá trị tương lai.
93. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Mức ý nghĩa (alpha) của kiểm định.
94. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị lớn nhất của dữ liệu.
D. Giá trị trung bình của dữ liệu.
95. Khi nào nên sử dụng kiểm định Friedman?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của ba mẫu trở lên liên quan mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
96. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ quan hệ nhân quả giữa hai biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
D. Độ lệch chuẩn của các ước lượng.
97. Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?
A. Mức độ quan hệ nhân quả giữa hai biến.
B. Mức độ liên kết tuyến tính giữa hai biến.
C. Mức độ biến động của một biến.
D. Mức độ phân tán của dữ liệu.
98. Khoảng tin cậy (confidence interval) cho trung bình tổng thể là gì?
A. Một giá trị duy nhất ước lượng trung bình tổng thể.
B. Một khoảng giá trị mà trung bình mẫu chắc chắn nằm trong đó.
C. Một khoảng giá trị mà trung bình tổng thể có khả năng nằm trong đó với một độ tin cậy nhất định.
D. Một khoảng giá trị chứa tất cả các giá trị trong mẫu.
99. Ý nghĩa của mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất mắc sai lầm loại I.
D. Xác suất quan sát được kết quả nếu H0 là đúng.
100. Phân tích hồi quy (regression analysis) được sử dụng để làm gì?
A. Mô tả đặc điểm của một biến duy nhất.
B. Ước lượng giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập.
C. So sánh trung bình của hai nhóm.
D. Đo lường mức độ phân tán của dữ liệu.
101. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu liên quan mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
102. Trong thống kê, ‘median’ (trung vị) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
103. Trong phân tích dữ liệu, mã hóa biến (variable encoding) là gì?
A. Quá trình chuyển đổi biến định tính thành biến định lượng.
B. Quá trình loại bỏ các biến không quan trọng.
C. Quá trình chuẩn hóa dữ liệu.
D. Quá trình làm sạch dữ liệu.
104. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi so sánh phương sai của hai nhóm.
C. Khi muốn nghiên cứu ảnh hưởng của hai yếu tố độc lập lên một biến phụ thuộc.
D. Khi muốn phân tích mối quan hệ giữa hai biến định tính.
105. Sai lầm loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 đúng.
106. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) thể hiện điều gì?
A. Sự thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Độ lệch chuẩn của các ước lượng.
107. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 đúng.
108. Trong phân tích dữ liệu, outlier (giá trị ngoại lệ) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị khác biệt đáng kể so với các giá trị còn lại trong tập dữ liệu.
D. Giá trị nằm giữa của tập dữ liệu.
109. Sai số chuẩn (standard error) của trung bình mẫu ước lượng điều gì?
A. Độ lệch chuẩn của tổng thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số do đo lường không chính xác.
110. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình nhóm đều bằng nhau.
B. Tất cả các phương sai nhóm đều bằng nhau.
C. Có ít nhất một trung bình nhóm khác biệt.
D. Không có sự khác biệt giữa các nhóm.
111. Trong thống kê, phương sai (variance) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị lớn nhất của dữ liệu.
D. Giá trị trung bình của dữ liệu.
112. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của ba nhóm trở lên độc lập mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh phương sai của hai nhóm.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
113. Khi nào nên sử dụng kiểm định t (t-test) độc lập?
A. Khi so sánh trung bình của hai mẫu liên quan.
B. Khi so sánh trung bình của hai mẫu độc lập.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến.
114. Ý nghĩa của bậc tự do (degrees of freedom) trong kiểm định thống kê là gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng biến trong mô hình.
C. Số lượng giá trị trong tính toán cuối cùng có thể thay đổi một cách độc lập.
D. Mức ý nghĩa của kiểm định.
115. Tình huống nào sau đây thích hợp để sử dụng kiểm định Chi-square?
A. So sánh trung bình của hai nhóm độc lập.
B. Phân tích mối quan hệ giữa hai biến định tính.
C. Dự đoán giá trị của một biến liên tục.
D. Đo lường độ phân tán của dữ liệu.
116. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về một khoảng giá trị chung, thường là từ 0 đến 1.
C. Thay đổi phân phối của dữ liệu thành phân phối chuẩn.
D. Tăng độ lớn của dữ liệu.
117. Khi nào nên sử dụng phân tích tương quan hạng Spearman (Spearman’s rank correlation)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi muốn đo lường mối quan hệ phi tuyến tính giữa hai biến.
C. Khi muốn đo lường mối quan hệ giữa hai biến định tính.
D. Khi muốn so sánh trung bình của hai nhóm.
118. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Khi so sánh trung bình của hai mẫu liên quan.
B. Khi so sánh trung bình của hai mẫu độc lập mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
119. Phương pháp lấy mẫu phân tầng (stratified sampling) là gì?
A. Lấy mẫu ngẫu nhiên từ toàn bộ tổng thể.
B. Chia tổng thể thành các nhóm (strata) và lấy mẫu ngẫu nhiên từ mỗi nhóm.
C. Chọn các phần tử dễ tiếp cận nhất.
D. Chọn các phần tử theo một quy tắc nhất định.
120. Trong thống kê, ‘mode’ (mốt) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
121. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α (alpha) đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất mắc lỗi loại I.
C. Công suất kiểm định (power of the test).
D. Kích thước mẫu.
122. Khi nào thì việc sử dụng trung bình (mean) không phải là thước đo tốt để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi dữ liệu có các giá trị ngoại lệ (outliers).
C. Khi dữ liệu có tính đối xứng.
D. Khi kích thước mẫu lớn.
123. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Mức ý nghĩa thống kê được chọn trước.
D. Kích thước của mẫu.
124. Phương pháp nào sau đây được sử dụng để dự báo giá trị tương lai dựa trên dữ liệu chuỗi thời gian?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Mô hình ARIMA (Autoregressive Integrated Moving Average).
D. Kiểm định Chi-bình phương.
125. Khi nào nên sử dụng kiểm định t (t-test)?
A. Khi so sánh trung bình của ba nhóm trở lên.
B. Khi so sánh phương sai của hai nhóm.
C. Khi so sánh trung bình của hai nhóm.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
126. Trong thống kê, ‘phân phối lấy mẫu’ (sampling distribution) là gì?
A. Phân phối của tất cả các giá trị có thể có trong một mẫu.
B. Phân phối của một thống kê (ví dụ: trung bình mẫu) được tính từ tất cả các mẫu có thể có cùng kích thước được lấy từ một tổng thể.
C. Phân phối của dữ liệu trong tổng thể.
D. Phân phối của sai số trong một mô hình hồi quy.
127. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi-bình phương.
128. Trong thống kê mô tả, ‘trung vị’ (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm chính giữa tập dữ liệu đã được sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.
129. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
130. Trong thống kê phi tham số, khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
B. Để so sánh phương sai của hai nhóm.
C. Để phân tích mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến định lượng dựa trên một biến định tính.
131. Trong thống kê, ‘phân phối chuẩn’ (normal distribution) còn được gọi là gì?
A. Phân phối Poisson.
B. Phân phối Bernoulli.
C. Phân phối Gaussian.
D. Phân phối nhị thức.
132. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết null khi nó thực sự đúng.
D. Chấp nhận giả thuyết null khi nó thực sự sai.
133. Trong phân tích rủi ro, ‘giá trị kỳ vọng’ (expected value) là gì?
A. Giá trị lớn nhất có thể xảy ra.
B. Giá trị có khả năng xảy ra cao nhất.
C. Trung bình có trọng số của các kết quả có thể xảy ra, với trọng số là xác suất của chúng.
D. Giá trị nhỏ nhất có thể xảy ra.
134. Trong thống kê suy diễn, khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước tính cho tham số tổng thể.
B. Một khoảng giá trị mà chúng ta tin rằng tham số tổng thể nằm trong đó với một độ tin cậy nhất định.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa thống kê.
135. Trong phân tích hồi quy logistic, biến phụ thuộc có dạng gì?
A. Định lượng liên tục.
B. Định lượng rời rạc.
C. Định tính nhị phân (binary).
D. Định tính đa phân (categorical).
136. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
137. Trong thống kê, ‘hệ số biến thiên’ (coefficient of variation) là gì?
A. Một thước đo về độ lệch của phân phối.
B. Một thước đo về sự tập trung của dữ liệu xung quanh giá trị trung bình.
C. Một thước đo về sự phân tán tương đối của dữ liệu, được tính bằng cách chia độ lệch chuẩn cho giá trị trung bình.
D. Một thước đo về mối quan hệ tuyến tính giữa hai biến.
138. Khi thực hiện một cuộc khảo sát, điều gì quan trọng nhất để đảm bảo tính đại diện của mẫu?
A. Kích thước mẫu lớn.
B. Phương pháp chọn mẫu ngẫu nhiên.
C. Sử dụng bảng câu hỏi phức tạp.
D. Thu thập dữ liệu từ nhiều nguồn khác nhau.
139. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (seasonality).
B. Tính chu kỳ (cyclicality).
C. Xu hướng (trend).
D. Tính ngẫu nhiên (randomness).
140. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn.
B. Giá trị trung bình.
C. Phương sai.
D. Trung vị.
141. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc định lượng và một hoặc nhiều biến độc lập định lượng?
A. Kiểm định Chi-bình phương.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định t.
142. Trong lý thuyết xác suất, sự kiện độc lập là gì?
A. Hai sự kiện không thể xảy ra cùng một lúc.
B. Hai sự kiện có xác suất xảy ra bằng nhau.
C. Sự xảy ra của một sự kiện không ảnh hưởng đến xác suất xảy ra của sự kiện kia.
D. Sự xảy ra của một sự kiện chắc chắn dẫn đến sự xảy ra của sự kiện kia.
143. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh hai nhóm độc lập.
B. Để so sánh hai nhóm liên quan (paired samples) khi dữ liệu không tuân theo phân phối chuẩn.
C. Để phân tích mối quan hệ giữa hai biến định tính.
D. Để so sánh phương sai của hai nhóm.
144. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để phân tích mối quan hệ giữa hai biến định tính.
C. Để dự đoán giá trị của một biến định lượng dựa trên một biến định tính.
D. Để so sánh phương sai của hai nhóm.
145. Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?
A. Từ 0 đến 1.
B. Từ -1 đến 0.
C. Từ -1 đến 1.
D. Từ -∞ đến +∞.
146. Trong thống kê, phương sai (variance) được tính như thế nào?
A. Là căn bậc hai của độ lệch chuẩn.
B. Là trung bình của các độ lệch tuyệt đối so với giá trị trung bình.
C. Là trung bình của các bình phương độ lệch so với giá trị trung bình.
D. Là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất.
147. Khi nào nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để kiểm tra xem một mẫu dữ liệu có tuân theo một phân phối cụ thể hay không.
C. Để phân tích mối quan hệ giữa hai biến định tính.
D. Để so sánh phương sai của hai nhóm.
148. Trong phân tích độ tin cậy, hệ số Cronbach’s alpha đo lường điều gì?
A. Độ ổn định của các phép đo theo thời gian.
B. Mức độ nhất quán nội tại của các mục trong một thang đo.
C. Sự tương đương giữa các phiên bản khác nhau của một thang đo.
D. Mức độ mà một thang đo đo lường những gì nó được cho là đo lường.
149. Ý nghĩa của việc lấy mẫu ngẫu nhiên là gì?
A. Đảm bảo mỗi phần tử trong mẫu có cùng một đặc điểm.
B. Đảm bảo mỗi phần tử trong tổng thể có cơ hội được chọn vào mẫu như nhau.
C. Giảm thiểu kích thước mẫu cần thiết.
D. Tăng độ chính xác của các phép đo trong mẫu.
150. Trong phân tích hồi quy, R-squared (R²) thể hiện điều gì?
A. Mức độ tin cậy của mô hình.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Giá trị p của mô hình.