1. Một nhà nghiên cứu muốn so sánh mức độ hài lòng của sinh viên giữa ba trường đại học khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
2. Trong thống kê, ‘mẫu’ (sample) là gì?
A. Toàn bộ đối tượng nghiên cứu.
B. Một phần của quần thể được chọn để nghiên cứu.
C. Một phương pháp phân tích dữ liệu.
D. Một loại biểu đồ.
3. Trong thống kê, ‘lệch’ (bias) đề cập đến điều gì?
A. Sự khác biệt ngẫu nhiên giữa mẫu và quần thể.
B. Sai số hệ thống dẫn đến ước lượng sai lệch so với giá trị thực.
C. Sự biến động của dữ liệu trong mẫu.
D. Sự vắng mặt của giá trị ngoại lệ.
4. Phương pháp nào sau đây giúp giảm thiểu tác động của các biến nhiễu (confounding variables) trong một nghiên cứu quan sát?
A. Chọn mẫu ngẫu nhiên
B. Phân tích hồi quy đa biến
C. Kiểm định t (t-test)
D. Tính trung bình
5. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với giá trị trung bình (mean) để đo lường xu hướng trung tâm của một tập dữ liệu?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu có dạng rời rạc.
D. Khi dữ liệu có kích thước mẫu lớn.
6. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là alpha (α) thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
C. Xác suất chấp nhận giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
7. Trong thống kê, ‘phân phối chuẩn’ (normal distribution) còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối Gaussian
D. Phân phối mũ
8. Khi phân tích dữ liệu khảo sát, bạn nhận thấy một số người tham gia không trả lời một số câu hỏi. Tình huống này được gọi là gì?
A. Sai số chọn mẫu
B. Lệch phản hồi
C. Dữ liệu bị thiếu (missing data)
D. Đa cộng tuyến
9. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach’s alpha được sử dụng để đo lường điều gì?
A. Tính giá trị của thang đo.
B. Tính ổn định của thang đo theo thời gian.
C. Tính nhất quán nội tại của thang đo.
D. Tính tương đương giữa các phiên bản của thang đo.
10. Khi nào thì sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh trung bình của hai mẫu độc lập có phân phối chuẩn.
B. Khi so sánh trung bình của hai mẫu phụ thuộc có phân phối chuẩn.
C. Khi so sánh hai mẫu độc lập không yêu cầu phân phối chuẩn.
D. Khi so sánh hai mẫu phụ thuộc không yêu cầu phân phối chuẩn.
11. Trong nghiên cứu khoa học xã hội, thuật ngữ ‘giả thuyết’ (hypothesis) dùng để chỉ điều gì?
A. Một sự thật đã được chứng minh.
B. Một câu hỏi nghiên cứu.
C. Một phát biểu dự đoán về mối quan hệ giữa các biến.
D. Một phương pháp thu thập dữ liệu.
12. Trong phân tích bảng chéo (crosstabulation), bạn sử dụng thống kê nào để kiểm tra mối quan hệ giữa hai biến định tính?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hệ số tương quan Pearson
D. Kiểm định Chi-bình phương
13. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) phải có đặc điểm gì?
A. Là biến định lượng liên tục.
B. Là biến định tính có hai giá trị.
C. Là biến định tính có nhiều hơn hai giá trị.
D. Là biến thứ bậc.
14. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Giá trị lớn nhất
C. Độ lệch chuẩn
D. Mode
15. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Sự khác biệt giữa hai biến định tính.
B. Mối quan hệ tuyến tính giữa hai biến định lượng.
C. Mối quan hệ phi tuyến tính giữa hai biến định lượng.
D. Mức độ ảnh hưởng của một biến lên biến khác.
16. Khi bạn muốn ước lượng khoảng tin cậy (confidence interval) cho trung bình của một quần thể, yếu tố nào sau đây ảnh hưởng đến độ rộng của khoảng tin cậy?
A. Giá trị trung bình mẫu
B. Kích thước mẫu và độ lệch chuẩn
C. Mức ý nghĩa (alpha)
D. Tất cả các yếu tố trên
17. Một nhà nghiên cứu muốn tìm hiểu xem có sự khác biệt về mức độ lo lắng giữa sinh viên nam và sinh viên nữ hay không. Thống kê nào phù hợp nhất?
A. Phân tích phương sai (ANOVA)
B. Hồi quy tuyến tính
C. Kiểm định t (t-test) độc lập
D. Kiểm định Chi-bình phương
18. Trong phân tích hồi quy tuyến tính, giá trị R-squared (R²) thể hiện điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa của mô hình.
19. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần ước lượng tham số của quần thể.
20. Khi nào thì sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai mẫu độc lập có phân phối chuẩn.
B. Khi so sánh trung bình của hai mẫu phụ thuộc có phân phối chuẩn.
C. Khi so sánh hai mẫu độc lập không yêu cầu phân phối chuẩn.
D. Khi so sánh hai mẫu phụ thuộc không yêu cầu phân phối chuẩn.
21. Khi thực hiện một cuộc khảo sát, bạn muốn đảm bảo rằng mẫu của bạn đại diện cho quần thể. Phương pháp chọn mẫu nào sau đây tốt nhất để đạt được điều này?
A. Chọn mẫu thuận tiện
B. Chọn mẫu tuyết lăn
C. Chọn mẫu ngẫu nhiên đơn giản
D. Chọn mẫu mục đích
22. Trong một nghiên cứu về mối quan hệ giữa thu nhập và trình độ học vấn, biến nào là biến độc lập?
A. Thu nhập
B. Trình độ học vấn
C. Cả hai biến đều độc lập
D. Không có biến nào độc lập
23. Trong thống kê, ‘phương sai’ (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Độ lệch chuẩn của dữ liệu.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất của dữ liệu.
24. Trong phân tích hồi quy, sai số chuẩn (standard error) của hệ số hồi quy đo lường điều gì?
A. Độ lớn của hệ số hồi quy.
B. Độ chính xác của ước lượng hệ số hồi quy.
C. Mức ý nghĩa của hệ số hồi quy.
D. Tầm quan trọng của biến độc lập.
25. Giả sử bạn có một tập dữ liệu về tuổi và thu nhập của một nhóm người. Bạn muốn tìm hiểu xem có mối quan hệ giữa hai biến này hay không. Thống kê nào sau đây phù hợp nhất?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hệ số tương quan Pearson
D. Kiểm định Chi-bình phương
26. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
D. Ước lượng tham số của một quần thể.
27. Nếu giá trị p (p-value) trong một kiểm định giả thuyết là 0.03 và mức ý nghĩa (alpha) là 0.05, bạn nên đưa ra kết luận gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không có đủ bằng chứng để bác bỏ H0.
D. Cần thêm dữ liệu để đưa ra kết luận.
28. Khi thực hiện kiểm định t (t-test) độc lập, giả định nào sau đây cần được đáp ứng?
A. Phương sai của hai nhóm phải bằng nhau.
B. Dữ liệu phải tuân theo phân phối nhị thức.
C. Các quan sát phải độc lập trong từng nhóm và giữa các nhóm.
D. Kích thước mẫu của hai nhóm phải bằng nhau.
29. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ giữa hai biến định lượng.
30. Trong một nghiên cứu về tác động của một chương trình can thiệp xã hội lên sức khỏe tinh thần của thanh thiếu niên, nhóm nào nhận được chương trình can thiệp?
A. Nhóm đối chứng
B. Nhóm can thiệp
C. Cả hai nhóm
D. Không nhóm nào
31. Khi phân tích dữ liệu khảo sát, một nhà nghiên cứu nhận thấy có nhiều giá trị bị thiếu (missing data). Phương pháp nào sau đây có thể được sử dụng để xử lý vấn đề này?
A. Loại bỏ tất cả các trường hợp có giá trị bị thiếu
B. Thay thế giá trị bị thiếu bằng giá trị trung bình của biến
C. Sử dụng phương pháp ước lượng giá trị bị thiếu (imputation)
D. Tất cả các phương án trên đều có thể sử dụng
32. Một tạp chí khoa học yêu cầu các bài báo phải báo cáo ‘khoảng tin cậy 95%’ cho các ước lượng. Điều này có nghĩa là gì?
A. Có 95% khả năng giá trị thực của tham số nằm trong khoảng tin cậy
B. Nếu lặp lại nghiên cứu nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa giá trị thực của tham số
C. Sai số của ước lượng là 5%
D. Giá trị p nhỏ hơn 0.05
33. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc không tuân theo phân phối chuẩn
B. Khi các biến độc lập có mối tương quan cao với nhau
C. Khi số lượng biến độc lập quá ít
D. Khi mô hình hồi quy không phù hợp với dữ liệu
34. Hệ số Cronbach’s alpha được sử dụng để đánh giá điều gì trong nghiên cứu khoa học xã hội?
A. Độ tin cậy của thang đo
B. Giá trị của các biến
C. Mức độ phù hợp của mô hình
D. Tính hợp lệ của kết quả
35. Một nhà xã hội học muốn nghiên cứu về sự khác biệt trong quan điểm chính trị giữa các nhóm tuổi khác nhau. Thống kê nào sau đây phù hợp để so sánh quan điểm chính trị (được đo bằng thang đo Likert) giữa các nhóm tuổi?
A. Phân tích tương quan
B. Phân tích hồi quy
C. Phân tích phương sai (ANOVA)
D. Kiểm định t độc lập
36. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai nhóm?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi phương sai của quần thể đã biết
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết
D. Khi so sánh trung bình của nhiều hơn hai nhóm
37. Một nhà nghiên cứu muốn xây dựng một mô hình dự đoán khả năng một người sẽ bỏ phiếu cho một ứng cử viên dựa trên các yếu tố như tuổi, thu nhập và trình độ học vấn. Kỹ thuật nào sau đây phù hợp nhất?
A. Phân tích tương quan
B. Phân tích hồi quy logistic
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-square
38. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết không (null hypothesis) là đúng
B. Xác suất quan sát được kết quả kiểm định (hoặc kết quả còn cực đoan hơn) nếu giả thuyết không là đúng
C. Mức ý nghĩa thống kê của kiểm định
D. Kích thước ảnh hưởng của hiệu ứng được kiểm định
39. Một nghiên cứu về ảnh hưởng của chương trình can thiệp tâm lý đến mức độ lo âu của thanh thiếu niên sử dụng thiết kế ‘trước – sau’ (pre-post test). Thống kê nào sau đây phù hợp để so sánh mức độ lo âu trước và sau can thiệp?
A. Kiểm định t độc lập
B. Kiểm định t ghép cặp
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-square
40. Một nhà nghiên cứu muốn xác định xem có sự khác biệt về điểm trung bình môn toán giữa học sinh nam và học sinh nữ hay không, khi biết dữ liệu không tuân theo phân phối chuẩn. Kiểm định nào sau đây phù hợp nhất?
A. Kiểm định t độc lập
B. Kiểm định Mann-Whitney U
C. Kiểm định ANOVA
D. Kiểm định Chi-square
41. Một nhà nghiên cứu giáo dục muốn đánh giá hiệu quả của một phương pháp giảng dạy mới so với phương pháp truyền thống. Thiết kế nghiên cứu nào sau đây là phù hợp nhất để kiểm soát các yếu tố gây nhiễu?
A. Nghiên cứu mô tả
B. Nghiên cứu tương quan
C. Thực nghiệm ngẫu nhiên có nhóm đối chứng
D. Nghiên cứu trường hợp
42. Trong thống kê suy luận, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết không khi nó thực sự sai
B. Bác bỏ giả thuyết không khi nó thực sự đúng
C. Không bác bỏ giả thuyết không khi nó thực sự sai
D. Bác bỏ giả thuyết không khi nó thực sự sai
43. Trong một nghiên cứu về mối quan hệ giữa thu nhập và mức độ hạnh phúc, biến nào là biến độc lập và biến nào là biến phụ thuộc?
A. Thu nhập là biến độc lập, mức độ hạnh phúc là biến phụ thuộc
B. Mức độ hạnh phúc là biến độc lập, thu nhập là biến phụ thuộc
C. Cả hai đều là biến độc lập
D. Cả hai đều là biến phụ thuộc
44. Trong một nghiên cứu về thái độ của người dân đối với biến đổi khí hậu, biến nào sau đây là biến định tính?
A. Nhiệt độ trung bình hàng năm
B. Lượng mưa hàng năm
C. Ý kiến về mức độ nghiêm trọng của biến đổi khí hậu (đồng ý, không đồng ý, không chắc chắn)
D. Mức tiêu thụ năng lượng bình quân đầu người
45. Trong phân tích hồi quy tuyến tính, hệ số tương quan (r) đo lường điều gì?
A. Mức độ ảnh hưởng của biến độc lập lên biến phụ thuộc
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến
C. Sự phù hợp của mô hình hồi quy với dữ liệu
D. Sai số của ước lượng
46. Một nhà tâm lý học sử dụng thang đo trầm cảm Beck (BDI) để đánh giá mức độ trầm cảm của bệnh nhân. Thang đo BDI thuộc loại thang đo nào?
A. Thang đo danh nghĩa
B. Thang đo thứ bậc
C. Thang đo khoảng
D. Thang đo tỷ lệ
47. Trong thống kê, ‘power’ của một kiểm định thống kê (statistical power) thể hiện điều gì?
A. Xác suất mắc sai lầm loại I
B. Xác suất mắc sai lầm loại II
C. Xác suất bác bỏ giả thuyết không khi nó thực sự sai
D. Xác suất chấp nhận giả thuyết không khi nó thực sự đúng
48. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với giá trị trung bình (mean) để đo xu hướng trung tâm của một tập dữ liệu?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi dữ liệu có các giá trị ngoại lệ (outliers)
C. Khi dữ liệu có số lượng quan sát lớn
D. Khi dữ liệu có tính đối xứng
49. Một nhà nghiên cứu thị trường muốn dự đoán doanh số bán hàng của một sản phẩm mới dựa trên chi phí quảng cáo. Kỹ thuật thống kê nào sau đây phù hợp nhất?
A. Phân tích phương sai (ANOVA)
B. Phân tích tương quan
C. Phân tích hồi quy
D. Kiểm định Chi-square
50. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt về mức độ hài lòng với công việc giữa nhân viên làm việc toàn thời gian và nhân viên làm việc bán thời gian hay không. Biến nào sau đây là biến độc lập?
A. Mức độ hài lòng với công việc
B. Loại hình công việc (toàn thời gian/bán thời gian)
C. Thu nhập
D. Tuổi
51. Một nhà nghiên cứu sử dụng phương pháp lấy mẫu phân tầng (stratified sampling). Mục đích của phương pháp này là gì?
A. Giảm thiểu chi phí thu thập dữ liệu
B. Đảm bảo tính đại diện của mẫu cho các nhóm khác nhau trong tổng thể
C. Tăng kích thước mẫu
D. Đơn giản hóa quá trình thu thập dữ liệu
52. Một nhà khoa học chính trị muốn nghiên cứu về mối quan hệ giữa trình độ học vấn và mức độ tham gia bầu cử. Thống kê nào sau đây phù hợp để đo lường mức độ liên kết giữa hai biến này?
A. Hệ số tương quan Pearson
B. Hệ số tương quan Spearman
C. Hệ số Cramer’s V
D. Hệ số hồi quy
53. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Giá trị trung bình
54. Trong phân tích dữ liệu lớn (big data), kỹ thuật nào sau đây thường được sử dụng để khám phá các mẫu và mối quan hệ ẩn trong dữ liệu?
A. Phân tích hồi quy tuyến tính
B. Khai phá dữ liệu (data mining)
C. Kiểm định t
D. Phân tích phương sai (ANOVA)
55. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa các phương sai của các nhóm
B. Sự khác biệt giữa các trung bình của các nhóm
C. Mối quan hệ giữa các biến định tính
D. Mức độ phù hợp của dữ liệu với phân phối chuẩn
56. Một nhà nghiên cứu muốn khảo sát ý kiến của sinh viên về chất lượng dịch vụ thư viện. Phương pháp chọn mẫu nào sau đây phù hợp nhất để đảm bảo tính đại diện của mẫu?
A. Chọn tất cả sinh viên năm cuối
B. Chọn ngẫu nhiên sinh viên từ danh sách đăng ký sử dụng thư viện
C. Chọn sinh viên tình nguyện tham gia khảo sát
D. Chọn sinh viên thường xuyên sử dụng thư viện nhất
57. Một nghiên cứu sử dụng phương pháp phỏng vấn sâu để thu thập dữ liệu về trải nghiệm của người vô gia cư. Phương pháp này thuộc loại nghiên cứu nào?
A. Nghiên cứu định lượng
B. Nghiên cứu định tính
C. Nghiên cứu hỗn hợp
D. Nghiên cứu thực nghiệm
58. Khi nào thì nên sử dụng kiểm định Chi-square (χ²) để phân tích dữ liệu?
A. Khi so sánh trung bình của hai nhóm
B. Khi phân tích mối quan hệ giữa hai biến định lượng
C. Khi phân tích mối quan hệ giữa hai biến định tính
D. Khi dự đoán giá trị của một biến dựa trên biến khác
59. Trong nghiên cứu định tính, phương pháp nào sau đây thường được sử dụng để phân tích dữ liệu văn bản (ví dụ: phỏng vấn, nhật ký)?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích nội dung
D. Phân tích tương quan
60. Một nhà nghiên cứu muốn tìm hiểu về kinh nghiệm của những người đã từng trải qua thiên tai. Phương pháp nghiên cứu nào sau đây phù hợp nhất để thu thập dữ liệu sâu sắc và chi tiết?
A. Khảo sát trực tuyến với câu hỏi đóng
B. Phỏng vấn bán cấu trúc
C. Thực nghiệm trong phòng thí nghiệm
D. Phân tích thống kê dữ liệu thứ cấp
61. Khi nào nên sử dụng kiểm định Mann-Whitney U thay vì kiểm định t Student độc lập?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có thứ bậc
D. Khi phương sai của các nhóm bằng nhau
62. Trong thống kê, thuật ngữ ‘lỗi loại I’ (Type I error) đề cập đến điều gì?
A. Việc chấp nhận giả thuyết null khi nó thực sự sai
B. Việc bác bỏ giả thuyết null khi nó thực sự đúng
C. Việc không bác bỏ giả thuyết null khi nó thực sự sai
D. Việc thu thập dữ liệu không chính xác
63. Ý nghĩa của việc sử dụng phương pháp lấy mẫu ngẫu nhiên (random sampling) là gì?
A. Để đảm bảo mẫu có kích thước lớn
B. Để giảm chi phí thu thập dữ liệu
C. Để đảm bảo mỗi thành viên của quần thể có cơ hội được chọn vào mẫu như nhau, giúp mẫu đại diện hơn cho quần thể
D. Để loại bỏ các ngoại lệ
64. Ý nghĩa của việc sử dụng kiểm định một phía (one-tailed test) so với kiểm định hai phía (two-tailed test) là gì?
A. Kiểm định một phía có độ mạnh cao hơn nếu hướng của hiệu ứng được dự đoán trước
B. Kiểm định hai phía luôn chính xác hơn
C. Kiểm định một phía chỉ được sử dụng khi kích thước mẫu lớn
D. Kiểm định hai phía chỉ được sử dụng khi dữ liệu tuân theo phân phối chuẩn
65. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Xác suất mắc lỗi loại I
C. Xác suất thu được kết quả cực đoan như kết quả quan sát được (hoặc cực đoan hơn) nếu giả thuyết null là đúng
D. Xác suất giả thuyết thay thế là đúng
66. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt về tỷ lệ cử tri ủng hộ một ứng cử viên giữa hai khu vực khác nhau hay không. Phương pháp nào sau đây là phù hợp nhất?
A. Kiểm định t Student
B. Hồi quy tuyến tính
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi bình phương
67. Trong thống kê, ‘bậc tự do’ thường liên quan đến điều gì?
A. Số lượng biến trong một tập dữ liệu
B. Số lượng quan sát trong một mẫu
C. Số lượng giá trị độc lập có thể thay đổi trong một ước tính thống kê
D. Mức ý nghĩa (alpha) của một kiểm định
68. Trong thống kê, ‘phân phối lấy mẫu’ (sampling distribution) là gì?
A. Phân phối của dữ liệu trong một mẫu duy nhất
B. Phân phối của tất cả các giá trị có thể có của một thống kê (ví dụ: trung bình mẫu) từ tất cả các mẫu có thể có cùng kích thước được lấy từ một quần thể
C. Phân phối của dữ liệu trong toàn bộ quần thể
D. Phân phối của các biến độc lập trong một mô hình hồi quy
69. Trong phân tích hồi quy, hệ số R bình phương (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Độ lớn của tác động của biến độc lập lên biến phụ thuộc
D. Mức độ phù hợp của mô hình với dữ liệu
70. Trong phân tích độ tin cậy của thang đo (ví dụ: Cronbach’s alpha), giá trị alpha cao cho thấy điều gì?
A. Thang đo không đáng tin cậy
B. Các mục trong thang đo có sự tương quan cao và đo lường cùng một khái niệm
C. Thang đo có nhiều ngoại lệ
D. Thang đo có phân phối không chuẩn
71. Trong thống kê, ‘lỗi loại II’ (Type II error) đề cập đến điều gì?
A. Việc bác bỏ giả thuyết null khi nó thực sự đúng
B. Việc chấp nhận giả thuyết null khi nó thực sự đúng
C. Việc không bác bỏ giả thuyết null khi nó thực sự sai
D. Việc thu thập dữ liệu không chính xác
72. Khi nào thì thích hợp sử dụng phân tích phương sai (ANOVA)?
A. Khi so sánh trung bình của hai nhóm
B. Khi so sánh phương sai của hai nhóm
C. Khi so sánh trung bình của ba nhóm trở lên
D. Khi phân tích mối quan hệ giữa hai biến định tính
73. Ý nghĩa của việc chuẩn hóa dữ liệu (ví dụ: z-score normalization) là gì?
A. Để dữ liệu tuân theo phân phối chuẩn
B. Để loại bỏ các ngoại lệ
C. Để đưa các biến về cùng một thang đo, giúp so sánh dễ dàng hơn
D. Để tăng kích thước mẫu
74. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau. Phương pháp nào sau đây là phù hợp nhất?
A. Kiểm định t Student
B. Hồi quy tuyến tính
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi bình phương
75. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu so với giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Giá trị lớn nhất
76. Phương pháp nào sau đây giúp giảm số lượng biến trong một tập dữ liệu mà vẫn giữ lại phần lớn thông tin?
A. Hồi quy tuyến tính
B. Phân tích thành phần chính (PCA)
C. Kiểm định t Student
D. Phân tích phương sai (ANOVA)
77. Phương pháp nào sau đây được sử dụng để kiểm tra sự độc lập giữa hai biến định tính?
A. Kiểm định t Student
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi bình phương
D. Hồi quy tuyến tính
78. Trong phân tích hồi quy tuyến tính, sai số chuẩn của hệ số hồi quy ước lượng điều gì?
A. Độ lệch chuẩn của các giá trị dự đoán
B. Độ lệch chuẩn của các giá trị thực tế
C. Độ lệch chuẩn của phân phối lấy mẫu của hệ số hồi quy
D. Giá trị trung bình của sai số
79. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập không tương quan với nhau
B. Khi các biến độc lập tương quan mạnh với nhau
C. Khi biến phụ thuộc không tương quan với các biến độc lập
D. Khi mô hình hồi quy không phù hợp với dữ liệu
80. Trong thống kê, ‘phương sai’ (variance) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Mối quan hệ giữa hai biến
D. Độ tin cậy của một thang đo
81. Trong phân tích dữ liệu, ‘phân phối chuẩn’ (normal distribution) có đặc điểm gì?
A. Dữ liệu tập trung ở hai đầu
B. Dữ liệu phân bố đều
C. Dữ liệu tập trung xung quanh giá trị trung bình và đối xứng
D. Dữ liệu không có giá trị trung bình
82. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến
B. Mức độ phù hợp của mô hình hồi quy
C. Mối quan hệ tuyến tính giữa hai biến
D. Sự khác biệt giữa hai nhóm
83. Trong phân tích dữ liệu khảo sát, trọng số (weight) được sử dụng để làm gì?
A. Để làm cho dữ liệu dễ đọc hơn
B. Để điều chỉnh cho sự khác biệt trong xác suất chọn mẫu, giúp mẫu đại diện hơn cho quần thể
C. Để loại bỏ các ngoại lệ
D. Để tăng kích thước mẫu
84. Khi nào nên sử dụng kiểm định t Student thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi phương sai của quần thể đã biết
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết
D. Khi dữ liệu tuân theo phân phối chuẩn
85. Một nhà nghiên cứu muốn dự đoán điểm thi của sinh viên dựa trên số giờ học. Phương pháp nào sau đây là phù hợp nhất?
A. Kiểm định t Student
B. Hồi quy tuyến tính
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi bình phương
86. Khi nào nên sử dụng trung vị thay vì trung bình số học để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi dữ liệu có nhiều ngoại lệ
C. Khi muốn tính toán nhanh chóng
D. Khi dữ liệu có kích thước mẫu lớn
87. Trong một nghiên cứu, nhà nghiên cứu sử dụng cỡ mẫu nhỏ để ước tính tỷ lệ ủng hộ một chính sách mới trong dân số. Khoảng tin cậy 95% cho tỷ lệ này là (0.45, 0.55). Điều này có nghĩa là gì?
A. 95% dân số ủng hộ chính sách này
B. Có 95% khả năng tỷ lệ ủng hộ thực sự nằm trong khoảng (0.45, 0.55)
C. Nếu lặp lại nghiên cứu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tỷ lệ ủng hộ thực sự của dân số
D. Tỷ lệ ủng hộ chính sách này chắc chắn nằm trong khoảng (0.45, 0.55)
88. Trong nghiên cứu khoa học xã hội, phương pháp nào thường được sử dụng để phân tích mối quan hệ giữa nhiều biến độc lập và một biến phụ thuộc định tính?
A. Hồi quy tuyến tính
B. Hồi quy logistic
C. Phân tích phương sai (ANOVA)
D. Kiểm định t Student
89. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ
D. Khi phương sai của các nhóm bằng nhau
90. Trong phân tích dữ liệu, ‘ngoại lệ’ (outlier) là gì?
A. Một giá trị dữ liệu phổ biến
B. Một giá trị dữ liệu bị thiếu
C. Một giá trị dữ liệu khác biệt đáng kể so với các giá trị khác
D. Một giá trị dữ liệu bằng không
91. Độ tin cậy (reliability) trong nghiên cứu khoa học xã hội đề cập đến điều gì?
A. Khả năng đo lường chính xác khái niệm nghiên cứu
B. Tính nhất quán của kết quả đo lường khi thực hiện lặp lại
C. Khả năng tổng quát hóa kết quả nghiên cứu cho các đối tượng khác
D. Mức độ phù hợp của phương pháp nghiên cứu với mục tiêu nghiên cứu
92. Khi nào thì việc sử dụng trung vị thích hợp hơn so với giá trị trung bình để đo lường xu hướng trung tâm của một tập dữ liệu?
A. Khi dữ liệu có phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ
C. Khi dữ liệu có số lượng quan sát lớn
D. Khi dữ liệu có phương sai nhỏ
93. Thế nào là lỗi loại I trong kiểm định giả thuyết?
A. Bác bỏ giả thuyết không khi nó thực sự đúng
B. Chấp nhận giả thuyết không khi nó thực sự đúng
C. Bác bỏ giả thuyết không khi nó thực sự sai
D. Chấp nhận giả thuyết không khi nó thực sự sai
94. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau đối với kết quả học tập của sinh viên. Nên sử dụng kiểm định nào?
A. Kiểm định t
B. Kiểm định Chi-bình phương
C. Phân tích phương sai (ANOVA)
D. Hồi quy tuyến tính
95. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ quan hệ phi tuyến tính giữa hai biến
B. Mức độ quan hệ nhân quả giữa hai biến
C. Mức độ quan hệ tuyến tính giữa hai biến
D. Sự khác biệt giữa giá trị trung bình của hai biến
96. Trong thống kê mô tả, đại lượng nào được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Giá trị trung bình
97. Trong một nghiên cứu, nhà nghiên cứu muốn tìm hiểu xem có sự khác biệt về mức độ hài lòng công việc giữa nhân viên nam và nhân viên nữ hay không. Nên sử dụng kiểm định nào?
A. Kiểm định Chi-bình phương
B. Kiểm định t cho hai mẫu độc lập
C. Phân tích phương sai (ANOVA)
D. Phân tích hồi quy tuyến tính
98. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập
B. Khi so sánh trung bình của ba hoặc nhiều nhóm độc lập khi giả định về phân phối chuẩn không được đáp ứng
C. Khi phân tích mối quan hệ giữa hai biến định tính
D. Khi dự đoán giá trị của một biến liên tục
99. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc có phân phối không chuẩn
B. Khi các biến độc lập có tương quan cao với nhau
C. Khi số lượng biến độc lập quá ít
D. Khi mô hình hồi quy không phù hợp với dữ liệu
100. Khi nào nên sử dụng kiểm định phi tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi giả định về phân phối không được đáp ứng
D. Khi muốn so sánh trung bình của hai mẫu
101. Phân tích hồi quy tuyến tính được sử dụng để làm gì?
A. Đo lường sự khác biệt giữa các nhóm
B. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập
C. Xác định mối quan hệ nhân quả giữa hai biến
D. Phân loại các đối tượng vào các nhóm khác nhau
102. Loại biểu đồ nào sau đây phù hợp nhất để thể hiện sự phân bố tần suất của một biến số liên tục?
A. Biểu đồ tròn
B. Biểu đồ cột
C. Biểu đồ hộp
D. Biểu đồ tần suất (Histogram)
103. Trong phân tích hồi quy, hệ số hồi quy (regression coefficient) cho biết điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến
B. Sự thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị
C. Giá trị trung bình của biến phụ thuộc
D. Mức độ phân tán của dữ liệu xung quanh đường hồi quy
104. Trong một nghiên cứu, nhà nghiên cứu muốn tìm hiểu xem có mối quan hệ giữa số giờ học và điểm thi của sinh viên hay không. Nên sử dụng loại phân tích nào?
A. Kiểm định t
B. Kiểm định Chi-bình phương
C. Phân tích tương quan
D. Phân tích phương sai (ANOVA)
105. Một nhà xã hội học muốn nghiên cứu mối quan hệ giữa trình độ học vấn (tiểu học, trung học, đại học) và thu nhập (thấp, trung bình, cao) của người dân. Nên sử dụng kiểm định thống kê nào?
A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương
D. Hồi quy tuyến tính
106. Khi nào nên sử dụng kiểm định Chi-bình phương?
A. Khi so sánh trung bình của hai nhóm độc lập
B. Khi phân tích mối quan hệ giữa hai biến định tính
C. Khi dự đoán giá trị của một biến liên tục
D. Khi đo lường độ tương quan giữa hai biến liên tục
107. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc
B. Sai số giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc
C. Giá trị trung bình của biến độc lập
D. Hệ số tương quan giữa các biến độc lập
108. Thế nào là giá trị ngoại lệ (outlier) trong thống kê?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
B. Giá trị nằm ở giữa tập dữ liệu
C. Giá trị rất lớn hoặc rất nhỏ so với các giá trị còn lại trong tập dữ liệu
D. Giá trị trung bình của tập dữ liệu
109. Khi nào thì nên sử dụng kiểm định t (t-test) cho hai mẫu độc lập?
A. Khi so sánh phương sai của hai mẫu
B. Khi so sánh trung bình của hai mẫu độc lập
C. Khi phân tích mối quan hệ giữa hai biến định tính
D. Khi dự đoán giá trị của một biến liên tục
110. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh mẽ của mối quan hệ nhân quả
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Sai số chuẩn của ước lượng
D. Mức ý nghĩa của các biến độc lập
111. Trong kiểm định giả thuyết thống kê, mức ý nghĩa (alpha) thường được sử dụng là 0.05. Điều này có nghĩa là gì?
A. Có 5% khả năng giả thuyết không bị bác bỏ là đúng
B. Có 5% khả năng mắc lỗi loại II
C. Có 5% khả năng bác bỏ giả thuyết không khi nó thực sự đúng
D. Có 5% khả năng chấp nhận giả thuyết không khi nó thực sự sai
112. Trong thống kê, thế nào là cỡ mẫu (sample size)?
A. Số lượng biến trong một nghiên cứu
B. Tổng số đối tượng trong quần thể nghiên cứu
C. Số lượng đối tượng được chọn để tham gia vào nghiên cứu
D. Khoảng tin cậy của kết quả nghiên cứu
113. Trong phân tích thống kê, phương sai (variance) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Mối quan hệ giữa hai biến
D. Độ lệch của phân phối so với phân phối chuẩn
114. Trong thống kê, ‘mức ý nghĩa’ (significance level) thường được ký hiệu bằng ký tự nào?
A. β (beta)
B. α (alpha)
C. σ (sigma)
D. ρ (rho)
115. Thang đo nào sau đây là thang đo định danh (nominal scale)?
A. Nhiệt độ (độ C)
B. Thu nhập (VNĐ)
C. Giới tính (Nam, Nữ)
D. Xếp hạng (nhất, nhì, ba)
116. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết không đúng
B. Xác suất giả thuyết đúng
C. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn nếu giả thuyết không đúng
D. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn nếu giả thuyết đúng
117. Trong phân tích phương sai (ANOVA), yếu tố (factor) là gì?
A. Biến phụ thuộc
B. Biến độc lập định tính
C. Biến độc lập định lượng
D. Sai số ngẫu nhiên
118. Thống kê nào sau đây đo lường độ lệch của phân phối so với phân phối chuẩn?
A. Phương sai
B. Độ lệch chuẩn
C. Độ nhọn (Kurtosis)
D. Độ xiên (Skewness)
119. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai mẫu phụ thuộc
B. Khi so sánh trung bình của hai mẫu độc lập khi giả định về phân phối chuẩn không được đáp ứng
C. Khi phân tích mối quan hệ giữa hai biến định tính
D. Khi dự đoán giá trị của một biến liên tục
120. Giá trị của hệ số tương quan tuyến tính (r) nằm trong khoảng nào?
A. Từ 0 đến 1
B. Từ -1 đến 0
C. Từ -1 đến 1
D. Từ 0 đến vô cực
121. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị phổ biến nhất trong tập dữ liệu
B. Giá trị trung bình của tập dữ liệu
C. Giá trị khác biệt đáng kể so với các giá trị còn lại trong tập dữ liệu
D. Giá trị nằm ở giữa tập dữ liệu
122. Khi thực hiện phân tích hồi quy, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity) giữa các biến độc lập?
A. Mô hình trở nên chính xác hơn
B. Các hệ số hồi quy trở nên không ổn định và khó diễn giải
C. Giá trị R bình phương (R-squared) giảm
D. Sai số chuẩn của ước lượng giảm
123. Phương pháp nào sau đây giúp giảm thiểu sai số do yếu tố chủ quan của người nghiên cứu trong quá trình thu thập dữ liệu?
A. Phỏng vấn sâu
B. Quan sát tham gia
C. Sử dụng bảng hỏi có cấu trúc
D. Nghiên cứu trường hợp
124. Khi nào nên sử dụng phương pháp phân tích phương sai lặp lại (repeated measures ANOVA)?
A. Khi so sánh trung bình của các nhóm độc lập
B. Khi so sánh trung bình của các nhóm liên quan (ví dụ: đo lường nhiều lần trên cùng một đối tượng)
C. Khi phân tích mối quan hệ giữa hai biến định tính
D. Khi dự đoán giá trị của một biến
125. Trong thống kê, thuật ngữ ‘phương sai’ (variance) dùng để chỉ điều gì?
A. Giá trị trung bình của một tập dữ liệu
B. Độ lệch chuẩn của một tập dữ liệu
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong một tập dữ liệu
126. Khi nào nên sử dụng phương pháp lấy mẫu phân tầng (stratified sampling)?
A. Khi quần thể đồng nhất
B. Khi muốn đảm bảo tính đại diện của các nhóm khác nhau trong quần thể
C. Khi không có danh sách đầy đủ của quần thể
D. Khi muốn tiết kiệm chi phí
127. Trong phân tích dữ liệu định tính, khái niệm ‘bão hòa’ (saturation) đề cập đến điều gì?
A. Khi dữ liệu đã được thu thập đầy đủ
B. Khi không còn thông tin mới được tìm thấy trong quá trình thu thập dữ liệu
C. Khi dữ liệu đã được mã hóa hoàn chỉnh
D. Khi kết quả phân tích đã được xác nhận
128. Ưu điểm chính của việc sử dụng phương pháp chọn mẫu ngẫu nhiên đơn giản (simple random sampling) là gì?
A. Dễ thực hiện và đảm bảo tính đại diện cao
B. Tiết kiệm chi phí và thời gian
C. Loại bỏ hoàn toàn sai số chọn mẫu
D. Phù hợp với mọi loại quần thể
129. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. So sánh phương sai của hai nhóm
B. So sánh trung bình của ba nhóm trở lên
C. Đo lường mối quan hệ giữa hai biến
D. Dự đoán giá trị của một biến
130. Khi nào nên sử dụng phương pháp phân tích nhân tố (factor analysis)?
A. Để so sánh trung bình của các nhóm
B. Để giảm số lượng biến và xác định các cấu trúc tiềm ẩn
C. Để dự đoán giá trị của một biến
D. Để kiểm tra mối quan hệ giữa hai biến định tính
131. Khi nào thì nên sử dụng kiểm định t độc lập (independent samples t-test)?
A. Khi so sánh trung bình của hai biến định tính
B. Khi so sánh trung bình của hai nhóm độc lập
C. Khi so sánh trung bình của một nhóm trước và sau can thiệp
D. Khi phân tích mối quan hệ giữa hai biến định lượng
132. Trong phân tích hồi quy tuyến tính, giá trị R bình phương (R-squared) thể hiện điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
C. Sai số chuẩn của ước lượng
D. Mức độ ý nghĩa thống kê của mô hình
133. Thang đo nào sau đây là thang đo định danh (nominal scale)?
A. Nhiệt độ (độ Celsius)
B. Thu nhập (VND)
C. Mức độ hài lòng (1: Rất không hài lòng, 5: Rất hài lòng)
D. Giới tính (Nam, Nữ, Khác)
134. Khi nào nên sử dụng phân tích hồi quy logistic (logistic regression)?
A. Khi biến phụ thuộc là biến định lượng
B. Khi biến độc lập là biến định tính
C. Khi biến phụ thuộc là biến định tính nhị phân (binary)
D. Khi biến độc lập là biến định lượng
135. Trong phân tích dữ liệu định tính, mã hóa (coding) là quá trình như thế nào?
A. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng
B. Sắp xếp dữ liệu theo thứ tự thời gian
C. Gán nhãn hoặc mã cho các đoạn văn bản hoặc hình ảnh để xác định các chủ đề hoặc mẫu
D. Loại bỏ các dữ liệu không liên quan
136. Phương pháp nào sau đây giúp đánh giá mức độ phù hợp của dữ liệu với một mô hình lý thuyết?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Mô hình hóa phương trình cấu trúc (structural equation modeling)
137. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Khi so sánh trung bình của hai nhóm độc lập có phân phối chuẩn
B. Khi so sánh trung bình của hai nhóm độc lập không có phân phối chuẩn
C. Khi so sánh trung bình của hai nhóm liên quan có phân phối chuẩn
D. Khi so sánh trung bình của hai nhóm liên quan không có phân phối chuẩn
138. Trong thống kê suy luận, cỡ mẫu (sample size) có ảnh hưởng như thế nào đến độ chính xác của ước lượng?
A. Cỡ mẫu lớn hơn dẫn đến độ chính xác thấp hơn
B. Cỡ mẫu nhỏ hơn dẫn đến độ chính xác cao hơn
C. Cỡ mẫu lớn hơn dẫn đến độ chính xác cao hơn
D. Cỡ mẫu không ảnh hưởng đến độ chính xác của ước lượng
139. Ý nghĩa của hệ số Cronbach’s alpha là gì?
A. Đo lường tính hợp lệ của công cụ đo lường
B. Đo lường độ tin cậy giữa các người đánh giá
C. Đo lường tính nhất quán nội tại của một thang đo
D. Đo lường độ ổn định của kết quả theo thời gian
140. Trong thống kê mô tả, đại lượng nào được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Giá trị lớn nhất
C. Phương sai
D. Tần số
141. Phương pháp nào sau đây được sử dụng để kiểm tra tính chuẩn của dữ liệu?
A. Kiểm định t (t-test)
B. Biểu đồ tần số (histogram)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Phân tích phương sai (ANOVA)
142. Giá trị p (p-value) trong kiểm định giả thuyết thống kê biểu thị điều gì?
A. Xác suất mà giả thuyết không được chấp nhận là đúng
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng
C. Mức độ quan trọng của kết quả nghiên cứu
D. Sai số loại I
143. Khi dữ liệu không tuân theo phân phối chuẩn, phương pháp nào sau đây thường được sử dụng?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Kiểm định phi tham số (non-parametric test)
D. Hồi quy tuyến tính (linear regression)
144. Phương pháp nào sau đây giúp kiểm tra tính hợp lệ (validity) của một công cụ đo lường?
A. Tính hệ số Cronbach’s alpha
B. So sánh kết quả với một công cụ đo lường đã được chứng minh tính hợp lệ
C. Đo lường độ tin cậy giữa các người đánh giá
D. Kiểm tra tính nhất quán nội tại
145. Sai số loại I (Type I error) xảy ra khi nào?
A. Khi bác bỏ giả thuyết không (null hypothesis) trong khi nó thực sự đúng
B. Khi chấp nhận giả thuyết không (null hypothesis) trong khi nó thực sự sai
C. Khi chọn mẫu không đại diện cho quần thể
D. Khi tính toán sai các thống kê mô tả
146. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Khi so sánh trung bình của hai nhóm
B. Khi phân tích mối quan hệ giữa hai biến định lượng
C. Khi phân tích mối quan hệ giữa hai biến định tính
D. Khi dự đoán giá trị của một biến dựa trên biến khác
147. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến
B. Sự khác biệt giữa trung bình của hai nhóm
C. Mức độ tuyến tính của mối quan hệ giữa hai biến định lượng
D. Mức độ phù hợp của mô hình hồi quy
148. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa nhiều biến độc lập và một biến phụ thuộc định lượng?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hồi quy đa biến (multiple regression)
D. Kiểm định Chi-bình phương (Chi-square test)
149. Độ tin cậy (reliability) của một công cụ đo lường đề cập đến điều gì?
A. Khả năng đo lường chính xác khái niệm cần đo
B. Khả năng cho kết quả nhất quán khi đo lường nhiều lần
C. Khả năng áp dụng cho nhiều đối tượng khác nhau
D. Khả năng dễ sử dụng và dễ hiểu
150. Ý nghĩa của khoảng tin cậy (confidence interval) là gì?
A. Khoảng giá trị mà chúng ta chắc chắn 100% chứa giá trị thực của tham số
B. Khoảng giá trị mà chúng ta ước tính chứa giá trị thực của tham số với một độ tin cậy nhất định
C. Khoảng giá trị mà dữ liệu tập trung nhiều nhất
D. Khoảng giá trị mà chúng ta bác bỏ giả thuyết không