1. Hiệp phương sai (covariance) đo lường điều gì?
A. Độ lệch chuẩn của một biến.
B. Mối quan hệ tuyến tính giữa hai biến.
C. Sự khác biệt giữa hai giá trị trung bình.
D. Xác suất của một sự kiện.
2. Trong một nghiên cứu, bạn muốn kiểm tra xem phương pháp giảng dạy mới có cải thiện điểm số của học sinh hay không. Bạn sẽ sử dụng kiểm định nào?
A. Kiểm định t độc lập.
B. Kiểm định t ghép cặp.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-square.
3. Độ lệch chuẩn là thước đo của cái gì?
A. Giá trị trung bình.
B. Độ phân tán của dữ liệu.
C. Tương quan giữa các biến.
D. Xu hướng trung tâm.
4. Mục đích của việc sử dụng các phép biến đổi dữ liệu (ví dụ: logarit) trong phân tích thống kê là gì?
A. Để tăng kích thước mẫu.
B. Để làm cho dữ liệu phù hợp hơn với các giả định của các phương pháp thống kê.
C. Để giảm độ chính xác của dữ liệu.
D. Để thay đổi giá trị trung bình của dữ liệu.
5. Trong một phân phối chuẩn, bao nhiêu phần trăm dữ liệu nằm trong khoảng một độ lệch chuẩn so với giá trị trung bình?
A. 68%
B. 95%
C. 99.7%
D. 50%
6. Khi nào thì phương pháp bootstrap được sử dụng?
A. Để ước tính các tham số của quần thể khi không có công thức lý thuyết.
B. Để kiểm định giả thuyết về giá trị trung bình.
C. Để tính toán độ lệch chuẩn của một biến.
D. Để tìm kiếm mối quan hệ giữa các biến.
7. Đâu là mục tiêu chính của kiểm định giả thuyết?
A. Xác định mối quan hệ giữa các biến.
B. Đánh giá bằng chứng để ủng hộ hoặc bác bỏ một tuyên bố về một quần thể.
C. Mô tả dữ liệu bằng số liệu thống kê.
D. Dự đoán các giá trị trong tương lai.
8. Trong phân tích thời gian chuỗi, thành phần nào mô tả các biến động lặp đi lặp lại trong một khoảng thời gian cố định?
A. Xu hướng (trend).
B. Chu kỳ (cycle).
C. Tính thời vụ (seasonality).
D. Ngẫu nhiên (random).
9. Trong phân tích ROC (Receiver Operating Characteristic), diện tích dưới đường cong (AUC) đo lường điều gì?
A. Độ chính xác của mô hình phân loại.
B. Khả năng phân biệt giữa các lớp của mô hình.
C. Độ nhạy của mô hình.
D. Độ đặc hiệu của mô hình.
10. Trong kiểm định giả thuyết, đâu là rủi ro mắc phải lỗi loại I?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Đưa ra kết luận sai dựa trên kích thước mẫu nhỏ.
D. Không đưa ra kết luận nào.
11. Ý nghĩa của giá trị p trong kiểm định giả thuyết là gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất thu được kết quả quan sát được, hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
C. Xác suất chấp nhận giả thuyết null.
D. Xác suất mà giả thuyết null là đúng.
12. Giả sử bạn đang thực hiện một kiểm định giả thuyết với mức ý nghĩa 0.05. Giá trị p của bạn là 0.03. Bạn sẽ đưa ra kết luận nào?
A. Bác bỏ giả thuyết null.
B. Chấp nhận giả thuyết null.
C. Không có đủ bằng chứng để bác bỏ giả thuyết null.
D. Kiểm định là vô nghĩa vì giá trị p quá thấp.
13. Trong phân tích hồi quy đa biến, hiện tượng ‘đa cộng tuyến’ (multicollinearity) có nghĩa là gì?
A. Các biến độc lập không có mối quan hệ với nhau.
B. Các biến độc lập có tương quan cao với nhau.
C. Biến phụ thuộc không có mối quan hệ với các biến độc lập.
D. Mô hình không phù hợp với dữ liệu.
14. Hàm mật độ xác suất (PDF) của một biến ngẫu nhiên liên tục biểu diễn điều gì?
A. Xác suất của một giá trị cụ thể.
B. Xác suất của một khoảng giá trị.
C. Giá trị trung bình của biến ngẫu nhiên.
D. Độ lệch chuẩn của biến ngẫu nhiên.
15. Trong thống kê mô tả, giá trị trung vị (median) là gì?
A. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
B. Giá trị nằm ở giữa của tập dữ liệu đã được sắp xếp.
C. Tổng của tất cả các giá trị chia cho số lượng giá trị.
D. Độ phân tán của dữ liệu.
16. Đâu là một ví dụ về dữ liệu rời rạc?
A. Chiều cao của một người.
B. Cân nặng của một người.
C. Số lượng xe hơi trong một bãi đậu xe.
D. Nhiệt độ phòng.
17. Trong phân tích biến đổi Fourier (Fourier transform), mục tiêu chính là gì?
A. Phân tích dữ liệu trong miền thời gian.
B. Phân tích dữ liệu trong miền tần số.
C. Tìm kiếm mối quan hệ giữa các biến.
D. Xác định các giá trị trung bình.
18. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. So sánh giá trị trung bình của hai nhóm.
B. Xác định mối quan hệ giữa hai biến định lượng.
C. So sánh giá trị trung bình của ba hoặc nhiều nhóm.
D. Đánh giá mức độ phân tán của dữ liệu.
19. Đâu là một ví dụ về biến phân loại?
A. Chiều cao.
B. Cân nặng.
C. Màu sắc.
D. Thu nhập.
20. Độ tin cậy của một khoảng tin cậy được biểu thị như thế nào?
A. Mức ý nghĩa (alpha).
B. Giá trị p.
C. Tỷ lệ phần trăm.
D. Độ lệch chuẩn.
21. Khi nào thì một kiểm định hai đuôi (two-tailed test) được sử dụng?
A. Khi bạn chỉ quan tâm đến việc xác định xem một thông số khác biệt theo một hướng cụ thể.
B. Khi bạn không có giả thuyết về hướng của sự khác biệt.
C. Khi bạn muốn tăng sức mạnh của kiểm định.
D. Khi bạn có một mẫu lớn.
22. Trong thống kê, khái niệm ‘mẫu’ (sample) đề cập đến điều gì?
A. Toàn bộ nhóm cá nhân, đối tượng hoặc sự kiện mà bạn quan tâm.
B. Một tập hợp con của dữ liệu được chọn từ một quần thể.
C. Giá trị trung bình của một quần thể.
D. Một phương pháp thu thập dữ liệu.
23. Trong thống kê, khái niệm ‘quần thể’ (population) đề cập đến điều gì?
A. Một tập hợp con của dữ liệu được chọn từ một mẫu.
B. Toàn bộ nhóm cá nhân, đối tượng hoặc sự kiện mà bạn quan tâm.
C. Giá trị trung bình của một mẫu.
D. Một phương pháp thu thập dữ liệu.
24. Mục tiêu của phân tích cụm (cluster analysis) là gì?
A. Dự đoán giá trị của một biến dựa trên các biến khác.
B. Phân chia các đối tượng thành các nhóm dựa trên sự tương đồng của chúng.
C. Xác định mối quan hệ nhân quả giữa các biến.
D. Đánh giá mức độ phù hợp của một mô hình.
25. Kiểm định Chi-square được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa hai giá trị trung bình.
B. Kiểm định mối quan hệ giữa các biến phân loại.
C. Kiểm định tính phù hợp của dữ liệu với phân phối chuẩn.
D. Kiểm định giả thuyết về hệ số hồi quy trong mô hình tuyến tính.
26. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, thể hiện phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Giá trị trung bình của biến phụ thuộc.
C. Độ lệch chuẩn của các hệ số hồi quy.
D. Mức độ tương quan giữa các biến độc lập.
27. Trong một biểu đồ hộp (boxplot), hộp thể hiện điều gì?
A. Toàn bộ phạm vi của dữ liệu.
B. Khoảng tứ phân vị (IQR).
C. Giá trị trung bình.
D. Các điểm ngoại lệ.
28. Đâu là một ứng dụng phổ biến của thống kê suy luận?
A. Tính toán giá trị trung bình của một tập dữ liệu.
B. Ước tính các tham số của quần thể dựa trên dữ liệu mẫu.
C. Tạo biểu đồ trực quan hóa dữ liệu.
D. Tính toán tần suất của các giá trị trong một tập dữ liệu.
29. Đâu là giả định quan trọng nhất của phân tích hồi quy tuyến tính?
A. Các biến độc lập phải độc lập với nhau.
B. Mối quan hệ giữa các biến là phi tuyến tính.
C. Sai số có phân phối chuẩn và phương sai không đổi.
D. Kích thước mẫu phải nhỏ.
30. Trong phân tích hồi quy, điều gì biểu thị hệ số chặn (intercept)?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình.
D. Mức độ tương quan giữa các biến.
31. Trong kiểm định giả thuyết, sai số loại I là gì?
A. Chấp nhận sai giả thuyết null.
B. Bác bỏ đúng giả thuyết null.
C. Chấp nhận đúng giả thuyết null.
D. Bác bỏ sai giả thuyết null.
32. Mục tiêu chính của kiểm định giả thuyết là gì?
A. Để chứng minh một giả thuyết là đúng.
B. Để bác bỏ một giả thuyết null.
C. Để xác định phân phối của dữ liệu.
D. Để tính toán các giá trị trung bình.
33. Phân tích tương quan (correlation analysis) được sử dụng để làm gì?
A. Để so sánh giá trị trung bình của hai nhóm.
B. Để đo lường mức độ liên kết tuyến tính giữa hai biến số.
C. Để dự đoán giá trị của một biến số dựa trên các biến số khác.
D. Để kiểm tra sự khác biệt giữa các nhóm.
34. Trong kiểm định Chi-square, bậc tự do (degrees of freedom) được tính như thế nào?
A. Tổng số quan sát.
B. (Số hàng – 1) * (Số cột – 1).
C. Số lượng biến độc lập.
D. Số lượng biến phụ thuộc.
35. Trong một kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở mức nào?
A. 0.10
B. 0.01
C. 0.05
D. Tất cả các đáp án trên
36. Khi nào thì sử dụng kiểm định t-test cho hai mẫu độc lập?
A. Khi so sánh giá trị trung bình của hai nhóm độc lập và dữ liệu tuân theo phân phối chuẩn.
B. Khi so sánh giá trị trung bình của hai nhóm phụ thuộc.
C. Khi so sánh phương sai của hai nhóm.
D. Khi có nhiều hơn hai nhóm để so sánh.
37. Giá trị p-value cho biết điều gì?
A. Xác suất để bác bỏ giả thuyết null.
B. Xác suất quan sát được kết quả mẫu hoặc kết quả khắc nghiệt hơn, giả sử giả thuyết null là đúng.
C. Mức độ tin cậy của kết quả.
D. Tỷ lệ sai số loại II.
38. Trong phân tích phương sai (ANOVA), yếu tố (factor) là gì?
A. Biến phụ thuộc.
B. Biến độc lập phân loại (categorical variable).
C. Giá trị trung bình của một nhóm.
D. Sai số trong dữ liệu.
39. Khi nào thì sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh giá trị trung bình của hai nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
B. Khi so sánh giá trị trung bình của hai nhóm phụ thuộc và dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh phương sai của hai nhóm.
D. Khi có nhiều hơn hai nhóm để so sánh.
40. Điều gì là mục đích của phân tích hồi quy?
A. Để mô tả mối quan hệ giữa hai hoặc nhiều biến số.
B. Để so sánh giá trị trung bình của hai nhóm.
C. Để xác định phân phối của một biến số.
D. Để tính toán phương sai.
41. Kiểm định Levene được sử dụng để làm gì?
A. Kiểm tra tính chuẩn của dữ liệu.
B. Kiểm tra tính đồng nhất phương sai.
C. Kiểm tra sự khác biệt giữa các giá trị trung bình.
D. Kiểm tra sự độc lập của các biến.
42. Trong phân tích phương sai (ANOVA), giá trị F-statistic được sử dụng để làm gì?
A. Đo lường mức độ tương quan giữa các biến số.
B. Kiểm định sự khác biệt giữa các phương sai của các nhóm.
C. Kiểm định sự khác biệt giữa các giá trị trung bình của các nhóm.
D. Xác định mức độ phù hợp của mô hình.
43. Trong phân tích hồi quy, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình.
D. Sai số trong mô hình.
44. Trong một kiểm định giả thuyết, giá trị tới hạn (critical value) là gì?
A. Giá trị mà tại đó bạn bác bỏ giả thuyết null.
B. Giá trị trung bình của dữ liệu.
C. Giá trị của biến độc lập.
D. Giá trị của biến phụ thuộc.
45. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, thể hiện phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Mức độ tin cậy của các hệ số hồi quy, giá trị càng cao thì càng tin cậy.
C. Mức độ tương quan giữa các biến độc lập trong mô hình.
D. Sai số chuẩn của ước lượng hệ số hồi quy.
46. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
C. Hệ số hồi quy.
D. Giá trị trung bình của biến phụ thuộc.
47. Trong phân tích phương sai (ANOVA), sự khác biệt giữa các nhóm được đánh giá như thế nào?
A. Bằng cách so sánh phương sai giữa các nhóm với phương sai trong các nhóm.
B. Bằng cách kiểm tra độ tương quan giữa các nhóm.
C. Bằng cách tính toán các giá trị trung bình của các nhóm.
D. Bằng cách xem xét giá trị p-value của các nhóm.
48. Trong kiểm định Chi-square, giả thuyết null thường phát biểu điều gì?
A. Có sự khác biệt đáng kể giữa các nhóm.
B. Không có mối quan hệ giữa các biến phân loại.
C. Các biến số có phân phối chuẩn.
D. Các biến số có phương sai bằng nhau.
49. Trong phân tích hồi quy, sai số chuẩn (standard error) của hệ số hồi quy cho biết điều gì?
A. Mức độ phù hợp của mô hình.
B. Độ lệch chuẩn của hệ số hồi quy.
C. Giá trị dự đoán của biến phụ thuộc.
D. Mức độ tương quan giữa các biến.
50. Kiểm định Kolmogorov-Smirnov (K-S) được sử dụng để làm gì?
A. Kiểm tra tính chuẩn của dữ liệu.
B. Kiểm tra sự khác biệt giữa các giá trị trung bình.
C. Kiểm tra sự độc lập của các biến.
D. Kiểm tra tính đồng nhất phương sai.
51. Điều gì là quan trọng nhất khi lựa chọn một mô hình hồi quy?
A. Giá trị R-squared phải cao.
B. Các giả định của mô hình hồi quy phải được đáp ứng.
C. Số lượng biến độc lập phải lớn.
D. Giá trị p-value của tất cả các biến độc lập phải nhỏ.
52. Trong phân tích hồi quy, điều gì có thể gây ra hiện tượng tự tương quan (autocorrelation)?
A. Các biến độc lập tương quan cao với nhau.
B. Dữ liệu được thu thập theo thời gian.
C. Sai số trong dữ liệu.
D. Sự hiện diện của nhiều biến độc lập.
53. Giả sử bạn có một tập dữ liệu về doanh thu bán hàng và chi phí quảng cáo. Bạn chạy một phân tích hồi quy và nhận được p-value của hệ số hồi quy cho chi phí quảng cáo là 0.03. Điều này có ý nghĩa gì?
A. Chi phí quảng cáo không có tác động đến doanh thu bán hàng.
B. Có bằng chứng mạnh mẽ để bác bỏ giả thuyết null rằng chi phí quảng cáo không có tác động đến doanh thu bán hàng.
C. Mối quan hệ giữa chi phí quảng cáo và doanh thu bán hàng là không tuyến tính.
D. Mô hình hồi quy không phù hợp với dữ liệu.
54. Kiểm định Shapiro-Wilk được sử dụng để làm gì?
A. Kiểm định tính chuẩn của dữ liệu.
B. Kiểm định sự khác biệt giữa các giá trị trung bình.
C. Kiểm định sự độc lập của các biến.
D. Kiểm định tính đồng nhất phương sai.
55. Điều gì xảy ra nếu bạn có một mẫu dữ liệu nhỏ và muốn so sánh giá trị trung bình của hai nhóm?
A. Bạn không thể thực hiện kiểm định thống kê.
B. Bạn nên sử dụng kiểm định t-test.
C. Bạn nên sử dụng phân tích phương sai (ANOVA).
D. Bạn nên tăng kích thước mẫu.
56. Điều gì xảy ra nếu bạn không đáp ứng các giả định của phân tích hồi quy?
A. Kết quả hồi quy sẽ luôn chính xác.
B. Bạn không cần quan tâm đến các giả định.
C. Kết quả hồi quy có thể không đáng tin cậy.
D. Bạn nên tăng kích thước mẫu.
57. Trong phân tích phương sai (ANOVA), giả thuyết null thường phát biểu điều gì?
A. Có sự khác biệt đáng kể giữa các giá trị trung bình của các nhóm.
B. Không có sự khác biệt đáng kể giữa các giá trị trung bình của các nhóm.
C. Các nhóm có phương sai bằng nhau.
D. Các nhóm có phân phối chuẩn.
58. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Sự hiện diện của nhiều biến độc lập trong mô hình.
B. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
C. Mối quan hệ giữa biến độc lập và biến phụ thuộc là phi tuyến tính.
D. Sai số trong dữ liệu.
59. Khi nào thì sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh giá trị trung bình của hai nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
B. Khi so sánh giá trị trung bình của hai nhóm phụ thuộc.
C. Khi so sánh phương sai của hai nhóm.
D. Khi có nhiều hơn hai nhóm để so sánh.
60. Trong phân tích hồi quy, mục đích của việc kiểm tra các phần dư (residuals) là gì?
A. Để kiểm tra xem các biến độc lập có tương quan với nhau hay không.
B. Để đánh giá sự phù hợp của mô hình.
C. Để kiểm tra các giả định của mô hình hồi quy.
D. Để tìm giá trị trung bình của biến phụ thuộc.
61. Mục đích chính của phân tích hồi quy logistic là gì?
A. Dự đoán giá trị liên tục của một biến phụ thuộc.
B. Phân loại các quan sát vào các nhóm khác nhau dựa trên các biến độc lập.
C. Phân tích mối quan hệ giữa các biến định tính.
D. Đo lường mức độ tương quan giữa các biến.
62. Trong kiểm định giả thuyết, sức mạnh (power) của một kiểm định đại diện cho điều gì?
A. Xác suất chấp nhận giả thuyết null khi nó đúng.
B. Xác suất bác bỏ giả thuyết null khi nó sai.
C. Xác suất để có được kết quả quan sát được, giả sử giả thuyết null là đúng.
D. Mức độ phù hợp của mô hình.
63. Trong phân tích hồi quy, ‘phần dư’ (residual) đại diện cho điều gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sự khác biệt giữa giá trị quan sát được và giá trị dự đoán.
C. Mức độ tương quan giữa các biến.
D. Giá trị trung bình của dữ liệu.
64. Trong một kiểm định t-test, điều gì xảy ra nếu giá trị t-statistic lớn hơn giá trị tới hạn?
A. Chấp nhận giả thuyết null.
B. Bác bỏ giả thuyết null.
C. Không đủ thông tin để đưa ra kết luận.
D. Mô hình không phù hợp.
65. Trong phân tích phương sai (ANOVA) một chiều, bạn muốn so sánh giá trị trung bình của bao nhiêu nhóm?
A. Hai nhóm.
B. Ba nhóm trở lên.
C. Chỉ một nhóm.
D. Một nhóm và một biến độc lập.
66. Trong phân tích cụm (cluster analysis), điều gì xác định sự khác biệt giữa các cụm?
A. Khoảng cách giữa các điểm dữ liệu trong cùng một cụm.
B. Khoảng cách giữa các điểm dữ liệu trong các cụm khác nhau.
C. Giá trị trung bình của dữ liệu.
D. Độ lệch chuẩn của dữ liệu.
67. Mục tiêu của kiểm định Kolmogorov-Smirnov là gì?
A. Kiểm tra xem một mẫu dữ liệu có tuân theo một phân phối xác định hay không.
B. So sánh giá trị trung bình của hai nhóm.
C. Đo lường mối quan hệ giữa hai biến định tính.
D. Dự đoán giá trị trong tương lai.
68. Giả sử một nghiên cứu hồi quy tìm thấy R-squared là 0.85. Điều này có ý nghĩa gì?
A. 85% sự thay đổi của biến độc lập được giải thích bởi các biến phụ thuộc.
B. 85% sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Có một mối quan hệ nhân quả mạnh mẽ giữa các biến.
D. Mô hình không phù hợp với dữ liệu.
69. Trong phân tích thời gian chuỗi, khái niệm ‘tính tự tương quan’ (autocorrelation) đề cập đến điều gì?
A. Mối quan hệ giữa các giá trị của một biến tại các thời điểm khác nhau.
B. Sự thay đổi ngẫu nhiên trong dữ liệu.
C. Xu hướng tăng hoặc giảm trong dữ liệu.
D. Sự khác biệt giữa các biến độc lập.
70. Trong phân tích hồi quy, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ tương quan giữa các biến.
D. Giá trị trung bình của dữ liệu.
71. Ý nghĩa của ‘độ tin cậy’ (reliability) trong thống kê là gì?
A. Mức độ mà một phép đo đo lường chính xác những gì nó dự định đo.
B. Mức độ mà một phép đo cung cấp các kết quả nhất quán.
C. Khả năng khái quát hóa kết quả từ mẫu đến tổng thể.
D. Sự khác biệt giữa các nhóm.
72. Trong phân tích hồi quy, điều gì xảy ra nếu bạn thêm một biến độc lập không có ý nghĩa thống kê vào mô hình?
A. Mô hình sẽ trở nên chính xác hơn.
B. Mô hình có thể trở nên phức tạp hơn mà không cải thiện khả năng dự đoán.
C. R-squared sẽ giảm.
D. Các hệ số hồi quy sẽ thay đổi đáng kể.
73. Giả sử trong một phân tích ANOVA, giá trị p là 0.01. Bạn sẽ kết luận gì?
A. Không có sự khác biệt có ý nghĩa thống kê giữa các nhóm.
B. Có sự khác biệt có ý nghĩa thống kê giữa các nhóm.
C. Mô hình không phù hợp.
D. Giá trị trung bình của các nhóm bằng nhau.
74. Ý nghĩa của ‘giả thuyết null’ trong kiểm định giả thuyết là gì?
A. Giả thuyết mà nhà nghiên cứu muốn chứng minh là đúng.
B. Giả thuyết mà nhà nghiên cứu muốn bác bỏ.
C. Giả thuyết về sự khác biệt giữa các nhóm.
D. Giả thuyết về mối quan hệ giữa các biến.
75. Ý nghĩa của ‘phân phối chuẩn’ (normal distribution) trong thống kê là gì?
A. Một phân phối mà dữ liệu được phân bố đều.
B. Một phân phối đối xứng, có hình chuông, phổ biến trong tự nhiên.
C. Một phân phối mà dữ liệu có xu hướng về một giá trị duy nhất.
D. Một phân phối mà dữ liệu không có tính đối xứng.
76. Mục tiêu chính của phân tích nhân tố (factor analysis) là gì?
A. Để giảm số lượng biến trong một tập dữ liệu bằng cách nhóm các biến tương tự lại với nhau.
B. Để dự đoán giá trị của một biến phụ thuộc.
C. Để xác định mối quan hệ nhân quả giữa các biến.
D. Để kiểm định giả thuyết về sự khác biệt giữa các nhóm.
77. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, phản ánh tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
B. Giá trị trung bình của biến phụ thuộc.
C. Độ lệch chuẩn của các hệ số hồi quy.
D. Mức độ tương quan giữa các biến độc lập.
78. Trong phân tích thời gian chuỗi, phương pháp ‘trung bình trượt’ (moving average) được sử dụng để làm gì?
A. Để loại bỏ xu hướng và tính thời vụ từ dữ liệu.
B. Để dự đoán giá trị trong tương lai.
C. Để xác định các điểm ngoại lệ.
D. Để tính toán độ tin cậy.
79. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) đại diện cho điều gì?
A. Xác suất bác bỏ giả thuyết null khi nó là đúng.
B. Xác suất chấp nhận giả thuyết null khi nó là sai.
C. Xác suất để có được kết quả quan sát được, giả sử giả thuyết null là đúng.
D. Mức độ phù hợp của mô hình.
80. Trong kiểm định chi bình phương, bạn đang kiểm tra điều gì?
A. Sự khác biệt giữa các giá trị trung bình của các nhóm.
B. Mối quan hệ giữa hai biến định tính.
C. Mức độ phù hợp của mô hình.
D. Tính tự tương quan trong dữ liệu.
81. Trong một kiểm định giả thuyết, ‘sai lầm loại II’ (Type II error) là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Giá trị trung bình của dữ liệu.
D. Độ lệch chuẩn của dữ liệu.
82. Trong thống kê, ‘điểm ngoại lệ’ (outlier) là gì?
A. Một giá trị nằm gần giá trị trung bình.
B. Một giá trị nằm cách xa các giá trị khác trong tập dữ liệu.
C. Giá trị trung bình của dữ liệu.
D. Giá trị phổ biến nhất trong dữ liệu.
83. Trong phân tích hồi quy, điều gì xảy ra nếu có sự hiện diện của các giá trị ngoại lệ (outliers) trong dữ liệu?
A. Các hệ số hồi quy sẽ không bị ảnh hưởng.
B. Các hệ số hồi quy có thể bị ảnh hưởng đáng kể.
C. R-squared sẽ luôn tăng.
D. Mô hình sẽ trở nên chính xác hơn.
84. Ý nghĩa của khái niệm ‘bậc tự do’ (degrees of freedom) trong thống kê là gì?
A. Số lượng quan sát trong một mẫu.
B. Số lượng thông tin độc lập có sẵn để ước tính một tham số.
C. Giá trị trung bình của dữ liệu.
D. Độ lệch chuẩn của dữ liệu.
85. Trong phân tích cụm, phương pháp ‘phân cụm phân cấp’ (hierarchical clustering) khác với ‘phân cụm K-means’ (K-means clustering) như thế nào?
A. Phân cụm phân cấp yêu cầu bạn xác định trước số lượng cụm.
B. Phân cụm K-means tạo ra các cụm phân cấp.
C. Phân cụm phân cấp không yêu cầu bạn xác định trước số lượng cụm và thường tạo ra một sơ đồ phân cấp (dendrogram).
D. Phân cụm K-means nhanh hơn phân cụm phân cấp.
86. Trong phân tích phương sai (ANOVA), giá trị p (p-value) được sử dụng để làm gì?
A. Đánh giá mức độ phù hợp của mô hình.
B. Xác định mức độ tương quan giữa các biến.
C. Kiểm định giả thuyết về sự khác biệt giữa các giá trị trung bình của các nhóm.
D. Tính toán các hệ số hồi quy.
87. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Sự hiện diện của các biến độc lập không liên quan đến biến phụ thuộc.
B. Mối quan hệ mạnh mẽ giữa các biến độc lập.
C. Sự xuất hiện của các giá trị ngoại lệ trong dữ liệu.
D. Mô hình không phù hợp với dữ liệu.
88. Trong phân tích phương sai (ANOVA), ‘giá trị F’ (F-statistic) được sử dụng để làm gì?
A. Đo lường mức độ tương quan giữa các biến.
B. Kiểm định sự khác biệt giữa các giá trị trung bình của các nhóm.
C. Dự đoán giá trị trong tương lai.
D. Tính toán các hệ số hồi quy.
89. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mối quan hệ tuyến tính giữa hai biến liên tục.
C. Sự khác biệt giữa các nhóm.
D. Độ lệch chuẩn của dữ liệu.
90. Trong kiểm định giả thuyết, ‘giá trị tới hạn’ (critical value) là gì?
A. Giá trị mà tại đó chúng ta bác bỏ giả thuyết null.
B. Giá trị trung bình của dữ liệu.
C. Mức độ tương quan giữa các biến.
D. Giá trị mà chúng ta chấp nhận giả thuyết null.
91. Trong phân tích dữ liệu, mục đích của việc sử dụng phương pháp giảm chiều (dimensionality reduction) là gì?
A. Để tăng kích thước mẫu.
B. Để tăng độ phức tạp của mô hình.
C. Để giảm số lượng biến trong dữ liệu, loại bỏ thông tin dư thừa và cải thiện hiệu suất mô hình.
D. Để tìm kiếm các giá trị ngoại lai.
92. Trong phân tích hồi quy, điều gì xảy ra nếu bạn sử dụng một mô hình quá phức tạp (overfitting) cho dữ liệu?
A. Mô hình sẽ dự đoán tốt trên cả dữ liệu huấn luyện và dữ liệu mới.
B. Mô hình sẽ dự đoán tốt trên dữ liệu huấn luyện nhưng không tốt trên dữ liệu mới.
C. Giá trị R-squared sẽ luôn thấp.
D. Các hệ số hồi quy sẽ không có ý nghĩa thống kê.
93. Ý nghĩa của khoảng tin cậy (confidence interval) trong thống kê là gì?
A. Khoảng giá trị mà giá trị thực của tham số tổng thể có khả năng nằm trong đó.
B. Khoảng giá trị của dữ liệu mẫu.
C. Xác suất để một giá trị nằm trong khoảng đó là chính xác.
D. Xác suất để bác bỏ giả thuyết null.
94. Trong phân tích dữ liệu, ý nghĩa của việc chuẩn hóa dữ liệu là gì?
A. Để tăng kích thước mẫu.
B. Để giảm thiểu tác động của các giá trị ngoại lai.
C. Để đảm bảo các biến có cùng thang đo, giúp so sánh dễ dàng hơn.
D. Để loại bỏ các biến không quan trọng.
95. Trong phân tích dữ liệu, mục đích của việc sử dụng phương pháp Bootstrap là gì?
A. Để tăng kích thước mẫu.
B. Để ước lượng độ không đảm bảo của các ước lượng thống kê (ví dụ: sai số chuẩn).
C. Để loại bỏ các giá trị ngoại lai.
D. Để tìm kiếm các mối quan hệ nhân quả.
96. Trong kiểm định giả thuyết, lỗi loại II (Type II error) là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Chấp nhận giả thuyết null khi nó đúng.
D. Bác bỏ giả thuyết null khi nó sai.
97. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) đại diện cho điều gì?
A. Xác suất chấp nhận giả thuyết null.
B. Xác suất bác bỏ giả thuyết null khi nó đúng.
C. Xác suất để quan sát được kết quả mẫu.
D. Mức độ tin cậy của kết quả kiểm định.
98. Trong phân tích dữ liệu, ý nghĩa của việc sử dụng các phép biến đổi dữ liệu (data transformation) là gì?
A. Để tăng kích thước mẫu.
B. Để giảm thiểu tác động của các giá trị ngoại lai, làm cho dữ liệu gần với phân phối chuẩn hơn, hoặc điều chỉnh mối quan hệ giữa các biến.
C. Để loại bỏ các biến không quan trọng.
D. Để tăng độ phức tạp của mô hình.
99. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Các biến độc lập không có mối quan hệ với biến phụ thuộc.
B. Các biến độc lập có mối quan hệ mạnh mẽ với nhau.
C. Có quá nhiều biến độc lập trong mô hình.
D. Biến phụ thuộc là biến định tính.
100. Trong phân tích chuỗi thời gian, phương pháp ARIMA là gì?
A. Một phương pháp phân tích phương sai.
B. Một mô hình dự báo chuỗi thời gian, kết hợp các thành phần tự hồi quy (AR), tích phân (I) và trung bình trượt (MA).
C. Một phương pháp phân tích cụm.
D. Một phương pháp phân tích tương quan.
101. Trong phân tích dữ liệu, ý nghĩa của việc sử dụng các phương pháp khám phá dữ liệu (EDA – Exploratory Data Analysis) là gì?
A. Để xây dựng các mô hình dự báo.
B. Để hiểu rõ hơn về dữ liệu, phát hiện các mẫu, giá trị ngoại lai và làm sạch dữ liệu.
C. Để kiểm định các giả thuyết.
D. Để tự động hóa quá trình phân tích.
102. Mục tiêu chính của việc sử dụng các phương pháp làm mịn trong phân tích chuỗi thời gian là gì?
A. Loại bỏ thành phần ngẫu nhiên và làm nổi bật xu hướng và chu kỳ.
B. Tăng cường thành phần ngẫu nhiên.
C. Giảm độ chính xác của dự báo.
D. Phân tích dữ liệu theo mùa.
103. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, thể hiện phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Mức độ tin cậy của các hệ số hồi quy, giá trị càng cao thì càng tin cậy.
C. Mức độ tương quan giữa các biến độc lập trong mô hình.
D. Giá trị trung bình của biến phụ thuộc.
104. Trong phân tích dữ liệu, ý nghĩa của việc sử dụng các phương pháp xử lý giá trị thiếu (missing value imputation) là gì?
A. Để tăng kích thước mẫu.
B. Để loại bỏ các giá trị ngoại lai.
C. Để thay thế các giá trị bị thiếu bằng các giá trị ước tính, giúp phân tích dữ liệu đầy đủ hơn.
D. Để tìm kiếm các mối quan hệ nhân quả.
105. Trong phân tích chuỗi thời gian, thành phần ‘tính thời vụ’ (seasonality) biểu thị điều gì?
A. Sự thay đổi dài hạn trong dữ liệu.
B. Sự biến động ngẫu nhiên không thể dự đoán trước.
C. Sự biến động theo chu kỳ lặp lại với một khoảng thời gian cố định.
D. Sự thay đổi không liên tục trong dữ liệu.
106. Trong phân tích chuỗi thời gian, phương pháp làm mịn mũ (exponential smoothing) được sử dụng để làm gì?
A. Để phân tích mối quan hệ giữa các biến.
B. Để phát hiện các giá trị ngoại lai.
C. Để dự báo các giá trị trong tương lai dựa trên các giá trị trong quá khứ.
D. Để phân tích dữ liệu theo mùa.
107. Trong phân tích dữ liệu, mục đích của việc sử dụng các phương pháp phân tích cụm (clustering) là gì?
A. Để dự báo các giá trị trong tương lai.
B. Để phân nhóm các đối tượng thành các cụm dựa trên sự tương đồng của chúng.
C. Để phân tích mối quan hệ nhân quả.
D. Để kiểm định các giả thuyết thống kê.
108. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ liên kết giữa hai biến định tính.
B. Mức độ liên kết tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa hai trung bình.
D. Mối quan hệ nhân quả giữa hai biến.
109. Trong phân tích hồi quy, điều gì xảy ra nếu bạn bỏ sót một biến độc lập quan trọng trong mô hình?
A. Các ước lượng hệ số sẽ luôn chính xác.
B. Giá trị R-squared sẽ luôn tăng.
C. Các ước lượng hệ số có thể bị sai lệch (biased) và các kết luận có thể không chính xác.
D. Mô hình sẽ luôn dự đoán chính xác.
110. Khi nào thì nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi phân tích mối quan hệ tuyến tính giữa hai biến định lượng.
D. Khi dự báo giá trị trong tương lai.
111. Trong kiểm định giả thuyết, giá trị p (p-value) cho biết điều gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null.
C. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
D. Mức độ quan trọng của kết quả kiểm định.
112. Trong phân tích hồi quy, điều gì có thể gây ra hiện tượng phương sai thay đổi (heteroscedasticity)?
A. Mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc.
B. Sự hiện diện của các giá trị ngoại lai, sai số đo lường hoặc bỏ sót các biến quan trọng.
C. Các biến độc lập có mối quan hệ mạnh mẽ với nhau.
D. Kích thước mẫu quá nhỏ.
113. Trong phân tích hồi quy, điều gì xảy ra nếu bạn thêm một biến độc lập không liên quan vào mô hình?
A. Giá trị R-squared sẽ luôn giảm.
B. Giá trị R-squared sẽ không thay đổi.
C. Giá trị R-squared sẽ luôn tăng (hoặc không đổi).
D. Mô hình sẽ luôn chính xác hơn.
114. Trong phân tích dữ liệu, mục đích của việc sử dụng các phương pháp phân tích thành phần chính (PCA – Principal Component Analysis) là gì?
A. Để dự báo các giá trị trong tương lai.
B. Để phân nhóm các đối tượng.
C. Để giảm số chiều của dữ liệu bằng cách tìm ra các thành phần chính thể hiện phần lớn phương sai của dữ liệu.
D. Để kiểm định các giả thuyết.
115. Trong phân tích chuỗi thời gian, thành phần ‘xu hướng’ (trend) biểu thị điều gì?
A. Sự biến động theo mùa trong dữ liệu.
B. Sự thay đổi dài hạn trong dữ liệu.
C. Sự biến động ngẫu nhiên không thể dự đoán trước.
D. Sự biến động theo chu kỳ lặp lại trong dữ liệu.
116. Trong phân tích hồi quy, điều gì xảy ra nếu các giả định về phần dư (residuals) không được thỏa mãn?
A. Các hệ số hồi quy sẽ luôn chính xác.
B. Các ước lượng hệ số có thể không còn hiệu quả và các kiểm định giả thuyết có thể không còn đáng tin cậy.
C. Giá trị R-squared sẽ luôn bằng 1.
D. Mô hình sẽ luôn dự đoán chính xác.
117. Trong phân tích hồi quy, điều gì xảy ra nếu bạn vi phạm giả định về tính độc lập của các phần dư?
A. Các hệ số hồi quy sẽ luôn chính xác.
B. Các ước lượng hệ số có thể không còn hiệu quả và các kiểm định giả thuyết có thể không còn đáng tin cậy.
C. Giá trị R-squared sẽ luôn bằng 1.
D. Mô hình sẽ luôn dự đoán chính xác.
118. Giả sử bạn đang phân tích dữ liệu về doanh số bán hàng và chi phí quảng cáo. Bạn sử dụng phân tích hồi quy để dự đoán doanh số dựa trên chi phí quảng cáo. Nếu hệ số hồi quy của chi phí quảng cáo là dương, điều này có nghĩa là gì?
A. Mối quan hệ nghịch biến giữa chi phí quảng cáo và doanh số bán hàng.
B. Không có mối quan hệ giữa chi phí quảng cáo và doanh số bán hàng.
C. Cứ mỗi đơn vị tăng lên của chi phí quảng cáo, doanh số bán hàng sẽ tăng lên.
D. Chi phí quảng cáo là nguyên nhân duy nhất ảnh hưởng đến doanh số bán hàng.
119. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Phân tích mối quan hệ giữa hai biến định lượng.
C. So sánh trung bình của ba hoặc nhiều nhóm.
D. Kiểm tra tính độc lập của hai biến định tính.
120. Trong kiểm định giả thuyết, sức mạnh (power) của một kiểm định là gì?
A. Xác suất chấp nhận giả thuyết null.
B. Xác suất bác bỏ giả thuyết null khi nó sai.
C. Xác suất bác bỏ giả thuyết null khi nó đúng.
D. Mức ý nghĩa của kiểm định.
121. Khi nào thì nên sử dụng kiểm định Chi-squared?
A. Khi so sánh giá trị trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến phân loại.
C. Khi dự đoán một biến liên tục.
D. Khi kiểm tra sự phân phối chuẩn của dữ liệu.
122. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở giá trị nào?
A. 0.10
B. 0.05
C. 0.01
D. Tất cả các đáp án trên đều đúng.
123. Điều nào sau đây là một ví dụ về dữ liệu định tính?
A. Chiều cao của một người.
B. Doanh thu hàng tháng của một công ty.
C. Màu sắc yêu thích của một người.
D. Nhiệt độ trong phòng.
124. Trong thống kê, ‘tần số’ (frequency) có nghĩa là gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Số lần một giá trị xuất hiện trong một tập dữ liệu.
C. Độ lệch chuẩn của một tập dữ liệu.
D. Mối quan hệ giữa hai biến.
125. Khi bạn muốn so sánh giá trị trung bình của hai nhóm độc lập, bạn sẽ sử dụng kiểm định nào?
A. Kiểm định Chi-squared.
B. Kiểm định t-test độc lập.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Pearson.
126. Trong một kiểm định t-test một mẫu, bạn muốn kiểm tra xem giá trị trung bình của một mẫu có khác biệt đáng kể so với một giá trị cho trước không. Giả thuyết null (H0) của bạn sẽ là gì?
A. Giá trị trung bình của mẫu bằng giá trị cho trước.
B. Giá trị trung bình của mẫu khác với giá trị cho trước.
C. Giá trị trung bình của mẫu lớn hơn giá trị cho trước.
D. Giá trị trung bình của mẫu nhỏ hơn giá trị cho trước.
127. Trong thống kê, khái niệm ‘độ lệch chuẩn’ (standard deviation) đo lường điều gì?
A. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
B. Giá trị trung bình của dữ liệu.
C. Số lượng các quan sát trong một tập dữ liệu.
D. Mối quan hệ giữa hai biến.
128. Giả sử bạn đang phân tích dữ liệu về doanh thu bán hàng và chi phí quảng cáo. Bạn chạy một phân tích hồi quy và nhận được p-value cho hệ số của chi phí quảng cáo là 0.03. Điều này có ý nghĩa gì?
A. Chi phí quảng cáo không có tác động đáng kể đến doanh thu bán hàng.
B. Có bằng chứng mạnh mẽ để bác bỏ giả thuyết null rằng chi phí quảng cáo không có tác động đến doanh thu bán hàng.
C. Mô hình hồi quy không phù hợp với dữ liệu.
D. Mối quan hệ giữa chi phí quảng cáo và doanh thu bán hàng là không tuyến tính.
129. Trong phân tích phương sai (ANOVA), giả thuyết null thường phát biểu điều gì?
A. Ít nhất một giá trị trung bình khác với các giá trị trung bình khác.
B. Tất cả các giá trị trung bình đều bằng nhau.
C. Các phương sai của các nhóm khác nhau.
D. Không có sự khác biệt giữa các nhóm.
130. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất thu được kết quả quan sát hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Xác suất mắc sai lầm loại II.
131. Trong phân tích hồi quy, giá trị ‘residual’ (phần dư) đại diện cho điều gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sự khác biệt giữa giá trị quan sát và giá trị dự đoán của biến phụ thuộc.
C. Giá trị trung bình của biến phụ thuộc.
D. Hệ số hồi quy.
132. Trong kiểm định giả thuyết, giả thuyết thay thế (alternative hypothesis) là gì?
A. Giả thuyết bác bỏ.
B. Giả thuyết được kiểm định.
C. Giả thuyết đối lập với giả thuyết null.
D. Giả thuyết luôn đúng.
133. Trong một phân tích hồi quy, hệ số hồi quy cho một biến độc lập có giá trị dương. Điều này có nghĩa là gì?
A. Mối quan hệ giữa biến độc lập và biến phụ thuộc là âm.
B. Khi biến độc lập tăng, biến phụ thuộc có xu hướng giảm.
C. Khi biến độc lập tăng, biến phụ thuộc có xu hướng tăng.
D. Không có mối quan hệ nào giữa hai biến.
134. Trong kiểm định Chi-squared, bậc tự do (degrees of freedom) được tính như thế nào?
A. Tổng số quan sát.
B. (Số hàng – 1) * (Số cột – 1).
C. Số lượng các biến.
D. Giá trị trung bình của dữ liệu.
135. Trong phân tích hồi quy, điều gì xảy ra nếu bạn bỏ qua một biến quan trọng?
A. Hệ số ước lượng sẽ không bị ảnh hưởng.
B. Hệ số ước lượng có thể bị sai lệch (biased).
C. Giá trị R-squared sẽ tăng lên.
D. Các sai số sẽ không còn phân phối chuẩn.
136. Trong phân tích hồi quy, mục tiêu chính là gì?
A. Xác định mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập.
B. Tính toán giá trị trung bình của dữ liệu.
C. Xác định tần số của các giá trị trong dữ liệu.
D. Kiểm tra sự phân phối chuẩn của dữ liệu.
137. Trong phân tích hồi quy, hệ số chặn (intercept) có ý nghĩa gì?
A. Mức thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
B. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình.
D. Mức độ tương quan giữa các biến.
138. Ý nghĩa thống kê của một kết quả được thể hiện như thế nào?
A. Bằng hệ số tương quan.
B. Bằng p-value.
C. Bằng độ lệch chuẩn.
D. Bằng khoảng tin cậy.
139. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) có nghĩa là gì?
A. Các biến độc lập không độc lập với nhau.
B. Mối quan hệ giữa các biến không tuyến tính.
C. Các sai số không có phân phối chuẩn.
D. Có quá nhiều biến độc lập trong mô hình.
140. Trong kiểm định giả thuyết, việc bác bỏ giả thuyết null khi nó đúng được gọi là gì?
A. Sai lầm loại I.
B. Sai lầm loại II.
C. Độ tin cậy.
D. Giá trị p.
141. Trong kiểm định giả thuyết, sai lầm loại II là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Bác bỏ giả thuyết thay thế khi nó đúng.
D. Chấp nhận giả thuyết thay thế khi nó sai.
142. Điều gì là quan trọng nhất khi lựa chọn một kiểm định thống kê?
A. Kích thước mẫu.
B. Loại dữ liệu và câu hỏi nghiên cứu.
C. Phần mềm thống kê bạn sử dụng.
D. Thời gian bạn có để phân tích dữ liệu.
143. Trong phân tích hồi quy, điều gì xảy ra nếu bạn có hiện tượng phương sai thay đổi (heteroscedasticity)?
A. Các ước lượng hệ số không bị ảnh hưởng.
B. Các ước lượng hệ số vẫn là không chệch (unbiased), nhưng không hiệu quả (inefficient).
C. Các ước lượng hệ số là chệch (biased).
D. Giá trị R-squared sẽ giảm.
144. Khoảng tin cậy cung cấp thông tin gì?
A. Giá trị ước lượng điểm của một tham số.
B. Một phạm vi các giá trị có khả năng chứa giá trị thực của một tham số trong tổng thể.
C. Xác suất bác bỏ giả thuyết null.
D. Giá trị trung bình của mẫu.
145. Trong phân tích thời gian chuỗi, khái niệm ‘tính tự tương quan’ (autocorrelation) đề cập đến điều gì?
A. Mối quan hệ giữa một biến tại các thời điểm khác nhau.
B. Mối quan hệ giữa hai biến khác nhau tại cùng một thời điểm.
C. Xu hướng tăng hoặc giảm của dữ liệu theo thời gian.
D. Sự thay đổi ngẫu nhiên trong dữ liệu.
146. Trong kiểm định giả thuyết, giá trị alpha (α) đại diện cho điều gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng (sai lầm loại I).
B. Xác suất chấp nhận giả thuyết null khi nó sai (sai lầm loại II).
C. Giá trị trung bình của thống kê kiểm định.
D. Mức độ tin cậy của kết quả kiểm định.
147. Điều nào sau đây là một giả định quan trọng của phân tích hồi quy tuyến tính?
A. Các sai số phải có phân phối chuẩn.
B. Các biến độc lập phải độc lập với nhau (không có đa cộng tuyến).
C. Mối quan hệ giữa các biến phải tuyến tính.
D. Tất cả các đáp án trên.
148. Trong phân tích phương sai (ANOVA), giá trị F được sử dụng để làm gì?
A. Kiểm định sự khác biệt về phương sai giữa các nhóm.
B. Kiểm định sự khác biệt về giá trị trung bình giữa các nhóm.
C. Đo lường mức độ tương quan giữa các biến.
D. Xác định các giá trị ngoại lệ trong dữ liệu.
149. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình, thể hiện phần trăm phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
B. Giá trị trung bình của biến phụ thuộc.
C. Độ lệch chuẩn của các hệ số hồi quy.
D. Mức độ tương quan giữa các biến độc lập.
150. Trong phân tích phương sai (ANOVA), nếu giá trị F lớn và giá trị p nhỏ hơn mức ý nghĩa, bạn sẽ làm gì?
A. Chấp nhận giả thuyết null.
B. Bác bỏ giả thuyết null.
C. Kết luận rằng không có sự khác biệt giữa các nhóm.
D. Cần thêm dữ liệu để đưa ra kết luận.