1. Trong phân tích phương sai (ANOVA), điều gì xảy ra với sai số loại I khi số lượng so sánh cặp tăng lên?
A. Sai số loại I giảm.
B. Sai số loại I không đổi.
C. Sai số loại I tăng.
D. Không có mối quan hệ giữa số lượng so sánh cặp và sai số loại I.
2. Kiểm định nào sau đây là bảo thủ nhất trong các kiểm định hậu nghiệm (post-hoc)?
A. Tukey.
B. Bonferroni.
C. Scheffé.
D. Fisher’s LSD.
3. Giả sử bạn đang phân tích dữ liệu về hiệu quả quảng cáo bằng ANOVA hai yếu tố, với yếu tố A là loại quảng cáo (TV, radio, báo) và yếu tố B là khu vực địa lý (Bắc, Trung, Nam). Nếu có tương tác đáng kể giữa loại quảng cáo và khu vực địa lý, điều này có ý nghĩa gì?
A. Loại quảng cáo hiệu quả nhất là TV.
B. Khu vực địa lý không ảnh hưởng đến hiệu quả quảng cáo.
C. Hiệu quả của mỗi loại quảng cáo khác nhau tùy thuộc vào khu vực địa lý.
D. Hiệu quả của quảng cáo không đáng kể.
4. Giả định về tính cầu (sphericity) là gì trong ANOVA lặp lại?
A. Phương sai của các nhóm phải bằng nhau.
B. Hiệp phương sai giữa tất cả các cặp điều kiện phải bằng nhau.
C. Dữ liệu phải tuân theo phân phối chuẩn.
D. Không có giả định nào về hiệp phương sai.
5. Trong ANOVA, ‘tổng bình phương trong các nhóm’ (SSW) đại diện cho điều gì?
A. Sự biến thiên giữa các giá trị trung bình của các nhóm.
B. Sự biến thiên tổng thể trong dữ liệu.
C. Sự biến thiên do sai số ngẫu nhiên trong mỗi nhóm.
D. Sự biến thiên giữa các nhóm.
6. Trong ANOVA, thống kê F được tính như thế nào?
A. Tổng bình phương giữa các nhóm chia cho tổng bình phương trong các nhóm.
B. Tổng bình phương trong các nhóm chia cho tổng bình phương giữa các nhóm.
C. Tổng bình phương giữa các nhóm chia cho bậc tự do giữa các nhóm.
D. Trung bình bình phương giữa các nhóm chia cho trung bình bình phương trong các nhóm.
7. Trong ANOVA hai yếu tố, điều gì được kiểm tra ngoài ảnh hưởng chính của mỗi yếu tố?
A. Phương sai của các yếu tố.
B. Tương tác giữa các yếu tố.
C. Giá trị trung bình của tổng thể.
D. Độ lệch chuẩn của các yếu tố.
8. Nếu giá trị p thu được từ ANOVA nhỏ hơn mức ý nghĩa (alpha), điều gì xảy ra?
A. Chấp nhận giả thuyết không.
B. Từ chối giả thuyết thay thế.
C. Từ chối giả thuyết không.
D. Kết luận rằng không có sự khác biệt đáng kể giữa các nhóm.
9. Một số kiểm định hậu nghiệm (post-hoc) phổ biến bao gồm:
A. Kiểm định t, kiểm định z.
B. Tukey, Bonferroni, Scheffé.
C. Chi-bình phương, phân tích hồi quy.
D. Kiểm định Levene, kiểm định Shapiro-Wilk.
10. Điều gì xảy ra với bậc tự do trong các nhóm (dfw) khi kích thước mẫu tăng lên trong ANOVA?
A. Bậc tự do trong các nhóm giảm.
B. Bậc tự do trong các nhóm tăng.
C. Bậc tự do trong các nhóm không đổi.
D. Không có mối quan hệ giữa kích thước mẫu và bậc tự do trong các nhóm.
11. Ưu điểm chính của ANOVA lặp lại so với ANOVA thông thường là gì?
A. Đơn giản hơn để thực hiện.
B. Yêu cầu ít giả định hơn.
C. Kiểm soát được sự biến thiên giữa các đối tượng, làm tăng độ mạnh của kiểm định.
D. Không bị ảnh hưởng bởi kích thước mẫu.
12. ANOVA giả định điều gì về phương sai của các nhóm được so sánh?
A. Phương sai của các nhóm phải khác nhau đáng kể.
B. Phương sai của các nhóm phải bằng nhau hoặc gần bằng nhau.
C. Phương sai của các nhóm phải tuân theo phân phối chuẩn.
D. Không có giả định nào về phương sai của các nhóm.
13. Nếu bạn thực hiện ANOVA và nhận thấy rằng có sự khác biệt đáng kể giữa các nhóm, bước tiếp theo nên là gì?
A. Chấp nhận giả thuyết không.
B. Thực hiện kiểm định hậu nghiệm (post-hoc).
C. Kết luận rằng tất cả các nhóm đều khác nhau.
D. Không cần thực hiện thêm kiểm định nào.
14. Điều gì ảnh hưởng đến sức mạnh của kiểm định ANOVA?
A. Kích thước mẫu, mức ý nghĩa (alpha), và kích thước hiệu ứng.
B. Chỉ kích thước mẫu.
C. Chỉ mức ý nghĩa (alpha).
D. Chỉ kích thước hiệu ứng.
15. ANOVA lặp lại thích hợp khi nào?
A. Khi muốn so sánh các nhóm độc lập.
B. Khi muốn so sánh các nhóm có phương sai khác nhau.
C. Khi muốn so sánh các đo lường lặp lại trên cùng một đối tượng.
D. Khi muốn so sánh các biến khác nhau.
16. Giả sử bạn đang thực hiện ANOVA một yếu tố để so sánh doanh số bán hàng trung bình của ba loại sản phẩm khác nhau. Giả thuyết không (H0) trong trường hợp này là gì?
A. Tất cả các loại sản phẩm đều có doanh số bán hàng khác nhau.
B. Ít nhất hai loại sản phẩm có doanh số bán hàng khác nhau.
C. Tất cả các loại sản phẩm đều có doanh số bán hàng bằng nhau.
D. Doanh số bán hàng của một loại sản phẩm vượt trội hơn các loại khác.
17. Kích thước hiệu ứng (effect size) trong ANOVA đo lường điều gì?
A. Mức độ ý nghĩa thống kê.
B. Mức độ khác biệt giữa các giá trị trung bình của các nhóm.
C. Xác suất mắc sai số loại I.
D. Độ tin cậy của kết quả.
18. Kiểm định nào được sử dụng để kiểm tra tính đồng nhất của phương sai trong ANOVA?
A. Kiểm định t.
B. Kiểm định Chi-bình phương.
C. Kiểm định Levene.
D. Kiểm định Z.
19. Trong ANOVA, sai số loại II xảy ra khi nào?
A. Khi từ chối giả thuyết không khi nó đúng.
B. Khi không từ chối giả thuyết không khi nó sai.
C. Khi chấp nhận giả thuyết thay thế khi nó sai.
D. Khi tính toán sai thống kê F.
20. Nếu thống kê F trong ANOVA bằng 1, điều này có nghĩa là gì?
A. Giả thuyết không bị từ chối.
B. Giả thuyết thay thế bị từ chối.
C. Sự biến thiên giữa các nhóm bằng với sự biến thiên trong các nhóm.
D. Không có sự biến thiên trong dữ liệu.
21. Trong ANOVA lặp lại (Repeated Measures ANOVA), điều gì được kiểm soát?
A. Phương sai giữa các nhóm.
B. Phương sai trong các nhóm.
C. Sự khác biệt giữa các đối tượng.
D. Sự khác biệt giữa các biến.
22. Tương tác giữa các yếu tố trong ANOVA hai yếu tố có nghĩa là gì?
A. Các yếu tố không ảnh hưởng lẫn nhau.
B. Ảnh hưởng của một yếu tố lên biến phụ thuộc khác nhau tùy thuộc vào mức độ của yếu tố khác.
C. Các yếu tố có ảnh hưởng giống nhau lên biến phụ thuộc.
D. Các yếu tố hoàn toàn độc lập với nhau.
23. Giá trị p trong ANOVA đại diện cho điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Xác suất mắc sai số loại II.
24. Nếu kiểm định Mauchly cho thấy vi phạm tính cầu, điều gì nên được thực hiện?
A. Bỏ qua kết quả ANOVA.
B. Sử dụng hiệu chỉnh Greenhouse-Geisser hoặc Huynh-Feldt.
C. Tăng kích thước mẫu.
D. Giảm mức ý nghĩa (alpha).
25. Phương pháp nào sau đây được sử dụng để kiểm soát sai số loại I khi thực hiện nhiều so sánh trong ANOVA?
A. Phân tích hồi quy.
B. Kiểm định t.
C. Hiệu chỉnh Bonferroni.
D. Phân tích tương quan.
26. Nếu kiểm định Levene cho thấy phương sai không đồng nhất, giải pháp nào sau đây có thể được sử dụng?
A. Luôn thực hiện hiệu chỉnh Bonferroni.
B. Sử dụng kiểm định Welch hoặc điều chỉnh bậc tự do.
C. Tăng mức ý nghĩa (alpha).
D. Giảm kích thước mẫu.
27. Trong phân tích phương sai (ANOVA), ‘tổng bình phương giữa các nhóm’ (SSB) đại diện cho điều gì?
A. Sự biến thiên tổng thể trong dữ liệu.
B. Sự biến thiên do sai số ngẫu nhiên.
C. Sự biến thiên giữa các giá trị trung bình của các nhóm.
D. Sự biến thiên trong mỗi nhóm.
28. Trong ANOVA, điều gì xảy ra nếu kích thước mẫu của tất cả các nhóm đều bằng nhau?
A. Việc tính toán trở nên phức tạp hơn.
B. Giả định về tính đồng nhất của phương sai không còn quan trọng.
C. Kiểm định trở nên mạnh mẽ hơn.
D. Việc tính toán trở nên đơn giản hơn.
29. Kiểm định nào được sử dụng để kiểm tra tính cầu trong ANOVA lặp lại?
A. Kiểm định Levene.
B. Kiểm định Shapiro-Wilk.
C. Kiểm định Mauchly.
D. Kiểm định t.
30. Kiểm định hậu nghiệm (post-hoc) được sử dụng để làm gì trong ANOVA?
A. Để kiểm tra tính đồng nhất của phương sai.
B. Để xác định nhóm nào khác biệt đáng kể so với các nhóm khác.
C. Để tính toán thống kê F.
D. Để xác định bậc tự do.
31. Mối quan hệ giữa khoảng tin cậy và kiểm định giả thuyết là gì?
A. Nếu một giá trị được giả định nằm ngoài khoảng tin cậy, thì giả thuyết không về giá trị đó sẽ bị bác bỏ.
B. Khoảng tin cậy và kiểm định giả thuyết không liên quan đến nhau.
C. Nếu một giá trị được giả định nằm trong khoảng tin cậy, thì giả thuyết không về giá trị đó sẽ bị bác bỏ.
D. Khoảng tin cậy luôn rộng hơn vùng bác bỏ.
32. Nếu chúng ta giảm mức ý nghĩa alpha, điều gì xảy ra với công suất (power) của kiểm định?
A. Công suất giảm.
B. Công suất tăng.
C. Công suất không đổi.
D. Sai lầm loại II giảm.
33. Trong kiểm định giả thuyết, việc lựa chọn mức ý nghĩa alpha thấp hơn sẽ làm:
A. Giảm khả năng mắc sai lầm loại I nhưng tăng khả năng mắc sai lầm loại II.
B. Tăng khả năng mắc sai lầm loại I nhưng giảm khả năng mắc sai lầm loại II.
C. Giảm cả khả năng mắc sai lầm loại I và loại II.
D. Tăng cả khả năng mắc sai lầm loại I và loại II.
34. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc phải sai lầm loại I nếu giả thuyết không (H0) là đúng.
B. Xác suất giả thuyết không (H0) là đúng.
C. Xác suất giả thuyết thay thế (H1) là đúng.
D. Mức ý nghĩa (significance level) của kiểm định.
35. Nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa alpha, chúng ta nên làm gì?
A. Bác bỏ giả thuyết không (H0).
B. Chấp nhận giả thuyết không (H0).
C. Tăng kích thước mẫu.
D. Giảm mức ý nghĩa alpha.
36. Khi nào chúng ta sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để kiểm định giả thuyết về trung bình?
A. Khi độ lệch chuẩn của quần thể chưa biết và kích thước mẫu nhỏ.
B. Khi độ lệch chuẩn của quần thể đã biết và kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn.
D. Khi chúng ta muốn kiểm định phương sai thay vì trung bình.
37. Khi thực hiện kiểm định giả thuyết cho sự khác biệt giữa hai trung bình quần thể độc lập, chúng ta cần giả định điều gì về phương sai của hai quần thể?
A. Phương sai có thể bằng nhau hoặc khác nhau, tùy thuộc vào kiểm định được sử dụng.
B. Phương sai phải bằng nhau.
C. Phương sai phải khác nhau.
D. Phương sai phải bằng 0.
38. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không (H0) khi nó thực sự đúng.
B. Chấp nhận giả thuyết không (H0) khi nó thực sự đúng.
C. Bác bỏ giả thuyết không (H0) khi nó thực sự sai.
D. Chấp nhận giả thuyết không (H0) khi nó thực sự sai.
39. Bậc tự do (degrees of freedom) trong kiểm định t (t-test) cho một mẫu độc lập được tính như thế nào?
A. n – 1
B. n
C. n + 1
D. 2n – 2
40. Khi so sánh hai phương pháp điều trị, chúng ta sử dụng kiểm định giả thuyết nào để xác định xem có sự khác biệt đáng kể giữa tỷ lệ thành công của hai phương pháp hay không?
A. Kiểm định z cho sự khác biệt giữa hai tỷ lệ.
B. Kiểm định t cho sự khác biệt giữa hai trung bình.
C. Kiểm định chi bình phương (Chi-square).
D. Kiểm định F.
41. Trong kiểm định giả thuyết về tỷ lệ của một quần thể, thống kê kiểm định nào thường được sử dụng?
A. Thống kê z
B. Thống kê t
C. Thống kê chi bình phương (Chi-square)
D. Thống kê F
42. Giá trị tới hạn (critical value) trong kiểm định giả thuyết là gì?
A. Điểm phân chia vùng bác bỏ và vùng không bác bỏ.
B. Giá trị của thống kê kiểm định.
C. Mức ý nghĩa (significance level) của kiểm định.
D. Xác suất mắc phải sai lầm loại II.
43. Khi thực hiện kiểm định giả thuyết về sự khác biệt giữa hai trung bình của các mẫu ghép cặp (paired samples), chúng ta sử dụng kiểm định nào?
A. Kiểm định t cho mẫu ghép cặp.
B. Kiểm định t cho hai mẫu độc lập.
C. Kiểm định z.
D. Kiểm định chi bình phương (Chi-square).
44. Trong kiểm định giả thuyết về sự độc lập giữa hai biến phân loại, giả thuyết không (H0) thường là gì?
A. Hai biến là độc lập với nhau.
B. Hai biến có liên quan đến nhau.
C. Hai biến có phân phối giống nhau.
D. Hai biến có trung bình bằng nhau.
45. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu không tuân theo các giả định của kiểm định tham số (ví dụ: không phân phối chuẩn).
B. Khi kích thước mẫu lớn.
C. Khi độ lệch chuẩn quần thể đã biết.
D. Khi chúng ta muốn kiểm định trung bình.
46. Khi thực hiện kiểm định giả thuyết về sự khác biệt giữa hai phương sai, chúng ta sử dụng kiểm định nào?
A. Kiểm định F.
B. Kiểm định t.
C. Kiểm định z.
D. Kiểm định chi bình phương (Chi-square).
47. Yếu tố nào sau đây ảnh hưởng đến công suất (power) của một kiểm định giả thuyết?
A. Kích thước mẫu, mức ý nghĩa alpha, và độ lớn của hiệu ứng.
B. Chỉ kích thước mẫu.
C. Chỉ mức ý nghĩa alpha.
D. Chỉ độ lớn của hiệu ứng.
48. Trong kiểm định giả thuyết về trung bình của một quần thể khi độ lệch chuẩn quần thể đã biết, chúng ta sử dụng thống kê kiểm định nào?
A. Thống kê z
B. Thống kê t
C. Thống kê chi bình phương (Chi-square)
D. Thống kê F
49. Khi nào chúng ta sử dụng kiểm định F (F-test)?
A. Để so sánh phương sai của hai hay nhiều quần thể.
B. Để so sánh trung bình của hai quần thể.
C. Để kiểm tra tính độc lập giữa hai biến phân loại.
D. Để kiểm tra tỷ lệ của một quần thể.
50. Nếu chúng ta chấp nhận giả thuyết không (H0), điều đó có nghĩa là gì?
A. Không có đủ bằng chứng để bác bỏ giả thuyết không.
B. Giả thuyết không chắc chắn đúng.
C. Giả thuyết thay thế chắc chắn sai.
D. Chúng ta đã chứng minh giả thuyết không là đúng.
51. Giả sử bạn thực hiện kiểm định giả thuyết hai phía (two-tailed test). Điều này có nghĩa gì?
A. Bạn quan tâm đến việc liệu tham số quần thể có khác một giá trị cụ thể hay không.
B. Bạn chỉ quan tâm đến việc liệu tham số quần thể có lớn hơn một giá trị cụ thể hay không.
C. Bạn chỉ quan tâm đến việc liệu tham số quần thể có nhỏ hơn một giá trị cụ thể hay không.
D. Bạn không cần chia mức ý nghĩa alpha cho 2.
52. Trong kiểm định giả thuyết về phương sai, thống kê kiểm định nào thường được sử dụng?
A. Thống kê chi bình phương (Chi-square)
B. Thống kê t
C. Thống kê z
D. Thống kê F
53. Công suất (power) của một kiểm định giả thuyết được định nghĩa là gì?
A. Xác suất bác bỏ giả thuyết không (H0) khi nó thực sự sai.
B. Xác suất chấp nhận giả thuyết không (H0) khi nó thực sự đúng.
C. Xác suất mắc phải sai lầm loại I.
D. Xác suất mắc phải sai lầm loại II.
54. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Tập hợp các giá trị của thống kê kiểm định dẫn đến việc bác bỏ giả thuyết không (H0).
B. Tập hợp các giá trị của thống kê kiểm định dẫn đến việc chấp nhận giả thuyết không (H0).
C. Khoảng tin cậy cho tham số quần thể.
D. Mức ý nghĩa (significance level) của kiểm định.
55. Giả sử bạn thực hiện kiểm định giả thuyết một phía (one-tailed test) bên phải. Điều này có nghĩa gì?
A. Bạn chỉ quan tâm đến việc liệu tham số quần thể có lớn hơn một giá trị cụ thể hay không.
B. Bạn chỉ quan tâm đến việc liệu tham số quần thể có nhỏ hơn một giá trị cụ thể hay không.
C. Bạn quan tâm đến việc liệu tham số quần thể có khác một giá trị cụ thể hay không.
D. Bạn cần chia mức ý nghĩa alpha cho 2.
56. Mức ý nghĩa (significance level) alpha thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.01, 0.05, hoặc 0.10
B. 0.50, 0.75, hoặc 0.90
C. 0.95, 0.99, hoặc 0.999
D. 1.0, 2.0, hoặc 3.0
57. Sai lầm loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết không (H0) khi nó thực sự sai.
B. Bác bỏ giả thuyết không (H0) khi nó thực sự đúng.
C. Bác bỏ giả thuyết không (H0) khi nó thực sự sai.
D. Chấp nhận giả thuyết không (H0) khi nó thực sự đúng.
58. Trong kiểm định giả thuyết, điều gì xảy ra khi chúng ta tăng kích thước mẫu?
A. Công suất của kiểm định tăng lên.
B. Công suất của kiểm định giảm xuống.
C. Sai lầm loại I tăng lên.
D. Sai lầm loại II tăng lên.
59. Trong phân tích phương sai (ANOVA), giả thuyết không (H0) thường là gì?
A. Tất cả các trung bình quần thể đều bằng nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình khác.
C. Phương sai của tất cả các quần thể đều bằng nhau.
D. Phương sai của tất cả các quần thể đều khác nhau.
60. Kiểm định chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. Kiểm tra tính độc lập giữa hai biến phân loại.
B. Kiểm tra trung bình của một quần thể.
C. Kiểm tra phương sai của một quần thể.
D. Kiểm tra sự khác biệt giữa hai trung bình quần thể.
61. Một mô hình hồi quy có R-squared = 0.8. Điều này có nghĩa là gì?
A. 80% sự biến động của biến độc lập được giải thích bởi biến phụ thuộc.
B. 80% sự biến động của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Mô hình không phù hợp với dữ liệu.
D. Các biến độc lập không có ý nghĩa thống kê.
62. Trong phân tích hồi quy, khi nào thì nên sử dụng biến logarit?
A. Khi có mối quan hệ tuyến tính giữa các biến.
B. Khi biến phụ thuộc là nhị phân.
C. Khi phương sai của sai số thay đổi và biến có phân phối lệch.
D. Khi không có biến độc lập nào.
63. Để khắc phục hiện tượng đa cộng tuyến, biện pháp nào sau đây thường được sử dụng?
A. Thêm biến độc lập vào mô hình.
B. Loại bỏ một hoặc nhiều biến độc lập có tương quan cao.
C. Sử dụng biến phụ thuộc khác.
D. Không cần thực hiện biện pháp nào.
64. Mục đích chính của việc kiểm tra các giả định của mô hình hồi quy là gì?
A. Để tăng hệ số xác định (R-squared).
B. Để đảm bảo tính hợp lệ của các kết quả thống kê.
C. Để đơn giản hóa mô hình.
D. Để tìm ra các biến độc lập quan trọng nhất.
65. Trong phân tích hồi quy, điều kiện nào sau đây không phải là giả định của mô hình hồi quy tuyến tính cổ điển?
A. Mối quan hệ tuyến tính giữa các biến.
B. Sai số có phương sai không đổi.
C. Sai số có phân phối chuẩn.
D. Các biến độc lập có tương quan cao.
66. Giả sử bạn có một mô hình hồi quy với R-squared rất thấp. Điều này có nghĩa là gì?
A. Mô hình phù hợp rất tốt với dữ liệu.
B. Mô hình không phù hợp tốt với dữ liệu.
C. Các biến độc lập có ý nghĩa thống kê.
D. Không thể đưa ra kết luận.
67. Điều gì xảy ra với R-squared khi bạn thêm nhiều biến độc lập vào mô hình hồi quy?
A. R-squared luôn tăng.
B. R-squared luôn giảm.
C. R-squared không đổi.
D. R-squared có thể tăng hoặc giảm.
68. Trong phân tích hồi quy, sai số chuẩn (standard error) của hệ số hồi quy đo lường điều gì?
A. Mức độ biến động của biến phụ thuộc.
B. Mức độ chính xác của ước lượng hệ số hồi quy.
C. Mức độ phù hợp của mô hình.
D. Mức độ tương quan giữa các biến độc lập.
69. Khi nào thì nên sử dụng hồi quy Ridge hoặc Lasso?
A. Khi không có biến độc lập nào.
B. Khi có đa cộng tuyến và bạn muốn giảm phương sai của các ước lượng.
C. Khi biến phụ thuộc là nhị phân.
D. Khi bạn muốn tăng R-squared.
70. Trong phân tích hồi quy, điều gì xảy ra nếu bạn bỏ qua một biến quan trọng có tương quan với các biến khác trong mô hình?
A. Các ước lượng sẽ không bị chệch.
B. Các ước lượng sẽ bị chệch.
C. R-squared sẽ tăng.
D. Phương sai sai số sẽ giảm.
71. Trong phân tích hồi quy, biến giả (dummy variable) được sử dụng để làm gì?
A. Biểu diễn các biến định lượng.
B. Biểu diễn các biến định tính.
C. Khắc phục hiện tượng đa cộng tuyến.
D. Khắc phục hiện tượng phương sai sai số thay đổi.
72. Phương pháp nào sau đây có thể được sử dụng để phát hiện các giá trị ngoại lệ trong phân tích hồi quy?
A. Sử dụng biểu đồ phân tán (scatter plot).
B. Sử dụng biểu đồ hộp (box plot).
C. Sử dụng khoảng cách Cook (Cook’s distance).
D. Tất cả các đáp án trên.
73. Giả sử bạn có một mô hình hồi quy tuyến tính đơn giản y = a + bx. ‘b’ đại diện cho điều gì?
A. Giá trị dự đoán của y khi x bằng 0.
B. Sự thay đổi trong y cho mỗi đơn vị thay đổi trong x.
C. Giá trị trung bình của y.
D. Sai số chuẩn của mô hình.
74. Nếu bạn nghi ngờ có phương sai sai số thay đổi, bạn có thể sử dụng kiểm định nào?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Breusch-Pagan.
D. Kiểm định Chi-bình phương.
75. Trong phân tích hồi quy, giá trị p (p-value) cho biết điều gì?
A. Xác suất mà giả thuyết null là đúng.
B. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn nếu giả thuyết null là đúng.
C. Mức độ phù hợp của mô hình.
D. Mức độ quan trọng của biến độc lập.
76. Trong phân tích hồi quy, một biến tương tác (interaction variable) được tạo ra bằng cách nào?
A. Cộng hai biến độc lập lại với nhau.
B. Nhân hai biến độc lập lại với nhau.
C. Chia hai biến độc lập cho nhau.
D. Lấy logarit của một biến độc lập.
77. Trong phân tích hồi quy, một giá trị ngoại lệ (outlier) là gì?
A. Một giá trị dự đoán rất chính xác.
B. Một giá trị nằm gần giá trị trung bình.
C. Một giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị không có ý nghĩa thống kê.
78. Giả sử bạn thực hiện một kiểm định giả thuyết về hệ số hồi quy và nhận được giá trị p là 0.03. Với mức ý nghĩa 0.05, bạn sẽ kết luận thế nào?
A. Bác bỏ giả thuyết null.
B. Chấp nhận giả thuyết null.
C. Không thể đưa ra kết luận.
D. Cần thêm thông tin để kết luận.
79. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sai số giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
C. Hệ số hồi quy.
D. Sai số chuẩn của hệ số hồi quy.
80. Trong phân tích hồi quy, điều gì xảy ra nếu bạn bao gồm một biến không liên quan vào mô hình?
A. Các ước lượng sẽ trở nên chệch.
B. Phương sai của các ước lượng sẽ tăng.
C. R-squared sẽ giảm.
D. Không có ảnh hưởng gì.
81. Đa cộng tuyến (multicollinearity) xảy ra khi nào trong phân tích hồi quy?
A. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
B. Khi có mối tương quan cao giữa các biến độc lập.
C. Khi số lượng quan sát nhỏ hơn số lượng biến độc lập.
D. Khi phương sai của sai số thay đổi.
82. Khi nào thì nên sử dụng mô hình hồi quy bậc hai (quadratic regression)?
A. Khi có mối quan hệ tuyến tính giữa các biến.
B. Khi có mối quan hệ phi tuyến tính giữa các biến.
C. Khi biến phụ thuộc là nhị phân.
D. Khi không có biến độc lập nào.
83. Hiện tượng nào sau đây có thể làm cho các ước lượng trong mô hình hồi quy bị chệch?
A. Đa cộng tuyến.
B. Phương sai sai số thay đổi.
C. Bỏ sót biến quan trọng.
D. Tất cả các đáp án trên.
84. Phương sai sai số thay đổi (heteroscedasticity) ảnh hưởng đến kết quả hồi quy như thế nào?
A. Làm cho các ước lượng hệ số hồi quy bị chệch.
B. Làm cho các sai số chuẩn của hệ số hồi quy không đáng tin cậy.
C. Làm cho mô hình không còn tuyến tính.
D. Không ảnh hưởng đến kết quả hồi quy.
85. Để so sánh các mô hình hồi quy với số lượng biến độc lập khác nhau, nên sử dụng chỉ số nào?
A. R-squared.
B. Adjusted R-squared.
C. Sai số chuẩn của ước lượng.
D. Giá trị p.
86. Giả sử bạn muốn dự đoán doanh thu dựa trên chi phí quảng cáo. Bạn nên sử dụng loại mô hình nào?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính.
C. Kiểm định Chi-bình phương.
D. Phân tích chuỗi thời gian.
87. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu mẫu.
B. Mức độ ý nghĩa thống kê của các biến độc lập.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ biến động của sai số.
88. Khi nào thì nên sử dụng hồi quy đa biến thay vì hồi quy đơn biến?
A. Khi chỉ có một biến độc lập.
B. Khi có nhiều hơn một biến độc lập ảnh hưởng đến biến phụ thuộc.
C. Khi biến phụ thuộc là định tính.
D. Khi không có mối quan hệ tuyến tính giữa các biến.
89. Để đánh giá xem một biến độc lập có tác động phi tuyến tính đến biến phụ thuộc hay không, bạn có thể làm gì?
A. Sử dụng hồi quy tuyến tính đơn giản.
B. Sử dụng hồi quy logistic.
C. Thêm một biến bậc hai của biến độc lập vào mô hình.
D. Loại bỏ biến độc lập khỏi mô hình.
90. Khi nào thì nên sử dụng hồi quy logistic thay vì hồi quy tuyến tính?
A. Khi biến phụ thuộc là liên tục.
B. Khi biến phụ thuộc là nhị phân (binary).
C. Khi có mối quan hệ tuyến tính giữa các biến.
D. Khi không có biến độc lập nào.
91. Mục đích của việc sử dụng phương pháp Bootstrap là gì?
A. Để ước lượng sai số chuẩn và khoảng tin cậy khi không có công thức giải tích hoặc khi các giả định không được đáp ứng.
B. Để giảm hiện tượng đa cộng tuyến.
C. Để khắc phục phương sai sai số thay đổi.
D. Để tăng giá trị của R-squared.
92. Overfitting xảy ra khi nào?
A. Khi mô hình quá phức tạp và phù hợp quá sát với dữ liệu mẫu, dẫn đến kém hiệu quả khi dự đoán dữ liệu mới.
B. Khi mô hình quá đơn giản và không thể giải thích được dữ liệu mẫu.
C. Khi có hiện tượng đa cộng tuyến.
D. Khi phương sai của sai số thay đổi.
93. Trong phân tích hồi quy, khi nào thì nên sử dụng mô hình log-log?
A. Khi cả biến độc lập và biến phụ thuộc đều có mối quan hệ mũ (exponential) hoặc khi muốn ước lượng hệ số co giãn.
B. Khi biến phụ thuộc là biến nhị phân.
C. Khi có hiện tượng đa cộng tuyến.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
94. Kiểm định Durbin-Watson được sử dụng để kiểm tra điều gì?
A. Tự tương quan (autocorrelation) trong phần dư.
B. Đa cộng tuyến (multicollinearity).
C. Tính dừng (stationarity) của chuỗi thời gian.
D. Phương sai không đổi (homoscedasticity).
95. Phương pháp nào sau đây có thể được sử dụng để khắc phục phương sai sai số thay đổi?
A. Sử dụng sai số chuẩn mạnh (robust standard errors).
B. Loại bỏ các biến ngoại lệ.
C. Thêm biến độc lập vào mô hình.
D. Giảm kích thước mẫu.
96. Sai số chuẩn của hệ số hồi quy ước lượng đo lường điều gì?
A. Độ lệch chuẩn của phân phối lấy mẫu của hệ số ước lượng.
B. Sai số trung bình của mô hình hồi quy.
C. Mức độ phù hợp của mô hình hồi quy.
D. Mức độ biến động của biến phụ thuộc.
97. Phương pháp nào sau đây có thể được sử dụng để giảm thiểu overfitting?
A. Sử dụng kỹ thuật chính quy hóa (regularization).
B. Thêm biến tương tác.
C. Loại bỏ các biến ngoại lệ.
D. Giảm kích thước mẫu.
98. Biến tương tác (interaction variable) được tạo ra bằng cách nào?
A. Nhân hai hoặc nhiều biến độc lập với nhau.
B. Chia hai hoặc nhiều biến độc lập cho nhau.
C. Cộng hai hoặc nhiều biến độc lập với nhau.
D. Lấy căn bậc hai của một biến độc lập.
99. Nếu hai mô hình có hiệu suất dự đoán tương đương, mô hình nào nên được ưu tiên lựa chọn?
A. Mô hình đơn giản hơn (ít biến hơn).
B. Mô hình phức tạp hơn (nhiều biến hơn).
C. Mô hình có R-squared cao hơn.
D. Mô hình có AIC cao hơn.
100. Giả sử bạn có một mô hình hồi quy tuyến tính đơn giản. Nếu hệ số góc (slope) là 2, điều này có nghĩa là gì?
A. Khi biến độc lập tăng 1 đơn vị, biến phụ thuộc tăng 2 đơn vị.
B. Khi biến phụ thuộc tăng 1 đơn vị, biến độc lập tăng 2 đơn vị.
C. Biến độc lập và biến phụ thuộc không có mối quan hệ tuyến tính.
D. Giá trị trung bình của biến phụ thuộc là 2.
101. Giả sử bạn chạy một hồi quy và nhận thấy rằng phần dư có một mô hình rõ ràng (ví dụ: hình parabol). Điều này cho thấy điều gì?
A. Mô hình tuyến tính có thể không phù hợp và nên xem xét mô hình phi tuyến.
B. Có hiện tượng đa cộng tuyến.
C. Không có vấn đề gì, vì phần dư luôn có mô hình.
D. Kích thước mẫu quá nhỏ.
102. Trong phân tích hồi quy, biến độc lập còn được gọi là gì?
A. Biến giải thích (explanatory variable).
B. Biến phụ thuộc (dependent variable).
C. Biến kiểm soát (control variable).
D. Biến nhiễu (confounding variable).
103. Bootstrap là gì trong thống kê?
A. Một phương pháp lấy mẫu lại có thay thế từ dữ liệu gốc để ước lượng phân phối lấy mẫu của một thống kê.
B. Một phương pháp kiểm định giả thuyết.
C. Một phương pháp giảm phương sai.
D. Một phương pháp chọn biến.
104. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
B. Sai số chuẩn của hệ số hồi quy.
C. Giá trị trung bình của biến phụ thuộc.
D. Hệ số xác định (R-squared).
105. Phương pháp nào sau đây thường được sử dụng để khắc phục hiện tượng đa cộng tuyến?
A. Loại bỏ một hoặc nhiều biến độc lập có tương quan cao.
B. Thêm biến tương tác vào mô hình.
C. Sử dụng hồi quy phi tuyến.
D. Tăng kích thước mẫu.
106. Trong hồi quy logistic, hàm logistic được sử dụng để làm gì?
A. Để ước lượng xác suất của biến phụ thuộc.
B. Để tuyến tính hóa mối quan hệ giữa các biến.
C. Để khắc phục phương sai sai số thay đổi.
D. Để giảm hiện tượng đa cộng tuyến.
107. R-squared điều chỉnh (Adjusted R-squared) được sử dụng để làm gì?
A. Để phạt việc thêm các biến không cần thiết vào mô hình hồi quy.
B. Để loại bỏ hiện tượng đa cộng tuyến.
C. Để khắc phục phương sai sai số thay đổi.
D. Để tăng giá trị của R-squared.
108. Trong hồi quy logistic, odds ratio (tỷ lệ cược) được tính như thế nào?
A. exp(hệ số hồi quy).
B. 1 / hệ số hồi quy.
C. hệ số hồi quy * 100.
D. hệ số hồi quy / (1 – hệ số hồi quy).
109. Trong hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến nhị phân (binary variable).
B. Là biến liên tục (continuous variable).
C. Là biến rời rạc (discrete variable).
D. Là biến định tính (qualitative variable).
110. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Mức độ ý nghĩa thống kê của các biến độc lập.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ biến động của biến phụ thuộc.
111. Mục đích của việc sử dụng biến tương tác trong mô hình hồi quy là gì?
A. Để xem xét tác động có điều kiện của một biến độc lập lên biến phụ thuộc, phụ thuộc vào giá trị của biến độc lập khác.
B. Để giảm hiện tượng đa cộng tuyến.
C. Để đơn giản hóa mô hình hồi quy.
D. Để tăng hệ số xác định (R-squared).
112. Trong mô hình hồi quy bội, khi thêm một biến độc lập mới, R-squared sẽ như thế nào?
A. R-squared sẽ luôn tăng hoặc giữ nguyên.
B. R-squared sẽ luôn giảm.
C. R-squared sẽ không thay đổi.
D. R-squared sẽ tăng nếu biến mới có ý nghĩa thống kê.
113. Trong phân tích chuỗi thời gian, tính dừng (stationarity) có nghĩa là gì?
A. Các đặc tính thống kê của chuỗi (ví dụ: trung bình, phương sai) không thay đổi theo thời gian.
B. Chuỗi có xu hướng tăng hoặc giảm theo thời gian.
C. Chuỗi có tính chu kỳ rõ ràng.
D. Chuỗi không có tự tương quan.
114. Hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có mối tương quan cao giữa các biến độc lập trong mô hình hồi quy.
B. Khi có mối tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Khi mô hình hồi quy không phù hợp với dữ liệu.
D. Khi có quá nhiều biến độc lập trong mô hình.
115. Biến giả (dummy variable) được sử dụng để biểu diễn điều gì trong mô hình hồi quy?
A. Các biến định tính (qualitative variables).
B. Các biến định lượng (quantitative variables).
C. Các biến bị thiếu dữ liệu.
D. Các biến có phương sai lớn.
116. Trong kiểm định giả thuyết về hệ số hồi quy, giá trị p (p-value) cho biết điều gì?
A. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu giả thuyết không đúng là đúng.
B. Xác suất giả thuyết không đúng là đúng.
C. Mức độ quan trọng của biến độc lập.
D. Mức độ phù hợp của mô hình.
117. Giá trị AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion) được sử dụng để làm gì?
A. So sánh và lựa chọn mô hình tốt nhất.
B. Kiểm tra phương sai sai số thay đổi.
C. Kiểm tra đa cộng tuyến.
D. Ước lượng hệ số hồi quy.
118. Nếu một biến giả có giá trị 1 cho nhóm A và 0 cho nhóm B, hệ số hồi quy của biến giả này thể hiện điều gì?
A. Sự khác biệt về giá trị trung bình của biến phụ thuộc giữa nhóm A và nhóm B.
B. Giá trị trung bình của biến phụ thuộc cho nhóm A.
C. Giá trị trung bình của biến phụ thuộc cho nhóm B.
D. Mức độ tương quan giữa nhóm A và biến phụ thuộc.
119. Trong phân tích hồi quy, biến phụ thuộc còn được gọi là gì?
A. Biến phản hồi (response variable).
B. Biến điều khiển (control variable).
C. Biến giải thích (explanatory variable).
D. Biến dự báo (predictor variable).
120. Phương sai sai số thay đổi (heteroscedasticity) xảy ra khi nào?
A. Khi phương sai của phần dư không đồng đều trên các giá trị của biến độc lập.
B. Khi các biến độc lập có tương quan cao.
C. Khi mô hình hồi quy không tuyến tính.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
121. Mức ý nghĩa (Significance level) α trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất mắc sai lầm loại I.
122. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng tham số quần thể nằm trong khoảng này.
B. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tham số quần thể thực sự.
C. Xác suất mắc sai lầm loại I là 5%.
D. Xác suất mắc sai lầm loại II là 5%.
123. Trong kiểm định giả thuyết, sai lầm loại II (Type II error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
124. Một nhà nghiên cứu muốn kiểm tra xem có mối liên hệ giữa giới tính và sở thích mua sắm một loại sản phẩm cụ thể hay không. Kiểm định nào phù hợp nhất?
A. Kiểm định t hai mẫu.
B. Kiểm định z một mẫu.
C. Phân tích phương sai (ANOVA).
D. Kiểm định χ².
125. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa α giảm?
A. Giá trị tới hạn tăng lên.
B. Giá trị tới hạn giảm xuống.
C. Giá trị tới hạn không thay đổi.
D. Không thể xác định được sự thay đổi.
126. Khi nào nên sử dụng kiểm định F để so sánh phương sai của hai quần thể?
A. Khi kích thước mẫu nhỏ (n < 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi muốn so sánh trung bình của hai quần thể.
D. Khi muốn so sánh phương sai của hai quần thể.
127. Điều gì xảy ra với công suất kiểm định khi tăng kích thước mẫu?
A. Công suất kiểm định tăng lên.
B. Công suất kiểm định giảm xuống.
C. Công suất kiểm định không thay đổi.
D. Không thể xác định được sự thay đổi.
128. Nếu giá trị p nhỏ hơn mức ý nghĩa α, thì quyết định kiểm định sẽ là gì?
A. Chấp nhận giả thuyết H0.
B. Không đưa ra kết luận.
C. Bác bỏ giả thuyết H0.
D. Cần thêm thông tin để đưa ra quyết định.
129. Một nhà quản lý muốn so sánh mức độ hài lòng của khách hàng đối với ba loại dịch vụ khác nhau. Loại kiểm định nào phù hợp nhất?
A. Kiểm định t hai mẫu.
B. Kiểm định z một mẫu.
C. Phân tích phương sai (ANOVA).
D. Kiểm định χ².
130. Một công ty muốn xác định xem có sự khác biệt đáng kể về doanh thu giữa các quý trong năm hay không. Phương pháp nào phù hợp nhất?
A. Kiểm định t độc lập.
B. Kiểm định χ².
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy.
131. Một công ty muốn kiểm tra xem có sự khác biệt về doanh thu giữa ba chi nhánh khác nhau hay không. Kiểm định nào phù hợp nhất?
A. Kiểm định t hai mẫu.
B. Kiểm định z một mẫu.
C. Phân tích phương sai (ANOVA).
D. Kiểm định χ².
132. Một công ty muốn kiểm tra xem có sự khác biệt về tỷ lệ sản phẩm lỗi giữa hai dây chuyền sản xuất hay không. Kiểm định nào phù hợp nhất?
A. Kiểm định t hai mẫu.
B. Kiểm định z một mẫu.
C. Kiểm định χ².
D. Phân tích phương sai (ANOVA).
133. Trong kiểm định giả thuyết, điều gì sẽ xảy ra nếu bạn giảm mức ý nghĩa α?
A. Xác suất mắc sai lầm loại I tăng lên.
B. Xác suất mắc sai lầm loại II tăng lên.
C. Công suất kiểm định tăng lên.
D. Không có ảnh hưởng đến các loại sai lầm hoặc công suất kiểm định.
134. Giá trị p (p-value) trong kiểm định giả thuyết được định nghĩa là gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất thu được kết quả kiểm định (test statistic) ít nhất cũng cực đoan như kết quả quan sát được, giả sử H0 là đúng.
C. Xác suất mắc sai lầm loại I.
D. Xác suất mắc sai lầm loại II.
135. Trong kiểm định một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở đâu?
A. Chia đều cho cả hai phía của phân phối.
B. Chỉ ở một phía của phân phối.
C. Nằm ở trung tâm của phân phối.
D. Không có vùng bác bỏ trong kiểm định một đuôi.
136. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để kiểm định trung bình của một quần thể?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi muốn kiểm định phương sai.
137. Khi thực hiện kiểm định giả thuyết về phương sai của một quần thể, thống kê kiểm định nào thường được sử dụng?
A. Kiểm định t.
B. Kiểm định z.
C. Kiểm định χ².
D. Kiểm định F.
138. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng kích thước mẫu?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
139. Ý nghĩa của thống kê kiểm định F trong ANOVA là gì?
A. Đo lường sự khác biệt giữa các phương sai trong các nhóm.
B. Đo lường sự khác biệt giữa các trung bình của các nhóm so với sự biến thiên trong mỗi nhóm.
C. Đo lường sự khác biệt giữa kích thước mẫu của các nhóm.
D. Đo lường tổng phương sai.
140. Trong kiểm định χ², bậc tự do (degrees of freedom) được tính như thế nào khi kiểm định tính độc lập giữa hai biến định tính?
A. (Số hàng – 1) + (Số cột – 1)
B. (Số hàng – 1) * (Số cột – 1)
C. Số hàng * Số cột
D. Tổng số quan sát – 1
141. Một công ty muốn kiểm tra xem tỷ lệ khách hàng hài lòng với sản phẩm A có cao hơn 80% hay không. Giả thuyết nào phù hợp để kiểm tra điều này?
A. H0: p = 0.8, H1: p ≠ 0.8
B. H0: p ≥ 0.8, H1: p < 0.8
C. H0: p ≤ 0.8, H1: p > 0.8
D. H0: p < 0.8, H1: p ≥ 0.8
142. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
143. Ý nghĩa của việc tính toán khoảng tin cậy (confidence interval) là gì?
A. Ước lượng một giá trị duy nhất cho tham số của quần thể.
B. Cung cấp một khoảng giá trị mà tham số của quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định giả thuyết về tham số của quần thể.
D. Tính toán sai số chuẩn.
144. Một nhà quản lý muốn so sánh năng suất trung bình của hai nhóm nhân viên khác nhau. Loại kiểm định nào phù hợp nhất để sử dụng?
A. Kiểm định χ².
B. Kiểm định t hai mẫu.
C. Kiểm định z một mẫu.
D. Phân tích phương sai (ANOVA).
145. Để giảm nguy cơ mắc sai lầm loại II, bạn có thể làm gì?
A. Giảm kích thước mẫu.
B. Tăng mức ý nghĩa α.
C. Sử dụng kiểm định một đuôi thay vì hai đuôi.
D. Tất cả các phương án trên.
146. Công suất kiểm định (Power of a test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
147. Một công ty muốn kiểm tra xem một chiến dịch quảng cáo mới có làm tăng doanh số bán hàng trung bình hàng tháng hay không. Giả thuyết nào phù hợp?
A. H0: μ = 0, H1: μ ≠ 0
B. H0: μ ≥ 0, H1: μ < 0
C. H0: μ ≤ 0, H1: μ > 0
D. H0: μ = 0, H1: μ > 0
148. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Tập hợp các giá trị mà nếu thống kê kiểm định rơi vào đó, ta chấp nhận H0.
B. Tập hợp các giá trị mà nếu thống kê kiểm định rơi vào đó, ta bác bỏ H0.
C. Tập hợp tất cả các giá trị có thể của thống kê kiểm định.
D. Tập hợp các giá trị mà giá trị p lớn hơn α.
149. Khi nào nên sử dụng kiểm định χ² (Chi-square test)?
A. Để kiểm định trung bình của một quần thể.
B. Để kiểm định phương sai của một quần thể.
C. Để kiểm định sự độc lập giữa hai biến định tính.
D. Để kiểm định sự bằng nhau giữa hai trung bình.
150. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều bằng nhau.
B. Ít nhất một trung bình của các nhóm khác với các trung bình còn lại.
C. Phương sai của tất cả các nhóm đều bằng nhau.
D. Phương sai của tất cả các nhóm đều khác nhau.