1. Trong phân tích phương sai (ANOVA), ‘giá trị F’ (F-statistic) dùng để làm gì?
A. So sánh phương sai giữa các nhóm với phương sai trong các nhóm.
B. Xác định mối quan hệ giữa hai biến.
C. Đo lường mức độ phân tán của dữ liệu.
D. Kiểm định sự độc lập của các biến.
2. Trong kiểm định giả thuyết, giá trị p (p-value) là gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null.
C. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
D. Mức ý nghĩa thống kê của kiểm định.
3. Trong phân tích dữ liệu, ‘tần suất’ (frequency) đề cập đến điều gì?
A. Số lần một giá trị xuất hiện trong một tập dữ liệu.
B. Giá trị trung bình của dữ liệu.
C. Độ lệch chuẩn của dữ liệu.
D. Mối quan hệ giữa hai biến.
4. Trong phân tích hồi quy, ‘kiểm định Wald’ (Wald test) được sử dụng để làm gì?
A. Kiểm định ý nghĩa thống kê của các hệ số hồi quy.
B. Kiểm tra sự phù hợp của mô hình.
C. Xác định các giá trị ngoại lai.
D. Kiểm tra tính đa cộng tuyến.
5. Điều gì xảy ra nếu giá trị p nhỏ hơn mức ý nghĩa (alpha) trong một kiểm định giả thuyết?
A. Bác bỏ giả thuyết null.
B. Chấp nhận giả thuyết null.
C. Không có kết luận nào có thể được đưa ra.
D. Kiểm định không có ý nghĩa thống kê.
6. Trong phân tích hồi quy đa biến, hiện tượng ‘đa cộng tuyến’ (multicollinearity) là gì?
A. Sự tương quan cao giữa các biến độc lập trong mô hình.
B. Sự tương quan thấp giữa các biến độc lập trong mô hình.
C. Sự tương quan giữa biến độc lập và biến phụ thuộc.
D. Sự hiện diện của các giá trị ngoại lai trong dữ liệu.
7. Trong phân tích hồi quy, ‘phần dư’ (residual) là gì?
A. Sự khác biệt giữa giá trị quan sát được và giá trị dự đoán từ mô hình.
B. Giá trị trung bình của biến phụ thuộc.
C. Hệ số góc của đường hồi quy.
D. Hệ số xác định (R-squared).
8. Trong một nghiên cứu về hiệu quả của một loại thuốc mới, nhóm đối chứng là gì?
A. Nhóm không nhận được thuốc hoặc nhận được giả dược.
B. Nhóm nhận được thuốc mới.
C. Nhóm bệnh nhân có tình trạng bệnh nặng nhất.
D. Nhóm bệnh nhân có tình trạng bệnh nhẹ nhất.
9. Trong thống kê, ‘ước lượng điểm’ (point estimate) là gì?
A. Một giá trị đơn lẻ được sử dụng để ước tính tham số tổng thể.
B. Khoảng giá trị được sử dụng để ước tính tham số tổng thể.
C. Xác suất một sự kiện xảy ra.
D. Độ lệch chuẩn của một mẫu.
10. Trong phân tích dữ liệu, ‘độ lệch chuẩn của mẫu’ (sample standard deviation) được tính như thế nào?
A. Căn bậc hai của phương sai mẫu.
B. Trung bình của các giá trị trong mẫu.
C. Hiệu của giá trị lớn nhất và nhỏ nhất trong mẫu.
D. Tổng của các giá trị trong mẫu chia cho kích thước mẫu.
11. Mục đích chính của phân tích phương sai (ANOVA) là gì?
A. So sánh giá trị trung bình của hai hoặc nhiều nhóm.
B. Xác định mối quan hệ giữa hai biến.
C. Đo lường mức độ phân tán của dữ liệu.
D. Kiểm định giả thuyết về sự độc lập của các biến.
12. Trong kiểm định giả thuyết, ‘giả thuyết null’ (null hypothesis) là gì?
A. Một tuyên bố về dân số mà chúng ta muốn kiểm định.
B. Giả thuyết mà chúng ta muốn chứng minh là đúng.
C. Mức ý nghĩa thống kê của kiểm định.
D. Xác suất bác bỏ giả thuyết null.
13. Trong phân tích hồi quy, ‘hệ số chặn’ (intercept) đại diện cho điều gì?
A. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
B. Độ dốc của đường hồi quy.
C. Mức độ phù hợp của mô hình.
D. Hệ số tương quan giữa các biến.
14. Giả sử bạn đang phân tích dữ liệu về doanh số bán hàng và chi phí quảng cáo. Nếu hệ số tương quan giữa hai biến này là 0.8, điều này có nghĩa là gì?
A. Có mối quan hệ tuyến tính thuận chiều mạnh giữa doanh số bán hàng và chi phí quảng cáo.
B. Chi phí quảng cáo không ảnh hưởng đến doanh số bán hàng.
C. Mối quan hệ giữa doanh số bán hàng và chi phí quảng cáo là phi tuyến tính.
D. Doanh số bán hàng và chi phí quảng cáo có mối quan hệ nghịch chiều.
15. Khi nào thì một kiểm định t-test một mẫu (one-sample t-test) được sử dụng?
A. Khi so sánh giá trị trung bình của một mẫu với một giá trị cho trước.
B. Khi so sánh giá trị trung bình của hai mẫu độc lập.
C. Khi so sánh giá trị trung bình của hai mẫu liên kết.
D. Khi phân tích mối quan hệ giữa hai biến.
16. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình, biểu thị tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
B. Giá trị trung bình của biến phụ thuộc.
C. Độ lệch chuẩn của các hệ số hồi quy.
D. Mức độ tương quan giữa các biến độc lập.
17. Hàm mật độ xác suất (probability density function – PDF) mô tả điều gì?
A. Xác suất mà một biến ngẫu nhiên nhận một giá trị cụ thể.
B. Giá trị trung bình của một biến ngẫu nhiên.
C. Độ lệch chuẩn của một biến ngẫu nhiên.
D. Xác suất tích lũy của một biến ngẫu nhiên.
18. Mục tiêu của kiểm định Chi-square (χ²) là gì?
A. Kiểm tra sự độc lập của hai biến phân loại.
B. So sánh giá trị trung bình của hai nhóm.
C. Đo lường mức độ phân tán của dữ liệu.
D. Xác định mối quan hệ tuyến tính giữa hai biến liên tục.
19. Trong thống kê, ‘độ lệch chuẩn của trung bình’ (standard error of the mean) đo lường điều gì?
A. Độ phân tán của các giá trị trung bình mẫu xung quanh giá trị trung bình tổng thể.
B. Độ phân tán của dữ liệu trong mẫu.
C. Giá trị trung bình của mẫu.
D. Độ lệch chuẩn của tổng thể.
20. Trong một nghiên cứu, ‘sai số loại I’ (Type I error) là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Sai số do đo lường không chính xác.
D. Sai số do chọn mẫu không ngẫu nhiên.
21. Trong thống kê, ‘phân phối chuẩn’ (normal distribution) được đặc trưng bởi điều gì?
A. Hình chuông, đối xứng xung quanh giá trị trung bình.
B. Hình dạng không đối xứng.
C. Giá trị trung bình bằng 0.
D. Độ lệch chuẩn bằng 1.
22. Mục đích của việc sử dụng các phép biến đổi dữ liệu (data transformation) trong phân tích thống kê là gì?
A. Để làm cho dữ liệu phù hợp hơn với các giả định của các phương pháp thống kê.
B. Để tăng kích thước của tập dữ liệu.
C. Để giảm độ chính xác của dữ liệu.
D. Để thay đổi giá trị trung bình của dữ liệu.
23. Trong phân tích chuỗi thời gian, phương pháp nào thường được sử dụng để làm mịn dữ liệu và loại bỏ các biến động ngắn hạn?
A. Trung bình trượt.
B. Phân tích hồi quy.
C. Kiểm định giả thuyết.
D. Phân tích phương sai.
24. Trong bối cảnh thống kê, khái niệm ‘độ lệch chuẩn’ (standard deviation) đo lường điều gì?
A. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
B. Giá trị trung bình của tập dữ liệu.
C. Số lượng các điểm dữ liệu trong một tập dữ liệu.
D. Mối quan hệ giữa hai biến.
25. Trong một nghiên cứu, ‘sai số loại II’ (Type II error) là gì?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Sai số do chọn mẫu không ngẫu nhiên.
D. Sai số do đo lường không chính xác.
26. Trong phân tích hồi quy, việc kiểm tra các giả định của mô hình hồi quy có quan trọng không? Tại sao?
A. Có, để đảm bảo kết quả hồi quy là chính xác và đáng tin cậy.
B. Không, vì kết quả hồi quy luôn đúng.
C. Không, chỉ quan trọng khi có nhiều biến độc lập.
D. Có, nhưng chỉ khi R-squared thấp.
27. Ý nghĩa của ‘khoảng tin cậy’ (confidence interval) trong thống kê là gì?
A. Khoảng giá trị mà chúng ta kỳ vọng chứa giá trị tham số thực của tổng thể với một mức độ tin cậy nhất định.
B. Giá trị trung bình của mẫu.
C. Độ lệch chuẩn của mẫu.
D. Xác suất bác bỏ giả thuyết null.
28. Trong phân tích dữ liệu, ‘giá trị ngoại lai’ (outlier) là gì?
A. Điểm dữ liệu khác biệt đáng kể so với các điểm dữ liệu khác.
B. Giá trị trung bình của dữ liệu.
C. Giá trị phổ biến nhất trong dữ liệu.
D. Điểm dữ liệu nằm trong khoảng tứ phân vị.
29. Trong phân tích dữ liệu, ‘tứ phân vị’ (quartile) là gì?
A. Các giá trị chia dữ liệu thành bốn phần bằng nhau.
B. Giá trị trung bình của dữ liệu.
C. Độ lệch chuẩn của dữ liệu.
D. Giá trị lớn nhất và nhỏ nhất của dữ liệu.
30. Trong một phân tích, ‘power’ (công suất) của một kiểm định thống kê là gì?
A. Xác suất bác bỏ giả thuyết null khi nó sai.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất bác bỏ giả thuyết null khi nó đúng.
D. Xác suất chấp nhận giả thuyết null khi nó đúng.
31. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Các biến độc lập có tương quan thấp với nhau.
B. Các biến độc lập có tương quan cao với nhau.
C. Biến phụ thuộc có tương quan cao với các biến độc lập.
D. Mẫu dữ liệu quá nhỏ.
32. Trong kiểm định giả thuyết, sức mạnh (power) của một kiểm định là gì?
A. Xác suất chấp nhận giả thuyết null khi nó đúng.
B. Xác suất bác bỏ giả thuyết null khi nó đúng.
C. Xác suất bác bỏ giả thuyết null khi nó sai.
D. Xác suất chấp nhận giả thuyết null khi nó sai.
33. Trong phân tích phương sai (ANOVA), F-statistic được sử dụng để làm gì?
A. So sánh phương sai giữa các nhóm với phương sai trong các nhóm.
B. Kiểm tra sự khác biệt giữa các giá trị trung bình của hai nhóm.
C. Đánh giá mối quan hệ giữa các biến định tính.
D. Xác định các giá trị ngoại lai trong dữ liệu.
34. Phương pháp Bootstrapping được sử dụng để làm gì trong thống kê?
A. Ước lượng độ lệch chuẩn và khoảng tin cậy của các thống kê.
B. Kiểm tra sự phân phối chuẩn của dữ liệu.
C. Phân tích mối quan hệ giữa các biến định tính.
D. Loại bỏ các giá trị ngoại lai trong dữ liệu.
35. Trong phân tích tương quan, hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ tuyến tính giữa hai biến định lượng.
B. Mối quan hệ giữa hai biến định tính.
C. Sự khác biệt giữa hai nhóm.
D. Mức độ phù hợp của mô hình hồi quy.
36. Trong kiểm định giả thuyết, lỗi loại II (Type II error) là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
D. Giá trị p-value nhỏ hơn mức ý nghĩa.
37. Trong phân tích thời gian (time series), khái niệm ‘tính tự tương quan’ (autocorrelation) đề cập đến điều gì?
A. Mối quan hệ giữa các giá trị của một biến tại các thời điểm khác nhau.
B. Mối quan hệ giữa các biến tại cùng một thời điểm.
C. Sự thay đổi của một biến theo thời gian.
D. Xu hướng tăng hoặc giảm của dữ liệu theo thời gian.
38. Hệ số xác định (R-squared) trong mô hình hồi quy cho biết điều gì?
A. Mức độ phù hợp của mô hình, thể hiện phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.
B. Giá trị trung bình của biến phụ thuộc.
C. Mức độ quan trọng của từng biến độc lập trong mô hình.
D. Sai số của mô hình.
39. Trong phân tích phương sai (ANOVA), giả định nào là quan trọng nhất?
A. Dữ liệu từ các nhóm khác nhau có phân phối chuẩn và phương sai bằng nhau.
B. Dữ liệu phải có phân phối đều.
C. Dữ liệu phải có giá trị trung bình bằng nhau.
D. Dữ liệu phải có các giá trị ngoại lai.
40. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng phương sai không đổi (heteroscedasticity) trong phần dư?
A. Ước lượng của các hệ số hồi quy là không chệch.
B. Ước lượng của các hệ số hồi quy là hiệu quả.
C. Sai số chuẩn của các hệ số hồi quy có thể bị ước lượng sai.
D. Hệ số xác định (R-squared) luôn chính xác.
41. Trong thống kê, ‘tần suất’ (frequency) là gì?
A. Số lần một giá trị xuất hiện trong một tập dữ liệu.
B. Giá trị trung bình của một tập dữ liệu.
C. Giá trị lớn nhất trong một tập dữ liệu.
D. Giá trị nhỏ nhất trong một tập dữ liệu.
42. Trong phân tích dữ liệu, ‘thiên lệch’ (bias) là gì?
A. Xu hướng của một ước lượng thống kê lệch khỏi giá trị thực tế của tham số.
B. Độ lệch chuẩn của một ước lượng thống kê.
C. Sự thay đổi ngẫu nhiên trong dữ liệu.
D. Mức độ phù hợp của mô hình hồi quy.
43. Ý nghĩa của việc sử dụng ‘khoảng tin cậy’ (confidence interval) trong ước lượng thống kê là gì?
A. Cung cấp một khoảng giá trị có khả năng chứa giá trị tham số tổng thể.
B. Đo lường độ lệch chuẩn của dữ liệu.
C. Đo lường mức độ phù hợp của mô hình hồi quy.
D. Kiểm tra sự phân phối chuẩn của dữ liệu.
44. Trong bối cảnh thống kê, khái niệm ‘độ tin cậy’ (confidence interval) đề cập đến điều gì?
A. Khoảng giá trị mà chúng ta tin rằng giá trị tham số tổng thể nằm trong đó.
B. Xác suất một giá trị cụ thể trong mẫu là chính xác.
C. Độ lệch chuẩn của dữ liệu.
D. Xác suất bác bỏ giả thuyết null.
45. Ý nghĩa của việc sử dụng ‘mức ý nghĩa’ (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất một kết quả quan sát được là do ngẫu nhiên.
D. Độ tin cậy của kết quả kiểm định.
46. Trong thống kê, ‘phân phối chuẩn’ (normal distribution) có đặc điểm gì?
A. Hình chuông, đối xứng quanh giá trị trung bình.
B. Hình chữ nhật, không đối xứng.
C. Hình chữ U, đối xứng.
D. Hình chữ L, không đối xứng.
47. Trong phân tích hồi quy, mục đích của việc kiểm tra các giả định của mô hình là gì?
A. Để đảm bảo các kết quả ước lượng là đáng tin cậy.
B. Để tăng R-squared.
C. Để loại bỏ các giá trị ngoại lai.
D. Để giảm thiểu sai số của mô hình.
48. Kiểm định t-test được sử dụng để làm gì?
A. So sánh giá trị trung bình của hai nhóm độc lập.
B. Phân tích mối quan hệ giữa hai biến định tính.
C. Đánh giá mức độ phù hợp của mô hình hồi quy.
D. Kiểm tra sự phân phối chuẩn của dữ liệu.
49. Trong thống kê, ‘phương sai’ (variance) đo lường điều gì?
A. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
B. Giá trị trung bình của dữ liệu.
C. Giá trị lớn nhất trong dữ liệu.
D. Giá trị nhỏ nhất trong dữ liệu.
50. Trong bối cảnh kiểm định giả thuyết, việc chọn mức ý nghĩa (alpha) ảnh hưởng như thế nào đến kết luận?
A. Mức alpha càng nhỏ, khả năng bác bỏ giả thuyết null càng thấp.
B. Mức alpha càng lớn, khả năng bác bỏ giả thuyết null càng thấp.
C. Mức alpha không ảnh hưởng đến kết luận.
D. Mức alpha luôn bằng 0.05.
51. Trong phân tích hồi quy đa biến, điều gì sẽ xảy ra nếu một biến độc lập bị bỏ sót?
A. Ước lượng của các hệ số hồi quy có thể bị sai lệch (bias).
B. Hệ số xác định (R-squared) sẽ tăng lên.
C. Sai số chuẩn của các hệ số hồi quy sẽ giảm.
D. Không có ảnh hưởng đáng kể đến kết quả.
52. Mục tiêu chính của kiểm định Chi-square là gì?
A. Kiểm tra sự độc lập giữa hai biến định tính.
B. So sánh giá trị trung bình của nhiều nhóm.
C. Đánh giá mức độ phù hợp của mô hình hồi quy.
D. Phân tích mối quan hệ tuyến tính giữa hai biến định lượng.
53. Phương pháp phân tích thành phần chính (PCA) được sử dụng để làm gì?
A. Giảm chiều dữ liệu bằng cách tìm các thành phần chính.
B. Kiểm tra sự phân phối chuẩn của dữ liệu.
C. Phân tích mối quan hệ giữa các biến định tính.
D. Đánh giá mức độ phù hợp của mô hình hồi quy.
54. Ý nghĩa của ‘mức ý nghĩa’ (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất chấp nhận giả thuyết null khi nó sai.
B. Xác suất bác bỏ giả thuyết null khi nó đúng (lỗi loại I).
C. Xác suất một kết quả quan sát được là do ngẫu nhiên.
D. Độ tin cậy của kết quả kiểm định.
55. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng tự tương quan (autocorrelation) trong phần dư?
A. Ước lượng của các hệ số hồi quy là không chệch.
B. Ước lượng của các hệ số hồi quy là hiệu quả.
C. Sai số chuẩn của các hệ số hồi quy có thể bị ước lượng sai.
D. Hệ số xác định (R-squared) luôn chính xác.
56. Giả sử bạn đang phân tích mối quan hệ giữa doanh thu bán hàng (Y) và chi phí quảng cáo (X). Kết quả hồi quy cho thấy hệ số hồi quy của X là 0.8. Điều này có ý nghĩa gì?
A. Mỗi khi chi phí quảng cáo tăng thêm 1 đơn vị, doanh thu bán hàng tăng thêm 0.8 đơn vị.
B. Doanh thu bán hàng luôn gấp 0.8 lần chi phí quảng cáo.
C. Mối quan hệ giữa doanh thu bán hàng và chi phí quảng cáo là âm.
D. Không có mối quan hệ nào giữa doanh thu bán hàng và chi phí quảng cáo.
57. Trong phân tích dữ liệu, ý nghĩa của việc chuẩn hóa (standardization) dữ liệu là gì?
A. Biến đổi dữ liệu về cùng một thang đo, giúp so sánh các biến có đơn vị khác nhau.
B. Loại bỏ các giá trị ngoại lai trong dữ liệu.
C. Tăng độ chính xác của các giá trị trung bình.
D. Giảm thiểu sự ảnh hưởng của nhiễu trong dữ liệu.
58. Khi nào thì một kiểm định giả thuyết được coi là có ý nghĩa thống kê?
A. Khi p-value lớn hơn mức ý nghĩa (alpha).
B. Khi p-value bằng mức ý nghĩa.
C. Khi p-value nhỏ hơn mức ý nghĩa (alpha).
D. Khi thống kê kiểm định bằng giá trị tới hạn.
59. Trong kiểm định giả thuyết, giá trị p-value (p-giá trị) là gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
D. Giá trị tới hạn để so sánh với thống kê kiểm định.
60. Trong phân tích dữ liệu, ‘dữ liệu ngoại lai’ (outliers) là gì?
A. Các giá trị khác biệt đáng kể so với các giá trị khác trong dữ liệu.
B. Các giá trị trung bình của dữ liệu.
C. Các giá trị phổ biến nhất trong dữ liệu.
D. Các giá trị không có ý nghĩa trong phân tích.
61. Trong kiểm định giả thuyết, lỗi loại II là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Chấp nhận giả thuyết đối khi nó sai.
D. Bác bỏ giả thuyết đối khi nó đúng.
62. Trong kiểm định giả thuyết, lỗi loại I là gì?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Chấp nhận giả thuyết đối khi nó sai.
D. Bác bỏ giả thuyết đối khi nó đúng.
63. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng tự tương quan (autocorrelation) trong phần dư?
A. Ước lượng các hệ số hồi quy là không chệch.
B. Ước lượng các hệ số hồi quy là hiệu quả.
C. Ước lượng các hệ số hồi quy là không chính xác.
D. Các hệ số hồi quy không bị ảnh hưởng.
64. Trong kiểm định t-test một mẫu, công thức tính giá trị t là gì?
A. (Giá trị trung bình của mẫu – Giá trị giả định) / Độ lệch chuẩn của mẫu
B. (Giá trị trung bình của mẫu – Giá trị giả định) / (Độ lệch chuẩn của mẫu / Căn bậc hai của kích thước mẫu)
C. (Giá trị trung bình của mẫu + Giá trị giả định) / Độ lệch chuẩn của mẫu
D. Độ lệch chuẩn của mẫu / (Giá trị trung bình của mẫu – Giá trị giả định)
65. Kiểm định Chi-square thường được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa các giá trị trung bình của hai nhóm.
B. Kiểm định mối quan hệ giữa hai biến định tính.
C. Kiểm định sự phù hợp của phân phối chuẩn.
D. Kiểm định tính đồng nhất của phương sai.
66. Trong kiểm định Chi-square, bậc tự do (degrees of freedom) được tính như thế nào?
A. (Số hàng – 1) * (Số cột – 1)
B. Tổng số quan sát trong bảng.
C. Số hàng + Số cột
D. (Số hàng + 1) * (Số cột + 1)
67. Hàm mật độ xác suất (PDF) của một biến ngẫu nhiên liên tục biểu diễn điều gì?
A. Xác suất của một giá trị cụ thể của biến ngẫu nhiên.
B. Xác suất tích lũy của biến ngẫu nhiên.
C. Mật độ xác suất tại một giá trị cụ thể của biến ngẫu nhiên.
D. Giá trị trung bình của biến ngẫu nhiên.
68. Trong phân tích phương sai (ANOVA), giả định về tính đồng nhất của phương sai có nghĩa là gì?
A. Phương sai của các nhóm phải khác nhau.
B. Phương sai của các nhóm phải bằng nhau.
C. Giá trị trung bình của các nhóm phải bằng nhau.
D. Phân phối của dữ liệu phải là phân phối chuẩn.
69. Kiểm định Shapiro-Wilk thường được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa hai giá trị trung bình.
B. Kiểm định sự phù hợp của phân phối chuẩn.
C. Kiểm định mối quan hệ giữa hai biến định lượng.
D. Kiểm định tính đồng nhất của phương sai.
70. Trong phân tích hồi quy, việc sử dụng các biến chuyển đổi (transformed variables) có thể giúp gì?
A. Loại bỏ hoàn toàn mối quan hệ giữa các biến.
B. Xử lý các vấn đề về phi tuyến tính và vi phạm các giả định của hồi quy tuyến tính.
C. Tăng cường đa cộng tuyến.
D. Giảm độ chính xác của mô hình.
71. Mục đích chính của kiểm định ANOVA (phân tích phương sai) là gì?
A. So sánh giá trị trung bình của hai nhóm.
B. Xác định mối quan hệ giữa hai biến định lượng.
C. So sánh giá trị trung bình của ba hoặc nhiều nhóm.
D. Đánh giá mức độ tương quan giữa các biến.
72. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, thể hiện bằng phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Giá trị trung bình của biến phụ thuộc trong mô hình hồi quy.
C. Độ lệch chuẩn của các hệ số hồi quy.
D. Mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc.
73. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sự khác biệt giữa giá trị quan sát được và giá trị dự đoán.
C. Hệ số của biến độc lập.
D. Giá trị trung bình của biến phụ thuộc.
74. Trong kiểm định giả thuyết, sức mạnh (power) của một kiểm định là gì?
A. Xác suất mắc lỗi loại I.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất bác bỏ giả thuyết null khi nó sai.
D. Xác suất mắc lỗi loại II.
75. Giả thuyết ‘giá trị trung bình của một mẫu bằng 0’ trong kiểm định t-test một mẫu là gì?
A. Giả thuyết đối.
B. Giả thuyết vô hướng.
C. Giả thuyết thống kê.
D. Giả thuyết null.
76. Kiểm định Kolmogorov-Smirnov thường được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa hai giá trị trung bình.
B. Kiểm định sự phù hợp của một phân phối với một phân phối lý thuyết.
C. Kiểm định mối quan hệ giữa hai biến định lượng.
D. Kiểm định tính đồng nhất của phương sai.
77. Trong phân tích hồi quy, tiêu chí nào sau đây thường được sử dụng để đánh giá chất lượng của mô hình?
A. Giá trị p của các hệ số hồi quy.
B. Hệ số xác định (R-squared).
C. Sai số chuẩn của ước lượng (SEE).
D. Tất cả các lựa chọn trên.
78. Trong phân tích hồi quy, mục đích của việc loại bỏ các giá trị ngoại lai (outliers) là gì?
A. Để tăng R-squared.
B. Để giảm độ chính xác của mô hình.
C. Để làm thay đổi các hệ số hồi quy.
D. Để cải thiện độ tin cậy và độ chính xác của ước lượng các hệ số hồi quy.
79. Trong phân tích phương sai (ANOVA), ý nghĩa của giá trị p là gì?
A. Xác suất để bác bỏ giả thuyết null khi nó đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Xác suất để chấp nhận giả thuyết null.
D. Xác suất để sai lầm khi chấp nhận giả thuyết null.
80. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được sử dụng để làm gì?
A. Xác định giá trị trung bình của mẫu.
B. Xác định xác suất mắc lỗi loại II.
C. Xác định ngưỡng để bác bỏ giả thuyết null.
D. Xác định độ tin cậy của ước lượng.
81. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Các biến độc lập có mối tương quan mạnh với nhau.
B. Biến phụ thuộc có mối tương quan mạnh với các biến độc lập.
C. Có quá nhiều quan sát trong dữ liệu.
D. Mô hình hồi quy không phù hợp với dữ liệu.
82. Trong kiểm định t-test hai mẫu độc lập, giá trị t được tính như thế nào?
A. (Hiệu của giá trị trung bình của hai mẫu) / (Sai số chuẩn của hiệu hai giá trị trung bình)
B. (Tổng của hai giá trị trung bình) / (Sai số chuẩn của tổng hai giá trị trung bình)
C. Giá trị trung bình của mẫu / Độ lệch chuẩn của mẫu
D. Độ lệch chuẩn của mẫu / Giá trị trung bình của mẫu
83. Ý nghĩa của hệ số chặn (intercept) trong mô hình hồi quy là gì?
A. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
B. Độ dốc của đường hồi quy.
C. Mức độ ảnh hưởng của biến độc lập lên biến phụ thuộc.
D. Giá trị trung bình của biến phụ thuộc.
84. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ tuyến tính giữa hai biến định lượng.
B. Mối quan hệ giữa hai biến định tính.
C. Mối quan hệ phi tuyến tính giữa hai biến định lượng.
D. Sự khác biệt giữa hai giá trị trung bình.
85. Trong phân tích phương sai (ANOVA), giá trị F được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm.
B. Tổng các giá trị trung bình.
C. Hiệu giữa các giá trị trung bình.
D. Tích của các giá trị trung bình.
86. Điều kiện cần để áp dụng kiểm định t-test độc lập là gì?
A. Dữ liệu phải có phân phối chuẩn và phương sai của hai nhóm phải bằng nhau.
B. Dữ liệu phải có phân phối chuẩn và kích thước mẫu phải lớn.
C. Dữ liệu phải là định lượng và hai mẫu độc lập.
D. Dữ liệu phải có phân phối chuẩn và phương sai của hai nhóm có thể khác nhau.
87. Ý nghĩa của khoảng tin cậy (confidence interval) là gì?
A. Khoảng giá trị mà giá trị thực của tham số nằm trong đó với một mức độ tin cậy nhất định.
B. Giá trị trung bình của một mẫu.
C. Độ lệch chuẩn của một mẫu.
D. Giá trị p trong kiểm định giả thuyết.
88. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất để bác bỏ giả thuyết null khi nó đúng.
B. Xác suất để thu được kết quả quan sát được (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Xác suất để chấp nhận giả thuyết null.
D. Xác suất để sai lầm khi chấp nhận giả thuyết null.
89. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng phương sai không đổi (heteroscedasticity) trong phần dư?
A. Ước lượng các hệ số hồi quy là không chệch và hiệu quả.
B. Ước lượng các hệ số hồi quy là chệch và không hiệu quả.
C. Ước lượng các hệ số hồi quy là không chệch, nhưng sai số chuẩn là không chính xác.
D. Không có ảnh hưởng đáng kể đến mô hình.
90. Trong kiểm định Chi-square, giả thuyết null thường là gì?
A. Hai biến độc lập.
B. Hai biến có mối quan hệ.
C. Hai biến không có mối quan hệ.
D. Hai biến phụ thuộc.
91. Trong một nghiên cứu, bạn muốn kiểm tra xem có sự khác biệt về điểm số kiểm tra giữa hai nhóm học sinh (A và B). Bạn sẽ sử dụng kiểm định nào?
A. Kiểm định Chi-square.
B. Kiểm định t-test cho hai mẫu độc lập.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Friedman.
92. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở giá trị nào?
A. 0.01
B. 0.05
C. 0.10
D. Tất cả các giá trị trên đều có thể được sử dụng.
93. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, thể hiện bằng phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Mức độ tương quan giữa các biến độc lập trong mô hình.
C. Giá trị trung bình của biến phụ thuộc.
D. Độ lệch chuẩn của các hệ số hồi quy.
94. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết thống kê là gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null.
C. Xác suất để quan sát được kết quả mẫu hoặc kết quả khắc nghiệt hơn, giả sử giả thuyết null là đúng.
D. Độ lớn của hiệu ứng quan sát được.
95. Trong một phân tích hồi quy, điều gì xảy ra nếu có đa cộng tuyến (multicollinearity) giữa các biến độc lập?
A. Các hệ số hồi quy sẽ được ước tính chính xác hơn.
B. Các sai số chuẩn của các hệ số hồi quy sẽ tăng lên.
C. Giá trị R-squared sẽ giảm.
D. Mô hình sẽ không thể ước tính được.
96. Điều gì sẽ xảy ra nếu bạn tăng kích thước mẫu?
A. Độ chính xác của ước lượng sẽ giảm.
B. Sai số chuẩn sẽ tăng lên.
C. Khoảng tin cậy sẽ rộng hơn.
D. Độ chính xác của ước lượng sẽ tăng lên.
97. Trong phân tích chuỗi thời gian, thành phần nào mô tả các biến động lặp đi lặp lại trong một khoảng thời gian cố định?
A. Xu hướng (Trend).
B. Chu kỳ (Cycle).
C. Tính thời vụ (Seasonality).
D. Ngẫu nhiên (Random).
98. Trong phân tích dữ liệu, khái niệm ‘bias’ (thiên vị) đề cập đến điều gì?
A. Sự biến động ngẫu nhiên trong dữ liệu.
B. Sự sai lệch có hệ thống trong ước tính.
C. Sự khác biệt giữa các giá trị quan sát được và giá trị trung bình.
D. Độ rộng của khoảng tin cậy.
99. Khi nào thì kiểm định Chi-square được sử dụng?
A. Để kiểm tra mối quan hệ giữa hai biến định lượng.
B. Để so sánh giá trị trung bình của nhiều nhóm.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự báo các giá trị tương lai trong chuỗi thời gian.
100. Điều gì thể hiện sự khác biệt giữa các giá trị trong một tập dữ liệu?
A. Giá trị trung bình.
B. Độ lệch chuẩn.
C. Giá trị trung vị.
D. Phương sai.
101. Trong phân tích chuỗi thời gian, phương pháp nào được sử dụng để giảm thiểu tính tự tương quan?
A. Phân tích thành phần.
B. Hiệu chỉnh theo mùa.
C. Làm mịn hàm mũ.
D. Phân tích hồi quy.
102. Phương pháp nào sau đây được sử dụng để phát hiện các giá trị ngoại lai trong một tập dữ liệu?
A. Phân tích hồi quy.
B. Biểu đồ phân tán.
C. Biểu đồ hộp (boxplot).
D. Kiểm định t-test.
103. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. Để so sánh giá trị trung bình của hai nhóm độc lập.
B. Để xác định mối quan hệ giữa hai biến định tính.
C. Để so sánh giá trị trung bình của ba hoặc nhiều nhóm độc lập.
D. Để dự báo các giá trị trong tương lai.
104. Trong kiểm định Chi-square, bậc tự do (degrees of freedom) được tính như thế nào?
A. Số lượng quan sát trừ đi số lượng biến.
B. (Số hàng – 1) * (Số cột – 1).
C. Số lượng biến độc lập.
D. Tổng số lượng quan sát.
105. Trong phân tích hồi quy, mục tiêu của việc chuyển đổi biến (ví dụ: logarit hóa) là gì?
A. Để tăng R-squared.
B. Để làm cho mối quan hệ giữa các biến tuyến tính hơn.
C. Để giảm thiểu đa cộng tuyến.
D. Để giảm sai số chuẩn.
106. Trong phân tích hồi quy, điều gì đại diện cho hệ số chặn (intercept)?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Giá trị trung bình của biến độc lập.
D. Mức độ phù hợp của mô hình.
107. Trong phân tích phương sai (ANOVA) hai chiều, bạn có thể phân tích ảnh hưởng của bao nhiêu biến độc lập?
A. Một.
B. Hai.
C. Ba.
D. Bốn.
108. Trong kiểm định giả thuyết, khi nào thì bạn bác bỏ giả thuyết null?
A. Khi giá trị p lớn hơn mức ý nghĩa.
B. Khi giá trị p nhỏ hơn mức ý nghĩa.
C. Khi giá trị kiểm định nằm trong vùng chấp nhận.
D. Luôn luôn.
109. Kiểm định giả thuyết nào sau đây được sử dụng để so sánh giá trị trung bình của hai nhóm độc lập?
A. Kiểm định Chi-square.
B. Kiểm định t-test độc lập.
C. Kiểm định ANOVA.
D. Kiểm định Friedman.
110. Trong kiểm định giả thuyết, điều gì đại diện cho sai lầm loại II?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Chấp nhận giả thuyết null khi nó đúng.
D. Bác bỏ giả thuyết null khi nó sai.
111. Trong phân tích hồi quy, mục tiêu chính của việc kiểm tra các giả định là gì?
A. Để đảm bảo rằng các kết quả hồi quy là đáng tin cậy.
B. Để tìm ra các biến độc lập tốt hơn.
C. Để tăng giá trị R-squared.
D. Để giảm sai số chuẩn.
112. Giả sử bạn đang phân tích dữ liệu về doanh số bán hàng và chi phí quảng cáo. Để xác định liệu chi phí quảng cáo có thực sự ảnh hưởng đến doanh số bán hàng hay không, phương pháp thống kê nào phù hợp nhất?
A. Phân tích phương sai (ANOVA).
B. Kiểm định Chi-square.
C. Phân tích hồi quy.
D. Kiểm định t-test cho hai mẫu độc lập.
113. Trong phân tích hồi quy, giả định về tính độc lập của các sai số có nghĩa là gì?
A. Các sai số không có mối quan hệ với nhau.
B. Các sai số có phân phối chuẩn.
C. Các sai số có phương sai không đổi.
D. Các sai số có giá trị trung bình bằng 0.
114. Độ tin cậy của một khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng giá trị thực của tham số nằm trong khoảng tin cậy.
B. Có 5% khả năng giá trị thực của tham số nằm ngoài khoảng tin cậy.
C. Nếu lặp lại việc lấy mẫu nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa giá trị thực của tham số.
D. Tất cả các đáp án trên đều đúng.
115. Trong phân tích phương sai (ANOVA) một chiều, biến độc lập có bao nhiêu nhóm?
A. Một.
B. Hai.
C. Ba.
D. Ba trở lên.
116. Kiểm định nào được sử dụng để xác định xem một biến có phân phối chuẩn hay không?
A. Kiểm định t-test.
B. Kiểm định Chi-square.
C. Kiểm định Shapiro-Wilk.
D. Kiểm định ANOVA.
117. Phương pháp nào sau đây là một kỹ thuật lấy mẫu ngẫu nhiên?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu theo mục đích.
D. Lấy mẫu tuyết rơi.
118. Trong phân tích hồi quy, giả định về tính tuyến tính có nghĩa là gì?
A. Mối quan hệ giữa các biến độc lập và biến phụ thuộc là tuyến tính.
B. Các biến độc lập không có mối quan hệ với nhau.
C. Các sai số có phân phối chuẩn.
D. Các sai số có phương sai không đổi.
119. Trong một biểu đồ phân tán, trục tung (y-axis) thường đại diện cho:
A. Biến độc lập.
B. Thời gian.
C. Biến phụ thuộc.
D. Tần số.
120. Phương pháp nào sau đây được sử dụng để dự báo giá trị trong tương lai dựa trên dữ liệu chuỗi thời gian?
A. Kiểm định t-test.
B. Phân tích hồi quy.
C. Làm mịn hàm mũ.
D. Kiểm định Chi-square.
121. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Các biến độc lập có tương quan thấp với nhau.
B. Các biến độc lập có phương sai bằng 0.
C. Các biến độc lập có tương quan cao với nhau.
D. Các biến độc lập không có mối quan hệ với biến phụ thuộc.
122. Trong phân tích thời gian chuỗi, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự báo giá trị tương lai của chuỗi thời gian.
B. Làm mịn dữ liệu và làm nổi bật xu hướng hoặc chu kỳ.
C. Kiểm tra tính tự tương quan của dữ liệu.
D. Phân tích thành phần mùa vụ của dữ liệu.
123. Trong phân tích phương sai (ANOVA), giá trị F-statistic được sử dụng để làm gì?
A. Đo lường mức độ tương quan giữa các biến.
B. So sánh phương sai giữa các nhóm với phương sai trong các nhóm.
C. Xác định hệ số xác định.
D. Quyết định bác bỏ hay chấp nhận giả thuyết null.
124. Trong phân tích hồi quy, hệ số chặn (intercept) có ý nghĩa gì?
A. Tác động của một đơn vị thay đổi của biến độc lập lên biến phụ thuộc.
B. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình.
D. Mức độ quan trọng của một biến độc lập.
125. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Phân loại các đối tượng thành các nhóm sao cho các đối tượng trong cùng một nhóm tương tự nhau hơn các đối tượng ở các nhóm khác.
B. Dự báo giá trị của một biến liên tục dựa trên các biến khác.
C. Xác định mối quan hệ nhân quả giữa các biến.
D. Kiểm tra tính độc lập giữa các biến.
126. Trong phân tích hồi quy, các giá trị ngoại lai (outliers) có thể ảnh hưởng đến điều gì?
A. Các ước lượng hệ số hồi quy và độ chính xác của chúng.
B. Chỉ số R-squared.
C. Chỉ số Durbin-Watson.
D. Tất cả các phương án trên.
127. Kiểm định Durbin-Watson được sử dụng để làm gì trong phân tích hồi quy?
A. Kiểm tra tính đa cộng tuyến.
B. Kiểm tra tính tự tương quan của phần dư.
C. Kiểm tra tính đồng nhất của phương sai.
D. Kiểm tra sự phù hợp của mô hình.
128. Trong kiểm định giả thuyết, lỗi loại II (Type II error) là gì?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó sai.
C. Kết quả kiểm định là không có ý nghĩa thống kê.
D. Dữ liệu không tuân theo phân phối chuẩn.
129. Trong kiểm định Chi-square, giả thuyết null thường phát biểu điều gì?
A. Không có mối liên hệ giữa các biến phân loại.
B. Có mối liên hệ giữa các biến phân loại.
C. Các biến phân loại có phân phối chuẩn.
D. Các biến phân loại có phương sai bằng nhau.
130. Ý nghĩa của kiểm định Kolmogorov-Smirnov trong thống kê?
A. Kiểm định sự phù hợp của phân phối chuẩn cho một mẫu dữ liệu.
B. Kiểm định sự khác biệt giữa hai trung bình.
C. Kiểm định sự độc lập giữa hai biến phân loại.
D. Kiểm định tính đồng nhất của phương sai.
131. Ý nghĩa của kiểm định Levene trong thống kê?
A. Kiểm định sự phù hợp của phân phối chuẩn cho một mẫu dữ liệu.
B. Kiểm định sự khác biệt giữa hai trung bình.
C. Kiểm định tính đồng nhất của phương sai giữa hai hoặc nhiều nhóm.
D. Kiểm định sự độc lập giữa hai biến phân loại.
132. Trong phân tích bảng chéo (cross-tabulation), kiểm định Chi-square được sử dụng để làm gì?
A. Xác định mối quan hệ nhân quả giữa các biến.
B. Kiểm định sự độc lập giữa hai biến phân loại.
C. Dự báo giá trị của một biến dựa trên biến khác.
D. Đo lường mức độ tương quan giữa hai biến liên tục.
133. Hệ số xác định (coefficient of determination), ký hiệu R-squared, trong phân tích hồi quy có ý nghĩa gì?
A. Đo lường mức độ phù hợp của mô hình, thể hiện tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.
B. Đo lường mức độ tương quan giữa các biến độc lập.
C. Đo lường mức độ sai lệch của các giá trị dự báo.
D. Đo lường mức độ quan trọng của một biến độc lập trong mô hình.
134. Ý nghĩa của việc sử dụng các phép biến đổi dữ liệu (ví dụ: logarit, căn bậc hai) trong phân tích thống kê?
A. Để tăng độ chính xác của các ước lượng hệ số.
B. Để làm cho phân phối của dữ liệu gần với phân phối chuẩn hơn và/hoặc để ổn định phương sai.
C. Để giảm thiểu tác động của các giá trị ngoại lai.
D. Tất cả các phương án trên.
135. Trong phân tích hồi quy, điều gì xảy ra nếu vi phạm giả định về tính độc lập của các phần dư?
A. Ước lượng hệ số hồi quy là không chệch.
B. Ước lượng độ lệch chuẩn của hệ số hồi quy là không chính xác.
C. Kiểm định t và F là chính xác.
D. Hệ số xác định (R-squared) không bị ảnh hưởng.
136. Trong phân tích dữ liệu, phương pháp bootstrapping được sử dụng để làm gì?
A. Ước lượng khoảng tin cậy và độ lệch chuẩn của các thống kê bằng cách lấy mẫu lại từ dữ liệu gốc.
B. Giảm thiểu sự hiện diện của các giá trị ngoại lai trong dữ liệu.
C. Xác định các mối quan hệ nhân quả giữa các biến.
D. Kiểm định giả thuyết về sự khác biệt giữa các nhóm.
137. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng phương sai thay đổi (heteroscedasticity)?
A. Các ước lượng hệ số hồi quy là không chệch.
B. Các ước lượng hệ số hồi quy là hiệu quả.
C. Các ước lượng độ lệch chuẩn của hệ số hồi quy là không chính xác.
D. Kiểm định t và F là không bị ảnh hưởng.
138. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) α (alpha) đại diện cho điều gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất để một kết quả quan sát được là do ngẫu nhiên.
D. Xác suất để một kết quả quan sát được là chính xác.
139. Ý nghĩa của việc sử dụng các trọng số (weights) trong phân tích thống kê?
A. Để giảm thiểu ảnh hưởng của các giá trị ngoại lai.
B. Để điều chỉnh sự khác biệt về tầm quan trọng của các quan sát.
C. Để tăng độ chính xác của ước lượng hệ số.
D. Để thay đổi phân phối của dữ liệu.
140. Trong phân tích thời gian chuỗi, thành phần mùa vụ (seasonal component) thể hiện điều gì?
A. Sự biến động ngẫu nhiên, không thể dự đoán trước.
B. Sự thay đổi dài hạn, có xu hướng tăng hoặc giảm, của dữ liệu.
C. Sự biến động lặp đi lặp lại trong một khoảng thời gian cố định (ví dụ: hàng năm, hàng quý).
D. Sự biến động do các yếu tố bên ngoài, như dịch bệnh.
141. Trong phân tích dữ liệu, phương pháp giảm chiều (dimensionality reduction) có mục tiêu gì?
A. Tăng số lượng biến trong dữ liệu.
B. Giảm số lượng biến trong dữ liệu trong khi vẫn giữ lại thông tin quan trọng.
C. Tăng độ phức tạp của mô hình.
D. Tăng số lượng quan sát trong dữ liệu.
142. Trong phân tích thời gian chuỗi, thành phần xu hướng (trend component) mô tả điều gì?
A. Sự biến động lặp đi lặp lại trong một khoảng thời gian cố định.
B. Sự thay đổi dài hạn, có xu hướng tăng hoặc giảm, của dữ liệu.
C. Sự biến động ngẫu nhiên, không thể dự đoán trước.
D. Sự biến động theo mùa trong một năm.
143. Khi nào thì kiểm định giả thuyết về hệ số hồi quy là quan trọng?
A. Khi muốn xác định xem một biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc hay không.
B. Khi muốn đánh giá mức độ phù hợp của mô hình.
C. Khi muốn dự báo giá trị của biến phụ thuộc.
D. Khi muốn xác định xem có đa cộng tuyến hay không.
144. Ý nghĩa của hệ số tương quan Pearson là gì?
A. Đo lường mức độ liên kết tuyến tính giữa hai biến liên tục.
B. Đo lường mức độ liên kết giữa hai biến phân loại.
C. Đo lường mức độ phù hợp của một mô hình hồi quy.
D. Đo lường sự khác biệt giữa hai trung bình.
145. Ý nghĩa của kiểm định Shapiro-Wilk trong thống kê?
A. Kiểm định sự phù hợp của phân phối chuẩn cho một mẫu dữ liệu.
B. Kiểm định sự khác biệt giữa hai trung bình.
C. Kiểm định sự độc lập giữa hai biến phân loại.
D. Kiểm định tính đồng nhất của phương sai.
146. Trong phân tích phương sai (ANOVA) một chiều, các giả định chính là gì?
A. Dữ liệu từ mỗi nhóm phải có phân phối chuẩn và phương sai của các nhóm phải bằng nhau.
B. Dữ liệu phải có phân phối chuẩn và các nhóm phải độc lập với nhau.
C. Phương sai của các nhóm phải bằng nhau và dữ liệu phải độc lập với nhau.
D. Dữ liệu phải có phân phối chuẩn, phương sai của các nhóm bằng nhau, và các nhóm phải độc lập với nhau.
147. Giả sử bạn muốn so sánh mức lương trung bình của nhân viên trong ba phòng ban khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Phân tích hồi quy.
B. Kiểm định t-test độc lập.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-square.
148. Trong phân tích phương sai (ANOVA), giá trị p-value được sử dụng để làm gì?
A. Xác định mức độ tương quan giữa các biến.
B. Quyết định bác bỏ hay chấp nhận giả thuyết null.
C. Đo lường phương sai giữa các nhóm.
D. Xác định hệ số xác định.
149. Trong kiểm định giả thuyết, sức mạnh (power) của một kiểm định là gì?
A. Xác suất bác bỏ giả thuyết null khi nó sai.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất bác bỏ giả thuyết null khi nó đúng.
D. Xác suất chấp nhận giả thuyết null khi nó đúng.
150. Trong phân tích dữ liệu, phương pháp phân tích nhân tố (factor analysis) được sử dụng để làm gì?
A. Giảm số lượng biến bằng cách nhóm các biến có liên quan thành các nhân tố.
B. Dự báo giá trị của một biến liên tục dựa trên các biến khác.
C. Kiểm tra tính độc lập giữa các biến.
D. So sánh các giá trị trung bình của các nhóm khác nhau.