1. Một cửa hàng muốn xác định xem có sự khác biệt đáng kể về doanh số bán hàng giữa hai chi nhánh hay không. Kiểm định thống kê nào phù hợp nhất để sử dụng?
A. Phân tích hồi quy
B. Kiểm định t (t-test) cho hai mẫu độc lập
C. Kiểm định Chi-bình phương
D. Phân tích phương sai (ANOVA)
2. Phương pháp nào sau đây được sử dụng để dự báo các giá trị trong tương lai dựa trên các giá trị trong quá khứ của một chuỗi thời gian?
A. Phân tích hồi quy tuyến tính
B. Trung bình trượt
C. ARIMA
D. Phân tích phương sai
3. Khi nào thì kiểm định Chi-bình phương (Chi-square test) được sử dụng?
A. So sánh trung bình của hai nhóm
B. Kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết
C. Đo lường mối quan hệ tuyến tính giữa hai biến
D. Dự báo giá trị tương lai
4. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Độ lớn của tác động của biến độc lập lên biến phụ thuộc
D. Mức độ tương quan giữa các biến độc lập
5. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) trong thống kê?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi độ lệch chuẩn của tổng thể đã biết
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết
D. Khi so sánh trung bình của hai tổng thể độc lập
6. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động ngẫu nhiên và không thể dự đoán được?
A. Xu hướng (Trend)
B. Tính thời vụ (Seasonality)
C. Chu kỳ (Cycle)
D. Tính bất thường (Irregularity)
7. Đâu là một ví dụ về dữ liệu định tính (qualitative data) trong kinh doanh?
A. Doanh thu hàng tháng
B. Số lượng khách hàng
C. Mức độ hài lòng của khách hàng (ví dụ: rất hài lòng, hài lòng, không hài lòng)
D. Chi phí sản xuất
8. Trong thống kê, thuật ngữ ‘phân phối chuẩn’ (normal distribution) còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
9. Ý nghĩa của hệ số tương quan bằng 0 trong phân tích thống kê là gì?
A. Có mối quan hệ tuyến tính hoàn hảo giữa hai biến
B. Không có mối quan hệ tuyến tính giữa hai biến
C. Có mối quan hệ phi tuyến tính giữa hai biến
D. Hai biến có mối quan hệ nhân quả
10. Trong kiểm định giả thuyết, mức ý nghĩa (alpha level) thể hiện điều gì?
A. Xác suất chấp nhận giả thuyết null khi nó đúng
B. Xác suất bác bỏ giả thuyết null khi nó đúng (sai lầm loại I)
C. Xác suất bác bỏ giả thuyết null khi nó sai
D. Xác suất chấp nhận giả thuyết null khi nó sai (sai lầm loại II)
11. Trong phân tích dữ liệu kinh doanh, biểu đồ nào thích hợp nhất để so sánh doanh số bán hàng của các sản phẩm khác nhau trong cùng một khoảng thời gian?
A. Biểu đồ phân tán
B. Biểu đồ tần suất
C. Biểu đồ cột
D. Biểu đồ hộp
12. Một nhà quản lý muốn so sánh hiệu quả của ba chiến dịch marketing khác nhau. Phương pháp thống kê nào phù hợp nhất để sử dụng?
A. Phân tích hồi quy
B. Kiểm định t (t-test)
C. Phân tích phương sai (ANOVA)
D. Phân tích tương quan
13. Khi thực hiện một cuộc khảo sát, loại sai lệch nào xảy ra khi một số nhóm trong tổng thể có khả năng tham gia khảo sát thấp hơn so với các nhóm khác?
A. Sai lệch chọn mẫu (selection bias)
B. Sai lệch phản hồi (response bias)
C. Sai lệch không phản hồi (non-response bias)
D. Sai lệch đo lường (measurement bias)
14. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với trung bình (mean) để đo lường xu hướng trung tâm của dữ liệu?
A. Khi dữ liệu có phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ (outliers)
C. Khi dữ liệu có kích thước mẫu lớn
D. Khi dữ liệu có tính đối xứng
15. Một công ty muốn khảo sát mức độ hài lòng của khách hàng về sản phẩm mới. Phương pháp lấy mẫu nào phù hợp nhất để đảm bảo tính đại diện cho tất cả các phân khúc khách hàng?
A. Lấy mẫu thuận tiện
B. Lấy mẫu ngẫu nhiên đơn giản
C. Lấy mẫu phân tầng
D. Lấy mẫu cụm
16. Khi nào thì việc sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) là phù hợp?
A. Khi tổng thể đồng nhất
B. Khi tổng thể có các nhóm (tầng) khác nhau về đặc điểm
C. Khi không có đủ thông tin về tổng thể
D. Khi cần tiết kiệm chi phí lấy mẫu
17. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó đúng
B. Bác bỏ giả thuyết null khi nó sai
C. Chấp nhận giả thuyết null khi nó sai
D. Bác bỏ giả thuyết null khi nó đúng
18. Trong phân tích dữ liệu, biểu đồ hộp (boxplot) cung cấp thông tin gì?
A. Tần suất xuất hiện của các giá trị
B. Mối quan hệ giữa hai biến
C. Phân vị (quartiles), giá trị ngoại lệ và độ trải của dữ liệu
D. Xu hướng theo thời gian
19. Trong thống kê, giá trị p (p-value) được sử dụng để làm gì?
A. Ước lượng giá trị trung bình của tổng thể
B. Đo lường độ mạnh của mối quan hệ giữa hai biến
C. Xác định mức ý nghĩa thống kê của kết quả
D. Tính toán kích thước mẫu cần thiết cho nghiên cứu
20. Trong phân tích phương sai (ANOVA), điều gì được kiểm tra?
A. Sự khác biệt giữa các phương sai của hai mẫu
B. Sự khác biệt giữa các trung bình của hai mẫu
C. Sự khác biệt giữa các trung bình của ba hoặc nhiều hơn các nhóm
D. Mối quan hệ giữa hai biến định lượng
21. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự báo giá trị tương lai
B. Loại bỏ tính thời vụ
C. Làm mượt dữ liệu và làm nổi bật xu hướng
D. Xác định các giá trị ngoại lệ
22. Đâu là một hạn chế chính của việc sử dụng kích thước mẫu nhỏ trong nghiên cứu thống kê?
A. Tăng chi phí thu thập dữ liệu
B. Giảm tính đại diện của mẫu
C. Giảm thời gian phân tích dữ liệu
D. Tăng độ chính xác của ước lượng
23. Trong thống kê kinh doanh, phương pháp nào thường được sử dụng để dự báo doanh thu dựa trên dữ liệu quá khứ?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy
C. Kiểm định Chi-bình phương
D. Thống kê mô tả
24. Một công ty muốn phân tích mối quan hệ giữa chi phí quảng cáo và doanh thu. Loại biểu đồ nào phù hợp nhất để trực quan hóa mối quan hệ này?
A. Biểu đồ cột
B. Biểu đồ đường
C. Biểu đồ phân tán (scatter plot)
D. Biểu đồ tròn
25. Công ty muốn tìm hiểu xem quảng cáo trên mạng xã hội có ảnh hưởng đến doanh số bán hàng hay không. Phương pháp thống kê nào phù hợp nhất để xác định mối quan hệ nhân quả?
A. Phân tích tương quan
B. Phân tích hồi quy
C. Thực nghiệm có đối chứng
D. Thống kê mô tả
26. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn mà vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy tuyến tính
B. Phân tích phương sai (ANOVA)
C. Phân tích thành phần chính (PCA)
D. Kiểm định giả thuyết
27. Trong phân tích dữ liệu, giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của dữ liệu
B. Giá trị xuất hiện thường xuyên nhất trong dữ liệu
C. Giá trị nằm ngoài phạm vi phân bố thông thường của dữ liệu
D. Giá trị được sử dụng để dự báo tương lai
28. Trong phân tích rủi ro, phương sai (variance) được sử dụng để đo lường điều gì?
A. Giá trị kỳ vọng của lợi nhuận
B. Mức độ biến động của lợi nhuận
C. Xác suất xảy ra rủi ro
D. Mức độ nghiêm trọng của rủi ro
29. Trong thống kê, thuật ngữ ‘bậc tự do’ (degrees of freedom) thường liên quan đến điều gì?
A. Kích thước mẫu
B. Số lượng biến trong mô hình
C. Số lượng giá trị độc lập có thể thay đổi trong phân tích
D. Mức ý nghĩa thống kê
30. Trong thống kê, độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình
D. Mức độ tin cậy của ước lượng
31. Trong kiểm định giả thuyết, lỗi loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H1 khi nó đúng.
D. Bác bỏ giả thuyết H1 khi nó sai.
32. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi số lượng biến độc lập quá ít.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
33. Trong kiểm định giả thuyết, lỗi loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó sai.
C. Bác bỏ giả thuyết H1 khi nó đúng.
D. Chấp nhận giả thuyết H1 khi nó sai.
34. Phương pháp nào sau đây được sử dụng để dự báo chuỗi thời gian?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Mô hình ARIMA.
D. Kiểm định Chi-square.
35. Độ tin cậy (confidence level) trong thống kê biểu thị điều gì?
A. Xác suất sai lầm khi bác bỏ giả thuyết H0.
B. Xác suất khoảng tin cậy chứa giá trị thực của tham số tổng thể.
C. Xác suất mẫu đại diện cho tổng thể.
D. Xác suất kết quả kiểm định là chính xác.
36. Trong kinh doanh online, chỉ số Customer Lifetime Value (CLTV) đo lường điều gì?
A. Tổng số khách hàng đã mua hàng.
B. Giá trị doanh thu mà một khách hàng mang lại trong suốt mối quan hệ với doanh nghiệp.
C. Chi phí trung bình để có được một khách hàng.
D. Thời gian trung bình mà một khách hàng duy trì mối quan hệ với doanh nghiệp.
37. Chỉ số CTR (Click-Through Rate) trong quảng cáo trực tuyến được tính như thế nào?
A. Tổng số lượt hiển thị quảng cáo chia cho tổng số lượt click.
B. Tổng số lượt click chia cho tổng số lượt hiển thị quảng cáo.
C. Tổng chi phí quảng cáo chia cho tổng số lượt click.
D. Tổng số khách hàng tiềm năng chia cho tổng số lượt click.
38. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ tác động của biến độc lập lên biến phụ thuộc.
C. Mức độ liên hệ tuyến tính giữa hai biến.
D. Mức độ phù hợp của mô hình hồi quy.
39. Trong phân tích dữ liệu, giá trị ngoại lệ (outlier) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm ngoài phạm vi phân bố thông thường của dữ liệu.
D. Giá trị trung vị của tập dữ liệu.
40. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị.
B. Mode.
C. Độ lệch chuẩn.
D. Tần số.
41. Phương pháp nào sau đây thường được sử dụng để kiểm tra sự phù hợp của mô hình hồi quy tuyến tính?
A. Kiểm định t-test.
B. Kiểm định ANOVA.
C. Kiểm định Chi-square.
D. Kiểm định Z-test.
42. Khi nào nên sử dụng biểu đồ histogram để biểu diễn dữ liệu?
A. Khi muốn so sánh các danh mục khác nhau.
B. Khi muốn biểu diễn sự thay đổi của dữ liệu theo thời gian.
C. Khi muốn biểu diễn phân phối tần số của dữ liệu liên tục.
D. Khi muốn biểu diễn mối quan hệ giữa hai biến.
43. Khi nào thì sử dụng kiểm định t-test một mẫu (one-sample t-test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của một mẫu với một giá trị đã biết.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
44. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) biểu diễn điều gì?
A. Giá trị dự đoán của biến độc lập khi biến phụ thuộc bằng 0.
B. Độ dốc của đường hồi quy.
C. Giá trị trung bình của biến phụ thuộc.
D. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
45. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi cần tính toán trung bình mẫu.
46. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
C. Xác suất giả thuyết H1 là đúng.
D. Mức ý nghĩa (significance level) của kiểm định.
47. Mục đích chính của việc phân tích A/B testing trong kinh doanh online là gì?
A. Đánh giá hiệu quả của chiến dịch marketing.
B. So sánh hai phiên bản khác nhau của một trang web hoặc ứng dụng để xác định phiên bản nào hoạt động tốt hơn.
C. Dự đoán xu hướng thị trường.
D. Phân tích đối thủ cạnh tranh.
48. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn.
B. Phương sai.
C. Trung vị.
D. Tần số.
49. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
A. β (beta).
B. σ (sigma).
C. α (alpha).
D. μ (mu).
50. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu mà vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi-square.
51. Trong kinh doanh online, chỉ số Conversion Rate (tỷ lệ chuyển đổi) đo lường điều gì?
A. Số lượng khách hàng truy cập website.
B. Tỷ lệ khách hàng thực hiện hành động mong muốn (ví dụ: mua hàng, đăng ký) so với tổng số khách hàng truy cập.
C. Tổng doanh thu từ các hoạt động bán hàng.
D. Chi phí trung bình để có được một khách hàng.
52. Trong phân tích dữ liệu marketing, cohort analysis được sử dụng để làm gì?
A. Dự đoán doanh thu trong tương lai.
B. Phân tích hành vi của các nhóm khách hàng có đặc điểm chung theo thời gian.
C. Tối ưu hóa giá sản phẩm.
D. Cải thiện trải nghiệm người dùng trên website.
53. Trong phân tích chuỗi thời gian, phương pháp làm trơn (smoothing) được sử dụng để làm gì?
A. Loại bỏ xu hướng (trend).
B. Loại bỏ tính thời vụ (seasonality).
C. Giảm nhiễu và làm nổi bật các xu hướng chính.
D. Dự đoán các giá trị trong tương lai.
54. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả các đặc điểm của mẫu.
B. Thu thập dữ liệu từ tổng thể.
C. Ước lượng và kiểm định các tham số của tổng thể dựa trên thông tin từ mẫu.
D. Trình bày dữ liệu một cách trực quan.
55. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu phân tầng.
B. Lấy mẫu cụm.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu thuận tiện.
56. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến liên tục.
B. Biến định tính (categorical).
C. Biến thứ bậc (ordinal).
D. Biến thời gian.
57. Trong kinh doanh online, chỉ số ROI (Return on Investment) đo lường điều gì?
A. Tổng doanh thu từ các hoạt động marketing.
B. Chi phí trung bình để có được một khách hàng.
C. Tỷ lệ lợi nhuận thu được so với chi phí đầu tư.
D. Số lượng khách hàng truy cập website.
58. Trong phân tích chuỗi thời gian, thành phần nào sau đây biểu thị sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
59. Trong phân tích dữ liệu bán hàng online, RFM (Recency, Frequency, Monetary) là gì?
A. Một phương pháp để dự đoán doanh thu trong tương lai.
B. Một mô hình để phân khúc khách hàng dựa trên hành vi mua hàng.
C. Một công cụ để tối ưu hóa giá sản phẩm.
D. Một kỹ thuật để cải thiện trải nghiệm người dùng trên website.
60. Trong phân tích rủi ro, phương sai (variance) được sử dụng để đo lường điều gì?
A. Giá trị kỳ vọng của một biến ngẫu nhiên.
B. Mức độ biến động hoặc phân tán của một biến ngẫu nhiên.
C. Xác suất xảy ra một sự kiện.
D. Mức độ tương quan giữa hai biến ngẫu nhiên.
61. Mục đích chính của việc sử dụng biểu đồ kiểm soát (control chart) trong quản lý chất lượng là gì?
A. Để xác định phân phối của dữ liệu.
B. Để so sánh trung bình của hai nhóm.
C. Để theo dõi quá trình và phát hiện các biến động bất thường.
D. Để dự đoán xu hướng trong tương lai.
62. Một công ty muốn đo lường mức độ hài lòng của khách hàng về dịch vụ của mình. Thang đo nào phù hợp nhất?
A. Thang đo danh nghĩa.
B. Thang đo thứ bậc.
C. Thang đo khoảng.
D. Thang đo tỷ lệ.
63. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Tính chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Irregularity).
64. Trong kinh doanh online, chỉ số ROI (Return on Investment) được sử dụng để đánh giá điều gì?
A. Mức độ hài lòng của khách hàng.
B. Hiệu quả của một khoản đầu tư.
C. Tần suất khách hàng quay lại mua hàng.
D. Số lượng khách hàng mới.
65. Giả sử một cửa hàng trực tuyến muốn kiểm tra xem việc thay đổi thiết kế trang web có làm tăng tỷ lệ chuyển đổi (conversion rate) hay không. Phương pháp kiểm định giả thuyết nào phù hợp nhất?
A. Kiểm định Chi-bình phương.
B. Kiểm định t (t-test).
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy.
66. Một công ty muốn xác định xem có sự khác biệt về mức độ hài lòng của khách hàng giữa các khu vực địa lý khác nhau hay không. Phương pháp nào phù hợp?
A. Kiểm định t (t-test).
B. Phân tích hồi quy.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
67. Khi nào thì trung bình (mean) không phải là thước đo tốt để đại diện cho trung tâm của dữ liệu?
A. Khi dữ liệu có phân phối đối xứng.
B. Khi dữ liệu không có giá trị ngoại lệ.
C. Khi dữ liệu có giá trị ngoại lệ.
D. Khi cỡ mẫu lớn.
68. Sai số loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết đúng.
B. Chấp nhận giả thuyết đúng.
C. Bác bỏ giả thuyết sai.
D. Không bác bỏ giả thuyết sai.
69. Trong thống kê, phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất của dữ liệu.
D. Giá trị nhỏ nhất của dữ liệu.
70. Một nhà nghiên cứu muốn so sánh sự khác biệt về thu nhập giữa nam và nữ trong một công ty. Phương pháp nào phù hợp?
A. Kiểm định Chi-bình phương.
B. Phân tích phương sai (ANOVA).
C. Kiểm định t (t-test).
D. Phân tích hồi quy.
71. Đâu là đặc điểm của phân phối chuẩn (normal distribution)?
A. Không đối xứng và có nhiều đỉnh.
B. Đối xứng và có một đỉnh.
C. Luôn có giá trị trung bình bằng 0.
D. Luôn có độ lệch chuẩn bằng 1.
72. Khi nào thì kiểm định giả thuyết thống kê một đuôi (one-tailed test) phù hợp hơn kiểm định hai đuôi (two-tailed test)?
A. Khi không có giả thuyết cụ thể về hướng của sự khác biệt.
B. Khi quan tâm đến cả hai hướng của sự khác biệt.
C. Khi chỉ quan tâm đến một hướng cụ thể của sự khác biệt.
D. Khi cỡ mẫu nhỏ.
73. Trong phân tích hồi quy tuyến tính đơn, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu, thể hiện tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Độ dốc của đường hồi quy.
C. Mức độ tương quan giữa các biến độc lập.
D. Sai số chuẩn của các ước lượng hệ số.
74. Trong phân tích tương quan, hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ phù hợp của mô hình hồi quy.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Mức độ phân tán của dữ liệu.
75. Trong kinh doanh online, chỉ số Customer Lifetime Value (CLTV) được sử dụng để ước tính điều gì?
A. Chi phí để có được một khách hàng mới.
B. Tổng doanh thu từ một khách hàng trong suốt thời gian họ mua hàng.
C. Tỷ lệ khách hàng quay lại mua hàng.
D. Mức độ hài lòng của khách hàng.
76. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết sai.
B. Bác bỏ giả thuyết đúng.
C. Không bác bỏ giả thuyết sai.
D. Không chấp nhận giả thuyết đúng.
77. Một cửa hàng trực tuyến muốn phân tích xem có mối liên hệ giữa số lượng đánh giá sản phẩm và doanh số bán hàng hay không. Phương pháp nào phù hợp?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Phân tích tương quan.
D. Kiểm định Chi-bình phương.
78. Phương pháp lấy mẫu nào đảm bảo mọi thành viên của quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu theo cụm.
79. Trong thống kê, trung vị (median) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Giá trị nằm giữa của dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong dữ liệu.
80. Trong kinh doanh online, chỉ số CR (Conversion Rate) được sử dụng để đo lường điều gì?
A. Tỷ lệ khách hàng truy cập trang web.
B. Tỷ lệ khách hàng hoàn thành một hành động mong muốn (ví dụ: mua hàng).
C. Tỷ lệ khách hàng nhấp vào quảng cáo.
D. Tỷ lệ khách hàng rời khỏi trang web.
81. Trong kinh doanh online, chỉ số CTR (Click-Through Rate) được tính như thế nào?
A. Số lượt hiển thị / Số lượt nhấp.
B. Số lượt nhấp / Tổng chi phí.
C. Số lượt nhấp / Số lượt hiển thị.
D. Tổng chi phí / Số lượt nhấp.
82. Trong kinh doanh online, chỉ số Bounce Rate (Tỷ lệ thoát) cho biết điều gì?
A. Tỷ lệ khách hàng rời khỏi trang web sau khi xem một trang duy nhất.
B. Tỷ lệ khách hàng hoàn thành giao dịch mua hàng.
C. Tỷ lệ khách hàng quay lại trang web nhiều lần.
D. Tỷ lệ khách hàng nhấp vào quảng cáo.
83. Một nhà quản lý muốn so sánh hiệu quả bán hàng của ba chiến dịch quảng cáo khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t (t-test).
B. Phân tích hồi quy.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
84. Trong phân tích chuỗi thời gian, phương pháp nào được sử dụng để làm mịn dữ liệu và loại bỏ các biến động ngẫu nhiên?
A. Hồi quy tuyến tính.
B. Trung bình động.
C. Phân tích phương sai.
D. Kiểm định Chi-bình phương.
85. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả đã thấy hoặc hơn, giả sử giả thuyết không đúng.
C. Mức ý nghĩa của kiểm định.
D. Sai số loại II.
86. Một công ty thương mại điện tử muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp nào phù hợp?
A. Kiểm định Chi-bình phương.
B. Phân tích phương sai (ANOVA).
C. Phân tích hồi quy.
D. Kiểm định t (t-test).
87. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích phương sai (ANOVA).
B. Phân tích hồi quy tuyến tính.
C. Phân tích thành phần chính (PCA).
D. Kiểm định Chi-bình phương.
88. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị.
B. Mode.
C. Độ lệch chuẩn.
D. Giá trị lớn nhất.
89. Một nhà phân tích dữ liệu muốn xác định xem có mối liên hệ giữa việc sử dụng thiết bị di động và hành vi mua hàng trực tuyến hay không. Phương pháp nào phù hợp?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương.
D. Kiểm định t (t-test).
90. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi muốn ước lượng tham số của quần thể.
91. Trong phân tích dữ liệu khách hàng, RFM (Recency, Frequency, Monetary) được sử dụng để làm gì?
A. Đo lường mức độ hài lòng của khách hàng.
B. Phân khúc khách hàng dựa trên hành vi mua hàng.
C. Dự báo doanh số bán hàng trong tương lai.
D. Xác định các kênh tiếp thị hiệu quả nhất.
92. Trong thống kê mô tả, trung vị (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
93. Chỉ số ROI (Return on Investment) đo lường điều gì?
A. Mức độ hài lòng của khách hàng.
B. Khả năng thanh toán nợ của doanh nghiệp.
C. Lợi nhuận thu được so với chi phí đầu tư.
D. Số lượng khách hàng mới thu hút được.
94. Khi nào thì nên sử dụng biểu đồ hộp (box plot) để phân tích dữ liệu?
A. Để so sánh trung bình của nhiều nhóm.
B. Để hiển thị phân phối tần số của dữ liệu.
C. Để xác định các giá trị ngoại lệ (outliers) và tóm tắt phân phối dữ liệu.
D. Để hiển thị xu hướng theo thời gian.
95. Trong phân tích chuỗi thời gian (time series analysis), thành phần nào sau đây biểu thị sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
96. Phương pháp lấy mẫu nào đảm bảo mọi phần tử của tổng thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu phân tầng (Stratified sampling).
B. Lấy mẫu cụm (Cluster sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu thuận tiện (Convenience sampling).
97. Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?
A. Mức độ quan hệ nhân quả giữa hai biến.
B. Mức độ biến thiên của hai biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Mức độ ảnh hưởng của một biến lên biến khác.
98. Mục tiêu chính của việc phân tích dữ liệu lớn (big data analytics) trong kinh doanh là gì?
A. Giảm chi phí lưu trữ dữ liệu.
B. Tăng cường bảo mật dữ liệu.
C. Tìm kiếm thông tin chi tiết và đưa ra quyết định kinh doanh tốt hơn.
D. Tự động hóa quy trình làm việc.
99. Trong phân tích hồi quy tuyến tính đơn, hệ số chặn (intercept) biểu diễn điều gì?
A. Giá trị dự đoán của biến độc lập khi biến phụ thuộc bằng 0.
B. Giá trị trung bình của biến phụ thuộc.
C. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
D. Mức độ ảnh hưởng của biến độc lập lên biến phụ thuộc.
100. Trong phân tích dữ liệu, giá trị nào sau đây cho biết mức độ mạnh yếu của mối tương quan tuyến tính giữa hai biến?
A. Giá trị trung bình.
B. Độ lệch chuẩn.
C. Hệ số tương quan.
D. Phương sai.
101. Khi phân tích dữ liệu bán hàng, việc sử dụng biểu đồ Pareto giúp xác định điều gì?
A. Các sản phẩm bán chạy nhất đóng góp phần lớn vào tổng doanh thu.
B. Xu hướng bán hàng theo thời gian.
C. Mối quan hệ giữa giá cả và số lượng bán ra.
D. Phân bố khách hàng theo khu vực địa lý.
102. Một công ty muốn khảo sát mức độ hài lòng của khách hàng về sản phẩm mới. Phương pháp thu thập dữ liệu nào sau đây là phù hợp nhất?
A. Thực hiện một thử nghiệm mù đôi (double-blind experiment).
B. Tiến hành một cuộc khảo sát trực tuyến (online survey).
C. Phân tích dữ liệu thứ cấp từ báo cáo của chính phủ.
D. Sử dụng phương pháp lấy mẫu cụm.
103. Một cửa hàng trực tuyến muốn tăng tỷ lệ chuyển đổi (conversion rate). Thử nghiệm A/B nào sau đây có thể giúp đạt được mục tiêu này?
A. Thay đổi màu sắc của nút ‘Thêm vào giỏ hàng’ và so sánh tỷ lệ nhấp chuột.
B. Tăng giá sản phẩm và theo dõi doanh số bán hàng.
C. Giảm chi phí quảng cáo và đo lường lưu lượng truy cập.
D. Gửi email khảo sát cho khách hàng hiện tại.
104. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất bác bỏ giả thuyết H0 khi H0 đúng.
B. Xác suất chấp nhận giả thuyết H0 khi H0 sai.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả còn cực đoan hơn) nếu giả thuyết H0 đúng.
D. Xác suất giả thuyết H0 đúng.
105. Trong kiểm định Chi-square, mục đích chính là gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự phù hợp giữa phân phối thực tế và phân phối lý thuyết.
C. Đo lường mối quan hệ tuyến tính giữa hai biến.
D. Dự báo giá trị của một biến dựa trên biến khác.
106. Một công ty muốn xác định xem có mối liên hệ giữa chi phí quảng cáo và doanh số bán hàng hay không. Phương pháp thống kê nào sau đây là phù hợp nhất?
A. Phân tích cụm (Cluster analysis).
B. Hồi quy tuyến tính (Linear regression).
C. Kiểm định Chi-square.
D. Phân tích phương sai (ANOVA).
107. Phương pháp nào sau đây thường được sử dụng để dự báo doanh số bán hàng dựa trên dữ liệu lịch sử?
A. Phân tích phương sai (ANOVA).
B. Hồi quy thời gian (Time series regression).
C. Kiểm định Chi-square.
D. Phân tích cụm (Cluster analysis).
108. Trong phân tích rủi ro, ma trận rủi ro (risk matrix) được sử dụng để làm gì?
A. Đo lường lợi nhuận kỳ vọng.
B. Đánh giá và ưu tiên các rủi ro dựa trên khả năng xảy ra và mức độ ảnh hưởng.
C. Xác định nguyên nhân gốc rễ của các vấn đề.
D. Dự báo xu hướng thị trường.
109. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Mức độ tin cậy của dữ liệu.
D. Mức độ chính xác của dữ liệu.
110. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của tổng thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết.
D. Khi dữ liệu tuân theo phân phối chuẩn.
111. Trong phân tích rủi ro, phương pháp nào sau đây thường được sử dụng để mô phỏng các kịch bản khác nhau và đánh giá tác động của chúng?
A. Phân tích SWOT.
B. Phân tích PESTEL.
C. Mô phỏng Monte Carlo.
D. Phân tích 5 lực lượng cạnh tranh của Porter.
112. Khi dữ liệu không tuân theo phân phối chuẩn, phương pháp thống kê nào sau đây nên được sử dụng?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Các phương pháp phi tham số (Non-parametric methods).
D. Hồi quy tuyến tính (Linear regression).
113. Trong kinh doanh online, chỉ số CAC (Customer Acquisition Cost) đo lường điều gì?
A. Doanh thu trung bình trên mỗi khách hàng.
B. Chi phí trung bình để thu hút một khách hàng mới.
C. Tỷ lệ giữ chân khách hàng.
D. Mức độ hài lòng của khách hàng.
114. Khi nào thì nên sử dụng phân tích hồi quy đa biến (multiple regression) thay vì hồi quy tuyến tính đơn?
A. Khi chỉ có một biến độc lập.
B. Khi có nhiều biến độc lập ảnh hưởng đến biến phụ thuộc.
C. Khi biến phụ thuộc là biến định tính.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
115. Trong phân tích thống kê, ‘outlier’ (giá trị ngoại lệ) là gì?
A. Một giá trị nằm gần giá trị trung bình.
B. Một giá trị rất khác biệt so với các giá trị còn lại trong tập dữ liệu.
C. Một giá trị bị thiếu trong tập dữ liệu.
D. Một giá trị được lặp lại nhiều lần trong tập dữ liệu.
116. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các nhóm đều có trung bình bằng nhau.
B. Ít nhất một nhóm có trung bình khác với các nhóm còn lại.
C. Phương sai của tất cả các nhóm đều bằng nhau.
D. Phương sai của ít nhất một nhóm khác với các nhóm còn lại.
117. Trong phân tích thống kê, khái niệm ‘bậc tự do’ (degrees of freedom) liên quan đến điều gì?
A. Số lượng biến trong một mô hình.
B. Số lượng quan sát trong một tập dữ liệu.
C. Số lượng thông tin độc lập có sẵn để ước tính một tham số.
D. Mức độ tin cậy của một ước tính.
118. Trong phân tích ANOVA, yếu tố nào sau đây được so sánh để xác định xem có sự khác biệt đáng kể giữa các nhóm?
A. Phương sai giữa các nhóm và phương sai trong nội bộ nhóm.
B. Trung bình của các nhóm và độ lệch chuẩn của các nhóm.
C. Trung vị của các nhóm và khoảng tứ phân vị của các nhóm.
D. Tần số của các nhóm.
119. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 sai.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H0 khi H0 đúng.
D. Chấp nhận giả thuyết H0 khi H0 đúng.
120. Trong kinh doanh online, A/B testing được sử dụng để làm gì?
A. Đo lường mức độ hài lòng của khách hàng.
B. So sánh hiệu quả của hai phiên bản khác nhau của một trang web hoặc ứng dụng.
C. Dự báo doanh số bán hàng trong tương lai.
D. Phân tích đối thủ cạnh tranh.
121. Một công ty muốn phân tích xem có sự khác biệt về mức độ hài lòng của khách hàng giữa các kênh bán hàng khác nhau (online, offline) hay không. Họ nên sử dụng kiểm định nào?
A. Kiểm định Chi-bình phương.
B. Kiểm định t độc lập.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
122. Trong phân tích chuỗi thời gian, phương pháp nào sau đây được sử dụng để làm mịn dữ liệu và loại bỏ nhiễu?
A. Trung bình động (Moving average).
B. Hồi quy tuyến tính.
C. Kiểm định t.
D. Phân tích phương sai (ANOVA).
123. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích thành phần chính (PCA).
B. Hồi quy tuyến tính.
C. Kiểm định t.
D. Phân tích phương sai (ANOVA).
124. Một cửa hàng muốn xác định xem có mối liên hệ giữa việc quảng cáo trên mạng xã hội và doanh số bán hàng hay không. Họ nên sử dụng phương pháp thống kê nào?
A. Phân tích tương quan.
B. Kiểm định t.
C. Phân tích phương sai (ANOVA).
D. Hồi quy logistic.
125. Trong phân tích rủi ro, phương sai (variance) được sử dụng để đo lường điều gì?
A. Mức độ biến động hoặc phân tán của các kết quả có thể xảy ra.
B. Giá trị trung bình của các kết quả có thể xảy ra.
C. Xác suất xảy ra kết quả tốt nhất.
D. Xác suất xảy ra kết quả xấu nhất.
126. Trong thống kê, ‘p-value’ thể hiện điều gì?
A. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết không (null hypothesis) là đúng.
B. Mức ý nghĩa thống kê được chọn trước.
C. Kích thước của mẫu.
D. Sai số chuẩn của trung bình.
127. Trong phân tích hồi quy tuyến tính đơn, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu, thể hiện tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
B. Độ dốc của đường hồi quy.
C. Mức độ tương quan giữa các biến độc lập.
D. Sai số chuẩn của ước lượng.
128. Khi nào nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để kiểm tra xem một mẫu dữ liệu có tuân theo một phân phối cụ thể hay không.
B. Để so sánh trung bình của hai nhóm.
C. Để đo lường độ tương quan giữa hai biến.
D. Để dự đoán giá trị của một biến.
129. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Sự tương quan cao giữa các biến độc lập.
B. Sự tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Sự không tuyến tính trong mối quan hệ giữa các biến.
D. Sự thay đổi phương sai của sai số.
130. Khi nào nên sử dụng kiểm định Chi-bình phương?
A. Để kiểm tra mối quan hệ giữa hai biến định tính.
B. Để so sánh trung bình của hai nhóm.
C. Để dự đoán giá trị của một biến liên tục.
D. Để đo lường độ tương quan giữa hai biến liên tục.
131. Trong phân tích độ tin cậy, hệ số Cronbach’s alpha được sử dụng để đo lường điều gì?
A. Mức độ nhất quán nội tại của một thang đo.
B. Mức độ ổn định của một thang đo theo thời gian.
C. Mức độ tương đương giữa các phiên bản khác nhau của một thang đo.
D. Mức độ chính xác của một thang đo.
132. Một công ty muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Họ nên sử dụng kỹ thuật thống kê nào?
A. Hồi quy tuyến tính.
B. Kiểm định t.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
133. Khi nào nên sử dụng hồi quy logistic thay vì hồi quy tuyến tính?
A. Khi biến phụ thuộc là biến định tính.
B. Khi biến phụ thuộc là biến liên tục.
C. Khi có nhiều biến độc lập.
D. Khi các biến độc lập tương quan với nhau.
134. Trong phân tích cụm (cluster analysis), phương pháp nào sau đây là một phương pháp phân cấp?
A. Phân cụm phân cấp (Hierarchical clustering).
B. K-means clustering.
C. Phân tích thành phần chính (PCA).
D. Hồi quy logistic.
135. Trong phân tích phương sai lặp lại (repeated measures ANOVA), điều gì được kiểm tra?
A. Sự khác biệt giữa trung bình của các nhóm khi các quan sát được lặp lại trên cùng một đối tượng.
B. Sự khác biệt giữa trung bình của các nhóm độc lập.
C. Mối quan hệ giữa hai biến định tính.
D. Mức độ tương quan giữa hai biến liên tục.
136. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh ba hoặc nhiều nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
B. Để so sánh hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến.
137. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
B. Để so sánh hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến.
138. Một nhà nghiên cứu muốn xác định xem có mối quan hệ phi tuyến tính giữa hai biến hay không. Họ nên sử dụng phương pháp nào?
A. Hồi quy đa thức (Polynomial regression).
B. Hồi quy tuyến tính.
C. Phân tích tương quan Pearson.
D. Kiểm định t.
139. Một công ty muốn xác định xem có mối quan hệ giữa chi phí quảng cáo, giá sản phẩm và doanh số bán hàng hay không. Họ nên sử dụng kỹ thuật nào?
A. Hồi quy đa biến.
B. Kiểm định t.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
140. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để ước tính điều gì?
A. Xác suất sống sót theo thời gian.
B. Tỷ lệ tử vong.
C. Thời gian sống trung bình.
D. Nguy cơ tử vong tức thời.
141. Giả sử bạn có dữ liệu về sự hài lòng của khách hàng (thang đo Likert) và muốn so sánh sự hài lòng giữa hai nhóm khách hàng khác nhau. Bạn nên sử dụng kiểm định nào?
A. Kiểm định Mann-Whitney U.
B. Kiểm định t độc lập.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
142. Trong phân tích độ nhạy (sensitivity analysis), điều gì được đánh giá?
A. Mức độ ảnh hưởng của sự thay đổi trong các biến đầu vào đến kết quả đầu ra.
B. Giá trị trung bình của các biến đầu vào.
C. Độ lệch chuẩn của các biến đầu vào.
D. Mức độ tương quan giữa các biến đầu vào.
143. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện biến động ngắn hạn và không đều?
A. Thành phần ngẫu nhiên (Irregular component).
B. Xu hướng (Trend).
C. Tính thời vụ (Seasonality).
D. Tính chu kỳ (Cyclicality).
144. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự đúng.
B. Chấp nhận giả thuyết không (null hypothesis) khi nó thực sự sai.
C. Sai số trong việc thu thập dữ liệu.
D. Sai số trong việc nhập liệu.
145. Một nhà quản lý muốn so sánh hiệu suất bán hàng của ba nhóm nhân viên khác nhau. Họ nên sử dụng phương pháp thống kê nào?
A. Phân tích phương sai (ANOVA).
B. Kiểm định t.
C. Hồi quy tuyến tính.
D. Kiểm định Chi-bình phương.
146. Trong thống kê mô tả, độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
B. Giá trị trung bình của dữ liệu.
C. Giá trị lớn nhất của dữ liệu.
D. Giá trị nhỏ nhất của dữ liệu.
147. Trong phân tích ANOVA, yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa trung bình của nhiều nhóm.
B. Mối quan hệ giữa hai biến định tính.
C. Mức độ tương quan giữa hai biến liên tục.
D. Sự phù hợp của mô hình hồi quy.
148. Khi nào nên sử dụng phương pháp Bootstrap?
A. Khi cần ước tính sai số chuẩn hoặc khoảng tin cậy mà không có giả định về phân phối của dữ liệu.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi cần kiểm tra mối quan hệ giữa hai biến định tính.
D. Khi cần dự đoán giá trị của một biến.
149. Trong phân tích bảng chéo (cross-tabulation), số lượng kỳ vọng (expected count) được tính toán như thế nào?
A. (Tổng hàng * Tổng cột) / Tổng chung.
B. Tổng hàng + Tổng cột – Tổng chung.
C. (Tổng hàng + Tổng cột) / Tổng chung.
D. Tổng hàng * Tổng cột * Tổng chung.
150. Phương pháp nào sau đây thường được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai nhóm độc lập?
A. Kiểm định t độc lập.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương.
D. Hồi quy tuyến tính.