Bộ đề 1

Câu 1

Một nhà nghiên cứu muốn xác định xem có mối quan hệ tuyến tính giữa số giờ học và điểm thi hay không. Nên sử dụng phương pháp thống kê nào?

Câu 2

Trong phân tích phương sai (ANOVA), mục đích chính là gì?

Câu 3

Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

Câu 4

Một công ty muốn kiểm tra xem một chiến dịch quảng cáo mới có làm tăng doanh số bán hàng hay không. Họ thu thập dữ liệu doanh số trước và sau chiến dịch. Nên sử dụng kiểm định thống kê nào?

Câu 5

Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt là 0.05. Điều này có nghĩa là gì?

Câu 6

Độ lệch chuẩn (standard deviation) đo lường điều gì?

Câu 7

Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai nhóm?

Câu 8

Khi nào thì nên sử dụng phương pháp lấy mẫu phân tầng (stratified sampling)?

Câu 9

Một nhà nghiên cứu muốn xác định xem có mối quan hệ giữa hút thuốc và bệnh phổi hay không. Họ thu thập dữ liệu từ một mẫu lớn người và ghi lại tình trạng hút thuốc và tình trạng bệnh phổi của họ. Nên sử dụng kiểm định nào để xác định mối quan hệ này?

Câu 10

Khoảng tin cậy (confidence interval) cho trung bình của một tổng thể được hiểu như thế nào?

Câu 11

Một nhà máy sản xuất ốc vít. Trọng lượng của ốc vít tuân theo phân phối chuẩn với trung bình là 10 gram và độ lệch chuẩn là 0.5 gram. Một ốc vít được coi là lỗi nếu trọng lượng của nó nhỏ hơn 9 gram hoặc lớn hơn 11 gram. Tính xác suất một ốc vít được sản xuất là lỗi.

Câu 12

Một tập dữ liệu có các giá trị: 2, 4, 6, 8, 10. Tính phương sai (variance) của tập dữ liệu này.

Câu 13

Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?

Câu 14

Trong phân tích hồi quy, một biến nhiễu (confounding variable) là gì?

Câu 15

Một nhà hàng ghi nhận số lượng khách hàng đến mỗi giờ. Trong một giờ cao điểm, trung bình có 20 khách hàng. Tính xác suất để có đúng 15 khách hàng đến trong giờ đó (sử dụng phân phối Poisson).

Câu 16

Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?

Câu 17

Một cửa hàng bán quần áo ghi lại số lượng quần áo bán được mỗi ngày trong một tuần. Các số liệu là: 10, 12, 15, 11, 14, 16, 13. Tính trung bình (mean) số lượng quần áo bán được mỗi ngày.

Câu 18

Trong một cuộc khảo sát, người ta hỏi ý kiến về một sản phẩm mới (hài lòng, không hài lòng, trung lập). Nên sử dụng kiểm định nào để xác định xem có sự khác biệt đáng kể giữa các nhóm ý kiến hay không?

Câu 19

Trong thống kê, phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?

Câu 20

Một tập dữ liệu có các giá trị: 5, 7, 9, 11, 13. Tính trung vị (median) của tập dữ liệu này.

Câu 21

Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?

Câu 22

Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm của họ. Họ thu thập dữ liệu từ một mẫu ngẫu nhiên 200 khách hàng và thấy rằng 160 người hài lòng. Tính ước lượng điểm (point estimate) cho tỷ lệ khách hàng hài lòng.

Câu 23

Một tập dữ liệu có các giá trị: 1, 3, 5, 7, 9. Tính độ lệch chuẩn (standard deviation) của tập dữ liệu này.

Câu 24

Một tập dữ liệu có các giá trị: 2, 4, 6, 8, 10, 12. Tính khoảng tứ phân vị (interquartile range - IQR) của tập dữ liệu này.

Câu 25

Một công ty muốn so sánh hiệu quả của ba phương pháp đào tạo khác nhau. Họ chia ngẫu nhiên nhân viên thành ba nhóm và áp dụng mỗi phương pháp cho một nhóm. Sau đó, họ đánh giá hiệu suất làm việc của nhân viên. Nên sử dụng kiểm định nào để so sánh hiệu quả của ba phương pháp?

Câu 26

Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?

Câu 27

Trong phân tích hồi quy tuyến tính, hệ số R-squared (R²) cho biết điều gì?

Câu 28

Một nghiên cứu về chiều cao của sinh viên cho thấy chiều cao trung bình là 170cm với độ lệch chuẩn là 5cm. Tính khoảng tin cậy 95% cho chiều cao trung bình của sinh viên (giả sử phân phối chuẩn).

Câu 29

Một công ty sản xuất bóng đèn nhận thấy rằng 5% số bóng đèn bị lỗi. Nếu một khách hàng mua 10 bóng đèn, xác suất để có đúng 1 bóng đèn bị lỗi là bao nhiêu (sử dụng phân phối nhị thức)?

Câu 30

Trung vị (median) của một tập dữ liệu là gì?