1. Trong khoa học dữ liệu, kỹ thuật ‘cross-validation’ (kiểm định chéo) được sử dụng để làm gì?
A. Tăng tốc độ xử lý dữ liệu
B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới
C. Giảm kích thước tập dữ liệu
D. Cải thiện độ chính xác của dữ liệu đầu vào
2. Trong kinh doanh online, việc sử dụng A/B testing nhằm mục đích gì?
A. Tăng tốc độ tải trang web
B. So sánh hai phiên bản của một trang web hoặc ứng dụng để xác định phiên bản nào hoạt động tốt hơn
C. Phân tích đối thủ cạnh tranh
D. Tối ưu hóa công cụ tìm kiếm (SEO)
3. Trong kinh doanh online, việc sử dụng dữ liệu để phân tích giá (price optimization) có thể mang lại lợi ích gì?
A. Giảm chi phí marketing
B. Tối ưu hóa giá sản phẩm để tăng doanh thu và lợi nhuận
C. Tăng cường bảo mật thông tin khách hàng
D. Loại bỏ hoàn toàn nhu cầu về nhân lực bán hàng
4. Trong mô hình hóa dữ liệu, ‘one-hot encoding’ được sử dụng để làm gì?
A. Chuẩn hóa dữ liệu số
B. Giảm số lượng chiều dữ liệu
C. Chuyển đổi dữ liệu категориальный thành dạng số phù hợp cho các thuật toán học máy
D. Loại bỏ các giá trị thiếu
5. Trong khoa học dữ liệu, ‘overfitting’ đề cập đến vấn đề gì?
A. Mô hình hoạt động quá chậm
B. Mô hình quá phức tạp và khớp quá chặt với dữ liệu huấn luyện, dẫn đến kém hiệu quả trên dữ liệu mới
C. Dữ liệu đầu vào bị thiếu thông tin
D. Mô hình không đủ mạnh để học từ dữ liệu
6. Trong khoa học dữ liệu, thuật ngữ ‘precision’ (độ chính xác) và ‘recall’ (độ phủ) được sử dụng để đánh giá điều gì?
A. Hiệu suất của thuật toán sắp xếp
B. Hiệu quả của thuật toán nén dữ liệu
C. Hiệu quả của mô hình phân loại (classification model)
D. Tốc độ xử lý dữ liệu của thuật toán
7. Đâu là một lợi ích của việc sử dụng cloud computing (điện toán đám mây) cho các dự án khoa học dữ liệu trong kinh doanh online?
A. Giảm chi phí phần cứng và cơ sở hạ tầng
B. Tăng cường bảo mật tuyệt đối cho dữ liệu
C. Loại bỏ hoàn toàn nhu cầu về nhân lực IT
D. Đảm bảo tốc độ xử lý dữ liệu nhanh nhất
8. Phương pháp nào sau đây được sử dụng để chia một tập dữ liệu thành các nhóm dựa trên sự tương đồng giữa các điểm dữ liệu?
A. Hồi quy tuyến tính
B. Phân tích chuỗi thời gian
C. Phân cụm (Clustering)
D. Phân tích phương sai
9. Mục tiêu chính của việc xây dựng hệ thống đề xuất (recommendation system) trong kinh doanh online là gì?
A. Giảm chi phí marketing
B. Tăng cường bảo mật thông tin khách hàng
C. Cá nhân hóa trải nghiệm người dùng và tăng doanh số bán hàng
D. Tối ưu hóa quy trình vận hành kho bãi
10. Trong mô hình hóa dữ liệu, ‘feature engineering’ là gì?
A. Quá trình chọn các thuật toán học máy phù hợp nhất
B. Quá trình làm sạch và chuẩn hóa dữ liệu
C. Quá trình tạo ra các thuộc tính (features) mới từ dữ liệu hiện có để cải thiện hiệu suất mô hình
D. Quá trình triển khai mô hình vào sản xuất
11. Trong phân tích dữ liệu, ‘outlier’ (giá trị ngoại lệ) là gì?
A. Một thuộc tính quan trọng trong tập dữ liệu
B. Một giá trị dữ liệu khác biệt đáng kể so với các giá trị khác trong tập dữ liệu
C. Một lỗi trong quá trình thu thập dữ liệu
D. Một mô hình học máy phức tạp
12. Phương pháp nào sau đây giúp đánh giá hiệu quả của mô hình phân loại (classification model)?
A. RMSE (Root Mean Squared Error)
B. MAE (Mean Absolute Error)
C. Confusion matrix (Ma trận nhầm lẫn)
D. R-squared
13. Trong bối cảnh kinh doanh online, chỉ số churn rate thể hiện điều gì?
A. Tỷ lệ chuyển đổi khách hàng tiềm năng thành khách hàng thực tế
B. Tỷ lệ khách hàng rời bỏ dịch vụ hoặc sản phẩm trong một khoảng thời gian nhất định
C. Tỷ lệ tăng trưởng doanh thu hàng tháng
D. Tỷ lệ hoàn vốn đầu tư (ROI) cho các chiến dịch marketing
14. Trong kinh doanh online, việc phân tích đường dẫn hành vi (customer journey) giúp ích gì?
A. Dự đoán xu hướng thị trường
B. Hiểu rõ hơn về cách khách hàng tương tác với website hoặc ứng dụng, từ đó tối ưu hóa trải nghiệm người dùng
C. Tối ưu hóa công cụ tìm kiếm (SEO)
D. Quản lý rủi ro tài chính
15. Phương pháp nào sau đây được sử dụng để dự đoán giá trị tương lai dựa trên dữ liệu quá khứ theo thời gian?
A. Hồi quy tuyến tính
B. Phân tích chuỗi thời gian (Time Series Analysis)
C. Phân cụm (Clustering)
D. Phân tích phương sai
16. Phương pháp nào sau đây được sử dụng để tìm kiếm các mẫu hoặc quy luật ẩn trong một tập dữ liệu lớn?
A. Hồi quy tuyến tính
B. Phân tích chuỗi thời gian
C. Khai thác dữ liệu (Data mining)
D. Phân tích phương sai
17. Kỹ thuật nào sau đây được sử dụng để dự đoán giá trị của một biến số dựa trên một hoặc nhiều biến số khác?
A. Phân cụm (Clustering)
B. Phân loại (Classification)
C. Hồi quy (Regression)
D. Khai thác luật kết hợp (Association Rule Mining)
18. Phương pháp nào sau đây thường được sử dụng để giảm số lượng chiều dữ liệu trong khoa học dữ liệu, giúp đơn giản hóa mô hình và giảm overfitting?
A. Mã hóa one-hot
B. Chuẩn hóa dữ liệu
C. Phân tích thành phần chính (PCA)
D. K-Means Clustering
19. Trong kinh doanh online, loại phân tích dữ liệu nào giúp xác định các sản phẩm thường được mua cùng nhau?
A. Phân tích hồi quy
B. Phân tích chuỗi thời gian
C. Phân tích kết hợp (Market Basket Analysis)
D. Phân tích phương sai
20. Chỉ số RFM (Recency, Frequency, Monetary) thường được sử dụng để làm gì trong kinh doanh online?
A. Dự đoán xu hướng thị trường
B. Phân tích hiệu quả chiến dịch quảng cáo
C. Phân khúc khách hàng dựa trên hành vi mua hàng
D. Đánh giá rủi ro tín dụng của khách hàng
21. Đâu là một nguy cơ tiềm ẩn khi sử dụng dữ liệu cá nhân của khách hàng trong kinh doanh online?
A. Tăng chi phí marketing
B. Vi phạm quyền riêng tư và các quy định về bảo vệ dữ liệu cá nhân
C. Giảm hiệu quả của các chiến dịch quảng cáo
D. Làm chậm tốc độ tải trang web
22. Trong kinh doanh online, việc phân tích cohort (nhóm когорта) giúp ích gì?
A. Dự đoán xu hướng thị trường
B. Phân tích hành vi của các nhóm khách hàng có đặc điểm chung theo thời gian
C. Tối ưu hóa công cụ tìm kiếm (SEO)
D. Quản lý rủi ro tài chính
23. Loại biểu đồ nào sau đây thường được sử dụng để hiển thị sự phân bố của một biến số liên tục?
A. Biểu đồ tròn (Pie chart)
B. Biểu đồ cột (Bar chart)
C. Biểu đồ đường (Line chart)
D. Biểu đồ histogram
24. Trong khoa học dữ liệu, thuật ngữ ‘bias’ (thiên vị) đề cập đến điều gì?
A. Sự chênh lệch giữa kết quả dự đoán của mô hình và giá trị thực tế
B. Xu hướng của mô hình học máy dự đoán sai lệch do dữ liệu huấn luyện không đại diện hoặc thuật toán có vấn đề
C. Tốc độ xử lý dữ liệu của thuật toán
D. Khả năng mở rộng của hệ thống lưu trữ dữ liệu
25. Trong bối cảnh kinh doanh online, phân tích sentiment (cảm xúc) được sử dụng để làm gì?
A. Dự đoán doanh thu bán hàng
B. Xác định cảm xúc của khách hàng về sản phẩm hoặc dịch vụ thông qua phân tích văn bản
C. Phân tích cấu trúc website
D. Tối ưu hóa chiến dịch quảng cáo trên mạng xã hội
26. Trong khoa học dữ liệu, thuật ngữ ‘feature scaling’ (tỉ lệ hóa thuộc tính) đề cập đến điều gì?
A. Quá trình chọn các thuộc tính quan trọng nhất cho mô hình
B. Quá trình chuyển đổi dữ liệu để các thuộc tính có cùng thang đo
C. Quá trình mã hóa dữ liệu văn bản thành số
D. Quá trình loại bỏ các giá trị ngoại lệ
27. Đâu là một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong kinh doanh online?
A. Sự thiếu hụt các công cụ phân tích dữ liệu
B. Khả năng thu thập dữ liệu từ nhiều nguồn khác nhau
C. Xử lý và lưu trữ dữ liệu với khối lượng lớn và tốc độ cao
D. Sự thiếu hụt nhân lực có kỹ năng marketing
28. Trong kinh doanh online, việc sử dụng dữ liệu để cá nhân hóa email marketing có thể mang lại lợi ích gì?
A. Giảm chi phí gửi email
B. Tăng tỷ lệ mở email và tỷ lệ nhấp chuột (CTR)
C. Tăng cường bảo mật thông tin khách hàng
D. Loại bỏ hoàn toàn nhu cầu về nhân lực marketing
29. Trong kinh doanh online, việc sử dụng chatbot có thể hỗ trợ thu thập dữ liệu khách hàng như thế nào?
A. Tự động thu thập thông tin cá nhân của khách hàng mà không cần sự đồng ý
B. Ghi lại lịch sử duyệt web của khách hàng
C. Thu thập thông tin về sở thích, nhu cầu và phản hồi của khách hàng thông qua tương tác trò chuyện
D. Chặn quảng cáo từ đối thủ cạnh tranh
30. Trong khoa học dữ liệu, kỹ thuật ‘regularization’ (chính quy hóa) được sử dụng để làm gì?
A. Tăng tốc độ xử lý dữ liệu
B. Giảm overfitting bằng cách thêm một hình phạt vào các tham số của mô hình
C. Giảm kích thước tập dữ liệu
D. Cải thiện độ chính xác của dữ liệu đầu vào
31. Khi xây dựng mô hình dự đoán, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (test set) nhằm mục đích gì?
A. Tăng tốc độ xử lý dữ liệu
B. Đánh giá hiệu suất của mô hình trên dữ liệu mới
C. Giảm dung lượng lưu trữ dữ liệu
D. Đơn giản hóa mô hình
32. Trong phân tích dữ liệu, ‘correlation’ (tương quan) đo lường điều gì?
A. Mức độ biến động của dữ liệu
B. Mối quan hệ tuyến tính giữa hai biến
C. Sự khác biệt giữa các nhóm dữ liệu
D. Tần suất xuất hiện của một giá trị trong dữ liệu
33. Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) trong kinh doanh online?
A. Bảng dữ liệu khách hàng với các cột như tên, địa chỉ, số điện thoại
B. Dữ liệu bán hàng với các cột như mã sản phẩm, số lượng, giá
C. Các bài đánh giá sản phẩm của khách hàng
D. Thông tin về các giao dịch tài chính
34. Phương pháp nào sau đây thường được sử dụng để giảm số lượng chiều (features) của dữ liệu trong khoa học dữ liệu?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Phân tích tương quan
35. Khi xây dựng mô hình học máy, mục tiêu của việc điều chỉnh siêu tham số (hyperparameter tuning) là gì?
A. Tăng tốc độ xử lý dữ liệu
B. Tìm ra các giá trị tốt nhất cho các tham số của mô hình để tối ưu hóa hiệu suất
C. Giảm dung lượng lưu trữ dữ liệu
D. Đơn giản hóa mô hình
36. Trong kinh doanh online, việc phân tích log file của máy chủ web có thể giúp doanh nghiệp hiểu được điều gì?
A. Mức độ hài lòng của khách hàng
B. Thông tin về các giao dịch tài chính
C. Hành vi của người dùng trên trang web (ví dụ: trang nào được truy cập nhiều nhất, thời gian ở lại trên trang)
D. Thông tin về đối thủ cạnh tranh
37. Trong khoa học dữ liệu, hiện tượng ‘overfitting’ xảy ra khi nào?
A. Mô hình quá đơn giản và không thể nắm bắt được các mẫu trong dữ liệu
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra
C. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra
D. Dữ liệu huấn luyện và dữ liệu kiểm tra giống hệt nhau
38. Trong kinh doanh online, việc sử dụng hệ thống đề xuất (recommendation system) có thể mang lại lợi ích gì?
A. Giảm chi phí lưu trữ dữ liệu
B. Tăng doanh số bán hàng bằng cách đề xuất các sản phẩm phù hợp với khách hàng
C. Cải thiện bảo mật dữ liệu khách hàng
D. Tự động hóa quy trình sản xuất
39. Khi đánh giá mô hình hồi quy, độ đo ‘R-squared’ thể hiện điều gì?
A. Mức độ phức tạp của mô hình
B. Tỷ lệ phương sai của biến mục tiêu được giải thích bởi các biến độc lập
C. Sai số trung bình của mô hình
D. Số lượng biến độc lập trong mô hình
40. Trong kinh doanh online, ‘churn rate’ (tỷ lệ rời bỏ) là gì?
A. Tỷ lệ khách hàng mới đăng ký dịch vụ
B. Tỷ lệ khách hàng hủy dịch vụ hoặc ngừng mua hàng trong một khoảng thời gian nhất định
C. Tỷ lệ khách hàng quay lại mua hàng sau một thời gian
D. Tỷ lệ khách hàng giới thiệu sản phẩm cho người khác
41. Trong kinh doanh online, việc sử dụng dữ liệu để phân tích hành vi người dùng trên mạng xã hội có thể giúp doanh nghiệp làm gì?
A. Xác định xu hướng thị trường và nhu cầu của khách hàng
B. Cải thiện bảo mật dữ liệu khách hàng
C. Giảm chi phí lưu trữ dữ liệu
D. Tự động hóa quy trình sản xuất
42. Khi xây dựng mô hình dự đoán, ‘regularization’ (chuẩn hóa) được sử dụng để làm gì?
A. Tăng tốc độ xử lý dữ liệu
B. Giảm overfitting bằng cách thêm một hình phạt vào hàm mất mát (loss function)
C. Giảm dung lượng lưu trữ dữ liệu
D. Đơn giản hóa mô hình
43. Đâu là một thách thức lớn trong việc thu thập và xử lý dữ liệu lớn (Big Data) cho kinh doanh online?
A. Dữ liệu luôn có cấu trúc rõ ràng
B. Chi phí lưu trữ và xử lý dữ liệu
C. Luôn có đủ nhân lực có kỹ năng phân tích dữ liệu
D. Các công cụ phân tích dữ liệu luôn tương thích hoàn toàn
44. Trong phân tích dữ liệu, ‘outlier’ là gì?
A. Một xu hướng phổ biến trong dữ liệu
B. Một giá trị dữ liệu khác biệt đáng kể so với các giá trị khác
C. Một lỗi trong quá trình thu thập dữ liệu
D. Một mô hình dự đoán chính xác
45. Phương pháp nào sau đây thường được sử dụng để dự đoán doanh số bán hàng trong tương lai dựa trên dữ liệu lịch sử?
A. Phân tích SWOT
B. Phân tích PEST
C. Phân tích chuỗi thời gian (Time Series Analysis)
D. Phân tích ABC
46. Trong kinh doanh online, loại phân tích dữ liệu nào giúp xác định sản phẩm hoặc dịch vụ nào thường được mua cùng nhau?
A. Phân tích hồi quy
B. Phân tích chuỗi thời gian
C. Phân tích kết hợp (Association Rule Mining)
D. Phân tích phương sai
47. Trong phân tích dữ liệu, ‘hypothesis testing’ (kiểm định giả thuyết) được sử dụng để làm gì?
A. Đánh giá hiệu suất của mô hình
B. Xác định xem có đủ bằng chứng để bác bỏ một giả thuyết về dữ liệu hay không
C. Tìm ra các mối quan hệ giữa các biến
D. Dự đoán các giá trị trong tương lai
48. Trong kinh doanh online, chỉ số ‘Customer Lifetime Value’ (CLTV) dùng để đo lường điều gì?
A. Tổng doanh thu của một sản phẩm
B. Chi phí để thu hút một khách hàng mới
C. Giá trị dự kiến mà một khách hàng sẽ mang lại trong suốt thời gian họ là khách hàng của doanh nghiệp
D. Số lượng khách hàng truy cập website mỗi ngày
49. Trong lĩnh vực kinh doanh online, ‘sentiment analysis’ (phân tích cảm xúc) thường được sử dụng để làm gì?
A. Dự đoán doanh số bán hàng
B. Phân tích phản hồi của khách hàng về sản phẩm hoặc dịch vụ
C. Xác định đối tượng mục tiêu cho chiến dịch quảng cáo
D. Tối ưu hóa giá sản phẩm
50. Kỹ thuật nào trong khoa học dữ liệu thường được sử dụng để phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi và đặc điểm của họ?
A. Phân tích tương quan
B. Phân tích cụm (Clustering)
C. Phân tích hồi quy tuyến tính
D. Phân tích phương sai
51. Đâu là một lợi ích chính của việc sử dụng khoa học dữ liệu trong quản lý chuỗi cung ứng của một doanh nghiệp kinh doanh online?
A. Giảm chi phí marketing
B. Tăng cường bảo mật dữ liệu khách hàng
C. Dự đoán nhu cầu và tối ưu hóa lượng hàng tồn kho
D. Tự động hóa hoàn toàn quy trình sản xuất
52. Khi đánh giá mô hình phân loại, độ đo ‘precision’ thể hiện điều gì?
A. Tỷ lệ các trường hợp thực tế là dương tính được dự đoán đúng
B. Tỷ lệ các trường hợp được dự đoán là dương tính thực sự là dương tính
C. Tỷ lệ các trường hợp thực tế là âm tính được dự đoán đúng
D. Tỷ lệ các trường hợp được dự đoán là âm tính thực sự là âm tính
53. Trong kinh doanh online, việc sử dụng dữ liệu để tối ưu hóa giá sản phẩm (price optimization) có thể mang lại lợi ích gì?
A. Giảm chi phí marketing
B. Tăng doanh thu bằng cách tìm ra mức giá tối ưu cho từng sản phẩm
C. Cải thiện bảo mật dữ liệu khách hàng
D. Tự động hóa quy trình sản xuất
54. Phương pháp nào sau đây có thể được sử dụng để phát hiện gian lận trong các giao dịch kinh doanh online?
A. Phân tích SWOT
B. Phân tích PEST
C. Phân tích phát hiện bất thường (Anomaly Detection)
D. Phân tích hồi quy
55. Trong kinh doanh online, việc sử dụng chatbot để hỗ trợ khách hàng là một ứng dụng của công nghệ nào?
A. Internet of Things (IoT)
B. Trí tuệ nhân tạo (Artificial Intelligence – AI)
C. Blockchain
D. Điện toán đám mây (Cloud Computing)
56. Trong khoa học dữ liệu, thuật ngữ ‘feature engineering’ đề cập đến điều gì?
A. Quá trình lựa chọn thuật toán phù hợp nhất cho một bài toán
B. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau
C. Quá trình tạo ra các thuộc tính (features) mới từ dữ liệu hiện có để cải thiện hiệu suất của mô hình
D. Quá trình đánh giá hiệu suất của mô hình
57. Đâu là một ứng dụng của khoa học dữ liệu trong việc cá nhân hóa trải nghiệm người dùng trên một trang web kinh doanh online?
A. Hiển thị quảng cáo cho tất cả người dùng
B. Gửi email marketing hàng loạt
C. Đề xuất sản phẩm dựa trên lịch sử mua hàng và hành vi duyệt web của người dùng
D. Sử dụng cùng một bố cục trang web cho tất cả người dùng
58. Trong phân tích dữ liệu kinh doanh online, ‘cohort analysis’ được sử dụng để làm gì?
A. Phân tích hiệu quả của các chiến dịch quảng cáo
B. Phân tích hành vi của các nhóm người dùng có chung đặc điểm hoặc trải nghiệm trong một khoảng thời gian nhất định
C. Dự đoán xu hướng thị trường
D. Tối ưu hóa giá sản phẩm
59. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data) trong khoa học dữ liệu?
A. Loại bỏ các hàng chứa dữ liệu bị thiếu
B. Thay thế dữ liệu bị thiếu bằng giá trị trung bình, trung vị hoặc một giá trị phù hợp khác
C. Sử dụng các thuật toán học máy để dự đoán dữ liệu bị thiếu
D. Tất cả các phương án trên
60. Trong bối cảnh kinh doanh online, ‘A/B testing’ được sử dụng để làm gì?
A. Đánh giá hiệu quả của một chiến dịch marketing tổng thể
B. So sánh hai phiên bản khác nhau của một trang web hoặc ứng dụng để xem phiên bản nào hoạt động tốt hơn
C. Phân tích dữ liệu khách hàng để tìm ra các xu hướng mua sắm
D. Dự đoán doanh số bán hàng trong tương lai
61. Mục tiêu chính của việc sử dụng chatbot trong kinh doanh online là gì?
A. Tăng cường bảo mật thông tin khách hàng
B. Tự động hóa tương tác và hỗ trợ khách hàng
C. Thu thập dữ liệu về đối thủ cạnh tranh
D. Cải thiện tốc độ tải trang web
62. Trong lĩnh vực kinh doanh online, chỉ số ROI (Return on Investment) thường được sử dụng để đánh giá điều gì?
A. Mức độ hài lòng của khách hàng
B. Hiệu quả của một chiến dịch marketing
C. Số lượng truy cập trang web
D. Tốc độ tải trang web
63. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để giảm thiểu tác động của các giá trị ngoại lệ (outliers) trong dữ liệu?
A. Chuẩn hóa dữ liệu (Data Normalization)
B. Xử lý giá trị thiếu (Missing Value Imputation)
C. Phân tích tương quan (Correlation Analysis)
D. Phân tích hồi quy (Regression Analysis)
64. Trong khoa học dữ liệu, phương pháp nào giúp đánh giá mức độ quan trọng của các biến đầu vào trong mô hình dự đoán?
A. Phân tích phương sai (ANOVA)
B. Phân tích tầm quan trọng của đặc trưng (Feature Importance Analysis)
C. Phân tích tương quan (Correlation Analysis)
D. Phân tích chuỗi thời gian (Time Series Analysis)
65. Trong khoa học dữ liệu, ‘feature engineering’ là quá trình gì?
A. Lựa chọn các thuật toán phù hợp nhất cho mô hình
B. Xây dựng, biến đổi và lựa chọn các đặc trưng (features) phù hợp từ dữ liệu thô để cải thiện hiệu suất mô hình
C. Đánh giá hiệu quả của mô hình
D. Thu thập dữ liệu từ nhiều nguồn khác nhau
66. Phương pháp nào trong khoa học dữ liệu giúp xác định các sản phẩm thường được mua cùng nhau trong kinh doanh online?
A. Phân tích hồi quy (Regression Analysis)
B. Phân tích giỏ hàng (Market Basket Analysis)
C. Phân tích chuỗi thời gian (Time Series Analysis)
D. Phân tích phương sai (ANOVA)
67. Trong kinh doanh online, ‘customer segmentation’ (phân khúc khách hàng) là gì?
A. Quá trình thu thập thông tin về khách hàng
B. Quá trình chia khách hàng thành các nhóm dựa trên các đặc điểm chung
C. Quá trình đánh giá mức độ hài lòng của khách hàng
D. Quá trình xây dựng mối quan hệ với khách hàng
68. Trong kinh doanh online, kỹ thuật nào của khoa học dữ liệu giúp phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi mua sắm?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân cụm (Clustering)
D. Phân tích chuỗi thời gian
69. Trong kinh doanh online, ‘tỷ lệ chuyển đổi’ (conversion rate) được định nghĩa là gì?
A. Tỷ lệ khách hàng rời bỏ trang web sau khi truy cập
B. Tỷ lệ khách hàng hoàn thành một hành động mong muốn (ví dụ: mua hàng) trên tổng số khách truy cập
C. Tỷ lệ khách hàng quay lại trang web sau một thời gian
D. Tỷ lệ khách hàng chia sẻ thông tin sản phẩm trên mạng xã hội
70. Trong kinh doanh online, ‘upselling’ và ‘cross-selling’ khác nhau như thế nào?
A. Upselling là bán sản phẩm rẻ hơn, cross-selling là bán sản phẩm đắt hơn
B. Upselling là bán sản phẩm tương tự nhưng cao cấp hơn, cross-selling là bán sản phẩm liên quan
C. Upselling là bán cho khách hàng mới, cross-selling là bán cho khách hàng cũ
D. Upselling và cross-selling là hai khái niệm hoàn toàn giống nhau
71. Trong kinh doanh online, phương pháp remarketing (tiếp thị lại) hoạt động như thế nào?
A. Gửi email hàng loạt đến tất cả khách hàng trong danh sách
B. Hiển thị quảng cáo cho những người đã từng truy cập trang web hoặc tương tác với thương hiệu
C. Tặng quà cho khách hàng thân thiết
D. Giảm giá cho khách hàng mới
72. Trong khoa học dữ liệu, ma trận nhầm lẫn (confusion matrix) được sử dụng để đánh giá hiệu quả của mô hình nào?
A. Mô hình hồi quy (Regression Model)
B. Mô hình phân loại (Classification Model)
C. Mô hình phân cụm (Clustering Model)
D. Mô hình chuỗi thời gian (Time Series Model)
73. Trong kinh doanh online, ’email marketing automation’ là gì?
A. Gửi email hàng loạt đến tất cả khách hàng trong danh sách
B. Sử dụng phần mềm để tự động gửi email dựa trên hành vi và thông tin của khách hàng
C. Thu thập địa chỉ email của khách hàng
D. Thiết kế mẫu email đẹp mắt
74. Trong khoa học dữ liệu, phương pháp nào giúp dự đoán giá trị liên tục của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập?
A. Phân tích hồi quy (Regression Analysis)
B. Phân tích phân loại (Classification Analysis)
C. Phân tích cụm (Cluster Analysis)
D. Phân tích chuỗi thời gian (Time Series Analysis)
75. Trong khoa học dữ liệu, ‘precision’ và ‘recall’ là các chỉ số đánh giá hiệu quả của mô hình nào?
A. Mô hình hồi quy (Regression Model)
B. Mô hình phân loại (Classification Model)
C. Mô hình phân cụm (Clustering Model)
D. Mô hình chuỗi thời gian (Time Series Model)
76. Trong khoa học dữ liệu, ‘overfitting’ là hiện tượng xảy ra khi nào?
A. Mô hình quá đơn giản và không thể nắm bắt được các mối quan hệ phức tạp trong dữ liệu
B. Mô hình quá phức tạp và học thuộc lòng dữ liệu huấn luyện, dẫn đến kém hiệu quả trên dữ liệu mới
C. Dữ liệu huấn luyện không đủ lớn để xây dựng mô hình
D. Mô hình không được huấn luyện đầy đủ
77. Phương pháp nào trong khoa học dữ liệu thường được sử dụng để dự đoán doanh số bán hàng trong tương lai dựa trên dữ liệu lịch sử?
A. Phân tích thành phần chính (PCA)
B. Phân tích chuỗi thời gian (Time Series Analysis)
C. Phân tích tương quan (Correlation Analysis)
D. Phân tích hồi quy tuyến tính (Linear Regression)
78. Trong kinh doanh online, ‘content marketing’ (tiếp thị nội dung) là gì?
A. Hình thức quảng cáo trả tiền trên các công cụ tìm kiếm
B. Chiến lược tạo và phân phối nội dung giá trị, liên quan và nhất quán để thu hút và giữ chân khách hàng
C. Hình thức bán hàng trực tiếp cho khách hàng
D. Hình thức tặng quà cho khách hàng thân thiết
79. Trong khoa học dữ liệu, phương pháp nào giúp xác định cấu trúc ẩn trong dữ liệu đa chiều?
A. Phân tích thành phần chính (PCA)
B. Phân tích hồi quy (Regression Analysis)
C. Phân tích phương sai (ANOVA)
D. Phân tích chuỗi thời gian (Time Series Analysis)
80. Trong khoa học dữ liệu, kỹ thuật nào giúp giảm số lượng biến đầu vào trong mô hình mà vẫn giữ được thông tin quan trọng?
A. Phân tích hồi quy (Regression Analysis)
B. Phân tích phương sai (ANOVA)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Phân tích chuỗi thời gian (Time Series Analysis)
81. Trong khoa học dữ liệu, kỹ thuật nào giúp phát hiện các gian lận trong giao dịch trực tuyến?
A. Phân tích hồi quy (Regression Analysis)
B. Phát hiện bất thường (Anomaly Detection)
C. Phân tích phương sai (ANOVA)
D. Phân tích chuỗi thời gian (Time Series Analysis)
82. Phương pháp nào trong khoa học dữ liệu giúp tìm ra các quy luật hoặc mối quan hệ ẩn trong dữ liệu lớn?
A. Khai phá dữ liệu (Data Mining)
B. Phân tích hồi quy (Regression Analysis)
C. Phân tích phương sai (ANOVA)
D. Phân tích chuỗi thời gian (Time Series Analysis)
83. Kỹ thuật nào trong khoa học dữ liệu giúp xác định các chủ đề (topics) đang được thảo luận nhiều nhất trên mạng xã hội liên quan đến một thương hiệu?
A. Phân tích hồi quy (Regression Analysis)
B. Phân tích chủ đề (Topic Modeling)
C. Phân tích phương sai (ANOVA)
D. Phân tích chuỗi thời gian (Time Series Analysis)
84. Trong kinh doanh online, chỉ số ‘Customer Lifetime Value’ (CLTV) dùng để đo lường điều gì?
A. Chi phí để thu hút một khách hàng mới
B. Tổng doanh thu mà một khách hàng dự kiến sẽ mang lại trong suốt mối quan hệ với doanh nghiệp
C. Số lượng khách hàng hủy đăng ký dịch vụ
D. Mức độ hài lòng của khách hàng về sản phẩm
85. Trong kinh doanh online, ‘retargeting’ khác với ‘remarketing’ như thế nào?
A. Retargeting chỉ sử dụng email, trong khi remarketing sử dụng nhiều kênh khác nhau
B. Retargeting tập trung vào việc hiển thị quảng cáo, trong khi remarketing bao gồm cả email và các hình thức tiếp thị khác
C. Retargeting và remarketing là hai khái niệm hoàn toàn giống nhau
D. Retargeting chỉ dành cho khách hàng đã mua hàng, trong khi remarketing dành cho tất cả khách truy cập
86. Thuật ngữ ‘A/B testing’ trong kinh doanh online dùng để chỉ phương pháp nào?
A. Kiểm tra độ bảo mật của website
B. Kiểm tra tốc độ tải trang web
C. So sánh hai phiên bản của một trang web hoặc ứng dụng để xem phiên bản nào hoạt động tốt hơn
D. Đánh giá trải nghiệm người dùng trên thiết bị di động
87. Trong kinh doanh online, ‘churn rate’ (tỷ lệ rời bỏ) đo lường điều gì?
A. Số lượng khách hàng mới đăng ký dịch vụ
B. Tỷ lệ khách hàng hủy đăng ký dịch vụ trong một khoảng thời gian nhất định
C. Số lượng khách hàng truy cập trang web mỗi ngày
D. Tỷ lệ khách hàng hoàn thành mua hàng
88. Trong kinh doanh online, ‘cart abandonment rate’ (tỷ lệ bỏ giỏ hàng) là gì?
A. Tỷ lệ khách hàng thêm sản phẩm vào giỏ hàng nhưng không hoàn thành việc mua hàng
B. Tỷ lệ khách hàng hủy đơn hàng sau khi đã thanh toán
C. Tỷ lệ khách hàng trả lại sản phẩm sau khi mua
D. Tỷ lệ khách hàng liên hệ với bộ phận hỗ trợ
89. Trong kinh doanh online, ‘SEO’ (Search Engine Optimization) là gì?
A. Chiến lược bán hàng trực tuyến
B. Quy trình quản lý kho hàng
C. Tối ưu hóa công cụ tìm kiếm để cải thiện thứ hạng trang web trên các công cụ tìm kiếm
D. Phần mềm quản lý quan hệ khách hàng
90. Trong kinh doanh online, ‘affiliate marketing’ (tiếp thị liên kết) là gì?
A. Hình thức quảng cáo trên mạng xã hội
B. Hình thức hợp tác với các đối tác để quảng bá sản phẩm và nhận hoa hồng khi có khách hàng mua hàng thông qua liên kết
C. Hình thức bán hàng trực tiếp cho khách hàng
D. Hình thức tặng quà cho khách hàng thân thiết
91. Trong kinh doanh online, chỉ số ‘Customer Acquisition Cost’ (CAC) đo lường điều gì?
A. Doanh thu trung bình trên mỗi khách hàng
B. Chi phí để có được một khách hàng mới
C. Tỷ lệ giữ chân khách hàng
D. Mức độ hài lòng của khách hàng
92. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để chuẩn hóa dữ liệu về cùng một thang đo?
A. Feature extraction
B. Data imputation
C. Feature scaling (Chuẩn hóa đặc trưng)
D. Dimensionality reduction
93. Trong khoa học dữ liệu, phương pháp nào được sử dụng để đánh giá hiệu suất của mô hình phân loại?
A. Mean Squared Error (MSE)
B. R-squared
C. Confusion matrix (Ma trận nhầm lẫn)
D. Root Mean Squared Error (RMSE)
94. Trong kinh doanh online, ‘Lead scoring’ (Chấm điểm khách hàng tiềm năng) sử dụng khoa học dữ liệu để làm gì?
A. Tạo ra các chiến dịch marketing hàng loạt
B. Xếp hạng khách hàng tiềm năng dựa trên khả năng chuyển đổi thành khách hàng thực tế
C. Giảm chi phí marketing
D. Tăng số lượng email gửi đi
95. Trong kinh doanh online, chỉ số ‘Customer Lifetime Value’ (CLTV) được sử dụng để làm gì?
A. Đo lường sự hài lòng của khách hàng
B. Dự đoán tổng doanh thu mà một khách hàng sẽ mang lại trong suốt thời gian họ là khách hàng
C. Xác định chi phí để có được một khách hàng mới
D. Đánh giá hiệu quả của chiến dịch marketing
96. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để xử lý dữ liệu bị thiếu (missing data)?
A. Feature extraction
B. Data imputation (Điền giá trị thiếu)
C. Feature scaling
D. Dimensionality reduction
97. Trong kinh doanh online, thuật ngữ ‘Retargeting’ (Tiếp thị lại) dùng để chỉ điều gì?
A. Thu hút khách hàng mới
B. Hiển thị quảng cáo cho những người đã truy cập trang web của bạn nhưng chưa thực hiện hành động mua hàng
C. Phân tích đối thủ cạnh tranh
D. Cải thiện trải nghiệm người dùng
98. Trong kinh doanh online, thuật ngữ ‘Attribution modeling’ (Mô hình phân bổ) dùng để chỉ điều gì?
A. Tạo ra các chiến dịch marketing
B. Xác định kênh marketing nào đóng góp nhiều nhất vào việc chuyển đổi khách hàng
C. Phân tích đối thủ cạnh tranh
D. Cải thiện trải nghiệm người dùng
99. Trong khoa học dữ liệu, thuật ngữ nào mô tả việc lựa chọn các biến đầu vào quan trọng nhất cho mô hình?
A. Feature engineering
B. Feature scaling
C. Feature selection (Lựa chọn đặc trưng)
D. Data imputation
100. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để tìm các mẫu ẩn trong dữ liệu?
A. Feature extraction
B. Data imputation
C. Data mining (Khai thác dữ liệu)
D. Dimensionality reduction
101. Trong khoa học dữ liệu, thuật ngữ nào mô tả việc giảm số lượng biến đầu vào trong mô hình dự đoán để tránh overfitting?
A. Feature engineering
B. Feature scaling
C. Dimensionality reduction (Giảm chiều dữ liệu)
D. Data imputation
102. Trong khoa học dữ liệu, kỹ thuật ‘Cross-validation’ (Kiểm định chéo) được sử dụng để làm gì?
A. Tăng kích thước dữ liệu
B. Đánh giá hiệu suất của mô hình trên dữ liệu mới
C. Chuẩn hóa dữ liệu
D. Điền giá trị thiếu
103. Trong khoa học dữ liệu, phương pháp nào được sử dụng để phân tích chuỗi thời gian?
A. Phân tích hồi quy
B. Phân cụm (Clustering)
C. Phân tích chuỗi thời gian (Time series analysis)
D. Phân tích phương sai
104. Trong khoa học dữ liệu, phương pháp nào được sử dụng để dự đoán giá trị của một biến số dựa trên các biến số khác?
A. Phân cụm (Clustering)
B. Phân loại (Classification)
C. Hồi quy (Regression)
D. Phân tích thành phần chính (PCA)
105. Trong khoa học dữ liệu, phương pháp nào thường được sử dụng để tìm các quy luật kết hợp giữa các sản phẩm trong giỏ hàng của khách hàng?
A. Phân tích hồi quy
B. Phân cụm (Clustering)
C. Phân tích giỏ hàng (Market Basket Analysis)
D. Phân tích chuỗi thời gian
106. Mô hình ‘Cohort analysis’ trong kinh doanh online được sử dụng để làm gì?
A. Dự đoán doanh thu hàng tháng
B. Phân tích hành vi của nhóm khách hàng có chung đặc điểm trong một khoảng thời gian nhất định
C. Tối ưu hóa giá sản phẩm
D. Xác định các kênh marketing hiệu quả nhất
107. Trong khoa học dữ liệu, thuật ngữ nào mô tả việc tạo ra các biến mới từ các biến hiện có?
A. Feature engineering (Thiết kế đặc trưng)
B. Feature scaling
C. Feature selection
D. Data imputation
108. Trong khoa học dữ liệu, kỹ thuật ‘Regularization’ (Chính quy hóa) được sử dụng để làm gì?
A. Tăng độ phức tạp của mô hình
B. Giảm overfitting (quá khớp) bằng cách thêm một khoản phạt vào các tham số lớn của mô hình
C. Chuẩn hóa dữ liệu
D. Điền giá trị thiếu
109. Trong kinh doanh online, thuật ngữ ‘A/B testing’ dùng để chỉ điều gì?
A. Kiểm tra độ bảo mật của website
B. So sánh hai phiên bản của một trang web hoặc ứng dụng để xem phiên bản nào hoạt động tốt hơn
C. Phân tích đối thủ cạnh tranh
D. Đánh giá trải nghiệm người dùng
110. Trong kinh doanh online, thuật ngữ ‘Churn rate’ (Tỷ lệ rời bỏ) dùng để chỉ điều gì?
A. Tỷ lệ khách hàng mới đăng ký
B. Tỷ lệ khách hàng hủy dịch vụ hoặc ngừng mua hàng trong một khoảng thời gian nhất định
C. Tỷ lệ khách hàng truy cập trang web
D. Tỷ lệ khách hàng hoàn thành giao dịch
111. Trong kinh tế và kinh doanh online, ‘Recommendation system’ (Hệ thống gợi ý) sử dụng thuật toán nào để đề xuất sản phẩm cho người dùng?
A. Linear Regression
B. Logistic Regression
C. Collaborative Filtering (Lọc cộng tác)
D. Decision Tree
112. Trong kinh doanh online, ‘Personalized marketing’ (Marketing cá nhân hóa) sử dụng khoa học dữ liệu để làm gì?
A. Tạo ra các chiến dịch marketing chung cho tất cả khách hàng
B. Tùy chỉnh thông điệp và ưu đãi marketing cho từng khách hàng dựa trên dữ liệu về hành vi và sở thích của họ
C. Giảm chi phí marketing
D. Tăng số lượng email gửi đi
113. Trong kinh doanh online, chỉ số ‘Net Promoter Score’ (NPS) đo lường điều gì?
A. Doanh thu trung bình trên mỗi khách hàng
B. Mức độ hài lòng và lòng trung thành của khách hàng
C. Chi phí để có được một khách hàng mới
D. Tỷ lệ chuyển đổi
114. Trong khoa học dữ liệu, thuật ngữ nào chỉ việc chuyển đổi dữ liệu định tính thành dữ liệu định lượng để sử dụng trong các mô hình học máy?
A. Feature scaling
B. Data imputation
C. Encoding (Mã hóa)
D. Dimensionality reduction
115. Phương pháp nào trong khoa học dữ liệu thường được sử dụng để phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi mua sắm của họ?
A. Hồi quy tuyến tính
B. Phân cụm (Clustering)
C. Phân tích chuỗi thời gian
D. Phân tích phương sai
116. Trong kinh doanh online, chỉ số ‘Conversion Rate’ (Tỷ lệ chuyển đổi) đo lường điều gì?
A. Số lượng khách hàng truy cập trang web
B. Tỷ lệ phần trăm khách hàng hoàn thành một hành động mong muốn (ví dụ: mua hàng)
C. Chi phí để có được một khách hàng mới
D. Doanh thu trung bình trên mỗi khách hàng
117. Trong khoa học dữ liệu, phương pháp nào được sử dụng để giảm kích thước dữ liệu trong khi vẫn giữ lại thông tin quan trọng?
A. Feature engineering
B. Feature scaling
C. Dimensionality reduction (Giảm chiều dữ liệu)
D. Data imputation
118. Trong kinh tế và kinh doanh online, kỹ thuật nào của khoa học dữ liệu thường được sử dụng để phân tích cảm xúc khách hàng từ các bình luận trên mạng xã hội?
A. Phân tích hồi quy
B. Phân tích chuỗi thời gian
C. Phân tích văn bản (Text analysis)
D. Phân tích phương sai
119. Trong kinh doanh online, kỹ thuật ‘Price optimization’ (Tối ưu hóa giá) sử dụng khoa học dữ liệu để làm gì?
A. Dự đoán xu hướng thị trường
B. Xác định mức giá tối ưu để tối đa hóa lợi nhuận
C. Phân tích đối thủ cạnh tranh
D. Cải thiện trải nghiệm người dùng
120. Trong kinh doanh online, chỉ số ‘Average Order Value’ (AOV) đo lường điều gì?
A. Tổng doanh thu
B. Giá trị trung bình của mỗi đơn hàng
C. Số lượng đơn hàng
D. Chi phí trung bình trên mỗi đơn hàng
121. Trong bối cảnh kinh doanh online, kỹ thuật nào của khoa học dữ liệu giúp phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi và đặc điểm?
A. Hồi quy tuyến tính
B. Phân cụm (Clustering)
C. Phân tích chuỗi thời gian
D. Kiểm định giả thuyết
122. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để tạo ra các mô hình có khả năng dự đoán hoặc phân loại dữ liệu mới dựa trên dữ liệu đã biết?
A. Trực quan hóa dữ liệu
B. Học máy (Machine Learning)
C. Thống kê mô tả
D. Khai phá dữ liệu
123. Trong kinh doanh online, việc sử dụng các công cụ trực quan hóa dữ liệu (data visualization) giúp ích gì?
A. Tăng tốc độ tải trang web
B. Giúp hiểu và truyền đạt thông tin từ dữ liệu một cách dễ dàng hơn
C. Tự động tạo ra các báo cáo tài chính
D. Bảo vệ dữ liệu khỏi bị tấn công
124. Trong kinh doanh online, việc sử dụng khoa học dữ liệu để dự đoán nhu cầu sản phẩm (demand forecasting) có thể giúp doanh nghiệp làm gì?
A. Giảm chi phí marketing
B. Tối ưu hóa lượng hàng tồn kho
C. Tăng cường bảo mật cho dữ liệu khách hàng
D. Cải thiện trải nghiệm người dùng trên trang web
125. Trong khoa học dữ liệu, thuật ngữ nào mô tả việc đánh giá hiệu suất của một mô hình học máy trên dữ liệu mới (dữ liệu chưa được sử dụng để huấn luyện mô hình)?
A. Huấn luyện mô hình (Model Training)
B. Kiểm tra mô hình (Model Testing)
C. Tối ưu hóa mô hình (Model Optimization)
D. Triển khai mô hình (Model Deployment)
126. Trong kinh doanh online, việc sử dụng chatbot để trả lời câu hỏi của khách hàng là một ứng dụng của lĩnh vực nào trong khoa học dữ liệu?
A. Thống kê mô tả
B. Học máy (Machine Learning)
C. Khai phá dữ liệu (Data Mining)
D. Trực quan hóa dữ liệu
127. Đâu là thách thức lớn nhất khi áp dụng khoa học dữ liệu vào kinh doanh online liên quan đến dữ liệu?
A. Chi phí phần mềm
B. Sự khan hiếm nhân tài
C. Khả năng mở rộng của cơ sở hạ tầng
D. Chất lượng dữ liệu không đảm bảo và thiếu tính nhất quán
128. Mục tiêu chính của việc sử dụng khoa học dữ liệu trong quản lý chuỗi cung ứng của một doanh nghiệp kinh doanh online là gì?
A. Tăng cường quảng bá sản phẩm
B. Tối ưu hóa chi phí và nâng cao hiệu quả hoạt động
C. Cải thiện giao diện website
D. Tăng số lượng nhân viên
129. Trong kinh doanh online, việc sử dụng khoa học dữ liệu để phát hiện các đánh giá giả mạo (fake reviews) có thể giúp doanh nghiệp làm gì?
A. Tăng cường bảo mật cho trang web
B. Cải thiện uy tín và độ tin cậy của sản phẩm
C. Giảm chi phí quảng cáo
D. Tự động trả lời các đánh giá của khách hàng
130. Trong khoa học dữ liệu, phương pháp nào được sử dụng để chia một tập dữ liệu thành các nhóm (clusters) sao cho các điểm dữ liệu trong cùng một nhóm có tính tương đồng cao hơn so với các điểm dữ liệu ở các nhóm khác?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích cụm (Clustering)
D. Phân tích thành phần chính
131. Trong lĩnh vực kinh doanh online, kỹ thuật nào của khoa học dữ liệu được sử dụng để phát hiện các gian lận trong thanh toán trực tuyến?
A. Phân tích tương quan
B. Phát hiện dị thường (Anomaly Detection)
C. Phân tích hồi quy
D. Phân tích phương sai
132. Trong kinh doanh online, việc dự đoán khả năng khách hàng rời bỏ (churn) dịch vụ là một ứng dụng của bài toán nào trong khoa học dữ liệu?
A. Hồi quy
B. Phân loại (Classification)
C. Phân cụm
D. Giảm chiều
133. Trong kinh doanh online, phương pháp nào sử dụng dữ liệu lịch sử giao dịch để dự đoán khả năng khách hàng sẽ mua lại sản phẩm?
A. Phân tích cảm xúc
B. Phân tích RFM (Recency, Frequency, Monetary)
C. Phân tích văn bản
D. Phân tích mạng xã hội
134. Doanh nghiệp kinh doanh online sử dụng phương pháp nào để cá nhân hóa trải nghiệm mua sắm của khách hàng dựa trên lịch sử duyệt web và mua hàng?
A. Phân tích SWOT
B. Hệ thống gợi ý (Recommendation System)
C. Phân tích PEST
D. Mô hình 5 lực lượng Porter
135. Trong khoa học dữ liệu, phương pháp nào được sử dụng để đánh giá tầm quan trọng của các thuộc tính (features) trong một mô hình dự đoán?
A. Phân tích phương sai (ANOVA)
B. Đánh giá tầm quan trọng của thuộc tính (Feature Importance)
C. Phân tích hồi quy
D. Phân tích cụm
136. Trong kinh doanh online, việc phân tích cảm xúc (sentiment analysis) thường được sử dụng để làm gì?
A. Dự đoán doanh số bán hàng
B. Đánh giá phản hồi của khách hàng về sản phẩm hoặc dịch vụ
C. Phân loại khách hàng thành các nhóm
D. Tối ưu hóa giá sản phẩm
137. Trong khoa học dữ liệu, thuật ngữ nào mô tả quá trình làm sạch và biến đổi dữ liệu thô để chuẩn bị cho phân tích?
A. Trực quan hóa dữ liệu
B. Khai phá dữ liệu
C. Tiền xử lý dữ liệu (Data Preprocessing)
D. Mô hình hóa dữ liệu
138. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để tìm ra các quy luật hoặc mối quan hệ ẩn trong một tập dữ liệu lớn, ví dụ như các sản phẩm thường được mua cùng nhau?
A. Phân tích hồi quy
B. Khai phá luật kết hợp (Association Rule Mining)
C. Phân tích phương sai
D. Phân tích thành phần chính
139. Trong khoa học dữ liệu, phương pháp nào được sử dụng để giảm số lượng chiều dữ liệu (ví dụ: số lượng thuộc tính của sản phẩm) mà vẫn giữ lại được thông tin quan trọng nhất?
A. Phân tích ANOVA
B. Phân tích thành phần chính (Principal Component Analysis – PCA)
C. Phân tích chuỗi thời gian
D. Phân tích hồi quy đa biến
140. Trong khoa học dữ liệu, phương pháp nào được sử dụng để ước lượng giá trị của một biến số liên tục dựa trên giá trị của các biến số khác?
A. Phân tích hồi quy (Regression Analysis)
B. Phân tích phương sai (ANOVA)
C. Phân tích cụm (Clustering)
D. Phân tích thành phần chính (PCA)
141. Trong kinh doanh online, việc sử dụng A/B testing để so sánh hai phiên bản khác nhau của một trang web hoặc ứng dụng là một ứng dụng của phương pháp nào?
A. Thống kê mô tả
B. Suy luận thống kê (Statistical Inference)
C. Học máy
D. Khai phá dữ liệu
142. Trong kinh doanh online, việc sử dụng khoa học dữ liệu để phân tích hành vi của khách hàng trên mạng xã hội có thể giúp doanh nghiệp làm gì?
A. Tăng cường bảo mật cho tài khoản của khách hàng
B. Cải thiện hiệu quả của các chiến dịch marketing
C. Giảm chi phí vận chuyển
D. Tự động tạo ra các bài viết trên mạng xã hội
143. Trong kinh doanh online, loại dữ liệu nào sau đây KHÔNG thuộc về dữ liệu hành vi của khách hàng?
A. Lịch sử mua hàng
B. Thời gian ở lại trên trang web
C. Thông tin nhân khẩu học (tuổi, giới tính)
D. Số lần nhấp vào quảng cáo
144. Trong kinh doanh online, việc sử dụng khoa học dữ liệu để tối ưu hóa giá sản phẩm (price optimization) có thể giúp doanh nghiệp làm gì?
A. Giảm chi phí sản xuất
B. Tăng doanh thu và lợi nhuận
C. Cải thiện chất lượng sản phẩm
D. Tăng số lượng khách hàng
145. Trong kinh doanh online, chỉ số nào sau đây KHÔNG phải là một phần của phân tích RFM?
A. Recency (Thời gian mua hàng gần nhất)
B. Frequency (Tần suất mua hàng)
C. Monetary (Giá trị đơn hàng)
D. Sentiment (Cảm xúc khách hàng)
146. Khi xây dựng mô hình dự đoán giá cho một sản phẩm trên sàn thương mại điện tử, thuật toán nào thường được sử dụng để xác định mối quan hệ giữa các thuộc tính của sản phẩm và giá cả?
A. K-means Clustering
B. Support Vector Machine (SVM)
C. Linear Regression (Hồi quy tuyến tính)
D. Principal Component Analysis (PCA)
147. Trong khoa học dữ liệu, thuật ngữ nào mô tả việc biến đổi dữ liệu từ định dạng này sang định dạng khác để phù hợp với yêu cầu của phân tích?
A. Làm sạch dữ liệu (Data Cleaning)
B. Biến đổi dữ liệu (Data Transformation)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Lựa chọn thuộc tính (Feature Selection)
148. Khi đánh giá hiệu quả của một chiến dịch quảng cáo online, chỉ số nào sau đây KHÔNG liên quan trực tiếp đến khoa học dữ liệu?
A. Tỷ lệ chuyển đổi (Conversion Rate)
B. Chi phí trên mỗi nhấp chuột (Cost Per Click – CPC)
C. Độ nhận diện thương hiệu (Brand Awareness)
D. Tỷ lệ giữ chân khách hàng (Customer Retention Rate)
149. Trong khoa học dữ liệu, thuật ngữ nào mô tả việc lựa chọn một tập hợp con các thuộc tính (features) quan trọng nhất từ tập dữ liệu gốc để sử dụng trong mô hình?
A. Giảm chiều dữ liệu (Dimensionality Reduction)
B. Lựa chọn thuộc tính (Feature Selection)
C. Biến đổi dữ liệu (Data Transformation)
D. Làm sạch dữ liệu (Data Cleaning)
150. Khi một doanh nghiệp kinh doanh online muốn dự đoán số lượng sản phẩm bán ra trong tháng tới, phương pháp nào của khoa học dữ liệu là phù hợp nhất?
A. Phân tích phương sai (ANOVA)
B. Phân tích chuỗi thời gian (Time Series Analysis)
C. Phân tích hồi quy tuyến tính (Linear Regression)
D. Phân tích phân cụm (Clustering)