Trong nghiên cứu khoa học thống kê, kiểm định Anova là một phương pháp được nhiều người vận dụng để so sánh trị giá từ những bộ dữ liệu khác nhau. Những phân tích Anova ngày càng chứng minh sự hữu ích và quan yếu của mình trong những bài luận văn. Vậy bạn đã biết Kiểm định Anova là gì? Sử dụng kiểm định Anova ra sao và thực hiện như thế nào? Tất cả sẽ được tư vấn trong bài viết dưới đây của Tri Thức Cùng Đồng.
1. Khái niệm về kiểm định Anova
Lúc mới xúc tiếp với những phương pháp phân tích thống kê trong nghiên cứu khoa học, nhiều người thường tự hỏi kiểm định ANOVA là gì?
Kiểm định ANOVA (ANOVA test), hay còn được gọi là phân tích phương sai (Analysis of Variance), là một kỹ thuật thống kê thông số được sử dụng để phân trò vè khác nhau giữa trị giá trung bình của những biến phụ thuộc với nhau (Ronald Fisher, 1918).
Hiểu đơn thuần, đây là một phương tiện giúp xác định tác động của những biến độc lập với biến phụ thuộc trong một nghiên cứu hồi quy. Nhưng thay vì chỉ so sánh những đối tượng trong một nhóm nghiên cứu, phân tích ANOVA giúp so sánh trong phạm vi rộng hơn, giữa hai hoặc nhiều nhóm đối tượng.
Phương tiện phân tích ANOVA sẽ chia một biến tổng hợp quan sát được tìm thấy bên trong tập dữ liệu thành Hai phần để phân tích:
- Yếu tố hệ thống: Là yếu tố với tác động thống kê tới tập dữ liệu đã cho
- Yếu tố ngẫu nhiên: Trái lại với yếu tố hệ thống, chúng ko tác động tới tập dữ liệu với sẵn.
Ví dụ: Trong ứng dụng kinh doanh, phòng ban R&D sử dụng phân tích ANOVA thử nghiệm hai thứ tự sản xuất khác nhau để xem liệu thứ tự nào tốt hơn về hiệu quả mức giá so với thứ tự còn lại.
Tìm hiểu parametric test là gì.
2. Tổng hợp 3 loại phân tích Anova phổ biến
Kiểm định ANOVA bao gồm 3 phương pháp bao gồm: ANOVA một chiều (One-way ANOVA), ANOVA hai chiều (Two-way ANOVA) và ANOVA đa biến (MANOVA). Cụ thể từng phương pháp là gì, hãy tìm hiểu tiếp trong phần dưới đây.
2.1. One-way ANOVA
One-way ANOVA là một loại thử nghiệm thống kê nhằm thẩm định tác động của một biến độc lập duy nhất lên một biến phản hồi duy nhất. Nó giúp xác định xem tất cả những mẫu với giống nhau hay ko.
Tóm lại, One-way ANOVA được sử dụng để xác định liệu với bất kỳ sự khác biệt với ý nghĩa nào giữa những đối tượng của ba hay nhiều nhóm độc lập với nhau hay ko.
Tất cả những kết quả trả ra đều dựa trên giả thiết rằng khả năng phạm sai trái chỉ là 5%.
Ví dụ: Sử dụng One-way ANOVA để tìm hiểu xem liệu với sự phụ thuộc của độ tuổi khách hàng (Khách hàng trẻ tuổi, khách hàng trung niên và khách hàng cao tuổi) với hành vi sắm hàng của họ hay ko.
2.2. Two-way ANOVA
Two-way ANOVA với thể được coi là một phần mở rộng của phân tích One-way ANOVA. Vì đối với One-way ANOVA bạn chỉ với thể nghiên cứu tác động của một biến độc lập với một biến phụ thuộc, còn Two-way ANOVA sẽ với Hai biến độc lập.
Phân tích Two-way ANOVA được sử dụng để quan sát sự tương tác giữa hai yếu tố và rà soát sự tác động của Hai yếu tố đó lên biến phụ thuộc cùng một lúc.
Tương tự như trên, phương pháp này dựa trên giả thiết khả năng phạm lỗi chỉ là 5%.
Ví dụ: Two-way ANOVA Test giúp chúng ta tìm ra liệu sự tác động của độ tuổi tới sự hài lòng giữa Nam và Nữ với khác nhau ko.
2.3. MANOVA
Một kiểm định MANOVA với thể với hai hoặc nhiều biến độc lập, và tương tự với biến phụ thuộc.
Trong thống kê, MANOVA ko chỉ so sánh sự khác biệt về điểm trung bình giữa những nhóm mà còn giúp giả thiết mối quan hệ nhân - quả giữa những biến trong kiểm định. Theo đó, một học nhiều biến độc lập sẽ gây ra sự khác biệt đáng kể của một hoặc nhiều đặc điểm lên biến phụ thuộc.
3. Ví dụ tiêu biểu về kiểm định Anova
Để Quý độc giả hiểu rõ hơn về cách thức vận dụng của kiểm định ANOVA thông qua ví dụ tiêu biểu sau đây:
Một doanh nghiệp muốn tập huấn viên chức sử dụng chương trình bảng tính nâng cấp nội bộ để tăng tốc độ làm việc của mỗi người. Chuyên gia doanh nghiệp đưa ra 3 khóa học: Beginner, Intermediate và Advanced.
Tuy nhiên, chủ doanh nghiệp ko kiên cố khóa học nào là cần thiết cho viên chức. Nên ông đã quyết định thử nghiệm:
- Gửi 10 người vào khóa học Beginner
- Gửi 10 người khác vào khóa Intermediate
- Gửi 10 người nữa cho khóa Advanced
Lúc tất cả kết thúc khóa học, ông chủ đưa ra một vấn đề, yêu cầu học xử lý bằng chương trình bảng tính đã học và đo thời kì hoàn thành.
Mục đích cuối cùng của ông chủ là nhằm xem xét liệu với sự khác biệt nào trong thời kì trung bình để hoàn thành vấn đề giữa 3 khóa học hay ko.
Điều đó sẽ được thực hiện thông qua phương tiện Phân tích phương sai một chiều One-way ANOVA. Chi tiết sẽ được hướng dẫn trong phần dưới đây.
4. Cách chạy Anova trong spss
Tiếp nối ví dụ được nhắc ở trên, trong phần này, Tri Thức Cùng Đồng sẽ hướng dẫn chi tiết cách chạy ANOVA trong SPSS thông qua 6 bước thực hiện sau.
4.1. Tổng hợp 6 bước phân tích Anova
Bước 1: Nhập dữ liệu vào SPSS, sau đổi tại thanh phương tiện chọn Analyze → Compare Means → One-way ANOVA
Bước 2: Lúc hộp thoại One-way ANOVA được mở ra. Thao tác chuyển biến Time vào ô biến phụ thuộc (Dependent List) và biến Course vào ô nhân tố tác động (Factor) bằng cách kéo thả và sử dụng mũi tên ở giữa.
Bước 3: Một cửa sổ mới mở ra, chọn Post Hoc và tick chọn Tukey. Sau đó nhấn tiếp Continue.
Bước 5: Quay về hộp thoại ANOVA, chọn tiếp Options, tick vào ô Descriptive trong miền Statistic, sau đó nhấn Continue
Bước 6: Quay lại hộp thoại ANOVA chính, nhấn chọn OK và chờ kết quả
4.2. Cách phân tích kết quả
Sau lúc thực hiện 6 bước như trên, ta nhận được bảng kết quả bao gồm 3 bảng, cụ thể Tri Thức Cùng Đồng sẽ giúp bạn phân tích kết quả tại mỗi bảng.
Bảng mô tả (Descriptives)
Bảng mô tả này phân phối cho bạn những con số về Trị giá trung bình (Mean), Độ lệch chuẩn (Std. Deviation), Sai số (Std. Error) hoặc Độ tin cậy 95% cho biến phụ thuộc Time...
Bảng ANOVA
Những kết quả đầu ra phân tích chủ yếu dựa vào bảng ANOVA ở trên. Từ bảng này giúp ta thẩm định được liệu với sự khác biệt với ý nghĩa giữa những nhóm đối tượng thống kê hay ko.
Chỉ số đáng quan tâm ở bảng trên là hệ số Sig. Nếu hệ số này nhỏ hơn 0.05 (Sig < 0.05) tức là khẳng định với sự khác biệt với ý nghĩa thống kê giữa những nhóm đối tượng.
Cụ thể, trong ví dụ trên, ta thấy hệ số Sig. = 0.021 < 0.05 ⇒ Với sự khác biệt với ý nghĩa về thời kì trung bình hoàn thành bảng tính giữa những khóa học với nhau.
Tuy nhiên để biết chi tiết mức khác biệt giữa những nhóm ra sao, chúng ta phải dựa vào bảng tiếp theo.
Bảng Multiple Comparisons
Với bảng Multiple Comparisons này, chúng ta sẽ phân tích rõ hơn sự khác biệt giữa những nhóm với nhau. Nếu trị giá Sig. nào nhỏ hơn 0.05 thì chứng tỏ với sự khác biệt về trị giá trung bình của đối tượng được so sánh.
Cụ thể, trong bảng trên, ta thấy với trị giá Sig. của Beginner và Intermediate là 0.046 < 0.05, chứng tỏ với sự khác biệt với ý nghĩa thống kê về thời kì để hoàn thành bảng tính giữa hai khóa học Beginner và Intermediate.
Tương tự, ta cũng thấy Sig. giữa khóa Beginner và Advanced là 0.034 < 0.05, tương tự cũng với sự khác biệt về thời kì hoàn thành bảng tính giữa hai khóa Beginner và Advanced.
Và nhận thấy hệ số Sig. giữa hai khóa Intermediate và Advanced to hơn 0.05 nên ko với sự khác biệt nào giữa hai khóa học trên.
Trên đây là toàn bộ thông tin hữu ích giúp bạn hiểu rõ Kiểm định ANOVA là gì cũng như cách sử dụng phương tiện trong SPSS. Đây mới chỉ là những thông tin tổng quan và cơ bản nhất, tuy nhiên trên thực tế lúc sử dụng phương tiện phân tích ANOVA lại rất phức tạp và cần trải qua nhiều bước kiểm định chọn mẫu kỹ lưỡng. Do đó, nếu gặp phải những khó khăn thì hãy liên hệ ngay với Tri Thức Cùng Đồng để được tương trợ nhanh và chuẩn xác nhất.
Tài liệu tham khảo
- Hair, C & Ronald Fisher. (1917). "The Correlation between Relatives on the Supposition of Mendelian Inheritance." Investopedia: Fundamental Analytics.
- Aylmer, R. (2020). Bách khoa toàn thư. UK: Britannica.
- Minh Anh. (2018). Kiểm định ANOVA là gì? Những bước phân tích ANOVA. Tạp chí VietnamFinance.