Các bài kiểm tra thống kê: Ý nghĩa, ví dụ và các loại của chúng

kiểm tra thống kê
Nguồn hình ảnh: Trình tải xuống khóa học

Kiểm tra thống kê là một thành phần thiết yếu của phân tích dữ liệu. Họ hỗ trợ chúng tôi hiểu dữ liệu và rút ra kết luận về dân số. Chúng cũng được sử dụng để điều tra các mối quan hệ biến đổi và kiểm tra các giả thuyết. Nói chung, chúng là một phương pháp phân tích dữ liệu để xác định liệu có sự khác biệt đáng kể giữa hai nhóm hay không. Với sự trợ giúp của các ví dụ, chúng ta sẽ thảo luận về các loại thử nghiệm thống kê khác nhau và tầm quan trọng của chúng trong bài đăng trên blog này.

Kiểm tra thống kê là gì?

Các kiểm định thống kê được sử dụng để xác định xem hai bộ dữ liệu có khác biệt đáng kể với nhau hay không. Các bài kiểm tra thống kê thực hiện điều này bằng cách sử dụng nhiều biện pháp thống kê như giá trị trung bình, độ lệch chuẩn và hệ số biến thiên. Kiểm tra thống kê sau đó sẽ so sánh các biện pháp thống kê được tính toán với một tập hợp các tiêu chí được xác định trước. Kiểm định thống kê sẽ kết luận rằng có sự khác biệt đáng kể giữa hai bộ dữ liệu nếu dữ liệu đáp ứng các tiêu chí.

Tùy thuộc vào loại dữ liệu được phân tích, các thử nghiệm thống kê khác nhau có thể được sử dụng. Kiểm tra T, kiểm tra chi bình phương và kiểm tra ANOVA là ba trong số các kiểm tra thống kê phổ biến nhất.

Các loại kiểm tra thống kê

Các bài kiểm tra thống kê có nhiều loại:

#1. Kiểm tra thống kê tham số

Nếu dữ liệu được phân phối bình thường, các kiểm tra tham số được sử dụng.

Một bài kiểm tra thống kê tham số đưa ra các giả định về các tham số dân số và phân phối dữ liệu. Các thử nghiệm này bao gồm thử nghiệm t, thử nghiệm z và thử nghiệm ANOVA, giả định rằng dữ liệu được phân phối bình thường.

Kiểm tra Z

Khi biết phương sai và cỡ mẫu lớn, kiểm định z được sử dụng để xác định xem hai trung bình tổng thể có khác nhau hay không. Giá trị trung bình của dân số được so sánh bằng cách sử dụng kiểm tra z. Các tham số được sử dụng là trung bình dân số và độ lệch chuẩn. Thử nghiệm Z được sử dụng để xác nhận rằng mẫu được lấy từ cùng một quần thể.

Ho: Trung bình mẫu bằng trung bình dân số (Giả thuyết không)

z = (x — ) / ( / n), trong đó x=trung bình mẫu, u=trung bình dân số và / n=độ lệch chuẩn dân số.

Chấp nhận giả thuyết không nếu giá trị z nhỏ hơn giá trị tới hạn; mặt khác, bác bỏ giả thuyết không.

kiểm tra T

Thử nghiệm t so sánh phương tiện của hai mẫu. Khi các tham số tổng thể (giá trị trung bình và độ lệch chuẩn) không được biết, kiểm tra t được sử dụng.

Kiểm tra T theo cặp được sử dụng để so sánh sự khác biệt giữa hai biến từ cùng một dân số (điểm trước và sau kiểm tra). Ví dụ, trong một chương trình đào tạo, điểm số của học viên trước và sau khi hoàn thành chương trình.

Kiểm tra t độc lập, còn được gọi là kiểm tra t hai mẫu hoặc kiểm tra t của sinh viên, là một kiểm tra thống kê được sử dụng để xác định liệu có sự khác biệt có ý nghĩa thống kê về phương tiện của hai nhóm không liên quan hay không.

Ví dụ, hãy xem xét việc so sánh các bé trai và bé gái trong một quần thể.

Giá trị trung bình của một nhóm duy nhất được so sánh với giá trị trung bình đã cho trong thử nghiệm t một mẫu. Ví dụ: nếu doanh số trung bình được đưa ra, người ta có thể kiểm tra mức tăng và giảm doanh số.

t = (x1 — x2) / (/ n1 + / n2), trong đó x1 và x2 tương ứng là giá trị trung bình của mẫu 1 và 2.

Thử nghiệm ANOVA

Phân tích phương sai (ANOVA) là một kỹ thuật thống kê được sử dụng để xác định xem phương tiện của hai hay nhiều nhóm có khác biệt đáng kể với nhau hay không. ANOVA so sánh phương tiện của các mẫu khác nhau để xác định tác động của một hoặc nhiều yếu tố. Nếu chúng ta sử dụng kiểm tra t thay vì kiểm tra ANOVA, kết quả sẽ không chính xác vì có nhiều hơn hai mẫu.

Trong ANOVA, giả thuyết đang được kiểm tra là Ho: Tất cả các cặp mẫu đều giống nhau, tức là tất cả các phương tiện mẫu đều bằng nhau.

Ít nhất một cặp mẫu khác nhau đáng kể.

Chúng tôi tính toán giá trị F trong thử nghiệm anova và so sánh nó với giá trị tới hạn

F= ((SSE1 — SSE2)/m)/ SSE2/nk, trong đó SSE = tổng bình phương còn lại.

m = số ràng buộc

k biểu thị số lượng biến độc lập.

#2. Kiểm tra thống kê phi tham số

Kiểm tra thống kê phi tham số được sử dụng khi dữ liệu không được phân phối bình thường. Phép thử chi-square là một ví dụ về phép thử phi tham số.

Kiểm định Chi bình phương (2 kiểm định)

Phép thử chi-square so sánh hai biến phân loại. Tính toán giá trị thống kê Chi-Square và so sánh nó với giá trị tới hạn từ phân phối Chi-Square cho phép bạn xác định xem tần suất quan sát được và tần suất dự kiến ​​có khác biệt đáng kể hay không.

Ho: Các biến x và y độc lập là giả thuyết đang được kiểm định cho chi-square.

Các biến x và y không độc lập với nhau.

Công thức Chi-square (o=quan sát, e=dự kiến).

Chọn kiểm tra thống kê nào để sử dụng

Dưới đây là các tham số sẽ giúp bạn xác định nên sử dụng kiểm tra thống kê nào

#1. Vấn đề nghiên cứu

Việc lựa chọn một bài kiểm tra thống kê được xác định bởi câu hỏi nghiên cứu cần được trả lời. Hơn nữa, các câu hỏi nghiên cứu sẽ hỗ trợ bạn phát triển cấu trúc dữ liệu và thiết kế nghiên cứu.

#2. Phát triển một giả thuyết Null

Bạn có thể tạo một giả thuyết vô hiệu sau khi đã xác định câu hỏi nghiên cứu. Một giả thuyết không ngụ ý rằng không có ý nghĩa thống kê trong các quan sát dự kiến.

#3. Tầm quan trọng của Đề cương Nghiên cứu

Một mức độ quan trọng được chỉ định trước khi bắt đầu giao thức nghiên cứu. Mức ý nghĩa xác định ý nghĩa thống kê, xác định liệu giả thuyết không được chấp nhận hay từ chối.

#4. Sự lựa chọn của một đuôi so với hai đuôi

Bạn phải quyết định nghiên cứu của bạn sẽ là nghiên cứu một chiều hay hai chiều. Bạn phải sử dụng các bài kiểm tra một đầu nếu bạn có bằng chứng rõ ràng rằng số liệu thống kê chỉ theo một hướng. Tuy nhiên, nếu không có hướng rõ ràng về sự khác biệt dự kiến, thì cần phải thực hiện thử nghiệm hai đầu.

#5. Số biến sẽ được kiểm tra

Các thử nghiệm và thủ tục thống kê được phân loại dựa trên số lượng biến mà chúng dự định phân tích. Do đó, khi chọn một bài kiểm tra, bạn phải xem xét có bao nhiêu biến bạn muốn phân tích.

#6. Loại dữ liệu

Điều quan trọng là phải xác định xem dữ liệu của bạn là liên tục, phân loại hay nhị phân. Trong trường hợp dữ liệu liên tục, bạn cũng phải xác định xem dữ liệu được phân phối bình thường hay sai lệch để xác định nên sử dụng thử nghiệm thống kê nào.

#7. Thiết kế nghiên cứu, ghép đôi và không ghép đôi

Khi hai mẫu phụ thuộc vào nhau, một thiết kế theo cặp bao gồm các nghiên cứu so sánh trong đó hai trung bình tổng thể được so sánh. Kết quả của hai mẫu được nhóm lại và so sánh trong một thiết kế nghiên cứu không ghép đôi hoặc độc lập.

Bạn đang trên con đường tìm kiếm bài kiểm tra thống kê phù hợp cho câu hỏi nghiên cứu của mình khi bạn đã học được các bước để chọn bài kiểm tra thống kê. Bởi vì mọi tình huống đều khác nhau, điều quan trọng là phải hiểu tất cả các lựa chọn của bạn và đưa ra quyết định sáng suốt.

Nếu bạn không chắc chắn nên sử dụng bài kiểm tra nào, hãy luôn tham khảo ý kiến ​​của điều tra viên chính, nhà thống kê hoặc phần mềm của bạn.

Các bài kiểm tra ý nghĩa thống kê là gì?

Kiểm tra ý nghĩa thống kê là quyết định của nhà phân tích rằng kết quả của dữ liệu không thể được giải thích một cách ngẫu nhiên. Nhà phân tích đưa ra quyết định này bằng cách sử dụng thử nghiệm giả thuyết thống kê. Thử nghiệm này trả về giá trị p, là xác suất nhìn thấy kết quả cực đoan như kết quả trong dữ liệu, giả sử kết quả hoàn toàn là do ngẫu nhiên. Giá trị p từ 5% trở xuống thường được coi là có ý nghĩa thống kê.

Hiểu các bài kiểm tra ý nghĩa thống kê

Ý nghĩa thống kê là việc xác định giả thuyết không, ngụ ý rằng các kết quả chỉ là do ngẫu nhiên. Khi giá trị p đủ nhỏ, một tập dữ liệu cung cấp ý nghĩa thống kê.

Khi giá trị p lớn, kết quả của dữ liệu chỉ có thể giải thích được một cách ngẫu nhiên và dữ liệu được coi là phù hợp với (nhưng không chứng minh) giả thuyết khống.

Hơn nữa, khi giá trị p đủ nhỏ (thường là 5% hoặc ít hơn), kết quả không thể được giải thích một cách ngẫu nhiên và dữ liệu được coi là không phù hợp với giả thuyết khống. Trong trường hợp này, giả thuyết vô hiệu về cơ hội như một lời giải thích cho dữ liệu bị bác bỏ để ủng hộ một lời giải thích có hệ thống hơn.

Ý nghĩa thống kê thường được sử dụng trong các thử nghiệm dược phẩm mới, thử nghiệm vắc-xin và nghiên cứu bệnh lý để thử nghiệm hiệu quả và thông báo cho các nhà đầu tư về sự thành công của công ty trong việc phát hành sản phẩm mới.

Ví dụ về kiểm tra ý nghĩa thống kê

Giả sử Alex, một nhà phân tích tài chính, tò mò liệu một số nhà đầu tư có biết về sự sụp đổ sắp xảy ra của một công ty hay không. Alex quyết định so sánh mức trung bình của lợi nhuận thị trường hàng ngày trước và sau khi công ty thất bại để xem liệu có sự khác biệt đáng kể về mặt thống kê giữa hai mức trung bình hay không.

Giá trị p của nghiên cứu là 28% (>5%), cho thấy sự khác biệt về độ lớn này (-0.0033 đến +0.0007) không phải là bất thường theo cách giải thích chỉ mang tính cơ hội. Do đó, dữ liệu không cung cấp bằng chứng thuyết phục về kiến ​​thức trước đó về sự cố. Nếu giá trị p là 0.01% (ít hơn nhiều so với 5%), sự khác biệt quan sát được sẽ cực kỳ bất thường theo lời giải thích chỉ có cơ hội. Trong trường hợp này, Alex có thể chọn bác bỏ giả thuyết không và xem xét liệu một số nhà giao dịch có biết trước hay không.

Ý nghĩa thống kê cũng được sử dụng để đánh giá các sản phẩm y tế mới như thuốc, thiết bị y tế và vắc-xin. Các báo cáo có ý nghĩa thống kê được công khai cũng thông báo cho các nhà đầu tư về sự thành công của công ty trong việc phát hành sản phẩm mới.

Ví dụ, giả sử rằng một công ty dược phẩm chuyên về thuốc điều trị bệnh tiểu đường đã báo cáo rằng bệnh tiểu đường loại 1 đã giảm đáng kể về mặt thống kê sau khi thử nghiệm loại insulin mới của họ. Nghiên cứu bao gồm 26 tuần điều trị ngẫu nhiên ở bệnh nhân tiểu đường, với giá trị p là 4%. Điều này cho các nhà đầu tư và cơ quan quản lý biết rằng dữ liệu cho thấy tỷ lệ mắc bệnh tiểu đường loại 1 giảm đáng kể về mặt thống kê.

Yếu tố nào ảnh hưởng đến ý nghĩa thống kê?

Để xác định xem dữ liệu có ý nghĩa thống kê hay không, kiểm định giả thuyết thống kê được sử dụng. Nói cách khác, liệu hiện tượng này có thể được giải thích một cách ngẫu nhiên hay không. Ý nghĩa thống kê là việc xác định giả thuyết không, trong đó nêu rõ rằng các kết quả hoàn toàn là do ngẫu nhiên. Giả thuyết không phải bị bác bỏ để dữ liệu được coi là có ý nghĩa thống kê.

Giá trị P chính xác là gì?

Giá trị p là thước đo khả năng một sự khác biệt quan sát được có thể xảy ra một cách tình cờ. Khi giá trị p đủ nhỏ (ví dụ: 5% hoặc ít hơn), kết quả không thể được giải thích một cách ngẫu nhiên và giả thuyết không có thể bị bác bỏ. Khi giá trị p lớn, kết quả của dữ liệu chỉ có thể giải thích được một cách ngẫu nhiên và dữ liệu được coi là phù hợp với (và do đó chứng minh) giả thuyết không.

Ý nghĩa thống kê được sử dụng như thế nào?

Ý nghĩa thống kê thường được sử dụng để đánh giá hiệu quả của các sản phẩm y tế mới như thuốc, thiết bị và vắc-xin. Các báo cáo có ý nghĩa thống kê được công khai cũng thông báo cho các nhà đầu tư về sự thành công của công ty trong việc phát hành sản phẩm mới. Giá cổ phiếu của các công ty dược phẩm thường bị ảnh hưởng đáng kể bởi các thông báo về ý nghĩa thống kê của các sản phẩm mới của họ.

Ba loại kiểm tra thống kê chính là gì?

Kiểm tra hồi quy, kiểm tra so sánh và kiểm tra tương quan là ba loại kiểm tra thống kê chính.

Các bài kiểm tra thống kê trong SPSS là gì?

Kiểm tra T, chi bình phương, tương quan, hồi quy và phân tích phương sai nằm trong số các kiểm tra thống kê có sẵn trong SPSS.

Hai phương pháp chính trong thống kê là gì?

Trong thống kê, có hai phương pháp chính: thống kê mô tả, tóm tắt dữ liệu bằng cách sử dụng các chỉ số như giá trị trung bình và trung vị, và thống kê suy luận, đưa ra kết luận từ dữ liệu bằng các bài kiểm tra thống kê như bài kiểm tra t của học sinh.

ANOVA có phải là một bài kiểm tra thống kê không?

ANOVA, viết tắt của Phân tích phương sai, là một bài kiểm tra thống kê được sử dụng để so sánh phương tiện của nhiều nhóm.

Kết luận

Các kiểm định thống kê được sử dụng để xác định xem hai bộ dữ liệu có khác biệt đáng kể với nhau hay không. Các kiểm định thống kê được phân thành hai loại: tham số và phi tham số. Các bài kiểm tra tham số đưa ra các giả định về dữ liệu, trong khi các bài kiểm tra phi tham số không đưa ra các giả định về dữ liệu. Cả hai loại thử nghiệm đều được sử dụng để đưa ra kết luận về dân số từ một mẫu. Loại thử nghiệm được sử dụng được xác định bởi loại dữ liệu có sẵn.

  1. PHÂN TÍCH THỐNG KÊ: Các loại, Kỹ thuật và Mục đích
  2. Hoạch định nhu cầu: Tổng quan, So sánh, Lương & Công việc
  3. PHƯƠNG PHÁP THỐNG KÊ: Những điều bạn nên biết & hướng dẫn
  4. Loại thử nghiệm ma túy tốt nhất để sử dụng để sàng lọc nhân viên là gì?
  5. Lương số lượng: Một sự cố hoàn chỉnh & Cách trở thành một số lượng lớn

dự án

Bình luận

Chúng tôi sẽ không công khai email của bạn. Các ô đánh dấu * là bắt buộc *

Bạn cũng có thể thích