Semua tentang pembinaan dan pengubahsuaian

Tahap kepentingan statistik dalam psikologi. Tahap kepentingan statistik (p)

Tahap keertian - ialah kebarangkalian bahawa kami menganggap perbezaan itu ketara, tetapi ia sebenarnya rawak.

Apabila kita menunjukkan bahawa perbezaan adalah ketara pada aras keertian 5%, atau pada R< 0,05 , maka kami maksudkan bahawa kebarangkalian bahawa mereka masih tidak boleh dipercayai ialah 0.05.

Apabila kita menunjukkan bahawa perbezaan adalah ketara pada tahap keertian 1%, atau pada R< 0,01 , maka kami maksudkan bahawa kebarangkalian bahawa mereka masih tidak boleh dipercayai ialah 0.01.

Jika kita menterjemah semua ini ke dalam bahasa yang lebih formal, maka tahap keertiannya ialah kebarangkalian untuk menolak hipotesis nol, sedangkan ia adalah benar.

Ralat,yang terdiri daripadayang satuapa yang kitaditolakhipotesis nol,manakala ia benar dipanggil ralat jenis 1.(Lihat Jadual 1)

Tab. 1. Hipotesis nol dan alternatif dan keadaan ujian yang mungkin.

Kebarangkalian ralat sedemikian biasanya dilambangkan sebagai α. Malah, kita perlu memasukkan kurungan bukan p < 0.05 atau p < 0.01, dan α < 0.05 atau α < 0,01.

Jika kebarangkalian ralat adalah α , maka kebarangkalian keputusan yang betul: 1-α. Semakin kecil α, semakin besar kebarangkalian penyelesaian yang betul.

Dari segi sejarah, dalam psikologi, adalah kebiasaan untuk menganggap tahap 5% (p≤0.05) sebagai tahap kepentingan statistik terendah: tahap 1% adalah mencukupi (p≤0.01) dan tahap 0.1% tertinggi (p≤0.001), oleh itu, dalam jadual nilai kritikal, nilai kriteria biasanya diberikan, sepadan dengan tahap kepentingan statistik p≤0.05 dan p≤0.01, kadang-kadang - p≤0.001. Untuk beberapa kriteria, jadual menunjukkan tahap keertian yang tepat bagi nilai empirikal yang berbeza. Contohnya, untuk φ*=1.56 p=0.06.

Sehingga, walau bagaimanapun, tahap kepentingan statistik mencapai p=0.05, kami belum lagi berhak untuk menolak hipotesis nol. Kami akan mematuhi peraturan berikut untuk menolak hipotesis tiada perbezaan (HO) dan menerima hipotesis kepentingan statistik perbezaan (H 1).

Peraturan penolakan Ho dan penerimaan h1

Jika nilai empirikal kriteria sama atau melebihi nilai kritikal yang sepadan dengan p≤0.05, maka H 0 ditolak, tetapi kita belum boleh menerima H 1 dengan pasti.

Jika nilai empirikal kriteria sama atau melebihi nilai kritikal sepadan dengan p≤0.01, maka H 0 ditolak dan H 1 diterima.

Pengecualian : Ujian tanda G, ujian Wilcoxon T, dan ujian Mann-Whitney U. Mereka berkait songsang.

nasi. 4. Contoh "paksi keertian" untuk ujian Rosenbaum Q.

Nilai kritikal kriteria ditetapkan sebagai Q o.o5 dan Q 0.01, nilai empirikal kriteria sebagai Q emp. Ia tertutup dalam elips.

Di sebelah kanan nilai kritikal Q 0.01 memanjangkan "zon keertian" - nilai empirikal jatuh di sini yang melebihi Q 0.01 dan, oleh itu, sudah tentu penting.

Di sebelah kiri nilai kritikal Q 0.05, "zon tidak penting" meluas - nilai empirikal Q jatuh di sini, yang berada di bawah Q 0.05, dan, oleh itu, adalah tidak penting tanpa syarat.

Kita nampak itu Q 0,05 =6; Q 0,01 =9; Q emp. =8;

Nilai empirikal kriteria berada dalam julat antara Q 0.05 dan Q 0.01. Ini adalah zon "ketidakpastian": kita sudah boleh menolak hipotesis tentang ketidakbolehpercayaan perbezaan (H 0), tetapi kita belum boleh menerima hipotesis tentang kebolehpercayaan mereka (H 1).

Walau bagaimanapun, dalam amalan, penyelidik boleh mempertimbangkan sudah ketara perbezaan yang tidak termasuk dalam zon tidak signifikan, mengisytiharkan bahawa ia adalah signifikan pada p < 0.05, atau menyatakan tahap keertian yang tepat bagi nilai empirikal kriteria yang diperolehi, contohnya: p=0.02. Dengan bantuan jadual standard yang terdapat dalam semua buku teks mengenai kaedah matematik, ini boleh dilakukan berhubung dengan kriteria Kruskal-Wallis H, χ 2 r Friedman, L Page, φ* Fisher .

Tahap kepentingan statistik atau nilai kritikal kriteria ditakrifkan secara berbeza apabila menguji hipotesis statistik terarah dan tidak terarah.

Dengan hipotesis statistik berarah, ujian satu hujung digunakan, dengan hipotesis tidak terarah, ujian dua hujung. Ujian dua hujung adalah lebih ketat kerana ia menguji perbezaan dalam kedua-dua arah, dan oleh itu nilai empirikal ujian yang sebelum ini sepadan dengan tahap keertian p < 0.05, kini hanya sepadan dengan tahap p < 0,10.

Kita tidak perlu memutuskan sendiri setiap kali sama ada dia menggunakan ujian satu ekor atau dua ekor. Jadual nilai kritikal kriteria dipilih sedemikian rupa sehingga hipotesis arah sepadan dengan kriteria satu sisi, dan hipotesis bukan arah sepadan dengan kriteria dua sisi, dan nilai yang diberikan memenuhi keperluan yang terpakai kepada setiap daripada mereka. Pengkaji hanya perlu memastikan hipotesisnya bertepatan makna dan bentuk dengan hipotesis yang dicadangkan dalam huraian setiap kriteria.

Kuliah 4

Prinsip umum ujian hipotesis statistik

Kami menekankan sekali lagi bahawa data yang diperoleh hasil daripada eksperimen pada mana-mana sampel berfungsi sebagai asas untuk menilai populasi umum. Walau bagaimanapun, disebabkan oleh tindakan sebab kebarangkalian rawak, anggaran parameter populasi umum yang dibuat berdasarkan data eksperimen (selektif) akan sentiasa disertai dengan ralat, dan oleh itu anggaran tersebut harus dianggap sebagai tekaan, dan bukan sebagai kenyataan akhir. Andaian yang sama tentang sifat dan parameter populasi umum dipanggil hipotesis statistik .

Intipati menguji hipotesis statistik adalah untuk menentukan sama ada data eksperimen dan hipotesis yang dikemukakan adalah konsisten, adakah dibenarkan untuk mengaitkan percanggahan antara hipotesis dan hasil analisis statistik data eksperimen disebabkan oleh sebab rawak? Oleh itu, hipotesis statistik ialah hipotesis saintifik yang membenarkan ujian statistik, dan statistik matematik ialah disiplin saintifik yang tugasnya adalah untuk mengesahkan ujian hipotesis statistik secara saintifik.

Hipotesis statistik

Apabila menguji hipotesis statistik, dua konsep digunakan: yang dipanggil sifar (notasi H 0) dan hipotesis alternatif (notasi H 1).

Hipotesis nol ialah hipotesis tiada beza. Ia ditetapkan sebagai dan dipanggil nol kerana ia mengandungi nombor 0: , di mana nilai ciri dipadankan.

Hipotesis nol adalah perkara yang ingin kita sanggah jika kita berhadapan dengan tugas untuk membuktikan kepentingan perbezaan.

Hipotesis alternatif adalah hipotesis tentang kepentingan perbezaan. Ia ditandakan sebagai . Hipotesis alternatif adalah apa yang kita ingin buktikan, itulah sebabnya ia kadang-kadang dipanggil percubaan hipotesis.

Terdapat masalah apabila ia diperlukan untuk membuktikan hanya tidak pentingnya perbezaan, i.e. mengesahkan hipotesis nol. Walau bagaimanapun, lebih kerap daripada tidak, ia diperlukan untuk membuktikan kepentingan perbezaan, kerana mereka lebih bermaklumat dalam mencari yang baharu.

Hipotesis nol dan alternatif boleh berarah atau tidak berarah.

Hipotesis arah

: tidak melebihi

: melebihi

Hipotesis tidak terarah

: tidak berbeza

: adalah berbeza

Jika semasa eksperimen diperhatikan bahawa dalam kumpulan air nilai individu subjek untuk beberapa sifat, contohnya, untuk keberanian sosial, adalah lebih tinggi, dan dalam kumpulan lain mereka lebih rendah, maka untuk menguji kepentingan perbezaan ini. , adalah perlu untuk merumuskan hipotesis terarah.

Sekiranya perlu untuk membuktikan bahawa kumpulan pertama mengalami perubahan yang lebih ketara di bawah pengaruh beberapa pengaruh eksperimen daripada kumpulan kedua, maka dalam kes ini juga perlu untuk merumuskan hipotesis terarah.

Sekiranya diperlukan untuk membuktikan bahawa bentuk taburan sesuatu ciri berbeza dalam kumpulan pertama dan kedua, maka hipotesis tidak terarah dirumuskan.

Komen. Apabila menerangkan setiap kriteria, rumusan hipotesis diberikan, yang membantu untuk menguji.

Secara umumnya, apabila menerima atau menolak hipotesis, pelbagai pilihan boleh dilakukan.

Sebagai contoh, seorang ahli psikologi menjalankan ujian terpilih penunjuk kecerdasan dalam sekumpulan remaja daripada keluarga lengkap dan ibu bapa tunggal. Hasil daripada pemprosesan data eksperimen, didapati remaja daripada keluarga ibu bapa tunggal mempunyai petunjuk kecerdasan yang lebih rendah secara purata berbanding rakan sebaya mereka daripada keluarga lengkap. Bolehkah ahli psikologi, berdasarkan keputusan yang diperoleh, menyimpulkan bahawa keluarga yang tidak lengkap membawa kepada penurunan kecerdasan dalam kalangan remaja? Kesimpulan yang diterima pakai dalam kes sedemikian dipanggil keputusan statistik. Kami menekankan bahawa penyelesaian sedemikian sentiasa berkemungkinan.

Apabila menguji hipotesis, data eksperimen mungkin bercanggah dengan hipotesis , maka hipotesis ini ditolak. Jika tidak, i.e. jika data eksperimen konsisten dengan hipotesis, ia tidak ditolak. Selalunya dalam kes sedemikian dikatakan bahawa hipotesis diterima (walaupun rumusan ini tidak sepenuhnya tepat, ia digunakan secara meluas dan kami akan menggunakannya dalam perkara berikut). Ini menunjukkan bahawa ujian statistik hipotesis berdasarkan eksperimen, data terpilih tidak dapat dielakkan dikaitkan dengan risiko (kebarangkalian) membuat keputusan yang salah. Dalam kes ini, ralat dua jenis adalah mungkin.

Ralat jenis I berlaku apabila keputusan dibuat untuk menolak hipotesis sedangkan ia ternyata benar.

Ralat jenis II akan berlaku apabila keputusan dibuat untuk tidak menolak hipotesis, walaupun pada hakikatnya ia adalah palsu. Jelas sekali, kesimpulan yang betul juga boleh dibuat dalam dua kes. Perkara di atas lebih baik dibentangkan dalam bentuk jadual 1:

Jadual 1

Ada kemungkinan bahawa ahli psikologi mungkin tersilap dalam keputusan statistiknya; Seperti yang kita lihat daripada Jadual 1, ralat ini hanya boleh terdiri daripada dua jenis. Oleh kerana adalah mustahil untuk mengecualikan kesilapan dalam penggunaan hipotesis statistik, adalah perlu untuk meminimumkan akibat yang mungkin, i.e. menerima hipotesis statistik yang salah. Dalam kebanyakan kes, satu-satunya cara untuk meminimumkan ralat adalah dengan meningkatkan saiz sampel.

Konsep tahap kepentingan statistik

Apabila mewajarkan inferens statistik, seseorang harus memutuskan di mana garis antara menerima dan menolak hipotesis nol? Disebabkan kehadiran pengaruh rawak dalam eksperimen, sempadan ini tidak boleh dilukis dengan tepat. Ia berdasarkan konsep aras keertian.

Def. Tahap keertianialah kebarangkalian menolak hipotesis nol secara salah. Atau, dengan kata lain, aras keertian ialah kebarangkalian ralat Jenis I dalam membuat keputusan.

Untuk menandakan kebarangkalian ini, sebagai peraturan, mereka menggunakan sama ada huruf Yunani atau huruf Latin R. Dalam perkara berikut, kami akan menggunakan surat itu R.

Dari segi sejarah, dalam sains gunaan yang menggunakan statistik, dan khususnya dalam psikologi, dianggap bahawa tahap kepentingan statistik yang paling rendah ialah tahap; mencukupi - tahap dan tingkat atas. Oleh itu, dalam jadual statistik yang diberikan dalam lampiran kepada buku teks mengenai statistik, nilai jadual untuk tahap biasanya diberikan: ; ; . Kadangkala nilai jadual diberikan untuk tahap dan . Nilai 0.05, 0.01 dan 0.001 adalah yang dipanggil tahap standard kepentingan statistik . Dalam analisis statistik data eksperimen, ahli psikologi, bergantung kepada objektif dan hipotesis kajian, mesti memilih tahap kepentingan yang diperlukan. Seperti yang anda lihat, di sini nilai terbesar, atau had bawah tahap kepentingan statistik, ialah 0.05 - ini bermakna lima ralat dibenarkan dalam sampel seratus elemen (kes, subjek) atau satu ralat daripada dua puluh elemen (kes, subjek). Adalah dipercayai bahawa tidak enam, atau tujuh, atau lebih daripada seratus, kita boleh membuat kesilapan. Kos kesilapan sedemikian akan menjadi terlalu tinggi.

Ambil perhatian bahawa dalam pakej perisian statistik moden pada komputer, bukan tahap keertian standard digunakan, tetapi tahap dikira secara langsung dalam proses bekerja dengan kaedah statistik yang sepadan. Tahap ini, dilambangkan dengan huruf R, boleh mempunyai ungkapan angka yang berbeza dalam julat dari 0 hingga 1, contohnya, R= 0,7, R= 0.23 atau R= 0.012. Adalah jelas bahawa dalam dua kes pertama, tahap kepentingan yang diperoleh adalah terlalu tinggi dan mustahil untuk mengatakan bahawa hasilnya adalah ketara. Pada masa yang sama, dalam kes kedua, hasilnya adalah ketara pada tahap 12 perseribu, ini adalah tahap yang boleh dipercayai.

Peraturan untuk menerima kesimpulan statistik adalah seperti berikut: berdasarkan data eksperimen yang diperoleh, ahli psikologi mengira apa yang dipanggil statistik empirikal, atau nilai empirikal, menggunakan kaedah statistik yang dipilih olehnya. Adalah mudah untuk menyatakan nilai ini sebagai H emp. Kemudian statistik empirikal H emp berbanding dengan dua nilai kritikal, yang sepadan dengan tahap keertian 5% dan 1% untuk kaedah statistik yang dipilih dan yang dilambangkan sebagai . Nilai ditemui untuk kaedah statistik yang diberikan mengikut jadual sepadan yang diberikan dalam lampiran kepada mana-mana buku teks tentang statistik. Kuantiti ini, sebagai peraturan, sentiasa berbeza dan, untuk kemudahan, mereka boleh dipanggil lebih lanjut sebagai dan . Nilai nilai kritikal yang ditemui daripada jadual dan mudah dibentangkan dalam bentuk tatatanda standard berikut:

Walau bagaimanapun, kami menekankan bahawa kami menggunakan tatatanda dan sebagai singkatan untuk perkataan "nombor". Dalam semua kaedah statistik, sebutan simbolik mereka untuk semua kuantiti ini diterima: kedua-dua nilai empirikal dikira dengan kaedah statistik yang sepadan, dan nilai kritikal yang ditemui dari jadual yang sepadan. Sebagai contoh, apabila mengira pekali korelasi pangkat Spearman mengikut Jadual 21 Lampiran, nilai-nilai kritikal berikut ditemui, yang untuk kaedah ini dilambangkan dengan huruf Yunani (rho).

Adalah lazim untuk menulis nilai yang dijumpai seperti berikut:

Sekarang kita perlu membandingkan nilai empirikal kita dengan dua nilai kritikal yang terdapat dalam jadual. Ini sebaiknya dilakukan dengan meletakkan ketiga-tiga nombor pada apa yang dipanggil " paksi kepentingan». « Paksi kepentingan» ialah garis lurus, di hujung kirinya ialah 0, walaupun ia biasanya tidak ditandakan pada garis lurus ini sendiri, dan siri nombor bertambah dari kiri ke kanan. Sebenarnya, ini adalah paksi x sekolah biasa OH Sistem koordinat kartesian. Walau bagaimanapun, keistimewaan paksi ini ialah tiga bahagian diperuntukkan padanya, " zon". Zon kiri dipanggil zon tidak penting , betul - zon kepentingan , dan perantaraan zon ketidakpastian . Sempadan ketiga-tiga zon ialah Ch cr1 Untuk P = 0.05 dan untuk P = 0.01 seperti yang ditunjukkan di bawah.

Apabila mengesahkan inferens statistik seseorang mesti memutuskan di mana garis antara penerimaan dan penolakan sifar hipotesis? Disebabkan kehadiran pengaruh rawak dalam eksperimen, sempadan ini tidak boleh dilukis dengan tepat. Ia berdasarkan konsep aras keertian.tahapkepentingan ialah kebarangkalian menolak hipotesis nol secara salah. Atau, dengan kata lain, tahapkepentingan-Ini kebarangkalian ralat Jenis I dalam membuat keputusan. Untuk menunjukkan kebarangkalian ini, sebagai peraturan, mereka menggunakan sama ada huruf Yunani α atau huruf Latin R. Dalam perkara berikut, kami akan menggunakan surat itu R.

Dari segi sejarah, ia telah berlaku bahawa dalam sains gunaan menggunakan statistik, dan khususnya dalam psikologi, adalah dianggap bahawa tahap kepentingan statistik yang paling rendah ialah tahap p = 0.05; mencukupi - tahap R= 0.01 dan tahap tertinggi p = 0.001. Oleh itu, dalam jadual statistik yang diberikan dalam lampiran kepada buku teks mengenai statistik, nilai jadual biasanya diberikan untuk tahap p = 0,05, p = 0.01 dan R= 0.001. Kadangkala nilai jadual diberikan untuk tahap R - 0.025 dan p = 0,005.

Nilai 0.05, 0.01 dan 0.001 adalah apa yang dipanggil tahap kepentingan statistik standard. Dalam analisis statistik data eksperimen, ahli psikologi, bergantung kepada objektif dan hipotesis kajian, mesti memilih tahap kepentingan yang diperlukan. Seperti yang anda lihat, di sini nilai terbesar, atau had bawah tahap kepentingan statistik, ialah 0.05 - ini bermakna lima ralat dibenarkan dalam sampel seratus elemen (kes, subjek) atau satu ralat daripada dua puluh elemen (kes, subjek). Adalah dipercayai bahawa tidak enam, atau tujuh, atau lebih daripada seratus, kita boleh membuat kesilapan. Kos kesilapan sedemikian akan menjadi terlalu tinggi.

Catatan, bahawa dalam pakej statistik moden pada komputer bukan tahap kepentingan standard digunakan, tetapi tahap dikira secara langsung dalam proses bekerja dengan kaedah statistik yang sepadan. Tahap ini, dilambangkan dengan huruf R, boleh mempunyai ungkapan angka yang berbeza dalam julat dari 0 hingga 1, contohnya, p = 0,7, R= 0.23 atau R= 0.012. Adalah jelas bahawa dalam dua kes pertama tahap keertian yang diperoleh adalah terlalu tinggi dan mustahil untuk mengatakan bahawa hasilnya adalah signifikan. Pada masa yang sama, dalam kes kedua, hasilnya adalah ketara pada tahap 12 perseribu. Ini adalah tahap yang sah.

Peraturan penerimaan inferens statistik adalah seperti berikut: berdasarkan data eksperimen yang diperoleh, ahli psikologi mengira, mengikut kaedah statistik yang dipilih olehnya, apa yang dipanggil statistik empirikal, atau nilai empirikal. Adalah mudah untuk menyatakan nilai ini sebagai H emp. Kemudian statistik empirikal H emp dibandingkan dengan dua nilai kritikal, yang sepadan dengan tahap keertian 5% dan 1% untuk kaedah statistik yang dipilih dan yang dilambangkan sebagai Ch cr. Kuantiti H cr didapati untuk kaedah statistik yang diberikan mengikut jadual sepadan yang diberikan dalam lampiran kepada mana-mana buku teks tentang statistik. Kuantiti ini, sebagai peraturan, sentiasa berbeza dan, untuk kemudahan, mereka boleh dirujuk selanjutnya sebagai Ch cr1 Dan Ch cr2. Nilai kritikal ditemui daripada jadual Ch cr1 Dan Ch cr2 Ia adalah mudah untuk mewakili dalam notasi standard berikut:


Kami tekankan, walau bagaimanapun, bahawa kami telah menggunakan tatatanda H emp Dan H cr sebagai singkatan daripada perkataan "nombor". Dalam semua kaedah statistik, sebutan simbolik mereka untuk semua kuantiti ini diterima: kedua-dua nilai empirikal dikira dengan kaedah statistik yang sepadan, dan nilai kritikal yang ditemui dari jadual yang sepadan. Sebagai contoh, apabila mengira pekali pangkat korelasi spearman mengikut jadual nilai kritikal pekali ini, nilai-nilai kritikal berikut dijumpai, yang untuk kaedah ini dilambangkan dengan huruf Yunani ρ ("ro"). Jadi untuk p = 0.05 mengikut jadual, nilai didapati ρ cr 1 = 0.61 dan untuk p = nilai 0.01 ρ cr 2 = 0,76.

Dalam notasi standard yang diterima pakai di bawah, ia kelihatan seperti ini:

Sekarang kami perlu bandingkan nilai empirikal kami dengan dua nilai kritikal yang ditemui daripada jadual. Ini sebaiknya dilakukan dengan meletakkan ketiga-tiga nombor pada apa yang dipanggil "paksi keertian". "Paksi kepentingan" ialah garis lurus, di hujung kirinya ialah 0, walaupun ia, sebagai peraturan, tidak ditandakan pada garis lurus ini sendiri, dan siri nombor bertambah dari kiri ke kanan. Sebenarnya, ini adalah paksi abscissa sekolah biasa OH Sistem koordinat kartesian. Walau bagaimanapun, keanehan paksi ini ialah tiga bahagian, "zon", dibezakan di atasnya. Satu zon ekstrem dipanggil zon tidak penting, zon ekstrem kedua dipanggil zon signifikan, dan zon pertengahan dipanggil zon ketidakpastian. Sempadan ketiga-tiga zon ialah Ch cr1 Untuk p = 0.05 dan Ch cr2 Untuk p = 0.01, seperti yang ditunjukkan dalam rajah.

Bergantung pada peraturan keputusan (peraturan inferens) yang ditetapkan dalam kaedah statistik ini, dua pilihan adalah mungkin.

Pilihan pertama: Hipotesis alternatif diterima jika H empCh cr.

Zon kepentingan
Zon tidak penting
0,05
0,01
Ch cr1
Ch cr2

Dikira H emp mengikut beberapa kaedah statistik, ia semestinya termasuk dalam salah satu daripada tiga zon.

Sekiranya nilai empirikal jatuh ke dalam zon tidak signifikan, maka hipotesis H 0 tentang ketiadaan perbezaan diterima.

Jika H emp jatuh ke dalam zon keertian, hipotesis alternatif H 1 diterima jika terdapat perbezaan, dan hipotesis H 0 ditolak.

Jika H emp jatuh ke dalam zon ketidakpastian, penyelidik hadapi dilema. Jadi, bergantung kepada kepentingan masalah yang diselesaikan, dia boleh menganggap anggaran statistik yang diperolehi boleh dipercayai pada tahap 5%, dan dengan itu menerima hipotesis H 1, menolak hipotesis H 0 , atau - tidak boleh dipercayai pada tahap 1%, dengan itu menerima hipotesis H 0 . Walau bagaimanapun, kami menekankan bahawa ini adalah keadaan apabila ahli psikologi boleh membuat kesilapan jenis pertama atau kedua. Seperti yang dibincangkan di atas, dalam keadaan ini adalah yang terbaik untuk meningkatkan saiz sampel.

Kami juga menekankan bahawa nilai H emp boleh betul-betul sepadan sama ada Ch cr1 atau Ch cr2. Dalam kes pertama, kita boleh mengandaikan bahawa anggaran boleh dipercayai tepat pada tahap 5% dan menerima hipotesis H 1, atau, sebaliknya, menerima hipotesis H 0 . Dalam kes kedua, sebagai peraturan, hipotesis alternatif H 1 tentang kehadiran perbezaan diterima, dan hipotesis H 0 ditolak.

Tentukan dijangka dalam keputusan percubaan anda. Biasanya, apabila saintis menjalankan eksperimen, mereka sudah mempunyai idea tentang keputusan apa yang perlu dipertimbangkan "normal" atau "tipikal." Ini mungkin berdasarkan keputusan percubaan eksperimen lepas, set data yang boleh dipercayai, data daripada literatur saintifik, atau saintis mungkin berdasarkan beberapa sumber lain. Untuk percubaan anda, tentukan keputusan yang dijangkakan dan nyatakan sebagai nombor.

  • Contoh: Katakan kajian awal telah menunjukkan bahawa di negara anda, pemilik kereta merah lebih berkemungkinan mendapat tiket laju daripada yang biru. Sebagai contoh, skor purata menunjukkan keutamaan 2:1 untuk kereta merah berbanding kereta biru. Tugas kami adalah untuk menentukan sama ada polis sama berat sebelah terhadap warna kereta di bandar anda. Untuk melakukan ini, kami akan menganalisis denda yang dikeluarkan untuk memandu laju. Jika kami mengambil set rawak 150 tiket laju yang dikeluarkan kepada pemilik kereta merah atau biru, kami menjangkakan bahawa 100 denda akan dikeluarkan kepada pemilik kereta merah, dan 50 - pemilik warna biru, jika pihak polis di bandar kita berprasangka buruk tentang warna kereta seperti di seluruh negara.

Tentukan diperhatikan hasil percubaan anda. Memandangkan anda telah menentukan hasil jangkaan anda, tiba masanya untuk mencuba dan mencari nilai sebenar (atau "diperhatikan"). Anda sekali lagi perlu mewakili keputusan ini sebagai nombor. Jika kita mencipta keadaan eksperimen dan keputusan yang diperhatikan berbeza dari jangkaan, maka kita mempunyai dua kemungkinan - sama ada ia berlaku secara tidak sengaja, atau ia disebabkan dengan eksperimen kami. Tujuan mencari nilai-p adalah tepat untuk menentukan sama ada keputusan yang diperhatikan berbeza daripada yang dijangkakan sedemikian rupa sehingga seseorang tidak boleh menolak "hipotesis nol" - hipotesis bahawa tiada hubungan antara pembolehubah eksperimen dan yang diperhatikan. keputusan.

  • Contoh: Katakan di bandar kita, kami memilih 150 tiket laju secara rawak yang dikeluarkan kepada pemilik kereta merah atau biru. Kami telah menentukannya 90 denda telah dikeluarkan kepada pemilik kereta merah, dan 60 - pemilik biru. Ini berbeza daripada hasil yang dijangkakan, iaitu 100 Dan 50, masing-masing. Adakah percubaan kami (dalam kes ini, menukar sumber data dari negeri ke bandar) sebenarnya membawa kepada perubahan dalam keputusan ini, atau adakah polis bandar kami berat sebelah terhadap pemandu? serupa, seperti purata kebangsaan, dan kita lihat hanya sisihan rawak? Nilai-p akan membantu kita menentukan ini.
  • Tentukan nombor darjah kebebasan percubaan anda. Bilangan darjah kebebasan ialah tahap kebolehubahan dalam percubaan anda, yang ditentukan oleh bilangan kategori yang anda terokai. Persamaan bagi bilangan darjah kebebasan ialah Bilangan darjah kebebasan = n-1, dengan "n" ialah bilangan kategori atau pembolehubah yang anda analisis dalam percubaan anda.

    • Contoh: dalam percubaan kami, terdapat dua kategori hasil: satu kategori untuk pemilik kereta merah dan satu untuk pemilik kereta biru. Oleh itu, dalam eksperimen kami, kami mempunyai 2-1 = 1 darjah kebebasan. Jika kita membandingkan kereta merah, biru dan hijau, kita akan mempunyai 2 darjah kebebasan, dan sebagainya.
  • Bandingkan keputusan yang dijangka dan diperhatikan dengan ujian khi kuasa dua. Khi kuasa dua (ditulis "x 2") ialah nilai berangka yang mengukur perbezaan antara dijangka Dan boleh diperhatikan nilai eksperimen. Persamaan untuk khi kuasa dua adalah seperti berikut: x 2 \u003d Σ ((o-e) 2 / e) di mana "o" ialah nilai yang diperhatikan dan "e" ialah nilai yang dijangkakan. Jumlahkan keputusan persamaan yang diberikan untuk semua hasil yang mungkin (lihat di bawah).

    • Ambil perhatian bahawa persamaan ini termasuk operator penjumlahan Σ (sigma). Dalam erti kata lain, anda perlu mengira ((|o-e|-.05) 2 /e) untuk setiap hasil yang mungkin dan menambah nombor bersama untuk mendapatkan nilai khi kuasa dua. Dalam contoh kami, kami mempunyai dua kemungkinan hasil - sama ada kereta yang menerima penalti adalah merah atau biru. Jadi kita perlu mengira ((o-e) 2 /e) dua kali - sekali untuk kereta merah dan sekali untuk kereta biru.
    • Contoh: Mari masukkan nilai jangkaan dan pemerhatian kita ke dalam persamaan x 2 = Σ((o-e) 2 /e). Ingat bahawa kerana operator penjumlahan, kita perlu mengira ((o-e) 2 /e) dua kali - sekali untuk kereta merah dan sekali untuk kereta biru. Kami akan membuat kerja ini seperti berikut:
      • x 2 = ((90-100) 2/100) + (60-50) 2/50)
      • x 2 = ((-10) 2/100) + (10) 2/50)
      • x 2 = (100/100) + (100/50) = 1 + 2 = 3 .
  • Pilih aras keertian. Sekarang setelah kita mengetahui bilangan darjah kebebasan dalam eksperimen kita dan nilai ujian khi kuasa dua, kita perlu melakukan satu perkara lagi sebelum kita dapat mencari nilai-p kita. Kita perlu menentukan tahap kepentingan. bercakap bahasa biasa, tahap keertian menunjukkan sejauh mana kami yakin dengan keputusan kami. Nilai keertian yang rendah sepadan dengan kebarangkalian rendah bahawa keputusan eksperimen adalah rawak dan begitu juga sebaliknya. Tahap keertian ditulis sebagai pecahan perpuluhan (seperti 0.01), yang sepadan dengan kebarangkalian bahawa kami memperoleh keputusan percubaan secara kebetulan (dalam kes ini, kebarangkalian ini ialah 1%).

  • Gunakan lembaran data taburan khi kuasa dua untuk mencari nilai p. Para saintis dan ahli statistik menggunakan hamparan yang besar untuk mengira nilai p bagi eksperimen mereka. Data jadual biasanya mempunyai paksi menegak di sebelah kiri, sepadan dengan bilangan darjah kebebasan, dan paksi mendatar di atas, sepadan dengan nilai-p. Gunakan data jadual untuk mencari bilangan darjah kebebasan anda dahulu, kemudian lihat siri anda dari kiri ke kanan sehingga anda menemui nilai pertama, lebih nilai khi kuasa dua anda. Lihat pada nilai p yang sepadan di bahagian atas lajur anda. Nilai p yang anda perlukan adalah antara nombor ini dan nombor seterusnya (yang di sebelah kiri anda).

    • Jadual taburan khi kuasa dua boleh diperolehi daripada pelbagai sumber - ia boleh didapati secara dalam talian, atau dicari dalam buku sains atau statistik. Jika anda tidak mempunyai buku ini, gunakan gambar di atas atau gunakan hamparan dalam talian yang boleh anda lihat secara percuma, seperti medcalc.org. Dia terletak.
    • Contoh: Nilai khi kuasa dua kami ialah 3. Jadi mari kita gunakan jadual taburan khi kuasa dua dalam imej di atas untuk mencari anggaran nilai p. Oleh kerana kita tahu bahawa dalam percubaan kami semua 1 tahap kebebasan, pilih baris pertama. Kami pergi dari kiri ke kanan di sepanjang baris yang diberikan sehingga kami mencapai nilai yang lebih besar daripada 3 , nilai khi kuasa dua kami. Yang pertama kita dapati ialah 3.84. Melihat lajur kami, kami melihat bahawa nilai p yang sepadan ialah 0.05. Ini bermakna bahawa nilai-p kami antara 0.05 dan 0.1(nilai p seterusnya dalam jadual dalam tertib menaik).
  • Tentukan sama ada untuk menolak atau meninggalkan hipotesis nol. Memandangkan anda telah menentukan anggaran nilai-p untuk percubaan anda, anda perlu memutuskan sama ada untuk menolak hipotesis nol percubaan anda atau tidak (ingat, ini ialah hipotesis bahawa pembolehubah eksperimen yang anda manipulasi Tidak mempengaruhi keputusan yang anda perhatikan). Jika nilai-p kurang daripada tahap keertian - tahniah, anda telah membuktikan bahawa terdapat kemungkinan besar hubungan antara pembolehubah yang anda manipulasi dan hasil yang anda perhatikan. Jika nilai-p lebih tinggi daripada aras keertian, tidak mungkin untuk mengatakan dengan pasti sama ada keputusan yang anda perhatikan adalah hasil daripada peluang tulen atau manipulasi pembolehubah ini.

    • Contoh: Nilai p kami adalah antara 0.05 dan 0.1. Ia jelas Tidak kurang daripada 0.05, jadi malangnya kami kami tidak boleh menolak hipotesis nol kami. Ini bermakna kita belum mencapai sekurang-kurangnya 95% kebarangkalian bahawa polis di bandar kita mengeluarkan tiket kepada pemilik kereta merah dan biru dengan kebarangkalian yang agak berbeza daripada purata nasional.
    • Dalam erti kata lain, terdapat kemungkinan 5-10% bahawa hasil yang kami perhatikan bukanlah akibat daripada perubahan lokasi (analisis bandar, bukan seluruh negara), tetapi hanya kemalangan. Memandangkan ketepatan yang kami dakwa tidak boleh melebihi 5%, kami tidak boleh menyatakan dengan pasti bahawa polis di bandar kita kurang berat sebelah terhadap pemilik kereta merah - terdapat kebarangkalian kecil (tetapi signifikan secara statistik) bahawa ini tidak berlaku.
  • Pengujian hipotesis dijalankan menggunakan analisis statistik. Kepentingan statistik didapati menggunakan nilai P, yang sepadan dengan kebarangkalian peristiwa tertentu di bawah andaian bahawa beberapa pernyataan (hipotesis nol) adalah benar. Jika nilai P kurang daripada tahap kepentingan statistik tertentu (biasanya 0.05), penguji boleh membuat kesimpulan dengan selamat bahawa hipotesis nol adalah palsu dan teruskan untuk mempertimbangkan hipotesis alternatif. Menggunakan ujian-t Pelajar, anda boleh mengira nilai-P dan menentukan kepentingan bagi dua set data.

    Langkah-langkah

    Bahagian 1

    Menyediakan percubaan

      Tentukan hipotesis anda. Langkah pertama dalam menilai kepentingan statistik ialah memilih soalan yang anda ingin jawab dan merumuskan hipotesis. Hipotesis ialah pernyataan tentang data eksperimen, taburan dan sifatnya. Untuk mana-mana eksperimen, terdapat kedua-dua hipotesis nol dan alternatif. Secara umumnya, anda perlu membandingkan dua set data untuk menentukan sama ada ia serupa atau berbeza.

      • Hipotesis nol (H 0) biasanya menyatakan bahawa tiada perbezaan antara dua set data. Contohnya: pelajar yang membaca bahan sebelum kelas tidak mendapat markah yang lebih tinggi.
      • Hipotesis alternatif (H a) adalah bertentangan dengan hipotesis nol dan merupakan pernyataan yang perlu disahkan dengan data eksperimen. Contohnya: pelajar yang membaca bahan sebelum kelas mendapat markah yang lebih tinggi.
    1. Tetapkan tahap keertian untuk menentukan berapa banyak taburan data mesti berbeza daripada yang biasa untuk dianggap sebagai hasil yang ketara. Tahap keertian (juga dipanggil α (\displaystyle \alpha )-level) ialah ambang yang anda tentukan untuk kepentingan statistik. Jika nilai-P kurang daripada atau sama dengan aras keertian, data tersebut dianggap signifikan secara statistik.

      Tentukan kriteria yang akan anda gunakan: satu belah atau dua belah. Salah satu andaian dalam ujian-t Pelajar ialah data bertaburan normal. Taburan normal ialah lengkung berbentuk loceng dengan bilangan hasil maksimum di tengah lengkung. Ujian-t pelajar ialah kaedah pengesahan data matematik yang membolehkan anda menentukan sama ada data berada di luar taburan normal (lebih banyak, kurang atau dalam "ekor" lengkung).

      • Jika anda tidak pasti sama ada data berada di atas atau di bawah kumpulan kawalan, gunakan ujian dua hujung. Ini akan membolehkan anda menentukan kepentingan dalam kedua-dua arah.
      • Jika anda tahu ke arah mana data mungkin berada di luar taburan normal, gunakan ujian satu hujung. Dalam contoh di atas, kami menjangkakan gred pelajar akan meningkat, jadi ujian satu hujung boleh digunakan.
    2. Tentukan saiz sampel menggunakan kuasa statistik. Kuasa statistik kajian ialah kebarangkalian bahawa saiz sampel yang diberikan akan menghasilkan hasil yang diharapkan. Ambang kuasa biasa (atau β) ialah 80%. Analisis kuasa tanpa sebarang data terdahulu boleh menjadi rumit kerana beberapa maklumat tentang cara yang dijangkakan dalam setiap set data dan sisihan piawainya diperlukan. Gunakan kalkulator kuasa statistik dalam talian untuk menentukan saiz sampel yang optimum untuk data anda.

      • Biasanya, penyelidik menjalankan kajian rintis kecil untuk menyediakan data untuk analisis kuasa dan menentukan saiz sampel yang diperlukan untuk kajian yang lebih besar dan lebih lengkap.
      • Jika anda tidak mempunyai peluang untuk menjalankan kajian rintis, cuba anggaran nilai purata yang mungkin berdasarkan data literatur dan keputusan orang lain. Ini boleh membantu anda menentukan saiz sampel yang optimum.

      Bahagian 2

      Kira Sisihan Piawai
      1. Tuliskan formula bagi sisihan piawai. Sisihan piawai menunjukkan betapa besar penyebaran data. Ia membolehkan anda membuat kesimpulan sejauh mana data yang diperolehi pada sampel tertentu. Pada pandangan pertama, formula itu kelihatan agak rumit, tetapi penjelasan di bawah akan membantu anda memahaminya. Formulanya adalah seperti berikut: s = √∑((x i – µ) 2 /(N – 1)).

        • s - sisihan piawai;
        • tanda ∑ menunjukkan bahawa semua data yang diperolehi dalam sampel perlu ditambah;
        • x i sepadan dengan nilai ke-i, iaitu hasil berasingan yang diperolehi;
        • µ ialah nilai purata untuk kumpulan ini;
        • N ialah jumlah bilangan data dalam sampel.
      2. Cari purata dalam setiap kumpulan. Untuk mengira sisihan piawai, anda mesti mencari min bagi setiap kumpulan kajian terlebih dahulu. Nilai min dilambangkan dengan huruf Yunani µ (mu). Untuk mencari purata, hanya tambahkan semua nilai yang terhasil dan bahagikannya dengan jumlah data (saiz sampel).

        • Contohnya, untuk mencari gred purata dalam kumpulan pelajar yang mempelajari bahan sebelum kelas, pertimbangkan set data yang kecil. Untuk kesederhanaan, kami menggunakan satu set lima mata: 90, 91, 85, 83 dan 94.
        • Mari tambah semua nilai bersama-sama: 90 + 91 + 85 + 83 + 94 = 443.
        • Bahagikan hasil tambah dengan bilangan nilai, N = 5: 443/5 = 88.6.
        • Oleh itu, nilai purata bagi kumpulan ini ialah 88.6.
      3. Tolak setiap nilai yang diperoleh daripada purata. Langkah seterusnya ialah mengira perbezaan (x i - µ). Untuk melakukan ini, tolak setiap nilai yang diperoleh daripada nilai purata yang ditemui. Dalam contoh kita, kita perlu mencari lima perbezaan:

        • (90 - 88.6), (91 - 88.6), (85 - 88.6), (83 - 88.6) dan (94 - 88.6).
        • Hasilnya, kami mendapat nilai berikut: 1.4, 2.4, -3.6, -5.6 dan 5.4.
      4. Kuadratkan setiap nilai yang diperoleh dan tambahkannya bersama-sama. Setiap kuantiti yang baru ditemui hendaklah diduakan. Langkah ini akan mengalih keluar semua nilai negatif. Jika selepas langkah ini anda masih mempunyai nombor negatif, maka anda terlupa untuk mengduakannya.

        • Untuk contoh kami, kami mendapat 1.96, 5.76, 12.96, 31.36 dan 29.16.
        • Kami menambah nilai yang diperoleh: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.
      5. Bahagikan dengan saiz sampel tolak 1. Dalam formula, jumlahnya dibahagikan dengan N - 1 kerana fakta bahawa kita tidak mengambil kira populasi umum, tetapi mengambil sampel semua pelajar untuk penilaian.

        • Tolak: N - 1 = 5 - 1 = 4
        • Bahagi: 81.2/4 = 20.3
      6. Ambil punca kuasa dua. Selepas membahagikan jumlah dengan saiz sampel tolak satu, ambil punca kuasa dua nilai yang ditemui. Ini adalah langkah terakhir dalam mengira sisihan piawai. Terdapat program statistik yang, selepas memasukkan data awal, melakukan semua pengiraan yang diperlukan.

        • Dalam contoh kami, sisihan piawai bagi markah pelajar yang membaca bahan sebelum kelas ialah s = √20.3 = 4.51.

      Bahagian 3

      Tentukan Kepentingan
      1. Kira varians antara dua kumpulan data. Sehingga langkah ini, kami telah mempertimbangkan contoh untuk hanya satu kumpulan data. Jika anda ingin membandingkan dua kumpulan, jelas anda harus mengambil data untuk kedua-dua kumpulan. Kira sisihan piawai bagi kumpulan data kedua dan kemudian cari varians antara dua kumpulan eksperimen. Serakan dikira menggunakan formula berikut: s d = √((s 1 /N 1) + (s 2 /N 2)).