كل ما يتعلق بالبناء والتجديد

مستوى الأهمية الإحصائية في علم النفس. مستوى الأهمية الإحصائية (ع)

مستوى الأهمية - هذا هو الاحتمال الذي اعتبرنا أن الاختلافات كبيرة، لكنها في الواقع عشوائية.

عندما نشير إلى أن الفروق دالة عند مستوى دلالة 5%، أو متى ر< 0,05 ، فإننا نعني أن احتمال عدم موثوقيتها هو 0.05.

عندما نشير إلى أن الفروق دالة عند مستوى دلالة 1%، أو متى ر< 0,01 ، فإننا نعني أن احتمال عدم موثوقيتها هو 0.01.

إذا ترجمنا كل هذا إلى لغة أكثر رسمية، فإن مستوى الأهمية هو احتمال رفض الفرضية الصفرية، في حين أنها صحيحة.

خطأ،تتكون منالواحدما كنامرفوضفرضية العدمفي حين أنه صحيح، فإنه يسمى خطأ من النوع 1.(انظر الجدول 1)

طاولة 1. الفرضيات الصفرية والبديلة وشروط الاختبار الممكنة.

يُشار عادةً إلى احتمال حدوث مثل هذا الخطأ على أنه α. في الجوهر، يجب أن نشير بين قوسين وليس ص < 0.05 أو ص < 0.01، و α < 0.05 أو ألفا < 0,01.

إذا كان احتمال الخطأ α ، ثم احتمال القرار الصحيح: 1-α. كلما كان α أصغر، زاد احتمال اتخاذ القرار الصحيح.

تاريخيًا، من المقبول عمومًا في علم النفس أن أدنى مستوى للأهمية الإحصائية هو مستوى 5% (p<0.05): يكفي مستوى 1% (p<0.01) والأعلى هو مستوى 0.1% (p<0.001). لذلك، تحتوي جداول القيم الحرجة عادةً على قيم المعايير المقابلة لمستويات الأهمية الإحصائية p<0.05 وp<0.01، وأحيانًا - p<0.001. بالنسبة لبعض المعايير، تشير الجداول إلى مستوى الأهمية الدقيق لقيمها التجريبية المختلفة. على سبيل المثال، بالنسبة إلى φ*=1.56 p=O.06.

ومع ذلك، حتى يصل مستوى الدلالة الإحصائية إلى p = 0.05، لا يزال ليس لدينا الحق في رفض فرضية العدم. وسوف نلتزم بالقاعدة التالية لرفض فرضية عدم وجود فروق (Ho) وقبول فرضية الأهمية الإحصائية للفروق (H1).

قاعدة رفض Ho وقبول h1

إذا كانت القيمة التجريبية للاختبار تساوي أو تزيد عن القيمة الحرجة المقابلة لـ p<0.05، فسيتم رفض H 0، ولكن لا يمكننا قبول H 1 بشكل مؤكد.

إذا كانت القيمة التجريبية للمعيار مساوية للقيمة الحرجة المقابلة لـ p≥0.01 أو تتجاوزها، فسيتم رفض H 0 ويتم قبول H 1.

الاستثناءات : اختبار علامة G واختبار ويلكوكسون T واختبار مان ويتني U. يتم إنشاء علاقات عكسية بالنسبة لهم.

أرز. 4. مثال على "محور الأهمية" لمعيار روزنباوم Q.

يتم تحديد القيم الحرجة للمعيار على أنها Q o و o5 و Q 0.01، والقيمة التجريبية للمعيار هي Q em. وهي محاطة بقطع ناقص.

على يمين القيمة الحرجة Q 0.01 تمتد "منطقة الأهمية" - وهذا يشمل القيم التجريبية التي تتجاوز Q 0.01 وبالتالي فهي مهمة بالتأكيد.

على يسار القيمة الحرجة Q 0.05، تمتد "منطقة الأهمية" - وهذا يشمل قيم Q التجريبية التي تقل عن Q 0.05، وبالتالي فهي غير ذات أهمية بالتأكيد.

نحن نرى ذلك س 0,05 =6; س 0,01 =9; س م. =8;

تقع القيمة التجريبية للمعيار في المنطقة بين Q 0.05 و Q 0.01. هذه منطقة "عدم اليقين": يمكننا بالفعل رفض الفرضية حول عدم موثوقية الاختلافات (H 0)، لكننا لا نستطيع بعد قبول الفرضية حول موثوقيتها (H 1).

ومع ذلك، من الناحية العملية، يمكن للباحث اعتبار تلك الاختلافات التي لا تقع في منطقة الأهمية موثوقة، معلنًا أنها يمكن الاعتماد عليها عند البحث. < 0.05، أو من خلال الإشارة إلى المستوى الدقيق لأهمية قيمة المعيار التجريبي التي تم الحصول عليها، على سبيل المثال: p=0.02. باستخدام الجداول القياسية الموجودة في جميع الكتب المدرسية حول الأساليب الرياضية، يمكن القيام بذلك فيما يتعلق بمعايير كروسكال-واليس H، χ 2 ص فريدمان، بايجز إل، فيشر φ* .

يتم تحديد مستوى الأهمية الإحصائية، أو قيم الاختبار الحرجة، بشكل مختلف عند اختبار الفرضيات الإحصائية الاتجاهية وغير الاتجاهية.

مع الفرضية الإحصائية الاتجاهية، يتم استخدام اختبار ذو طرف واحد، مع فرضية غير اتجاهية، يتم استخدام اختبار ذو طرفين. يعد الاختبار ثنائي الذيل أكثر صرامة لأنه يختبر الاختلافات في كلا الاتجاهين، وبالتالي القيمة التجريبية للاختبار التي تتوافق سابقًا مع مستوى الأهمية p < 0.05، يتوافق الآن فقط مع المستوى p < 0,10.

لن نضطر إلى أن نقرر بأنفسنا في كل مرة ما إذا كان سيستخدم معيارًا أحادي الجانب أم ثنائي الجانب. يتم اختيار جداول القيم الحرجة للمعايير بحيث تتوافق الفرضيات الاتجاهية مع معيار أحادي الجانب، والفرضيات غير الاتجاهية تتوافق مع معيار ثنائي الجانب، والقيم المعطاة تلبي المتطلبات التي تنطبق على كل واحد منهم. ويحتاج الباحث فقط إلى التأكد من تطابق فرضياته في المعنى والشكل مع الفرضيات المقترحة في وصف كل معيار من المعايير.

محاضرة 4.

المبادئ العامةاختبار الفرضيات الإحصائية

دعونا نؤكد مرة أخرى أن البيانات التي تم الحصول عليها نتيجة للتجربة على أي عينة هي بمثابة الأساس لإصدار الأحكام حول عامة السكان. ومع ذلك، ولأسباب احتمالية عشوائية، فإن تقدير معلمات المجتمع الذي يتم إجراؤه على أساس البيانات التجريبية (العينة) سيكون دائمًا مصحوبًا بخطأ، وبالتالي يجب اعتبار هذه التقديرات تخمينية، وليس كبيانات نهائية. تسمى هذه الافتراضات حول خصائص ومعايير السكان الفرضيات الإحصائية .

إن جوهر اختبار الفرضية الإحصائية هو التأكد من تطابق البيانات التجريبية مع الفرضية المطروحة، فهل يجوز إرجاع التناقض بين الفرضية ونتيجة التحليل الإحصائي للبيانات التجريبية إلى أسباب عشوائية؟ وبالتالي، فإن الفرضية الإحصائية هي فرضية علمية تسمح بالاختبار الإحصائي، والإحصاء الرياضي هو مجال علمي مهمته اختبار الفرضيات الإحصائية على أساس علمي.

الفرضيات الإحصائية

عند اختبار الفرضيات الإحصائية، يتم استخدام مفهومين: ما يسمى صفر (تعيين ن 0) والفرضية البديلة (الدلالة ن 1).

فرضية العدمهي فرضية حول عدم وجود اختلافات. تم تسميته ويسمى صفر لأنه يحتوي على الرقم 0: حيث يتم مقارنة قيم الميزات.

فرضية العدم هي ما نريد رفضه إذا أردنا إثبات أهمية الاختلاف.

فرضية بديلةهي فرضية حول أهمية الاختلافات. ويشار إليه بـ . الفرضية البديلة هي شيء نريد إثباته، لذلك يطلق عليه أحيانًا تجريبيفرضية.

هناك مشاكل عندما يكون من الضروري إثبات عدم أهمية الاختلافات، أي. تأكيد الفرضية الصفرية. ومع ذلك، في كثير من الأحيان لا يزال من الضروري إثبات ذلك أهمية الاختلافات، لأنها أكثر إفادة في العثور على شيء جديد.

يمكن أن تكون الفرضيات الصفرية والبديلة اتجاهية أو غير اتجاهية.

الفرضيات الاتجاهية

: لا يتجاوز

: يتجاوز

فرضيات غير اتجاهية

: لا يختلف

: مختلف

إذا لوحظ خلال التجربة أنه في المجموعة المائية كانت القيم الفردية للمشاركين في بعض السمات، على سبيل المثال، الشجاعة الاجتماعية، أعلى، وفي المجموعة الأخرى أقل، ثم لاختبار أهمية هذه الاختلافات هو اللازمة لصياغة فرضيات الاتجاه.

إذا كان من الضروري إثبات أن المجموعة الأولى، تحت تأثير بعض التأثيرات التجريبية، شهدت تغييرات أكثر وضوحا مما كانت عليه في المجموعة الثانية، فمن الضروري في هذه الحالة أيضًا صياغة فرضيات اتجاهية.

وإذا كان من الضروري إثبات أن أشكال توزيع الخاصية تختلف في المجموعتين الأولى والثانية، فإنه يتم صياغة فرضيات غير اتجاهية.

تعليق.وعند وصف كل معيار يتم صياغة الفرضيات التي يساعد على اختبارها.

بشكل عام، عند قبول أو رفض الفرضيات، هناك خيارات مختلفة ممكنة.

على سبيل المثال، أجرى طبيب نفساني اختبارًا عشوائيًا لمؤشرات الذكاء على مجموعة من المراهقين من عائلات مكونة من أحد الوالدين وأخرى ذات والد واحد. ونتيجة لمعالجة البيانات التجريبية، وجد أن المراهقين من الأسر ذات الوالد الوحيد لديهم درجات ذكاء أقل في المتوسط ​​من أقرانهم من الأسر السليمة. بناء على النتائج التي تم الحصول عليها، هل يمكن للطبيب النفسي أن يستنتج أن الأسرة غير المكتملة تؤدي إلى انخفاض الذكاء لدى المراهقين؟ ويسمى الاستنتاج المعتمد في مثل هذه الحالات بالقرار الإحصائي. ونؤكد أن مثل هذا القرار هو احتمالي دائما.

عند اختبار الفرضية، قد تتعارض البيانات التجريبية مع الفرضية , ومن ثم يتم رفض هذه الفرضية. خلاف ذلك، أي. إذا كانت البيانات التجريبية متوافقة مع الفرضية، فلا يتم رفضها. في كثير من الأحيان في مثل هذه الحالات يقولون إن الفرضية مقبولة (على الرغم من أن هذه الصيغة ليست دقيقة تماما، إلا أنها منتشرة على نطاق واسع وسوف نستخدمها في المستقبل). وهذا يوضح أن الاختبار الإحصائي للفرضيات بناءً على بيانات العينة التجريبية يرتبط حتماً بخطر (احتمال) اتخاذ قرار خاطئ. في هذه الحالة، الأخطاء من نوعين ممكنة.

خطأ من النوع الأوليحدث عندما يتم اتخاذ قرار برفض الفرضية على الرغم من أنها صحيحة بالفعل.

خطأ من النوع الثانييحدث عندما يتم اتخاذ قرار بعدم رفض الفرضية على الرغم من أنها في الواقع ستكون غير صحيحة. ومن الواضح أنه يمكن أيضًا اعتماد الاستنتاجات الصحيحة في حالتين. ومن الأفضل عرض ما سبق في شكل جدول 1:

الجدول 1

ومن الممكن أن يكون الطبيب النفسي مخطئًا في قراره الإحصائي؛ وكما نرى من الجدول 1، يمكن أن تكون هذه الأخطاء من نوعين فقط. وبما أنه من المستحيل القضاء على الأخطاء عند قبول الفرضيات الإحصائية، فمن الضروري تقليل العواقب المحتملة، أي. قبول فرضية إحصائية غير صحيحة. في معظم الحالات، الطريقة الوحيدة لتقليل الأخطاء هي زيادة حجم العينة.

فهم مستوى الأهمية الإحصائية

عند تبرير الاستدلال الإحصائي يجب طرح السؤال التالي: أين يقع الخط الفاصل بين قبول ورفض الفرضية الصفرية؟ ونظرًا لوجود تأثيرات عشوائية في التجربة، لا يمكن رسم هذه الحدود بدقة مطلقة. لأنه يقوم على هذا المفهوم مستوى الدلالة او الاهميه.

مواطنه. مستوى الدلالة او الاهميهيسمى احتمال الرفض الكاذب للفرضية الصفرية. أو بمعنى آخر، مستوى الأهميةهذا هو احتمال حدوث خطأ من النوع الأول عند اتخاذ القرار.

للإشارة إلى هذا الاحتمال، كقاعدة عامة، يستخدمون إما حرفًا يونانيًا أو حرفًا لاتينيًا ر.وفيما يلي سوف نستخدم الرسالة ر.

تاريخيًا، في العلوم التطبيقية التي تستخدم الإحصاء، وخاصة في علم النفس، يعتبر أدنى مستوى للأهمية الإحصائية هو مستوى ؛ كافية - المستوى و اعلى مستوى. لذلك، في الجداول الإحصائية الواردة في ملحق كتب الإحصاء، عادة ما يتم إعطاء القيم الجدولية للمستويات: ; ; . في بعض الأحيان يتم إعطاء قيم جدولية للمستويات. القيم 0.05 و 0.01 و 0.001 هي ما يسمى المستويات القياسية للأهمية الإحصائية . عند التحليل الإحصائي للبيانات التجريبية، يجب على الطبيب النفسي، اعتمادًا على أهداف وفرضيات الدراسة، تحديد مستوى الأهمية المطلوب. وكما نرى، هنا القيمة الأكبر، أو الحد الأدنى لمستوى الدلالة الإحصائية، تساوي 0.05 - وهذا يعني أنه مسموح بخمسة أخطاء في عينة مكونة من مائة عنصر (حالات، مواضيع) أو خطأ واحد في عشرين العناصر (الحالات والموضوعات). ويعتقد أننا لا نستطيع أن نخطئ لا ستة ولا سبعة ولا أكثر من مائة مرة. وستكون تكلفة مثل هذه الأخطاء مرتفعة للغاية.

لاحظ أن الحزم الإحصائية الحديثة على أجهزة الكمبيوتر لا تستخدم مستويات الدلالة القياسية، بل مستويات يتم حسابها مباشرة في عملية العمل بالطريقة الإحصائية المقابلة. هذه المستويات، التي حددتها الرسالة ص،يمكن أن يكون لها تعبير رقمي مختلف في النطاق من 0 إلى 1، على سبيل المثال، ر= 0,7, ر= 0.23 أو ر= 0.012. ومن الواضح أنه في الحالتين الأوليين، كانت مستويات الأهمية التي تم الحصول عليها مرتفعة للغاية ومن المستحيل القول بأن النتيجة مهمة. وفي الوقت نفسه، في الحالة الأخيرة، تكون النتائج مهمة عند مستوى 12 ألفًا، وهذا مستوى موثوق.

قاعدة قبول الاستنتاج الإحصائي هي كما يلي: بناءً على البيانات التجريبية التي تم الحصول عليها، يقوم عالم النفس بحساب ما يسمى بالإحصاءات التجريبية، أو القيمة التجريبية، باستخدام الطريقة الإحصائية التي اختارها. من الملائم الإشارة إلى هذه الكمية على أنها الفصل.ثم الإحصائيات التجريبية الفصل متمت مقارنتها بقيمتين حرجتين تتوافقان مع مستويات دلالة 5% و 1% للطريقة الإحصائية المختارة والتي يشار إليها بـ . تم العثور على القيم لطريقة إحصائية معينة باستخدام الجداول المقابلة الواردة في الملحق لأي كتاب إحصائي. هذه الكميات، كقاعدة عامة، تكون دائمًا مختلفة وفي المستقبل، من أجل الراحة، يمكن تسميتها بـ و . من الملائم تقديم القيم الحرجة الموجودة في الجداول في نموذج التدوين القياسي التالي:

ولكننا نؤكد أننا استخدمنا الترميز كاختصار لكلمة "رقم". اعتمدت جميع الأساليب الإحصائية تسمياتها الرمزية الخاصة لكل هذه الكميات: القيمة التجريبية المحسوبة باستخدام الطريقة الإحصائية المقابلة والقيمة الحرجة التي تم العثور عليها من الجداول المقابلة. على سبيل المثال، عند حساب معامل ارتباط رتبة سبيرمان باستخدام الجدول 21 من الملحق، تم العثور على القيم الحرجة التالية، والتي يُشار إليها لهذه الطريقة بالحرف اليوناني (rho).

ومن المعتاد كتابة القيم التي تم العثور عليها على النحو التالي:

نحتاج الآن إلى مقارنة القيمة التجريبية مع القيمتين الحرجتين الموجودتين في الجدولين. أفضل طريقة للقيام بذلك هي وضع الأرقام الثلاثة على ما يسمى "" محاور الأهمية». « محور الأهمية"يمثل خطًا مستقيمًا، يوجد في الطرف الأيسر منه 0، على الرغم من أنه، كقاعدة عامة، لا يتم تحديده على هذا الخط المستقيم نفسه، ومن اليسار إلى اليمين هناك زيادة في سلسلة الأرقام. في الواقع، هذا هو محور الإحداثي المدرسي المعتاد أوهنظام الإحداثيات الديكارتية. إلا أن خصوصية هذا المحور أنه يتكون من ثلاثة أقسام “ المناطق" المنطقة اليسرى تسمى منطقة عدم الأهمية ، يمين - منطقة الأهمية ، والوسيطة منطقة عدم اليقين . حدود جميع المناطق الثلاث هي الفصل cr1ل ف = 0.05 و ف = 0.01 كما هو موضح أدناه.

عند تبرير الاستنتاج الإحصائييجب معالجة السؤال حول أين يقع الخط الفاصل بين القبول والرفض فرضيات؟ ونظرًا لوجود تأثيرات عشوائية في التجربة، لا يمكن رسم هذه الحدود بدقة مطلقة. لأنه يقوم على هذا المفهوم مستوى الدلالة او الاهميه.مستوىأهميةيسمى احتمال الرفض الكاذب للفرضية الصفرية. أو بمعنى آخر، مستوىأهمية-هذااحتمالية حدوث خطأ من النوع الأول عند اتخاذ القرار. للإشارة إلى هذا الاحتمال، كقاعدة عامة، يستخدمون إما الحرف اليوناني α أو الحرف اللاتيني ر.وفيما يلي سوف نستخدم الرسالة ر.

تاريخيا حدث الأمر بهذه الطريقةأنه في العلوم التطبيقية التي تستخدم الإحصاء، وخاصة في علم النفس، يعتبر أن أدنى مستوى للدلالة الإحصائية هو المستوى ع = 0.05؛ المستوى الكافي ر= 0.01 ومستوى أعلى ع = 0.001. ولذلك فإنه في الجداول الإحصائية الواردة في ملحق كتب الإحصاء عادة ما تعطى القيم الجدولية للمستويات ع = 0,05, ع = 0.01 و ر= 0.001. في بعض الأحيان يتم إعطاء قيم جدولية للمستويات ص - 0.025 و ع = 0,005.

القيم 0.05 و 0.01 و 0.001 هي ما يسمى بالمستويات القياسية للأهمية الإحصائية. عند التحليل الإحصائي للبيانات التجريبية، يجب على الطبيب النفسي، اعتمادًا على أهداف وفرضيات الدراسة، تحديد مستوى الأهمية المطلوب. وكما نرى، فإن القيمة الأكبر هنا، أو الحد الأدنى لمستوى الدلالة الإحصائية، هو 0.05 - وهذا يعني أنه مسموح بخمسة أخطاء في عينة مكونة من مائة عنصر (حالات، مواضيع) أو خطأ واحد في عشرين عنصرًا ( الحالات والموضوعات). ويعتقد أننا لا نستطيع أن نخطئ لا ستة ولا سبعة ولا أكثر من مائة مرة. وستكون تكلفة مثل هذه الأخطاء مرتفعة للغاية.

ملحوظة، أنه في الحزم الإحصائية الحديثة على حاسوبلا يتم استخدام مستويات الأهمية القياسية، ولكن يتم حساب المستويات مباشرة في عملية العمل باستخدام الطريقة الإحصائية المقابلة. هذه المستويات، التي حددتها الرسالة ص،يمكن أن يكون لها تعبير رقمي مختلف في النطاق من 0 إلى 1، على سبيل المثال، ع = 0,7, ر= 0.23 أو ر= 0.012. ومن الواضح أنه في الحالتين الأوليين كانت مستويات الأهمية التي تم الحصول عليها مرتفعة للغاية ومن المستحيل القول بأن النتيجة مهمة. وفي الوقت نفسه، في الحالة الأخيرة، تكون النتائج مهمة عند مستوى 12 جزءًا من الألف. وهذا مستوى موثوق.

قاعدة القبولالاستنتاج الإحصائي هو كما يلي: على أساس البيانات التجريبية التي تم الحصول عليها، يقوم عالم النفس بحساب ما يسمى بالإحصاءات التجريبية، أو القيمة التجريبية، باستخدام الطريقة الإحصائية التي اختارها. من الملائم الإشارة إلى هذه الكمية على أنها الفصل.ثم الإحصائيات التجريبية الفصل متمت مقارنتها بقيمتين حرجتين، والتي تتوافق مع مستويات الأهمية 5٪ و 1٪ للطريقة الإحصائية المختارة والتي يشار إليها بـ الفصل كر.كميات الفصل كرتم العثور عليها لطريقة إحصائية معينة باستخدام الجداول المقابلة الواردة في ملحق أي كتاب إحصائي مدرسي. هذه الكميات، كقاعدة عامة، تكون دائما مختلفة وفي ما يلي، من أجل الراحة، يمكن تسميتها الفصل cr1و الفصل cr2.القيم الحرجة التي تم العثور عليها من الجداول الفصل cr1و الفصل كر2من الملائم تمثيلها في نموذج التدوين القياسي التالي:


ونحن نؤكدومع ذلك، استخدمنا الترميز الفصل مو الفصل كركاختصار لكلمة "رقم". اعتمدت جميع الأساليب الإحصائية تسمياتها الرمزية الخاصة لكل هذه الكميات: القيمة التجريبية المحسوبة باستخدام الطريقة الإحصائية المقابلة وتلك الموجودة في جداول القيم الحرجة المقابلة. على سبيل المثال، عند حساب معامل الترتيب علاقات سبيرمانوباستخدام جدول القيم الحرجة لهذا المعامل، تم العثور على القيم الحرجة التالية، والتي يُشار إليها بهذه الطريقة بالحرف اليوناني ρ ("rho"). وذلك ل ع =تم العثور على قيمة 0.05 من الجدول ρ كر 1 = 0.61 و ع = 0.01 حجم ρ كر 2 = 0,76.

في النموذج القياسي للتدوين المعتمد في العرض التالي، يبدو كما يلي:

الآن نحن ضروريقارن قيمتنا التجريبية بقيمتين مهمتين تم العثور عليهما في الجداول. أفضل طريقة للقيام بذلك هي وضع الأرقام الثلاثة على ما يسمى "محور الدلالة". "محور الأهمية" هو خط مستقيم، في الطرف الأيسر منه 0، على الرغم من أنه، كقاعدة عامة، لا يتم وضع علامة عليه على هذا الخط المستقيم نفسه، ومن اليسار إلى اليمين هناك زيادة في سلسلة الأرقام. في الواقع، هذا هو محور الإحداثي المدرسي المعتاد أوهنظام الإحداثيات الديكارتية. إلا أن خصوصية هذا المحور هو أنه يتكون من ثلاثة أقسام "مناطق". إحدى المناطق المتطرفة تسمى منطقة التفاهة، والمنطقة المتطرفة الثانية تسمى منطقة الأهمية، والمنطقة المتوسطة تسمى منطقة عدم اليقين. حدود جميع المناطق الثلاث هي الفصل cr1ل ع = 0.05 و الفصل كر2ل ع = 0.01 كما هو موضح في الشكل.

اعتمادا على قاعدة القرار (قاعدة الاستدلال) المنصوص عليها في هذه الطريقة الإحصائية، هناك خياران ممكنان.

الخيار الأول:يتم قبول الفرضية البديلة إذا الفصل مالفصل كر.

منطقة الأهمية
منطقة عدم الأهمية
0,05
0,01
الفصل cr1
الفصل كر2

عد الفصل موفقا لبعض الأساليب الإحصائية، يجب أن تقع بالضرورة في واحدة من ثلاث مناطق.

إذا كانت القيمة التجريبية تقع في منطقة الدلالة، يتم قبول الفرضية H 0 حول عدم وجود اختلافات.

لو الفصل ميقع في منطقة الأهمية، ويتم قبول الفرضية البديلة H 1، ورفض الفرضية H 0.

لو الفصل ميقع في منطقة من عدم اليقين، يواجه الباحث ورطة. لذا، اعتمادا على أهمية المشكلة التي يتم حلها، يمكنه اعتبار التقدير الإحصائي الذي تم الحصول عليه موثوقا به عند مستوى 5٪، وبالتالي قبول الفرضية H 1، ورفض الفرضية H 0 , أو - غير موثوقة عند مستوى 1%، وبالتالي قبول الفرضية H0. ومع ذلك، دعونا نؤكد أن هذا هو الحال بالضبط عندما يمكن لعالم النفس أن يرتكب أخطاء من النوع الأول أو الثاني. وكما نوقش أعلاه، فمن الأفضل في هذه الظروف زيادة حجم العينة.

دعونا نؤكد أيضا على أن القيمة الفصل مقد يتطابق تمامًا مع أي منهما الفصل cr1أو الفصل cr2.في الحالة الأولى، يمكننا أن نفترض أن التقدير موثوق به عند مستوى 5٪ بالضبط ونقبل الفرضية H 1، أو على العكس من ذلك، نقبل الفرضية H 0. وفي الحالة الثانية، كقاعدة عامة، يتم قبول الفرضية البديلة H1 حول وجود فروق، ويتم رفض الفرضية H0.

يُعرِّف مُتوقعفي نتائج تجربتك.عادة، عندما يجري العلماء تجربة ما، تكون لديهم بالفعل فكرة عن النتائج التي تعتبر "طبيعية" أو "نموذجية". وقد يعتمد ذلك على نتائج تجريبية من تجارب سابقة، أو على مجموعات بيانات موثوقة، أو على بيانات من المؤلفات العلمية، أو قد يعتمد العالم على بعض المصادر الأخرى. لتجربتك، حدد النتائج المتوقعة وعبر عنها بالأرقام.

  • على سبيل المثال: لنفترض أن الدراسات السابقة أظهرت أنه في بلدك، من المرجح أن يحصل أصحاب السيارات الحمراء على مخالفات السرعة أكثر من أصحاب السيارات الزرقاء. على سبيل المثال، يُظهر متوسط ​​النتائج تفضيلًا بنسبة 2:1 للسيارات الحمراء على السيارات الزرقاء. مهمتنا هي تحديد ما إذا كانت الشرطة متحيزة بالمثل تجاه لون السيارات في مدينتك. للقيام بذلك، سنقوم بتحليل الغرامات الصادرة بسبب السرعة الزائدة. إذا أخذنا مجموعة عشوائية من 150 مخالفة سرعة صادرة لأصحاب السيارات الحمراء أو الزرقاء، فإننا نتوقع ذلك 100 سيتم إصدار غرامات مالية على أصحاب السيارات الحمراء، و 50 - أصحاب الأزرق، إذا كانت الشرطة في مدينتنا متحيزة للون السيارات كما هو ملاحظ في جميع أنحاء البلاد.

يُعرِّف لاحظنتائج تجربتك.الآن وبعد أن حددت النتائج المتوقعة، فأنت بحاجة إلى إجراء تجربة والعثور على القيم الفعلية (أو "المرصودة"). مرة أخرى، تحتاج إلى تمثيل هذه النتائج كأرقام. إذا قمنا بتهيئة الظروف التجريبية والنتائج المرصودة اختلفمن المتوقع، فلدينا احتمالان: إما أنه حدث بالصدفة، أو أنه كان سببًا على وجه التحديد من خلال تجربتنا. الغرض من إيجاد قيمة p هو تحديد ما إذا كانت النتائج المرصودة تختلف عن النتائج المتوقعة بدرجة كافية للسماح لنا برفض "فرضية العدم" - الفرضية القائلة بعدم وجود علاقة بين المتغيرات التجريبية والنتائج المرصودة.

  • مثال: لنفترض أننا في مدينتنا اخترنا بشكل عشوائي 150 مخالفة سرعة تم إصدارها لأصحاب السيارات الحمراء أو الزرقاء. لقد قررنا ذلك 90 وتم إصدار غرامات مالية على أصحاب السيارات الحمراء، و 60 - أصحاب الزرقاء. وهذا يختلف عن النتائج المتوقعة، وهي 100 و 50, على التوالى. هل أدت تجربتنا (في هذه الحالة تغيير مصدر البيانات من مستوى الولاية إلى مستوى المدينة) إلى هذا التغيير في النتائج، أم أن شرطة مدينتنا متحيزة تجاه سائقي السيارات؟ مشابه، مثل المعدل الوطني، ونحن نشهد فقط انحرافا عشوائيا؟ ستساعدنا القيمة P في تحديد ذلك.
  • تحديد الرقم درجات الحريةتجربتك.عدد درجات الحرية هو درجة التباين في تجربتك، والتي يتم تحديدها من خلال عدد الفئات التي تفحصها. معادلة عدد درجات الحرية هي عدد درجات الحرية = ن-1، حيث "n" هو عدد الفئات أو المتغيرات التي تقوم بتحليلها في تجربتك.

    • مثال: في تجربتنا هناك فئتان من النتائج: فئة لأصحاب السيارات الحمراء وأخرى لأصحاب السيارات الزرقاء. لذلك، في تجربتنا لدينا 2-1 = 1 درجة الحرية. إذا أردنا أن نقارن بين السيارات الحمراء والزرقاء والخضراء، فسنفعل ذلك 2 درجات الحرية وهكذا.
  • مقارنة النتائج المتوقعة والمرصودة باستخدام معيار مربع كاي. مربع كاي (المكتوب "x2") هو قيمة عددية تقيس الفرق بين مُتوقعو يمكن ملاحظتهاالقيم التجريبية. معادلة مربع كاي هي: × 2 = Σ ((س-ه) 2 /ه)، حيث "o" هي القيمة المرصودة و"e" هي القيمة المتوقعة. قم بتلخيص نتائج هذه المعادلة لجميع النتائج المحتملة (انظر أدناه).

    • لاحظ أن هذه المعادلة تتضمن عامل الجمع Σ (سيجما). بمعنى آخر، تحتاج إلى حساب ((|o-e|-.05) 2 /e) لكل نتيجة محتملة وإضافة الأرقام الناتجة للحصول على قيمة اختبار مربع كاي. في مثالنا، لدينا نتيجتان محتملتان - إما أن تكون السيارة التي تلقت التذكرة حمراء أو زرقاء. لذلك يجب علينا حساب ((o-e) 2 /e) مرتين - مرة للسيارات الحمراء ومرة ​​للسيارات الزرقاء.
    • مثال: لنعوض بالقيم المتوقعة والمرصودة في المعادلة x 2 = Σ((o-e) 2 /e). تذكر أنه بسبب عامل المجموع، نحتاج إلى حساب ((o-e) 2 /e) مرتين - مرة للسيارات الحمراء ومرة ​​للسيارات الزرقاء. وسوف نقوم بهذه المهمة على النحو التالي:
      • × 2 = ((90-100) 2 /100) + (60-50) 2 /50)
      • × 2 = ((-10) 2 /100) + (10) 2 /50)
      • × 2 = (100/100) + (100/50) = 1 + 2 = 3 .
  • يختار مستوى الأهمية. الآن بعد أن عرفنا درجات الحرية في تجربتنا وعرفنا قيمة اختبار مربع كاي، علينا أن نفعل شيئًا آخر قبل أن نجد القيمة الاحتمالية. نحن بحاجة إلى تحديد مستوى الأهمية. تكلم بلغة بسيطة، يشير مستوى الأهمية إلى مدى ثقتنا في نتائجنا. تتوافق القيمة المنخفضة للأهمية مع احتمالية منخفضة بأن تكون النتائج التجريبية ناتجة عن الصدفة والعكس صحيح. تتم كتابة مستويات الأهمية كأرقام عشرية (مثل 0.01)، والتي تتوافق مع احتمال الحصول على النتائج التجريبية عن طريق الصدفة (في هذه الحالة، احتمال ذلك هو 1٪).

  • استخدم جدول بيانات توزيع مربع كاي للعثور على القيمة الاحتمالية.يستخدم العلماء والإحصائيون جداول كبيرة لحساب القيمة الاحتمالية لتجاربهم. تحتوي هذه الجداول عادةً على محور رأسي على اليسار، يتوافق مع عدد درجات الحرية، ومحور أفقي في الأعلى، يتوافق مع القيمة p. استخدم بيانات الجدول للعثور أولاً على عدد درجات الحرية الخاصة بك، ثم انظر إلى صفك من اليسار إلى اليمين حتى تجد القيمة الأولى، أكثرقيمة مربع كاي الخاص بك. انظر إلى القيمة p المقابلة في أعلى عمودك. القيمة الاحتمالية التي تحتاجها تقع بين هذا الرقم والرقم التالي (الرقم الموجود على يسار رقمك).

    • يمكن الحصول على جداول مربع كاي من العديد من المصادر - يمكنك ببساطة العثور عليها عبر الإنترنت، أو البحث عنها في كتب العلوم أو الإحصاء. إذا لم يكن لديك هذه الكتب في متناول اليد، استخدم الصورة أعلاه أو الرسم البياني عبر الإنترنت الذي يمكنك مشاهدته مجانًا، مثل medcalc.org. هي تقع .
    • مثال: قيمة اختبار مربع كاي كانت 3. لذلك دعونا نستخدم جدول توزيع مربع كاي في الصورة أعلاه للعثور على القيمة التقريبية. وبما أننا نعلم أن في تجربتنا كل شيء 1 درجة الحرية، اختر الصف الأول. ننتقل من اليسار إلى اليمين على طول هذا الخط حتى نواجه قيمة أكبر 3 ، قيمة اختبار مربع كاي لدينا. أول واحد نجده هو 3.84. ننظر إلى الجزء العلوي من العمود ونرى أن القيمة p المقابلة هي 0.05. وهذا يعني أن قيمة p لدينا بين 0.05 و 0.1(القيمة p التالية في الجدول بترتيب تصاعدي).
  • قرر ما إذا كنت تريد رفض فرضية العدم أو الاحتفاظ بها.نظرًا لأنك حددت القيمة الاحتمالية التقريبية لتجربتك، فأنت بحاجة إلى أن تقرر ما إذا كنت تريد رفض الفرضية الصفرية لتجربتك (تذكر أن هذه هي الفرضية القائلة بأن المتغيرات التجريبية التي تلاعبت بها لاأثرت على النتائج التي لاحظتها). إذا كانت القيمة الاحتمالية أقل من مستوى الأهمية، تهانينا، لقد أثبتت أن هناك علاقة محتملة جدًا بين المتغيرات التي تلاعبت بها والنتائج التي لاحظتها. إذا كانت القيمة الاحتمالية أعلى من مستوى الأهمية، فلا يمكنك أن تقول على وجه اليقين ما إذا كانت النتائج التي لاحظتها كانت بسبب الصدفة البحتة أو التلاعب بالمتغيرات المعطاة.

    • مثال: القيمة الاحتمالية لدينا تتراوح بين 0.05 و0.1. من الواضح لاأقل من 0.05، لذلك للأسف نحن لا يمكننا رفض فرضيتنا الصفرية. وهذا يعني أننا لم نصل إلى الحد الأدنى البالغ 95% للقول بأن الشرطة في مدينتنا تصدر مخالفات لأصحاب السيارات الحمراء والزرقاء بمعدل يختلف تمامًا عن المعدل الوطني.
    • بمعنى آخر، هناك احتمال بنسبة 5-10% أن النتائج التي لاحظناها ليست آثار تغيير في الموقع (النظر إلى مدينة بدلاً من البلد بأكمله)، ولكن ببساطة نتيجة للصدفة. وبما أن الدقة المعلنة لدينا يجب ألا تتجاوز 5%، فلا يمكننا أن نقول ذلك بالتأكيدأن الشرطة في مدينتنا أقل تحيزًا تجاه أصحاب السيارات الحمراء - هناك احتمال صغير (لكنه ذو دلالة إحصائية) ألا يكون الأمر كذلك.
  • ويتم اختبار الفرضيات باستخدام التحليل الإحصائي. تم العثور على أهمية إحصائية باستخدام القيمة P، والتي تتوافق مع احتمالية حدث معين على افتراض أن بعض العبارات (فرضية العدم) صحيحة. إذا كانت قيمة P أقل من مستوى محدد من الأهمية الإحصائية (عادة 0.05)، يمكن للمجرب أن يستنتج بأمان أن الفرضية الصفرية خاطئة وينتقل إلى النظر في الفرضية البديلة. باستخدام اختبار الطالب، يمكنك حساب القيمة P وتحديد الأهمية لمجموعتين من البيانات.

    خطوات

    الجزء 1

    إعداد التجربة

      حدد فرضيتك.الخطوة الأولى في تقييم الأهمية الإحصائية هي اختيار السؤال الذي تريد الإجابة عليه وصياغة فرضية. الفرضية عبارة عن بيان حول البيانات التجريبية وتوزيعها وخصائصها. في أي تجربة، هناك فرضية العدم وفرضية بديلة. بشكل عام، سيتعين عليك مقارنة مجموعتين من البيانات لتحديد ما إذا كانت متشابهة أم مختلفة.

      • تنص الفرضية الصفرية (H 0) عادةً على عدم وجود فرق بين مجموعتين من البيانات. على سبيل المثال: الطلاب الذين قرأوا المادة قبل الفصل لا يحصلون على درجات أعلى.
      • الفرضية البديلة (H a) هي عكس الفرضية الصفرية وهي عبارة تحتاج إلى دعم بالبيانات التجريبية. على سبيل المثال: الطلاب الذين قرأوا المادة قبل الفصل يحصلون على درجات أعلى.
    1. قم بتعيين مستوى الأهمية لتحديد مدى اختلاف توزيع البيانات عن الطبيعي حتى يتم اعتباره نتيجة مهمة. مستوى الأهمية (ويسمى أيضًا ألفا (\displaystyle \alpha )-level) هو الحد الذي تحدده للأهمية الإحصائية. إذا كانت القيمة P أقل من أو تساوي مستوى الأهمية، تعتبر البيانات ذات دلالة إحصائية.

      حدد المعيار الذي ستستخدمه:من جانب واحد أو على الوجهين. أحد الافتراضات في اختبار الطالب هو أن البيانات يتم توزيعها بشكل طبيعي. التوزيع الطبيعي هو منحنى على شكل جرس مع أكبر عدد ممكن من النتائج في منتصف المنحنى. اختبار t للطالب هو طريقة رياضية لاختبار البيانات التي تسمح لك بتحديد ما إذا كانت البيانات تقع خارج التوزيع الطبيعي (أكثر أو أقل أو في "ذيول" المنحنى).

      • إذا لم تكن متأكدًا مما إذا كانت البيانات أعلى أو أقل من قيم مجموعة التحكم، فاستخدم اختبارًا ثنائي الطرف. سيسمح لك ذلك بتحديد الأهمية في كلا الاتجاهين.
      • إذا كنت تعرف الاتجاه الذي قد تقع فيه البيانات خارج التوزيع الطبيعي، فاستخدم اختبارًا أحادي الطرف. في المثال أعلاه، نتوقع زيادة درجات الطلاب، لذلك يمكن استخدام اختبار أحادي الطرف.
    2. تحديد حجم العينة باستخدام القوة الإحصائية.القوة الإحصائية للدراسة هي احتمالية الحصول على النتيجة المتوقعة، بالنظر إلى حجم العينة. عتبة الطاقة المشتركة (أو β) هي 80%. قد يكون تحليل القوة الإحصائية دون أي بيانات مسبقة أمرًا صعبًا لأنه يتطلب بعض المعلومات حول المتوسطات المتوقعة في كل مجموعة من البيانات وانحرافاتها المعيارية. استخدم حاسبة تحليل الطاقة عبر الإنترنت لتحديد حجم العينة الأمثل لبياناتك.

      • عادة، يقوم الباحثون بإجراء دراسة تجريبية صغيرة توفر بيانات لتحليل القوة الإحصائية وتحدد حجم العينة اللازم لدراسة أكبر وأكثر اكتمالا.
      • إذا لم تتمكن من إجراء دراسة تجريبية، فحاول تقدير المتوسطات المحتملة بناءً على الأدبيات ونتائج الأشخاص الآخرين. قد يساعدك هذا في تحديد حجم العينة الأمثل.

      الجزء 2

      حساب الانحراف المعياري
      1. اكتب صيغة الانحراف المعياري.يوضح الانحراف المعياري مدى الانتشار الموجود في البيانات. يسمح لك باستنتاج مدى قرب البيانات التي تم الحصول عليها من عينة معينة. للوهلة الأولى، تبدو الصيغة معقدة للغاية، لكن التوضيحات الواردة أدناه ستساعدك على فهمها. الصيغة هي كما يلي: s = √∑((x i – μ) 2 /(N – 1)).

        • ق - الانحراف المعياري.
        • تشير العلامة ∑ إلى ضرورة إضافة جميع البيانات التي تم الحصول عليها من العينة؛
        • x i يتوافق مع القيمة i، أي نتيجة منفصلة تم الحصول عليها؛
        • μ هو متوسط ​​القيمة لمجموعة معينة؛
        • N هو العدد الإجمالي للبيانات في العينة.
      2. أوجد المتوسط ​​في كل مجموعة.لحساب الانحراف المعياري، يجب عليك أولاً العثور على المتوسط ​​لكل مجموعة دراسية. تتم الإشارة إلى القيمة المتوسطة بالحرف اليوناني μ (mu). للعثور على المتوسط، ما عليك سوى إضافة جميع القيم الناتجة وتقسيمها على كمية البيانات (حجم العينة).

        • على سبيل المثال، للعثور على متوسط ​​الدرجات لمجموعة من الطلاب الذين يدرسون قبل الفصل الدراسي، فكر في مجموعة بيانات صغيرة. للتبسيط، نستخدم مجموعة من خمس نقاط: 90، 91، 85، 83 و94.
        • لنجمع كل القيم معًا: 90 + 91 + 85 + 83 + 94 = 443.
        • دعونا نقسم المجموع على عدد القيم، N = 5: 443/5 = 88.6.
        • وبذلك يكون المعدل لهذه المجموعة 88.6.
      3. اطرح كل قيمة تم الحصول عليها من المتوسط.والخطوة التالية هي حساب الفرق (x i - μ). للقيام بذلك، قم بطرح كل قيمة تم الحصول عليها من القيمة المتوسطة التي تم العثور عليها. في مثالنا، نحتاج إلى إيجاد خمسة اختلافات:

        • (90 – 88.6)، (91 – 88.6)، (85 – 88.6)، (83 – 88.6)، (94 – 88.6).
        • ونتيجة لذلك، نحصل على القيم التالية: 1.4، 2.4، -3.6، -5.6 و5.4.
      4. قم بتربيع كل قيمة تم الحصول عليها وأضفها معًا.يجب تربيع كل الكميات التي تم العثور عليها للتو. ستؤدي هذه الخطوة إلى إزالة كافة القيم السلبية. إذا كان لا يزال لديك أرقام سالبة بعد هذه الخطوة، فقد نسيت تربيعها.

        • في مثالنا، نحصل على 1.96، و5.76، و12.96، و31.36، و29.16.
        • نجمع القيم الناتجة: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.
      5. قسّم على حجم العينة ناقص 1.في الصيغة، يتم تقسيم المجموع على N - 1 لأننا لا نأخذ في الاعتبار عموم السكان، ولكننا نأخذ عينة من جميع الطلاب للتقييم.

        • اطرح: ن – 1 = 5 – 1 = 4
        • اقسم: 81.2/4 = 20.3
      6. خذ الجذر التربيعي.بعد قسمة المجموع على حجم العينة ناقص واحد، خذ الجذر التربيعي للقيمة التي تم العثور عليها. هذه هي الخطوة الأخيرة في حساب الانحراف المعياري. هناك برامج إحصائية تقوم بعد إدخال البيانات الأولية بإجراء جميع الحسابات اللازمة.

        • في مثالنا، الانحراف المعياري لدرجات الطلاب الذين قرأوا المادة قبل الفصل هو s =√20.3 = 4.51.

      الجزء 3

      تحديد الأهمية
      1. حساب التباين بين مجموعتي البيانات.قبل هذه الخطوة، نظرنا إلى مثال لمجموعة واحدة فقط من البيانات. إذا كنت تريد المقارنة بين مجموعتين، فمن الواضح أنه ينبغي عليك أخذ البيانات من كلا المجموعتين. احسب الانحراف المعياري للمجموعة الثانية من البيانات، ثم أوجد التباين بين المجموعتين التجريبيتين. يتم حساب التباين باستخدام الصيغة التالية: s d = √((s 1 /N 1) + (s 2 /N 2)).