صيغة لحساب التباين لمتغير عشوائي منفصل. أنواع التشتتات

صيغة لحساب التباين لمتغير عشوائي منفصل.  أنواع التشتتات

دعونا نحسب فيآنسةاكسلتباين العينة والانحراف المعياري. وسنقوم أيضًا بحساب تباين المتغير العشوائي إذا كان توزيعه معروفًا.

دعونا نفكر أولا التباين، ثم الانحراف المعياري.

تباين العينة

تباين العينة (تباين العينة,عينةالتباين) يميز انتشار القيم في المصفوفة بالنسبة إلى .

جميع الصيغ الثلاثة متكافئة رياضيا.

ومن الصيغة الأولى يتضح ذلك تباين العينةهو مجموع الانحرافات التربيعية لكل قيمة في المصفوفة من المتوسطمقسومًا على حجم العينة ناقص 1.

الفروق عيناتيتم استخدام الدالة DISP() باللغة الإنجليزية. الاسم VAR، أي. التباين. من الإصدار MS EXCEL 2010، يوصى باستخدام DISP.V() التناظري، باللغة الإنجليزية. اسم VARS، أي. نموذج التباين. بالإضافة إلى ذلك، بدءًا من إصدار MS EXCEL 2010، توجد وظيفة DISP.Г() باللغة الإنجليزية. الاسم VARP، أي. التباين السكاني، الذي يحسب التباينل سكان. يعود الاختلاف بالكامل إلى المقام: بدلاً من n-1 مثل DISP.V()، يحتوي DISP.G() على n فقط في المقام. قبل MS EXCEL 2010، تم استخدام الدالة VAR() لحساب تباين المحتوى.

تباين العينة
=QUADROTCL(عينة)/(COUNT(عينة)-1)
=(SUM(عينة)-COUNT(عينة)*المتوسط(عينة)^2)/ (COUNT(عينة)-1)- الصيغة المعتادة
=SUM((العينة -المتوسط(العينة))^2)/ (COUNT(العينة)-1) –

تباين العينةيساوي 0، فقط إذا كانت جميع القيم متساوية مع بعضها البعض، وبالتالي متساوية متوسط ​​القيمة. عادة، كلما كانت القيمة أكبر الفروقكلما زاد انتشار القيم في المصفوفة.

تباين العينةهو تقدير نقطة الفروقتوزيع المتغير العشوائي الذي تم تكوينه منه عينة. حول البناء فترات الثقةعند التقييم الفروقيمكن قراءتها في المقال.

تباين متغير عشوائي

لكي يحسب التباينالمتغير العشوائي، عليك أن تعرفه.

ل الفروقغالبًا ما يُشار إلى المتغير العشوائي X بـ Var(X). تشتتيساوي مربع الانحراف عن المتوسط ​​E(X): Var(X)=E[(X-E(X)) 2 ]

تشتتتحسب بواسطة الصيغة:

حيث x i هي القيمة التي يمكن أن يأخذها المتغير العشوائي، و μ هي القيمة المتوسطة ()، و p(x) هو احتمال أن يأخذ المتغير العشوائي القيمة x.

إذا كان المتغير العشوائي يحتوي على تشتتتحسب بواسطة الصيغة:

البعد الفروقيتوافق مع مربع وحدة قياس القيم الأصلية. على سبيل المثال، إذا كانت القيم في العينة تمثل قياسات الوزن الجزئي (بالكجم)، فإن بعد التباين سيكون كجم 2 . قد يكون من الصعب تفسير ذلك، لذا لوصف انتشار القيم، قيمة تساوي الجذر التربيعي لـ الفروقالانحراف المعياري.

بعض الخصائص الفروق:

Var(X+a)=Var(X)، حيث X متغير عشوائي وa ثابت.

فار(aХ)=أ 2 فار(X)

فار(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

يتم استخدام خاصية التشتت هذه في مقالة عن الانحدار الخطي.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y)، حيث X وY متغيران عشوائيان، Cov(X;Y) هو التباين المشترك لهذه المتغيرات العشوائية.

إذا كانت المتغيرات العشوائية مستقلة فإنها التغايريساوي 0، وبالتالي Var(X+Y)=Var(X)+Var(Y). يتم استخدام خاصية التشتت هذه في الاشتقاق.

دعونا نبين أنه بالنسبة للكميات المستقلة Var(X-Y)=Var(X+Y). في الواقع، Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 فار(Y)= فار(X)+فار(Y)= فار(X+Y). يتم استخدام خاصية التشتت هذه في البناء.

الانحراف المعياري للعينة

الانحراف المعياري للعينةهو مقياس لمدى انتشار القيم في العينة بالنسبة إلى قيمها.

أ-بريوري، الانحراف المعيارييساوي الجذر التربيعي ل الفروق:

الانحراف المعياريلا يأخذ في الاعتبار حجم القيم الموجودة فيه عينةولكن فقط درجة تشتت القيم حولهم متوسط. لتوضيح ذلك، دعونا نعطي مثالا.

دعونا نحسب الانحراف المعياري لعينتين: (1؛ 5؛ 9) و (1001؛ 1005؛ 1009). في كلتا الحالتين، ق = 4. ومن الواضح أن نسبة الانحراف المعياري إلى قيم المصفوفة تختلف بشكل كبير بين العينات. لمثل هذه الحالات يتم استخدامه معامل الاختلاف(معامل التباين، السيرة الذاتية) - النسبة الانحراف المعياريإلى المتوسط علم الحساب، معبرا عنها كنسبة مئوية.

في MS EXCEL 2007 والإصدارات السابقة للحساب الانحراف المعياري للعينةيتم استخدام الدالة =STDEVAL() باللغة الإنجليزية. اسم STDEV، أي. الانحراف المعياري. من إصدار MS EXCEL 2010، يوصى باستخدام نظيره =STDEV.B() باللغة الإنجليزية. اسم STDEV.S، أي. الانحراف المعياري للعينة.

بالإضافة إلى ذلك، بدءًا من إصدار MS EXCEL 2010، توجد وظيفة STANDARDEV.G() باللغة الإنجليزية. اسم STDEV.P، أي. السكان DEViation القياسي، الذي يحسب الانحراف المعياريل سكان. يعود الاختلاف بالكامل إلى المقام: بدلاً من n-1 كما في STANDARDEV.V()، يحتوي STANDARDEVAL.G() على n فقط في المقام.

الانحراف المعيارييمكن أيضًا حسابه مباشرةً باستخدام الصيغ أدناه (انظر ملف المثال)
=ROOT(QUADROTCL(عينة)/(COUNT(عينة)-1))
=ROOT((SUM(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/(COUNT(Sample)-1))

تدابير أخرى للتشتت

تقوم الدالة SQUADROTCL () بالحساب باستخدام مجموع الانحرافات التربيعية للقيم منها متوسط. ستُرجع هذه الدالة نفس النتيجة مثل الصيغة =DISP.G( عينة)*يفحص( عينة) ، أين عينة- إشارة إلى نطاق يحتوي على مجموعة من قيم العينة (). يتم إجراء الحسابات في الدالة QUADROCL() وفقًا للصيغة:

تعتبر الدالة SROTCL() أيضًا مقياسًا لانتشار مجموعة من البيانات. تقوم الدالة SROTCL () بحساب متوسط ​​القيم المطلقة لانحرافات القيم عنها متوسط. ستعيد هذه الوظيفة نفس نتيجة الصيغة =SUMPRODUCT(ABS(عينة-متوسط(عينة)))/COUNT(عينة)، أين عينة- رابط لنطاق يحتوي على مجموعة من قيم العينة.

يتم إجراء الحسابات في الدالة SROTCL () وفقًا للصيغة:

إلى جانب دراسة تباين الخاصية في جميع أنحاء المجتمع ككل، غالبًا ما يكون من الضروري تتبع التغيرات الكمية في الخاصية عبر المجموعات التي ينقسم إليها السكان، وكذلك بين المجموعات. يتم تحقيق دراسة التباين هذه عن طريق حساب وتحليل أنواع مختلفة من التباين.
هناك تباينات إجمالية وداخلية وداخلية.
إجمالي التباين σ 2يقيس تباين السمة في جميع أنحاء المجتمع تحت تأثير جميع العوامل التي تسببت في هذا التباين.

يميز التباين بين المجموعات (δ) التباين المنهجي، أي. الاختلافات في قيمة السمة المدروسة التي تنشأ تحت تأثير علامة العامل التي تشكل أساس المجموعة. ويتم حسابها باستخدام الصيغة:
.

التباين داخل المجموعة (σ)يعكس الاختلاف العشوائي، أي. جزء من التباين الذي يحدث تحت تأثير عوامل غير محسوبة ولا يعتمد على سمة العامل التي تشكل أساس المجموعة. يتم حسابه بواسطة الصيغة:
.

متوسط ​​الفروق داخل المجموعة: .

هناك قانون يربط بين 3 أنواع من التشتت. إجمالي التباين يساوي مجموع متوسط ​​التباين داخل المجموعة وبين المجموعة: .
وتسمى هذه النسبة قواعد لإضافة الفروق.

من المؤشرات المستخدمة على نطاق واسع في التحليل نسبة التباين بين المجموعات في التباين الإجمالي. تسمى معامل التحديد التجريبي (η 2): .
يسمى الجذر التربيعي لمعامل التحديد التجريبي نسبة الارتباط التجريبية (η):
.
وهو يصف تأثير الخاصية التي تشكل أساس المجموعة على تباين الخاصية الناتجة. تتراوح نسبة الارتباط التجريبية من 0 إلى 1.
دعونا نوضح استخدامه العملي باستخدام المثال التالي (الجدول 1).

المثال رقم 1. الجدول 1 - إنتاجية العمل لمجموعتين من العمال في إحدى ورش عمل NPO Cyclone

لنحسب المتوسطات والتباينات الكلية والمجموعة:




يتم عرض البيانات الأولية لحساب متوسط ​​التباين داخل المجموعة وبين المجموعات في الجدول. 2.
الجدول 2
حساب وδ 2 لمجموعتين من العمال.


المجموعات العمالية
عدد العمال، الناس متوسط، أطفال/وردية تشتت

الانتهاء من التدريب الفني

5 95 42,0

أولئك الذين لم يكملوا التدريب الفني

5 81 231,2

جميع العمال

10 88 185,6
دعونا نحسب المؤشرات. متوسط ​​الفروق داخل المجموعة:
.
التباين بين المجموعات

التباين الكلي:
وبالتالي فإن نسبة الارتباط التجريبية: .

جنبا إلى جنب مع الاختلاف في الخصائص الكمية، يمكن أيضا ملاحظة الاختلاف في الخصائص النوعية. يتم تحقيق دراسة التباين هذه عن طريق حساب أنواع التباينات التالية:

يتم تحديد تشتت المشاركة داخل المجموعة بواسطة الصيغة

أين ن ط– عدد الوحدات في مجموعات منفصلة.
حصة الخاصية المدروسة في جميع السكان والتي تحددها الصيغة:
وترتبط أنواع التباين الثلاثة ببعضها البعض على النحو التالي:
.

تسمى علاقة التباين هذه بنظرية إضافة تباينات حصة السمة.

من بين العديد من المؤشرات المستخدمة في الإحصاء، من الضروري تسليط الضوء على حساب التباين. تجدر الإشارة إلى أن إجراء هذا الحساب يدويًا يعد مهمة شاقة إلى حد ما. ولحسن الحظ، يحتوي برنامج Excel على وظائف تسمح لك بأتمتة إجراء الحساب. دعنا نتعرف على الخوارزمية الخاصة بالعمل مع هذه الأدوات.

التشتت هو مؤشر للتباين، وهو متوسط ​​مربع الانحرافات عن التوقع الرياضي. وبالتالي، فإنه يعبر عن انتشار الأرقام حول المتوسط. يمكن إجراء حساب التباين لكل من عامة السكان والعينة.

الطريقة الأولى: الحساب على أساس عدد السكان

لحساب هذا المؤشر في Excel لعامة السكان، استخدم الدالة ديسب.ز. بناء جملة هذا التعبير كما يلي:

DISP.G(Number1;Number2;…)

يمكن استخدام إجمالي من 1 إلى 255 وسيطة. يمكن أن تكون الوسائط إما قيمًا رقمية أو مراجع للخلايا الموجودة فيها.

دعونا نرى كيفية حساب هذه القيمة لنطاق يحتوي على بيانات رقمية.


الطريقة الثانية: الحساب حسب العينة

على عكس حساب القيمة على أساس عدد السكان، عند حساب العينة، لا يشير المقام إلى العدد الإجمالي للأرقام، بل يشير إلى رقم واحد أقل. ويتم ذلك لغرض تصحيح الخطأ. يأخذ Excel هذا الفارق الدقيق في الاعتبار في وظيفة خاصة مصممة لهذا النوع من الحسابات - DISP.V. يتم تمثيل بناء الجملة الخاص به بالصيغة التالية:

DISP.B(Number1;Number2;…)

يمكن أيضًا أن يتراوح عدد الوسائط، كما في الوظيفة السابقة، من 1 إلى 255.


كما ترون، يمكن لبرنامج Excel تسهيل حساب التباين إلى حد كبير. ويمكن حساب هذه الإحصائية عن طريق التطبيق، سواء من المجتمع أو من العينة. في هذه الحالة، تتلخص جميع إجراءات المستخدم في تحديد نطاق الأرقام المراد معالجتها، ويقوم برنامج Excel بالعمل الرئيسي بنفسه. وبطبيعة الحال، سيوفر هذا قدرا كبيرا من وقت المستخدم.

للبيانات المجمعة التباين المتبقي- متوسط ​​التباينات داخل المجموعة:

حيث σ 2 j هو التباين داخل المجموعة j.

بالنسبة للبيانات غير المجمعة التباين المتبقي- قياس دقة التقريب، أي تقريب خط الانحدار للبيانات الأصلية:
حيث y(t) هي التوقعات باستخدام معادلة الاتجاه؛ y t – سلسلة الديناميكيات الأولية؛ ن - عدد النقاط؛ ع – عدد معاملات معادلة الانحدار (عدد المتغيرات التوضيحية).
في هذا المثال يطلق عليه مقدر التباين غير المتحيز.

المثال رقم 1. يتميز توزيع العاملين في ثلاث مؤسسات تابعة لجمعية واحدة حسب فئات التعريفة بالبيانات التالية:

فئة تعريفة العاملعدد العاملين بالمؤسسة
المؤسسة 1المؤسسة 2المؤسسة 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

يُعرِّف:
1. التباين لكل مؤسسة (التباينات داخل المجموعة)؛
2. متوسط ​​التباينات داخل المجموعة.
3. التشتت بين المجموعات.
4. التباين الكلي.

حل.
قبل البدء في حل المشكلة، من الضروري معرفة أي ميزة فعالة وأيها عاملية. في المثال قيد النظر، السمة الناتجة هي "فئة التعريفة"، وسمة العامل هي "رقم (اسم) المؤسسة".
ثم لدينا ثلاث مجموعات (المؤسسات)، والتي من الضروري حساب متوسط ​​المجموعة والتباينات داخل المجموعة:


شركةمتوسط ​​المجموعة،التباين داخل المجموعة،
1 4 1,8

متوسط ​​التباينات داخل المجموعة ( التباين المتبقي) سيتم حسابها باستخدام الصيغة:


حيث يمكنك حساب:
أو:


ثم:
سيكون التباين الإجمالي مساوياً لـ: s 2 = 1.6 + 0 = 1.6.
يمكن أيضًا حساب التباين الإجمالي باستخدام إحدى الصيغتين التاليتين:

عند حل المشكلات العملية، غالبًا ما يتعين على المرء التعامل مع ميزة تأخذ قيمتين بديلتين فقط. في هذه الحالة، نحن لا نتحدث عن وزن قيمة معينة لميزة ما، ولكن عن حصتها في المجموع. إذا تمت الإشارة إلى نسبة الوحدات السكانية التي تمتلك الخاصية محل الدراسة بالرمز " ر"، والذين لا يملكون - من خلال" س"، فيمكن حساب التباين باستخدام الصيغة:
ق 2 = ع×ف

المثال رقم 2. استنادًا إلى بيانات الإنتاج لستة عمال في فريق، حدد التباين بين المجموعات وقم بتقييم تأثير نوبة العمل على إنتاجية العمل إذا كان إجمالي التباين 12.2.

عامل الفريق رقمإخراج العامل، جهاز كمبيوتر شخصى.
في التحول الأولفي التحول الثاني
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

حل. البيانات الأولية

Xو 1و 2و 3و 4و 5و 6المجموع
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
المجموع 31 33 37 37 40 38

ثم لدينا 6 مجموعات من الضروري حساب متوسط ​​المجموعة والتباينات داخل المجموعة.
1. أوجد متوسط ​​القيم لكل مجموعة.







2. أوجد متوسط ​​مربع كل مجموعة.







دعونا نلخص نتائج الحساب في جدول:
رقم المجموعةمتوسط ​​المجموعةالتباين داخل المجموعة
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. التباين داخل المجموعةيميز التغير (التباين) في الخاصية المدروسة (الناتجة) داخل المجموعة تحت تأثير جميع العوامل المؤثرة عليها باستثناء العامل الأساسي للتجميع:
نحسب متوسط ​​​​التباينات داخل المجموعة باستخدام الصيغة:


4. التباين بين المجموعاتيميز التغيير (التباين) في الخاصية المدروسة (الناتجة) تحت تأثير العامل (الخاصية العاملية) الذي يشكل أساس المجموعة.
نحدد التباين بين المجموعات على النحو التالي:

أين


ثم

التباين الكلييميز التغير (التباين) في الخاصية المدروسة (النتيجة) تحت تأثير جميع العوامل (الخصائص العاملية) دون استثناء. وبحسب شروط المشكلة فهي تساوي 12.2.
علاقة الارتباط التجريبيةيقيس أي جزء من التباين الكلي للخاصية الناتجة ناتج عن العامل قيد الدراسة. هذه هي نسبة تباين العوامل إلى التباين الكلي:

نحدد علاقة الارتباط التجريبية:

يمكن أن تكون الروابط بين الخصائص ضعيفة وقوية (قريبة). يتم تقييم معاييرهم على مقياس تشادوك:
0.1 0.3 0.5 0.7 0.9 في مثالنا العلاقة بين السمة Y والعامل X ضعيفة
معامل التحديد.

لنحدد معامل التحديد:

وبالتالي فإن 0.67% من التباين يرجع إلى الاختلافات بين الصفات، و99.37% يرجع إلى عوامل أخرى.
خاتمة: في هذه الحالة لا يعتمد إنتاج العمال على العمل في وردية محددة، أي. إن تأثير نوبة العمل على إنتاجية عملهم ليس كبيراً ويعود إلى عوامل أخرى.

المثال رقم 3. بناءً على بيانات متوسط ​​الأجور ومربعات الانحرافات عن قيمتها لمجموعتين من العمال، أوجد التباين الإجمالي بتطبيق قاعدة إضافة التباينات:

حل:
متوسط ​​الفروق داخل المجموعة

نحدد التباين بين المجموعات على النحو التالي:


سيكون التباين الإجمالي: 480 + 13824 = 14304

المؤشرات العامة الرئيسية للتباين في الإحصائيات هي التشتت والانحرافات المعيارية.

تشتت هذا المتوسط ​​الحسابي الانحرافات التربيعية لكل قيمة مميزة عن المتوسط ​​العام. ويسمى التباين عادة بمتوسط ​​مربع الانحرافات ويرمز له بالرمز  2. اعتماداً على البيانات المصدرية، يمكن حساب التباين باستخدام الوسط الحسابي البسيط أو المرجح:

 التباين غير المرجح (البسيط)؛

 التباين المرجح.

الانحراف المعياري هذه خاصية عامة للأحجام المطلقة الاختلافات علامات في المجموع. ويتم التعبير عنها بنفس وحدات القياس مثل السمة (بالأمتار، الأطنان، النسبة المئوية، الهكتار، وما إلى ذلك).

الانحراف المعياري هو الجذر التربيعي للتباين ويرمز له بالرمز :

 الانحراف المعياري غير الموزون؛

 الانحراف المعياري المرجح.

الانحراف المعياري هو مقياس لموثوقية المتوسط. كلما كان الانحراف المعياري أصغر، كلما كان المتوسط ​​الحسابي يعكس إجمالي السكان الممثلين بشكل أفضل.

حساب الانحراف المعياري يسبقه حساب التباين.

يكون الإجراء الخاص بحساب التباين الموزون كما يلي:

1) تحديد الوسط الحسابي المرجح:

2) حساب انحرافات الخيارات عن المتوسط:

3) قم بتربيع انحراف كل خيار عن المتوسط:

4) اضرب مربعات الانحرافات بالأوزان (التكرارات):

5) تلخيص المنتجات الناتجة:

6) يتم تقسيم المبلغ الناتج على مجموع الأوزان:

مثال 2.1

دعونا نحسب الوسط الحسابي المرجح:

يتم عرض قيم الانحرافات عن الوسط ومربعاتها في الجدول. دعونا نحدد التباين:

الانحراف المعياري سيكون مساوياً لـ:

إذا تم تقديم البيانات المصدر في شكل فاصل زمني سلسلة التوزيع ، فأنت بحاجة أولاً إلى تحديد القيمة المنفصلة للسمة، ثم تطبيق الطريقة الموضحة.

مثال 2.2

دعونا نعرض حساب التباين لسلسلة فاصلة باستخدام بيانات حول توزيع المساحة المزروعة في المزرعة الجماعية حسب إنتاجية القمح.

الوسط الحسابي هو:

دعونا نحسب التباين:

6.3. حساب التباين باستخدام صيغة تعتمد على البيانات الفردية

تقنية الحساب الفروق معقدة، ومع وجود قيم كبيرة من الخيارات والترددات يمكن أن تكون مرهقة. يمكن تبسيط الحسابات باستخدام خصائص التشتت.

التشتت لديه الخصائص التالية.

1. إن تقليل أو زيادة الأوزان (الترددات) ذات الخاصية المتغيرة بعدد معين من المرات لا يغير من التشتت.

2. إنقاص أو زيادة كل قيمة للخاصية بنفس المقدار الثابت ألا يغير التشتت.

3. تقليل أو زيادة كل قيمة سمة بعدد معين من المرات كعلى التوالي يقلل أو يزيد التباين في ك 2 مرات الانحراف المعياري  في كمرة واحدة.

4. يكون تشتت الخاصية بالنسبة إلى القيمة التعسفية دائمًا أكبر من التشتت بالنسبة إلى المتوسط ​​الحسابي لكل مربع للفرق بين القيم المتوسطة والقيم التعسفية:

لو أ= 0 فنصل إلى المساواة التالية:

أي أن تباين الخاصية يساوي الفرق بين مربع متوسط ​​قيم الخصائص ومربع الوسط.

يمكن استخدام كل خاصية بشكل مستقل أو بالاشتراك مع خصائص أخرى عند حساب التباين.

إجراء حساب التباين بسيط:

1) تحديد المتوسط ​​الحسابي :

2) تربيع الوسط الحسابي :

3) تربيع انحراف كل متغير من السلسلة:

X أنا 2 .

4) أوجد مجموع مربعات الخيارات:

5) اقسم مجموع مربعات الخيارات على عددها، أي حدد المربع المتوسط:

6) حدد الفرق بين مربع متوسط ​​الخاصية ومربع المتوسط:

مثال 3.1تتوفر البيانات التالية عن إنتاجية العمال:

لنقم بالحسابات التالية:




معظم الحديث عنه
ما هي أنواع الإفرازات التي تحدث أثناء الحمل المبكر؟ ما هي أنواع الإفرازات التي تحدث أثناء الحمل المبكر؟
تفسير الأحلام وتفسير الأحلام تفسير الأحلام وتفسير الأحلام
لماذا ترى قطة في المنام؟ لماذا ترى قطة في المنام؟


قمة