إن الخاصية المثالية للتباين هي متوسط انحراف المربع، والذي يسمى المعيار (أو الانحراف المعياري). الانحراف المعياري() يساوي الجذر التربيعي لمتوسط الانحراف المربع للقيم الفردية للسمة من الوسط الحسابي:

الانحراف المعياري بسيط:

يتم تطبيق الانحراف المعياري المرجح على البيانات المجمعة:

بين جذر متوسط المربعات ومتوسط الانحرافات الخطية في ظل ظروف التوزيع الطبيعي تحدث النسبة التالية: ~ 1.25.

يُستخدم الانحراف المعياري، باعتباره المقياس المطلق الرئيسي للتباين، في تحديد القيم الإحداثية لمنحنى التوزيع الطبيعي، وفي الحسابات المتعلقة بتنظيم مراقبة العينة وتحديد دقة خصائص العينة، وكذلك في تقييم حدود الاختلاف في خاصية ما في مجتمع متجانس.

التشتت، أنواعه، الانحراف المعياري.

تباين متغير عشوائي- مقياس لانتشار متغير عشوائي معين، أي انحرافه عن التوقع الرياضي. في الإحصائيات، غالبًا ما يتم استخدام التدوين أو. ويسمى الجذر التربيعي للتباين الانحراف المعياري، أو الانحراف المعياري، أو الانتشار المعياري.

التباين الكلي (σ 2) يقيس تباين السمة بأكملها تحت تأثير جميع العوامل التي تسببت في هذا التباين. وفي الوقت نفسه، وبفضل طريقة التجميع، من الممكن تحديد وقياس التباين الناتج عن خاصية التجميع والتباين الناشئ تحت تأثير العوامل غير المحسوبة.

التباين بين المجموعات (σ 2 م.ج) يميز التباين المنهجي، أي الاختلافات في قيمة الخاصية المدروسة التي تنشأ تحت تأثير الخاصية - العامل الذي يشكل أساس المجموعة.

الانحراف المعياري(مرادفات: الانحراف المعياري، الانحراف المعياري، الانحراف المربع؛ المصطلحات ذات الصلة: الانحراف المعياري، الانتشار المعياري) - في نظرية الاحتمالات والإحصاء، المؤشر الأكثر شيوعًا لتشتت قيم المتغير العشوائي بالنسبة لتوقعه الرياضي. مع صفائف محدودة من عينات القيم، بدلا من التوقع الرياضي، يتم استخدام الوسط الحسابي لمجموعة العينات.

يتم قياس الانحراف المعياري بوحدات المتغير العشوائي نفسه ويستخدم عند حساب الخطأ المعياري للوسط الحسابي، عند بناء فترات الثقة، عند اختبار الفرضيات إحصائيا، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.

الانحراف المعياري:

الانحراف المعياري(تقدير الانحراف المعياري للمتغير العشوائي سبالنسبة إلى توقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

أين التشتت؟ — أناالعنصر الرابع من الاختيار؛ - حجم العينة؛ - الوسط الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة، من المستحيل بناء تقدير غير متحيز. ومع ذلك، فإن التقدير المبني على تقدير التباين غير المتحيز ثابت.

جوهر ونطاق وإجراءات تحديد الوضع والوسيط.

بالإضافة إلى متوسطات القوة في الإحصائيات، للتوصيف النسبي لقيمة الخصائص المتغيرة والبنية الداخلية لسلسلة التوزيع، يتم استخدام المتوسطات الهيكلية، والتي يتم تمثيلها بشكل أساسي بواسطة الموضة والوسيط.

موضة- هذا هو الشكل الأكثر شيوعًا في السلسلة. تُستخدم الموضة، على سبيل المثال، في تحديد حجم الملابس والأحذية الأكثر طلبًا بين المشترين. وضع السلسلة المنفصلة هو الوضع ذو التردد الأعلى. عند حساب الوضع لسلسلة تباين الفاصل الزمني، يجب عليك أولاً تحديد الفاصل الزمني المشروط (استنادًا إلى الحد الأقصى للتكرار)، ثم قيمة القيمة المشروطة للسمة باستخدام الصيغة:

- - قيمة الموضة

- — الحد الأدنى للفاصل الزمني

- — قيمة الفاصل

- — تردد الفاصل الزمني

- — تردد الفترة التي تسبق الشكل

- — تردد الفترة التي تلي الشكل

الوسيط -هذه هي قيمة السمة التي تكمن وراء السلسلة المرتبة وتقسم هذه السلسلة إلى جزأين متساويين.

لتحديد الوسيط في سلسلة منفصلة في وجود ترددات، قم أولاً بحساب نصف مجموع الترددات ثم حدد قيمة المتغير التي تقع عليه. (إذا كانت السلسلة التي تم فرزها تحتوي على عدد فردي من الميزات، فسيتم حساب الرقم المتوسط باستخدام الصيغة:

M e = (n (إجمالي عدد الميزات) + 1)/2,

وفي حالة وجود عدد زوجي من المعالم، فإن الوسيط سيكون مساوياً لمتوسط المعلمتين الموجودتين في منتصف الصف).

عند الحساب الوسطاءبالنسبة لسلسلة تباين الفاصل الزمني، حدد أولاً الفاصل الزمني المتوسط الذي يقع فيه الوسيط، ثم حدد قيمة الوسيط باستخدام الصيغة:

- - الوسيط المطلوب

- - الحد الأدنى للفاصل الزمني الذي يحتوي على الوسيط

- — قيمة الفاصل

- — مجموع التكرارات أو عدد مصطلحات السلسلة

مجموع التكرارات المتراكمة للفترات التي تسبق الوسيط

- — تردد الفاصل الزمني المتوسط

مثال. العثور على الوضع والوسيط.

حل:
في هذا المثال، يقع الفاصل المشروط ضمن الفئة العمرية 25-30 عامًا، نظرًا لأن هذا الفاصل الزمني له أعلى تكرار (1054).

دعونا نحسب حجم الوضع:

وهذا يعني أن العمر النموذجي للطلاب هو 27 عامًا.

دعونا نحسب الوسيط. يقع الفاصل الزمني المتوسط في الفئة العمرية من 25 إلى 30 عامًا، حيث يوجد ضمن هذا الفاصل خيار يقسم السكان إلى جزأين متساويين (Σf i /2 = 3462/2 = 1731). بعد ذلك، نستبدل البيانات الرقمية اللازمة في الصيغة ونحصل على قيمة الوسيط:

وهذا يعني أن نصف الطلاب أقل من 27.4 عامًا، والنصف الآخر أكبر من 27.4 عامًا.

بالإضافة إلى المنوال والوسيط، يمكن استخدام مؤشرات مثل الربعيات، وتقسيم السلسلة المرتبة إلى 4 أجزاء متساوية، أعشارية- 10 أجزاء ونسب مئوية - لكل 100 جزء.

مفهوم المراقبة الانتقائية ونطاقها.

مراقبة انتقائيةينطبق عند استخدام المراقبة المستمرة مستحيل جسديابسبب كمية كبيرة من البيانات أو غير مجدية اقتصاديا. وتحدث الاستحالة المادية، على سبيل المثال، عند دراسة تدفقات الركاب وأسعار السوق وميزانيات الأسرة. يحدث عدم الجدوى الاقتصادية عند تقييم جودة السلع المرتبطة بتدميرها، على سبيل المثال، التذوق، واختبار الطوب للقوة، وما إلى ذلك.

تشكل الوحدات الإحصائية المختارة للمراقبة إطار أخذ العينات أو العينة، وتشكل مجموعتها بأكملها المجتمع العام (GS). في هذه الحالة، يتم الإشارة إلى عدد الوحدات في العينة بواسطة ن، وفي النظام المنسق بأكمله - ن. سلوك ن / نيسمى الحجم النسبي أو نسبة العينة.

تعتمد جودة نتائج مراقبة العينة على تمثيلية العينة، أي على مدى تمثيلها في قطاع غزة. لضمان تمثيل العينة، فمن الضروري الامتثال مبدأ الاختيار العشوائي للوحدات، والذي يفترض أن إدراج وحدة النظام المنسق في العينة لا يمكن أن يتأثر بأي عامل آخر غير الصدفة.

موجود 4 طرق للاختيار العشوائيلأخذ عينات:

عشوائية في الواقعالاختيار أو "طريقة اليانصيب"، عندما يتم تعيين أرقام تسلسلية للكميات الإحصائية، المسجلة على كائنات معينة (على سبيل المثال، البراميل)، والتي يتم بعد ذلك خلطها في بعض الحاويات (على سبيل المثال، في كيس) واختيارها عشوائيًا. ومن الناحية العملية، يتم تنفيذ هذه الطريقة باستخدام مولد أرقام عشوائية أو جداول رياضية للأرقام العشوائية.
ميكانيكيالاختيار وفقا لكل ( لا/ن)-القيمة الرابعة لعامة السكان. على سبيل المثال، إذا كانت تحتوي على 100000 قيمة، وتحتاج إلى تحديد 1000، فسيتم تضمين كل 100000 / 1000 = القيمة رقم 100 في العينة. علاوة على ذلك، إذا لم يتم ترتيبهم، فسيتم اختيار الأول عشوائيًا من المائة الأولى، وستكون أعداد الآخرين أعلى بمائة. فمثلاً إذا كانت الوحدة الأولى رقم 19 فالتالية يجب أن تكون رقم 119 ثم رقم 219 ثم رقم 319 وهكذا. وفي حالة ترتيب الوحدات السكانية، يتم اختيار رقم 50 أولاً، ثم رقم 150، ثم رقم 250، وهكذا.
يتم اختيار القيم من مجموعة بيانات غير متجانسة طبقيةالطريقة (الطبقية)، عندما يتم تقسيم السكان أولاً إلى مجموعات متجانسة يتم تطبيق الاختيار العشوائي أو الميكانيكي عليها.
وهناك طريقة خاصة لأخذ العينات مسلسلالاختيار، حيث لا يختارون بشكل عشوائي أو ميكانيكي القيم الفردية، ولكن سلسلتهم (تسلسلات من رقم ما إلى رقم ما على التوالي)، والتي يتم من خلالها إجراء المراقبة المستمرة.

تعتمد جودة ملاحظات العينة أيضًا على نوع العينة: معادأو غير قابل للتكرار.

في إعادة الاختياريتم إرجاع القيم الإحصائية أو سلاسلها المتضمنة في العينة إلى عامة السكان بعد استخدامها، مع وجود فرصة لإدراجها في عينة جديدة. علاوة على ذلك، فإن جميع القيم في المجتمع لها نفس احتمالية إدراجها في العينة.

اختيار غير متكرريعني أن القيم الإحصائية أو سلسلتها المتضمنة في العينة لا تعود إلى عموم السكان بعد الاستخدام، وبالتالي بالنسبة للقيم المتبقية للأخيرة يزداد احتمال إدراجها في العينة التالية.

ويعطي أخذ العينات غير المتكررة نتائج أكثر دقة، لذلك يتم استخدامه في كثير من الأحيان. ولكن هناك حالات لا يمكن فيها تطبيقها (دراسة تدفقات الركاب، وطلب المستهلكين، وما إلى ذلك) ثم يتم إجراء الاختيار المتكرر.

الحد الأقصى لخطأ أخذ عينات المراقبة، ومتوسط خطأ أخذ العينات، وإجراءات حسابها.

دعونا نفكر بالتفصيل في طرق تكوين عينة السكان المذكورة أعلاه والأخطاء التي تنشأ عند القيام بذلك. التمثيل .
عشوائية بشكل صحيحتعتمد عملية أخذ العينات على اختيار وحدات من المجتمع بشكل عشوائي دون أي عناصر منهجية. من الناحية الفنية، يتم الاختيار العشوائي الفعلي عن طريق القرعة (على سبيل المثال، اليانصيب) أو باستخدام جدول أرقام عشوائية.

ونادرا ما يستخدم الاختيار العشوائي السليم “في شكله النقي” في ممارسة الملاحظة الانتقائية، ولكنه الأصل بين أنواع الاختيار الأخرى، فهو يطبق المبادئ الأساسية للملاحظة الانتقائية. دعونا نفكر في بعض الأسئلة المتعلقة بنظرية طريقة أخذ العينات وصيغة الخطأ لعينة عشوائية بسيطة.

أخذ العينات التحيزهو الفرق بين قيمة المعلمة في عموم السكان وقيمتها المحسوبة من نتائج ملاحظة العينة. بالنسبة للخاصية الكمية المتوسطة، يتم تحديد خطأ أخذ العينات بواسطة

ويسمى المؤشر خطأ أخذ العينات الهامشي.
متوسط العينة هو متغير عشوائي يمكن أن يأخذ قيمًا مختلفة اعتمادًا على الوحدات المضمنة في العينة. ولذلك، فإن أخطاء أخذ العينات هي أيضًا متغيرات عشوائية ويمكن أن تأخذ قيمًا مختلفة. ولذلك يتم تحديد متوسط الأخطاء المحتملة - متوسط خطأ أخذ العينات، والذي يعتمد على:

حجم العينة: كلما زاد العدد، قل متوسط الخطأ؛

درجة التغير في الخاصية محل الدراسة: كلما كان التغير في الخاصية أصغر، وبالتالي التشتت، كلما قل متوسط خطأ العينة.

في إعادة الاختيار العشوائييتم حساب متوسط الخطأ:
.
ومن الناحية العملية، فإن التباين العام غير معروف بدقة، ولكن في نظرية الاحتمالاتلقد ثبت ذلك
.
وبما أن قيمة n كبيرة بما فيه الكفاية قريبة من 1، يمكننا أن نفترض ذلك. ومن ثم يمكن حساب متوسط خطأ أخذ العينات:
.
ولكن في حالات عينة صغيرة (مع ن<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

في أخذ العينات العشوائية غير التكراريةيتم تعديل الصيغ المعطاة بالقيمة. ومن ثم فإن متوسط خطأ أخذ العينات غير التكراري هو:
و .
لأن دائمًا أقل، فإن المضاعف () دائمًا أقل من 1. وهذا يعني أن متوسط الخطأ أثناء الاختيار غير المتكرر يكون دائمًا أقل منه أثناء الاختيار المتكرر.
أخذ العينات الميكانيكيةيتم استخدامه عندما يتم ترتيب إجمالي عدد السكان بطريقة ما (على سبيل المثال، قوائم الناخبين أبجديًا، وأرقام الهواتف، وأرقام المنازل، وأرقام الشقق). ويتم اختيار الوحدات في فترة زمنية معينة، وهي تساوي معكوس النسبة المئوية لأخذ العينات. لذا، مع عينة 2%، يتم اختيار كل 50 وحدة = 1/0.02، مع عينة 5%، كل 1/0.05 = 20 وحدة من عموم السكان.

يتم تحديد النقطة المرجعية بطرق مختلفة: بشكل عشوائي، من منتصف الفاصل الزمني، مع تغيير النقطة المرجعية. الشيء الرئيسي هو تجنب الخطأ المنهجي. على سبيل المثال، في عينة 5%، إذا كانت الوحدة الأولى هي الثالثة عشر، فإن الوحدات التالية هي 33، 53، 73، إلخ.

من حيث الدقة، فإن الاختيار الميكانيكي قريب من أخذ العينات العشوائية الفعلية. ولذلك، لتحديد متوسط الخطأ في أخذ العينات الميكانيكية، يتم استخدام صيغ الاختيار العشوائي المناسبة.

في اختيار نموذجي يتم تقسيم السكان الذين يتم استطلاعهم بشكل مبدئي إلى مجموعات متجانسة ومتشابهة. على سبيل المثال، عند مسح المؤسسات، يمكن أن تكون هذه الصناعات أو القطاعات الفرعية. عند دراسة السكان، يمكن أن تكون هذه المناطق أو الفئات الاجتماعية أو العمرية. ثم يتم إجراء اختيار مستقل من كل مجموعة بطريقة ميكانيكية أو عشوائية بحتة.

يؤدي أخذ العينات النموذجي إلى نتائج أكثر دقة من الطرق الأخرى. تضمن كتابة المجتمع العام تمثيل كل مجموعة نمطية في العينة، مما يلغي تأثير التباين بين المجموعات على متوسط خطأ أخذ العينات. وبالتالي، عند العثور على خطأ عينة نموذجية وفقا لقاعدة إضافة التباينات ()، من الضروري أن نأخذ في الاعتبار متوسط تباينات المجموعة فقط. ثم متوسط خطأ أخذ العينات هو:
عند إعادة الاختيار
,
مع عدم التكرار في الاختيار
,
أين - متوسط التباينات داخل المجموعة في العينة.

اختيار المسلسل (أو العش). يستخدم عندما يتم تقسيم السكان إلى سلاسل أو مجموعات قبل بدء مسح العينة. يمكن أن تكون هذه السلسلة عبارة عن عبوات للمنتجات النهائية ومجموعات الطلاب والفرق. يتم اختيار السلاسل للفحص ميكانيكياً أو عشوائياً بحتاً، وضمن السلاسل يتم إجراء فحص مستمر للوحدات. ولذلك، فإن متوسط خطأ أخذ العينات يعتمد فقط على التباين بين المجموعات (السلاسل البينية)، والذي يتم حسابه باستخدام الصيغة:

حيث r هو عدد السلاسل المحددة؛
- متوسط السلسلة i-th.

يتم حساب متوسط خطأ أخذ العينات التسلسلي:

عند إعادة الاختيار:
,
مع اختيار غير متكرر:
,
حيث R هو العدد الإجمالي للحلقات.

مجموعاختيارهو مزيج من طرق الاختيار المدروسة.

يعتمد متوسط خطأ أخذ العينات لأي طريقة من طرق أخذ العينات بشكل أساسي على الحجم المطلق للعينة، وبدرجة أقل، على النسبة المئوية للعينة. لنفترض أنه تم إجراء 225 ملاحظة في الحالة الأولى من عدد سكان يبلغ 4500 وحدة وفي الحالة الثانية من عدد سكان يبلغ 225000 وحدة. التباينات في الحالتين تساوي 25. ففي الحالة الأولى، مع اختيار 5%، سيكون خطأ المعاينة:

في الحالة الثانية، مع اختيار 0.1%، سيكون مساوياً لـ:

هكذاومع انخفاض نسبة أخذ العينات بمقدار 50 مرة، زاد خطأ أخذ العينات بشكل طفيف، حيث لم يتغير حجم العينة.
لنفترض أن حجم العينة قد زاد إلى 625 ملاحظة. وفي هذه الحالة يكون خطأ أخذ العينات كما يلي:

إن زيادة العينة بمقدار 2.8 مرة بنفس حجم السكان يقلل من حجم خطأ العينة بأكثر من 1.6 مرة.

طرق وتقنيات تكوين مجتمع العينة.

في الإحصاء، يتم استخدام طرق مختلفة لتشكيل مجتمعات العينة، والتي تحددها أهداف الدراسة وتعتمد على تفاصيل موضوع الدراسة.

الشرط الأساسي لإجراء مسح العينة هو منع حدوث أخطاء منهجية ناشئة عن انتهاك مبدأ تكافؤ الفرص لكل وحدة من عموم السكان المراد تضمينهم في العينة. يتم منع الأخطاء المنهجية من خلال استخدام الأساليب العلمية لتشكيل مجتمع العينة.

هناك الطرق التالية لاختيار الوحدات من السكان:

1) الاختيار الفردي - يتم اختيار الوحدات الفردية للعينة؛

2) اختيار المجموعة - تتضمن العينة مجموعات متجانسة نوعيا أو سلسلة من الوحدات قيد الدراسة؛

3) الاختيار المشترك هو مزيج من الاختيار الفردي والجماعي.
يتم تحديد طرق الاختيار من خلال قواعد تشكيل عينة السكان.

يمكن أن تكون العينة:

عشوائية في الواقعيتمثل في حقيقة أن مجتمع العينة يتكون نتيجة الاختيار العشوائي (غير المقصود) للوحدات الفردية من عامة السكان. وفي هذه الحالة، عادة ما يتم تحديد عدد الوحدات المختارة في مجتمع العينة على أساس نسبة العينة المقبولة. نسبة العينة هي نسبة عدد الوحدات في مجتمع العينة n إلى عدد الوحدات في عموم السكان N، أي.

ميكانيكييتكون من حقيقة أن اختيار الوحدات في عينة السكان يتم من عامة السكان، مقسمة إلى فترات (مجموعات) متساوية. وفي هذه الحالة، يكون حجم الفاصل الزمني في المجتمع يساوي معكوس نسبة العينة. لذلك، مع عينة 2%، يتم اختيار كل وحدة 50 (1:0.02)، مع عينة 5%، كل وحدة 20 (1:0.05)، إلخ. وبالتالي، وفقًا لنسبة الاختيار المقبولة، يتم تقسيم عامة السكان ميكانيكيًا إلى مجموعات متساوية الحجم. ويتم اختيار وحدة واحدة فقط من كل مجموعة للعينة.
عادي -حيث يتم تقسيم عامة السكان أولاً إلى مجموعات نموذجية متجانسة. ثم، من كل مجموعة نموذجية، يتم استخدام عينة عشوائية أو ميكانيكية بحتة لاختيار الوحدات بشكل فردي في مجتمع العينة. من السمات المهمة للعينة النموذجية أنها تعطي نتائج أكثر دقة مقارنة بالطرق الأخرى لاختيار الوحدات في مجتمع العينة؛
مسلسل- حيث يتم تقسيم عامة السكان إلى مجموعات متساوية الحجم - سلسلة. يتم اختيار السلسلة في عينة السكان. ضمن السلسلة، يتم إجراء المراقبة المستمرة للوحدات المتضمنة في السلسلة؛
مجموع- يمكن أن يكون أخذ العينات على مرحلتين. في هذه الحالة، يتم تقسيم السكان أولاً إلى مجموعات. ثم يتم اختيار المجموعات، وضمن الأخيرة يتم اختيار الوحدات الفردية.

في الإحصاء، هناك الطرق التالية لاختيار الوحدات في عينة السكان::

مرحلة واحدةأخذ العينات - تخضع كل وحدة مختارة للدراسة على الفور وفقا لمعيار معين (أخذ العينات العشوائية والتسلسلية المناسبة)؛
متعدد المراحلأخذ العينات - يتم الاختيار من إجمالي عدد السكان للمجموعات الفردية، ويتم اختيار الوحدات الفردية من المجموعات (أخذ عينات نموذجية بطريقة ميكانيكية لاختيار الوحدات في مجتمع العينة).

بالإضافة إلى ذلك، هناك:

إعادة الاختيار- حسب مخطط الكرة المرتجعة. في هذه الحالة، يتم إرجاع كل وحدة أو سلسلة مدرجة في العينة إلى عامة السكان، وبالتالي يكون لديها فرصة لإدراجها في العينة مرة أخرى؛
اختيار غير متكرر- حسب مخطط الكرة غير المرتجعة. لديها نتائج أكثر دقة بنفس حجم العينة.

تحديد حجم العينة المطلوبة (باستخدام جدول t الخاص بالطالب).

أحد المبادئ العلمية في نظرية أخذ العينات هو التأكد من اختيار عدد كاف من الوحدات. من الناحية النظرية، يتم عرض الحاجة إلى الامتثال لهذا المبدأ في أدلة نظريات الحد في نظرية الاحتمالات، والتي تجعل من الممكن تحديد حجم الوحدات التي ينبغي اختيارها من السكان بحيث تكون كافية وتضمن تمثيل العينة.

إن الانخفاض في خطأ أخذ العينات المعياري، وبالتالي زيادة دقة التقدير، يرتبط دائمًا بزيادة في حجم العينة، لذلك، بالفعل في مرحلة تنظيم مراقبة العينة، من الضروري تحديد حجم العينة يجب أن يكون مجتمع العينة من أجل ضمان الدقة المطلوبة لنتائج المراقبة. ويتم حساب حجم العينة المطلوب باستخدام صيغ مشتقة من صيغ الحد الأقصى لأخطاء أخذ العينات (A)، التي تتوافق مع نوع معين وطريقة اختيار معينة. لذلك، بالنسبة لحجم العينة العشوائي المتكرر (n) لدينا:

وجوهر هذه الصيغة هو أنه مع الاختيار العشوائي المتكرر للعدد المطلوب يتناسب حجم العينة طرديا مع مربع معامل الثقة (ت2)وتباين الخاصية التباينية (?2) ويتناسب عكسياً مع مربع الحد الأقصى لخطأ المعاينة (?2). وعلى وجه الخصوص، مع زيادة الحد الأقصى للخطأ بعامل اثنين، يمكن تقليل حجم العينة المطلوب بعامل أربعة. من بين المعلمات الثلاثة، تم تعيين اثنين (t و؟) من قبل الباحث.

وفي الوقت نفسه، استنادا إلى الباحثمن غرض وأهداف مسح العينة، يجب حل السؤال: في أي مجموعة كمية من الأفضل تضمين هذه المعلمات لضمان الخيار الأمثل؟ في إحدى الحالات، قد يكون راضيًا عن موثوقية النتائج التي تم الحصول عليها (t) أكثر من رضاه عن مقياس الدقة (؟)، وفي حالة أخرى - والعكس صحيح. من الأصعب حل المشكلة المتعلقة بقيمة الحد الأقصى لخطأ المعاينة، حيث أن الباحث لا يملك هذا المؤشر في مرحلة تصميم ملاحظة العينة، لذلك من الناحية العملية جرت العادة على تحديد قيمة الحد الأقصى لخطأ المعاينة، عادة في حدود 10% من متوسط المستوى المتوقع للسمة. يمكن الوصول إلى تحديد المتوسط المقدر بطرق مختلفة: استخدام البيانات من المسوحات السابقة المماثلة، أو استخدام البيانات من إطار أخذ العينات وإجراء عينة تجريبية صغيرة.

إن أصعب ما يمكن تحديده عند تصميم عينة المراقبة هو المعلمة الثالثة في الصيغة (5.2) - تشتت مجتمع العينة. وفي هذه الحالة، من الضروري استخدام جميع المعلومات الموجودة تحت تصرف الباحث، والتي تم الحصول عليها في المسوحات المماثلة والتجريبية التي أجريت سابقًا.

سؤال حول التعريفويصبح حجم العينة المطلوب أكثر تعقيدا إذا كان مسح العينات يتضمن دراسة عدة خصائص لوحدات المعاينة. في هذه الحالة، يكون متوسط مستويات كل من الخصائص وتنوعها، كقاعدة عامة، مختلفًا، وبالتالي فإن تحديد التباين في أي من الخصائص التي يجب تفضيلها لا يمكن تحقيقه إلا مع مراعاة غرض وأهداف استطلاع.

عند تصميم عينة المراقبة، يتم افتراض قيمة محددة مسبقًا لخطأ العينة المسموح به وفقًا لأهداف دراسة معينة واحتمالية الاستنتاجات بناءً على نتائج الملاحظة.

بشكل عام، تسمح لنا صيغة الحد الأقصى للخطأ في متوسط العينة بتحديد:

حجم الانحرافات المحتملة للمؤشرات السكانية العامة عن المؤشرات السكانية للعينة؛

حجم العينة المطلوب، بما يضمن الدقة المطلوبة، بحيث لا تتجاوز حدود الخطأ المحتمل قيمة معينة محددة؛

احتمال أن يكون للخطأ في العينة حد محدد.

توزيع الطلابفي نظرية الاحتمالات، هي عائلة ذات معلمة واحدة من التوزيعات المستمرة تمامًا.

السلسلة الديناميكية (الفاصل الزمني، العزم)، السلسلة الديناميكية الختامية.

سلسلة ديناميات- هذه هي قيم المؤشرات الإحصائية التي يتم تقديمها بتسلسل زمني معين.

تحتوي كل سلسلة زمنية على عنصرين:

1) مؤشرات الفترات الزمنية (السنوات أو الأرباع أو الأشهر أو الأيام أو التواريخ)؛

2) المؤشرات المميزة للكائن قيد الدراسة لفترات زمنية أو في تواريخ مقابلة والتي تسمى بمستويات السلسلة.

يتم التعبير عن مستويات السلسلةكلا من القيم المطلقة والمتوسطة أو النسبية. اعتمادا على طبيعة المؤشرات، يتم إنشاء سلاسل زمنية من القيم المطلقة والنسبية والمتوسطة. يتم إنشاء السلسلة الديناميكية من القيم النسبية والمتوسطة على أساس سلسلة مشتقة من القيم المطلقة. هناك سلسلة زمنية ولحظية من الديناميكيات.

سلسلة الفاصل الديناميكييحتوي على قيم المؤشرات لفترات زمنية معينة. وفي سلسلة فواصل زمنية يمكن جمع المستويات للحصول على حجم الظاهرة على مدى فترة أطول، أو ما يسمى بالمجاميع المتراكمة.

سلسلة اللحظات الديناميكيةيعكس قيم المؤشرات في وقت معين (التاريخ الزمني). وفي المتسلسلة العزومية قد يهتم الباحث فقط باختلاف الظواهر التي تعكس التغير في مستوى المتسلسلة بين تواريخ معينة، حيث أن مجموع المستويات هنا ليس له محتوى حقيقي. لا يتم حساب المجاميع التراكمية هنا.

الشرط الأكثر أهمية للبناء الصحيح للسلاسل الزمنية هو مقارنة مستويات السلسلة التي تنتمي إلى فترات مختلفة. ويجب تقديم المستويات بكميات متجانسة، كما يجب أن يكون هناك اكتمال متساوي لتغطية الأجزاء المختلفة من الظاهرة.

بغرضلتجنب تشويه الديناميكيات الحقيقية، يتم إجراء حسابات أولية في الدراسة الإحصائية (إغلاق سلسلة الديناميكيات)، والتي تسبق التحليل الإحصائي للسلسلة الزمنية. يُفهم إغلاق السلسلة الديناميكية على أنه مزيج من سلسلتين أو أكثر في سلسلة واحدة، يتم حساب مستوياتها باستخدام منهجية مختلفة أو لا تتوافق مع الحدود الإقليمية، وما إلى ذلك. قد يعني إغلاق سلسلة الديناميكيات أيضًا جلب المستويات المطلقة لسلسلة الديناميكيات إلى أساس مشترك، مما يحيد عدم إمكانية المقارنة بين مستويات سلسلة الديناميكيات.

مفهوم المقارنة بين المتسلسلة الديناميكية والمعاملات والنمو ومعدلات النمو.

سلسلة ديناميات- هذه سلسلة من المؤشرات الإحصائية التي تميز تطور الظواهر الطبيعية والاجتماعية مع مرور الوقت. تحتوي المجموعات الإحصائية التي نشرتها لجنة الدولة للإحصاء في روسيا على عدد كبير من سلاسل الديناميكيات في شكل جدول. تتيح السلسلة الديناميكية تحديد أنماط تطور الظواهر قيد الدراسة.

تحتوي سلسلة الديناميكيات على نوعين من المؤشرات. مؤشرات الوقت(سنوات، أرباع، أشهر، إلخ) أو نقاط زمنية (في بداية العام، في بداية كل شهر، إلخ). مؤشرات مستوى الصف. يمكن التعبير عن مؤشرات مستويات سلسلة الديناميكيات بالقيم المطلقة (إنتاج المنتجات بالطن أو الروبل)، والقيم النسبية (نسبة سكان الحضر في المائة) والقيم المتوسطة (متوسط أجور عمال الصناعة حسب السنة ، إلخ.). في شكل جدول، تحتوي السلسلة الزمنية على عمودين أو صفين.

يتطلب البناء الصحيح للسلاسل الزمنية استيفاء عدد من المتطلبات:

يجب أن تكون جميع مؤشرات سلسلة الديناميكيات مبنية على أسس علمية وموثوقة؛
يجب أن تكون مؤشرات سلسلة من الديناميكيات قابلة للمقارنة مع مرور الوقت، أي. يجب أن يتم حسابها لنفس الفترات الزمنية أو في نفس التواريخ؛
ويجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة في جميع أنحاء الإقليم؛
يجب أن تكون مؤشرات سلسلة الديناميكيات قابلة للمقارنة في المحتوى، أي. وتحسب وفق منهجية واحدة وبنفس الطريقة؛
وينبغي أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر نطاق المزارع التي تؤخذ في الاعتبار. يجب إعطاء جميع مؤشرات سلسلة الديناميكيات في نفس وحدات القياس.

المؤشرات الإحصائيةيمكن وصف نتائج العملية قيد الدراسة على مدى فترة من الزمن، أو حالة الظاهرة قيد الدراسة في نقطة زمنية معينة، أي. يمكن أن تكون المؤشرات فاصلة (دورية) ولحظية. وبناء على ذلك، في البداية يمكن أن تكون سلسلة الديناميكيات إما فاصلة أو لحظة. يمكن لسلسلة ديناميكيات العزوم بدورها أن تكون ذات فترات زمنية متساوية أو غير متساوية.

يمكن تحويل سلسلة الديناميكيات الأصلية إلى سلسلة من القيم المتوسطة وسلسلة من القيم النسبية (السلسلة والأساسية). تسمى هذه السلاسل الزمنية بالسلاسل الزمنية المشتقة.

تختلف منهجية حساب المستوى المتوسط في السلسلة الديناميكية اعتمادًا على نوع السلسلة الديناميكية. باستخدام الأمثلة، سننظر في أنواع السلاسل الديناميكية والصيغ لحساب المستوى المتوسط.

الزيادات المطلقة (Δy) أظهر عدد الوحدات التي تغير فيها المستوى اللاحق للسلسلة مقارنة بالمستوى السابق (gr. 3. - الزيادات المطلقة للسلسلة) أو مقارنة بالمستوى الأولي (gr. 4. - الزيادات المطلقة الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

عندما تنخفض القيم المطلقة للسلسلة، سيكون هناك "نقصان" أو "نقصان"، على التوالي.

وتشير مؤشرات النمو المطلق إلى أنه على سبيل المثال، ارتفع إنتاج المنتج "أ" عام 1998 بمقدار 4 آلاف طن مقارنة بعام 1997، وبنحو 34 ألف طن مقارنة بعام 1994؛ لسنوات أخرى، انظر الجدول. 11.5 جرام. 3 و 4.

معدل النمويوضح عدد المرات التي تغير فيها مستوى السلسلة مقارنة بالمستوى السابق (جرام 5 - معاملات السلسلة للنمو أو الانخفاض) أو مقارنة بالمستوى الأولي (جرام 6 - المعاملات الأساسية للنمو أو الانخفاض). يمكن كتابة صيغ الحساب على النحو التالي:

معدلات النموأظهر النسبة المئوية للمستوى التالي من السلسلة مقارنة بالمستوى السابق (جرام 7 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (جرام 8 - معدلات النمو الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

لذلك، على سبيل المثال، في عام 1997، كان حجم إنتاج المنتج "أ" مقارنة بعام 1996 هو 105.5% (

معدل النموأظهر النسبة المئوية التي ارتفع بها مستوى الفترة المشمولة بالتقرير مقارنة بالمستوى السابق (العمود 9 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (العمود 10 - معدلات النمو الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

T pr = T r - 100% أو T pr = النمو المطلق / مستوى الفترة السابقة * 100%

لذلك، على سبيل المثال، في عام 1996، مقارنة بعام 1995، تم إنتاج المنتج "أ" بنسبة 3.8٪ (103.8٪ - 100٪) أو (8:210)×100٪ أكثر، ومقارنة بعام 1994 - بنسبة 9٪ (109٪ - 100%).

إذا انخفضت المستويات المطلقة في السلسلة فإن المعدل سيكون أقل من 100%، وبالتالي سيكون هناك معدل الانخفاض (معدل الزيادة بعلامة الطرح).

القيمة المطلقة للزيادة 1%(العمود 11) يوضح عدد الوحدات التي يجب إنتاجها في فترة معينة بحيث يرتفع مستوى الفترة السابقة بنسبة 1%. في مثالنا، في عام 1995، كان من الضروري إنتاج 2.0 ألف طن، وفي عام 1998 - 2.3 ألف طن، أي. أكبر بكثير.

يمكن تحديد القيمة المطلقة للنمو بنسبة 1% بطريقتين:

مستوى الفترة السابقة مقسم على 100؛

يتم تقسيم الزيادات المطلقة في السلسلة على معدلات نمو السلسلة المقابلة.

القيمة المطلقة للزيادة 1% =

في الديناميكيات، خاصة على مدى فترة طويلة، من المهم إجراء تحليل مشترك لمعدل النمو مع محتوى كل نسبة زيادة أو نقصان.

لاحظ أن المنهجية المدروسة لتحليل السلاسل الزمنية تنطبق على السلاسل الزمنية، التي يتم التعبير عن مستوياتها بالقيم المطلقة (ر، ألف روبل، عدد الموظفين، وما إلى ذلك)، وعلى السلاسل الزمنية، مستوياتها يتم التعبير عنها بمؤشرات نسبية (% من العيوب، % من محتوى الرماد في الفحم، وما إلى ذلك) أو القيم المتوسطة (متوسط العائد بالسنتيمتر/هكتار، ومتوسط الأجر، وما إلى ذلك).

إلى جانب المؤشرات التحليلية المدروسة، والتي يتم حسابها لكل سنة مقارنة بالمستوى السابق أو الأولي، عند تحليل سلسلة الديناميكيات، من الضروري حساب متوسط المؤشرات التحليلية للفترة: متوسط مستوى السلسلة، متوسط الزيادة السنوية المطلقة (النقصان) ومتوسط معدل النمو السنوي ومعدل النمو.

تمت مناقشة طرق حساب المستوى المتوسط لسلسلة من الديناميكيات أعلاه. في سلسلة ديناميكيات الفاصل التي ندرسها، يتم حساب المستوى المتوسط للسلسلة باستخدام صيغة المتوسط الحسابي البسيط:

متوسط حجم الإنتاج السنوي للمنتج للأعوام 1994-1998. بلغت 218.4 ألف طن.

يتم حساب متوسط النمو المطلق السنوي أيضًا باستخدام صيغة المتوسط الحسابي البسيط:

وتراوحت الزيادات المطلقة السنوية على مر السنين من 4 إلى 12 ألف طن (أنظر العمود 3)، ومتوسط الزيادة السنوية في الإنتاج خلال الفترة 1995 - 1998. بلغت 8.5 ألف طن.

تتطلب طرق حساب متوسط معدل النمو ومتوسط معدل النمو دراسة أكثر تفصيلاً. دعونا ننظر فيها باستخدام مثال مؤشرات مستوى السلسلة السنوية الواردة في الجدول.

المستوى المتوسط للسلسلة الديناميكية.

السلسلة الديناميكية (أو السلسلة الزمنية)- هذه هي القيم العددية لمؤشر إحصائي معين في لحظات أو فترات زمنية متتالية (أي مرتبة حسب الترتيب الزمني).

يتم استدعاء القيم العددية لمؤشر إحصائي أو آخر تشكل سلسلة الديناميكيات مستويات السلسلةوعادة ما يتم الإشارة إليه بالحرف ذ. الترم الأول من السلسلة ذ 1يسمى الأولي أو مستوى أساسي، وآخر واحد ذ ن - أخير. يتم تحديد اللحظات أو الفترات الزمنية التي تتعلق بها المستويات ر.

يتم عرض المتسلسلة الديناميكية عادةً في شكل جدول أو رسم بياني، مع إنشاء مقياس زمني على طول محور الإحداثي السيني روعلى طول الإحداثي - مقياس مستويات السلسلة ذ.

متوسط مؤشرات سلسلة الديناميكيات

يمكن اعتبار كل سلسلة من الديناميكيات بمثابة مجموعة معينة نالمؤشرات المتغيرة بمرور الوقت والتي يمكن تلخيصها كمتوسطات. تعتبر هذه المؤشرات المعممة (المتوسطة) ضرورية بشكل خاص عند مقارنة التغيرات في مؤشر معين خلال فترات مختلفة، في بلدان مختلفة، وما إلى ذلك.

إن الخاصية العامة للسلسلة الديناميكية يمكن أن تخدم، أولاً وقبل كل شيء، مستوى الصف الأوسط. تعتمد طريقة حساب المستوى المتوسط على ما إذا كانت سلسلة زمنية أو سلسلة زمنية (دورية).

متى فاصلةلسلسلة، يتم تحديد المستوى المتوسط لها من خلال صيغة المتوسط الحسابي البسيط لمستويات السلسلة، أي.

=
إذا كان متاحا لحظةصف يحتوي على نمستويات ( ص1، ص2، …، ص) مع فواصل زمنية متساوية بين التواريخ (الأوقات)، فيمكن تحويل هذه السلسلة بسهولة إلى سلسلة من القيم المتوسطة. وفي هذه الحالة يكون المؤشر (المستوى) في بداية كل فترة هو في نفس الوقت المؤشر في نهاية الفترة السابقة. ومن ثم يمكن حساب متوسط قيمة المؤشر لكل فترة (الفاصل الزمني بين التواريخ) على أنه نصف مجموع القيم فيفي بداية ونهاية الفترة، أي. كيف . سيكون عدد هذه المتوسطات . كما ذكرنا سابقًا، بالنسبة لسلسلة القيم المتوسطة، يتم حساب المستوى المتوسط باستخدام المتوسط الحسابي.

ولذلك يمكننا أن نكتب:
.
بعد تحويل البسط نحصل على:
,

أين Y1و ين— المستويين الأول والأخير من الصف؛ يي- المستويات المتوسطة .

ويعرف هذا المتوسط في الإحصائيات باسم متوسط زمنيلمسلسل لحظة. وقد حصلت على اسمها من كلمة "كرونوس" (الوقت، اللاتينية)، حيث يتم حسابها من المؤشرات التي تتغير مع مرور الوقت.

في حالة عدم المساواةالفواصل الزمنية بين التواريخ، يمكن حساب المتوسط الزمني لسلسلة زمنية على أنه الوسط الحسابي لمتوسط قيم المستويات لكل زوج من اللحظات، مرجحًا بالمسافات (الفترات الزمنية) بين التواريخ، أي.
.
في هذه الحالةمن المفترض أنه في الفترات الفاصلة بين التواريخ اتخذت المستويات قيمًا مختلفة، ونحن أحد اثنين معروفين ( ييو يي+1) نحدد المتوسطات، ومن ثم نحسب المتوسط الإجمالي للفترة التي تم تحليلها بأكملها.
فإذا افترض أن كل قيمة يييبقى دون تغيير حتى اليوم التالي (ط+ 1)- اللحظة الرابعة، أي. إذا كان التاريخ الدقيق للتغيير في المستويات معروفًا، فيمكن إجراء الحساب باستخدام صيغة المتوسط الحسابي المرجح:
,

أين هو الوقت الذي ظل فيه المستوى دون تغيير.

بالإضافة إلى المستوى المتوسط في سلسلة الديناميكيات، يتم حساب مؤشرات متوسطة أخرى - متوسط التغير في مستويات السلسلة (الطرق الأساسية والسلسلة)، ومتوسط معدل التغيير.

خط الأساس يعني التغيير المطلقهو حاصل قسمة التغيير المطلق الأخير على عدد التغييرات. إنه

السلسلة تعني التغيير المطلق مستويات السلسلة هي حاصل قسمة مجموع كل التغييرات المطلقة للسلسلة على عدد التغييرات، أي

كما تستخدم علامة متوسط التغيرات المطلقة للحكم على طبيعة التغير في ظاهرة ما في المتوسط: النمو أو الانخفاض أو الاستقرار.

من قاعدة التحكم في التغييرات الأساسية والسلسلة المطلقة، يترتب على ذلك أن التغييرات الأساسية ومتوسط السلسلة يجب أن تكون متساوية.

إلى جانب متوسط التغير المطلق، يتم حساب المتوسط النسبي أيضًا باستخدام الطرق الأساسية والمتسلسلة.

متوسط التغير النسبي الأساسيتحددها الصيغة:

سلسلة متوسط التغير النسبيتحددها الصيغة:

ومن الطبيعي أن تكون التغيرات النسبية الأساسية والسلسلة هي نفسها، وبمقارنتها مع القيمة المعيارية 1 يتم التوصل إلى استنتاج حول طبيعة التغير في الظاهرة في المتوسط: نمو أو تراجع أو استقرار.
عن طريق طرح 1 من القاعدة أو متوسط التغير النسبي للسلسلة، يكون المقابل متوسط معدل التغير، من خلال علامتها يمكن للمرء أيضًا الحكم على طبيعة التغيير في الظاهرة قيد الدراسة، والتي تنعكس في هذه السلسلة من الديناميكيات.

التقلبات الموسمية والمؤشرات الموسمية.

التقلبات الموسمية هي تقلبات مستقرة خلال السنة.

المبدأ الأساسي للإدارة للحصول على أقصى قدر من التأثير هو زيادة الدخل وتقليل التكاليف. ومن خلال دراسة التقلبات الموسمية تم حل مشكلة المعادلة القصوى عند كل مستوى من مستويات السنة.

عند دراسة التقلبات الموسمية يتم حل مشكلتين مترابطتين:

1. تحديد تفاصيل تطور الظاهرة في الديناميكيات البينية؛

2. قياس التقلبات الموسمية مع بناء نموذج الموجة الموسمية.

لقياس التباين الموسمي، عادة ما يتم حساب الديوك الرومية الموسمية. بشكل عام، يتم تحديدها من خلال نسبة المعادلات الأصلية لسلسلة الديناميكيات إلى المعادلات النظرية، والتي تعمل كأساس للمقارنة.

وبما أن الانحرافات العشوائية يتم فرضها على التقلبات الموسمية، يتم حساب متوسط المؤشرات الموسمية للقضاء عليها.

في هذه الحالة، لكل فترة من الدورة السنوية، يتم تحديد المؤشرات المعممة في شكل متوسط المؤشرات الموسمية:

وتخلو مؤشرات متوسط التقلبات الموسمية من تأثير الانحرافات العشوائية لاتجاه التنمية الرئيسي.

اعتمادًا على طبيعة الاتجاه، يمكن أن تتخذ صيغة متوسط المؤشر الموسمي الأشكال التالية:

1.بالنسبة لسلسلة من الديناميكيات البينية السنوية مع اتجاه رئيسي واضح للتنمية:

2. بالنسبة لسلسلة من الديناميكيات البينية السنوية التي لا يوجد فيها اتجاه متزايد أو متناقص أو تكون غير ذات أهمية:

أين هو المعدل العام؟

طرق تحليل الاتجاه الرئيسي.

يتأثر تطور الظواهر بمرور الوقت بعوامل مختلفة الطبيعة وقوة التأثير. بعضها عشوائي بطبيعته، والبعض الآخر له تأثير ثابت تقريبًا ويشكل اتجاهًا معينًا للتنمية في الديناميكيات.

إحدى المهام المهمة للإحصاءات هي تحديد ديناميكيات الاتجاه المتسلسلة، والتحرر من تأثير العوامل العشوائية المختلفة. ولهذا الغرض، تتم معالجة السلاسل الزمنية بطرق تكبير الفترات والمتوسط المتحرك والتسوية التحليلية وما إلى ذلك.

طريقة توسيع الفاصل الزمنييعتمد على توسيع الفترات الزمنية، والتي تشمل مستويات سلسلة من الديناميكيات، أي. هو استبدال البيانات المتعلقة بفترات زمنية صغيرة ببيانات لفترات أكبر. إنه فعال بشكل خاص عندما تتعلق المستويات الأولية للسلسلة بفترات زمنية قصيرة. على سبيل المثال، يتم استبدال سلسلة المؤشرات المرتبطة بالأحداث اليومية بسلسلة مرتبطة بالأحداث الأسبوعية والشهرية وما إلى ذلك. وهذا سوف يظهر بشكل أكثر وضوحا "محور تطور الظاهرة". ويتيح لنا المتوسط، المحسوب على فترات ممتدة، تحديد اتجاه وطبيعة (تسارع أو تباطؤ النمو) لاتجاه التنمية الرئيسي.

طريقة المتوسط المتحركمشابهة للمستوى السابق، ولكن في هذه الحالة يتم استبدال المستويات الفعلية بمستويات متوسطة محسوبة لفترات زمنية موسعة متحركة (منزلقة) بشكل تسلسلي تغطي ممستويات السلسلة.

على سبيل المثال، إذا قبلنا م = 3،ثم يتم أولاً حساب متوسط المستويات الثلاثة الأولى من السلسلة، ثم من نفس عدد المستويات، ولكن يبدأ من الثاني، ثم يبدأ من الثالث، وهكذا. وبالتالي، فإن متوسط "الشرائح" على طول سلسلة الديناميكيات، يتحرك بمقدار مصطلح واحد. تحسب من مالأعضاء، تشير المتوسطات المتحركة إلى منتصف (وسط) كل فترة.

هذه الطريقة تقضي فقط على التقلبات العشوائية. إذا كانت السلسلة بها موجة موسمية، فإنها ستستمر حتى بعد التجانس باستخدام طريقة المتوسط المتحرك.

المحاذاة التحليلية. من أجل القضاء على التقلبات العشوائية وتحديد الاتجاه، يتم استخدام تسوية مستويات السلسلة باستخدام الصيغ التحليلية (أو التسوية التحليلية). وجوهره هو استبدال المستويات التجريبية (الفعلية) بمستويات نظرية، والتي يتم حسابها باستخدام معادلة معينة معتمدة كنموذج للاتجاه الرياضي، حيث تعتبر المستويات النظرية كدالة للزمن: . وفي هذه الحالة يعتبر كل مستوى فعلي بمثابة مجموع مكونين: حيث هو مكون منهجي ويعبر عنه بمعادلة معينة، وهو متغير عشوائي يسبب تقلبات حول الاتجاه.

تتلخص مهمة المحاذاة التحليلية فيما يلي:

1. التحديد، بناءً على البيانات الفعلية، لنوع الوظيفة الافتراضية التي يمكن أن تعكس بشكل أكثر ملاءمة اتجاه تطور المؤشر قيد الدراسة.

2. إيجاد معلمات الدالة المحددة (المعادلة) من البيانات التجريبية

3. الحساب باستخدام المعادلة الموجودة للمستويات النظرية (المحاذاة).

يتم اختيار وظيفة معينة، كقاعدة عامة، على أساس التمثيل الرسومي للبيانات التجريبية.

النماذج عبارة عن معادلات انحدار، يتم حساب معلماتها باستخدام طريقة المربعات الصغرى

فيما يلي معادلات الانحدار الأكثر استخدامًا لمحاذاة السلاسل الزمنية، مع الإشارة إلى اتجاهات التطوير المحددة الأكثر ملاءمة للانعكاس.

للعثور على معلمات المعادلات المذكورة أعلاه، هناك خوارزميات خاصة وبرامج كمبيوتر. على وجه الخصوص، للعثور على معلمات معادلة الخط المستقيم، يمكن استخدام الخوارزمية التالية:

إذا تم ترقيم الفترات أو اللحظات الزمنية بحيث St = 0، فسيتم تبسيط الخوارزميات المذكورة أعلاه بشكل كبير وتتحول إلى

سيتم وضع المستويات المحاذية على الرسم البياني على خط مستقيم واحد، وتمر على أقرب مسافة من المستويات الفعلية لهذه السلسلة الديناميكية. مجموع الانحرافات المربعة هو انعكاس لتأثير العوامل العشوائية.

وباستخدامه نحسب متوسط الخطأ (المعياري) للمعادلة:

هنا n هو عدد الملاحظات، وm هو عدد المعلمات في المعادلة (لدينا اثنان منهم - b 1 و b 0).

يوضح الاتجاه الرئيسي (الاتجاه) كيف تؤثر العوامل المنهجية على مستويات سلسلة من الديناميكيات، ويعمل تقلب المستويات حول الاتجاه () كمقياس لتأثير العوامل المتبقية.

ولتقييم جودة نموذج السلاسل الزمنية المستخدم، يتم استخدامه أيضًا اختبار فيشر F. وهي نسبة التباينين، وهي نسبة التباين الناتج عن الانحدار، أي. العامل محل الدراسة إلى التباين الناتج عن أسباب عشوائية أي التشتت المتبقي:

وبشكل موسع، يمكن تقديم صيغة هذا المعيار على النحو التالي:

حيث n هو عدد الملاحظات، أي. عدد مستويات الصف،

m هو عدد المعلمات في المعادلة، y هو المستوى الفعلي للسلسلة،

مستوى الصف المحاذي - مستوى الصف الأوسط.

إن النموذج الأكثر نجاحًا من النماذج الأخرى قد لا يكون دائمًا مرضيًا بدرجة كافية. ولا يمكن التعرف عليه على هذا النحو إلا في الحالة التي يتجاوز فيها معياره F الحد الحرج المعروف. يتم إنشاء هذه الحدود باستخدام جداول التوزيع F.

جوهر وتصنيف المؤشرات.

في الإحصاء، يُفهم المؤشر على أنه مؤشر نسبي يميز التغير في حجم ظاهرة ما في الزمان أو المكان أو بالمقارنة مع أي معيار.

العنصر الرئيسي لعلاقة الفهرس هو القيمة المفهرسة. تُفهم القيمة المفهرسة على أنها قيمة إحدى خصائص المجتمع الإحصائي، والتي يكون تغييرها هو موضوع الدراسة.

باستخدام الفهارس، يتم حل ثلاث مهام رئيسية:

1) تقييم التغيرات في ظاهرة معقدة؛

2) تحديد تأثير العوامل الفردية على التغيرات في ظاهرة معقدة؛

3) مقارنة حجم الظاهرة بحجم الفترة الماضية وحجم منطقة أخرى وكذلك بالمعايير والخطط والتنبؤات.

يتم تصنيف المؤشرات وفقًا لثلاثة معايير:

2) حسب درجة تغطية عناصر السكان؛

3) وفقا لطرق حساب المؤشرات العامة.

حسب المحتوىالكميات المفهرسة، وتنقسم المؤشرات إلى مؤشرات المؤشرات الكمية (الحجم) ومؤشرات المؤشرات النوعية. مؤشرات المؤشرات الكمية - مؤشرات الحجم المادي للمنتجات الصناعية، الحجم المادي للمبيعات، عدد الموظفين، إلخ. مؤشرات المؤشرات النوعية - مؤشرات الأسعار، التكاليف، إنتاجية العمل، متوسط الأجور، إلخ.

ووفقا لدرجة تغطية الوحدات السكانية، تنقسم الأرقام القياسية إلى فئتين: فردية وعامة. لتوصيفها، نقدم الاتفاقيات التالية المعتمدة في ممارسة استخدام طريقة الفهرس:

س- الكمية (الحجم) لأي منتج من الناحية المادية ; ر- سعر الوحدة؛ ض- تكلفة وحدة الإنتاج؛ ر— الوقت المستغرق في إنتاج وحدة من المنتج (كثافة العمالة) ; ث- إنتاج المنتجات من حيث القيمة لكل وحدة زمنية؛ الخامس- مخرجات الإنتاج من الناحية المادية لكل وحدة زمنية؛ ت- إجمالي الوقت المستغرق أو عدد الموظفين.

من أجل التمييز بين الفترة أو الكائن الذي تنتمي إليه القيم المفهرسة، من المعتاد وضع اشتراكات في أسفل يمين الرمز المقابل. لذلك، على سبيل المثال، في مؤشرات الديناميكيات، كقاعدة عامة، يتم استخدام الرمز 1 للفترات التي تتم مقارنتها (الحالية، التقارير) وللفترات التي تتم المقارنة معها،

المؤشرات الفرديةتعمل على وصف التغيرات في العناصر الفردية لظاهرة معقدة (على سبيل المثال، التغيير في حجم إنتاج نوع واحد من المنتجات). وهي تمثل القيم النسبية للديناميكيات، والوفاء بالالتزامات، ومقارنة القيم المفهرسة.

يتم تحديد المؤشر الفردي للحجم المادي للمنتجات

من وجهة نظر تحليلية، فإن مؤشرات الديناميكيات الفردية المعطاة تشبه معاملات (معدلات) النمو وتميز التغير في القيمة المفهرسة في الفترة الحالية مقارنة بفترة الأساس، أي أنها تظهر عدد مرات الزيادة (النقصان) أو ما هي نسبة النمو (النقصان). يتم التعبير عن قيم الفهرس بالمعاملات أو النسب المئوية.

الفهرس العام (المركب).يعكس التغيرات في جميع عناصر الظاهرة المعقدة.

الفهرس الإجماليهو الشكل الأساسي للمؤشر. وسمي ركاماً لأن بسطه ومقامه مجموعة من الركام

المؤشرات المتوسطة وتعريفها.

بالإضافة إلى المؤشرات الإجمالية، يتم استخدام شكل آخر منها في الإحصائيات - مؤشرات المتوسط المرجح. ويتم اللجوء إلى حسابها عندما لا تسمح المعلومات المتوفرة بحساب الرقم القياسي الإجمالي العام. وبالتالي، إذا لم تتوفر بيانات عن الأسعار، ولكن هناك معلومات عن تكلفة المنتجات في الفترة الحالية وأرقام قياسية فردية لكل منتج معروفة، فلا يمكن تحديد الرقم القياسي العام للأسعار كرقم إجمالي، ولكن من الممكن لحسابه كمتوسط للأفراد. وبنفس الطريقة، إذا كانت كميات الأنواع الفردية من المنتجات المنتجة غير معروفة، ولكن المؤشرات الفردية وتكلفة الإنتاج لفترة الأساس معروفة، فيمكن تحديد المؤشر العام للحجم المادي للإنتاج كمتوسط مرجح قيمة.

متوسط المؤشر -هذامؤشر يتم حسابه على أنه متوسط المؤشرات الفردية. المؤشر الإجمالي هو الشكل الأساسي للمؤشر العام، لذا يجب أن يكون المؤشر المتوسط مطابقًا للمؤشر الإجمالي. عند حساب المؤشرات المتوسطة، يتم استخدام شكلين من المتوسطات: الحسابي والتوافقي.

ويكون مؤشر المتوسط الحسابي مطابقا للمؤشر الكلي إذا كانت أوزان المؤشرات الفردية هي مصطلحات مقام المؤشر الكلي. فقط في هذه الحالة، ستكون قيمة المؤشر المحسوبة باستخدام صيغة المتوسط الحسابي مساوية للمؤشر الإجمالي.

وفقًا لمسح العينة، تم تجميع المودعين وفقًا لحجم ودائعهم في بنك سبيربنك بالمدينة:

يُعرِّف:

1) نطاق الاختلاف؛

2) متوسط حجم الودائع.

3) متوسط الانحراف الخطي.

4) التشتت.

5) الانحراف المعياري.

6) معامل تباين الاشتراكات.

حل:

تحتوي سلسلة التوزيع هذه على فترات زمنية مفتوحة. في مثل هذه المتسلسلة، يُفترض تقليديًا أن تكون قيمة الفاصل الزمني للمجموعة الأولى مساوية لقيمة الفاصل الزمني للمجموعة التالية، وقيمة الفاصل الزمني للمجموعة الأخيرة تساوي قيمة الفاصل الزمني للمجموعة الأخيرة السابق.

قيمة الفترة من المجموعة الثانية تساوي 200، وبالتالي فإن قيمة الفترة من المجموعة الأولى هي أيضا تساوي 200. قيمة الفترة من المجموعة قبل الأخيرة تساوي 200، مما يعني أن الفترة الأخيرة سوف أيضا لها قيمة 200.

1) دعونا نحدد نطاق التباين على أنه الفرق بين أكبر وأصغر قيمة للسمة:

نطاق الاختلاف في حجم الوديعة هو 1000 روبل.

2) سيتم تحديد متوسط حجم المساهمة باستخدام معادلة المتوسط الحسابي المرجح.

دعونا أولاً نحدد القيمة المنفصلة للسمة في كل فترة. للقيام بذلك، باستخدام صيغة المتوسط الحسابي البسيط، نوجد نقاط منتصف الفترات.

القيمة المتوسطة للفاصل الزمني الأول ستكون:

والثاني - 500، الخ.

دعنا ندخل نتائج الحساب في الجدول:

مبلغ الإيداع، فرك.	عدد المودعين، و	منتصف الفاصل الزمني، x	xf
200-400	32	300	9600
400-600	56	500	28000
600-800	120	700	84000
800-1000	104	900	93600
1000-1200	88	1100	96800
المجموع	400	-	312000

يبلغ متوسط الإيداع في بنك سبيربنك بالمدينة 780 روبل:

3) متوسط الانحراف الخطي هو الوسط الحسابي للانحرافات المطلقة للقيم الفردية للخاصية عن المتوسط الإجمالي:

يكون الإجراء الخاص بحساب متوسط الانحراف الخطي في سلسلة التوزيع الفاصلة كما يلي:

1. يتم حساب الوسط الحسابي المرجح كما هو موضح في الفقرة (2).

2. يتم تحديد الانحرافات المطلقة عن المتوسط:

3. يتم ضرب الانحرافات الناتجة بالترددات:

4. أوجد مجموع الانحرافات الموزونة دون مراعاة الإشارة:

5. مجموع الانحرافات المرجحة مقسوم على مجموع الترددات:

من الملائم استخدام جدول بيانات الحساب:

مبلغ الإيداع، فرك.	عدد المودعين، و	منتصف الفاصل الزمني، x
200-400	32	300	-480	480	15360
400-600	56	500	-280	280	15680
600-800	120	700	-80	80	9600
800-1000	104	900	120	120	12480
1000-1200	88	1100	320	320	28160
المجموع	400	-	-	-	81280

متوسط الانحراف الخطي لحجم إيداع عملاء سبيربنك هو 203.2 روبل.

4) التشتت هو الوسط الحسابي لمربعات الانحرافات لكل قيمة سمة عن الوسط الحسابي.

يتم حساب التباين في سلسلة التوزيع الفاصلة باستخدام الصيغة:

ويكون إجراء حساب التباين في هذه الحالة كما يلي:

1. تحديد الوسط الحسابي المرجح كما هو موضح في الفقرة (2).

2. ابحث عن الانحرافات عن المتوسط:

3. قم بتربيع انحراف كل خيار عن المتوسط:

4. اضرب مربعات الانحرافات في الأوزان (التكرارات):

5. تلخيص المنتجات الناتجة:

6. يقسم المبلغ الناتج على مجموع الأوزان (التكرارات):

لنضع الحسابات في جدول:

مبلغ الإيداع، فرك.	عدد المودعين، و	منتصف الفاصل الزمني، x
200-400	32	300	-480	230400	7372800
400-600	56	500	-280	78400	4390400
600-800	120	700	-80	6400	768000
800-1000	104	900	120	14400	1497600
1000-1200	88	1100	320	102400	9011200
المجموع	400	-	-	-	23040000

الانحراف المعياري

الانحراف المعياري بسيط:

يتم تطبيق الانحراف المعياري المرجح على البيانات المجمعة:

تحدث النسبة التالية بين متوسط الانحرافات المربعة ومتوسط الانحرافات الخطية في ظل ظروف التوزيع الطبيعي: ~ 1.25.

18. التشتت أنواعه والانحراف المعياري.

تباين متغير عشوائي- مقياس انتشار متغير عشوائي معين، أي انحرافه عن التوقع الرياضي. في الإحصائيات، غالبًا ما يتم استخدام التدوين أو. عادة ما يسمى الجذر التربيعي للتباين الانحراف المعياري, الانحراف المعياريأو انتشار قياسي.

التباين بين المجموعات (σ 2 م.ج) يميز التباين المنهجي، أي الاختلافات في قيمة السمة المدروسة التي تنشأ تحت تأثير السمة - العامل الذي يشكل أساس المجموعة.

الانحراف المعياري(مرادفات: الانحراف المعياري, الانحراف المعياري, انحراف مربع; المصطلحات ذات الصلة: الانحراف المعياري, انتشار قياسي) - في نظرية الاحتمالات والإحصاء، المؤشر الأكثر شيوعا لتشتت قيم المتغير العشوائي نسبة إلى توقعه الرياضي. مع صفائف محدودة من عينات القيم، بدلا من التوقع الرياضي، يتم استخدام الوسط الحسابي لمجموعة العينات.

يتم قياس الانحراف المعياري بوحدات قياس المتغير العشوائي نفسه ويستخدم عند حساب الخطأ المعياري للوسط الحسابي، عند بناء فترات الثقة، عند اختبار الفرضيات إحصائيا، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.

الانحراف المعياري:

أين التشتت؟ - أناالعنصر الرابع من الاختيار؛ - حجم العينة؛ - الوسط الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة، من المستحيل بناء تقدير غير متحيز. وفي هذه الحالة، يكون التقدير المبني على تقدير التباين غير المتحيز متسقًا.

19. جوهر ونطاق وإجراءات تحديد الوضع والوسيط.

بالإضافة إلى متوسطات القوة في الإحصائيات، للتوصيف النسبي لقيمة خاصية متباينة والبنية الداخلية لسلسلة التوزيع، يتم استخدام المتوسطات الهيكلية، والتي تتمثل بشكل أساسي في الموضة والوسيط.

موضة- هذا هو الشكل الأكثر شيوعًا في السلسلة. تُستخدم الموضة، على سبيل المثال، في تحديد مقاسات الملابس والأحذية الأكثر طلبًا بين العملاء. وضع السلسلة المنفصلة هو المتغير ذو التردد الأعلى. عند حساب الوضع لسلسلة تباين الفاصل الزمني، من المهم للغاية تحديد الفاصل الزمني المشروط أولاً (بأقصى تردد)، ثم - قيمة القيمة المشروطة للسمة باستخدام الصيغة:

§ - معنى الموضة

§ - الحد الأدنى للفاصل المشروط

§ - قيمة الفاصل

§ - تردد الفاصل الزمني

§ - تردد الفاصل الزمني السابق للشكل

§ - تردد الفاصل الزمني التالي للشكل

الوسيط -تكمن قيمة السمة ĸᴏᴛᴏᴩᴏᴇ في أساس السلسلة المرتبة وتقسم هذه السلسلة إلى جزأين متساويين في العدد.

لتحديد الوسيط في سلسلة منفصلةإذا كانت الترددات متاحة، قم أولاً بحساب نصف مجموع الترددات، ثم حدد قيمة المتغير الذي يقع عليها. (إذا كانت السلسلة المصنفة تحتوي على عدد فردي من الخصائص، فسيتم حساب الرقم المتوسط باستخدام الصيغة:

M e = (n (إجمالي عدد الميزات) + 1)/2,

وفي حالة وجود عدد زوجي من المعالم، فإن الوسيط سيكون مساوياً لمتوسط المعلمتين الموجودتين في منتصف الصف).

عند حساب الوسيط لسلسلة التغيير الفاصلأولاً، حدد الفاصل الزمني المتوسط الذي يقع فيه الوسيط، ثم حدد قيمة الوسيط باستخدام الصيغة:

§ - الوسيط المطلوب

§ - الحد الأدنى للفاصل الذي يحتوي على الوسيط

§ - قيمة الفاصل

§ - مجموع الترددات أو عدد مصطلحات السلسلة

§ - مجموع الترددات المتراكمة للفترات التي تسبق الوسيط

§ - تردد الفاصل الزمني المتوسط

مثال. العثور على الوضع والوسيط.

حل: في هذا المثال، الفاصل الزمني يقع ضمن الفئة العمرية 25-30 سنة، حيث أن هذا الفاصل الزمني له أعلى تكرار (1054).

دعونا نحسب حجم الوضع:

وهذا يعني أن العمر النموذجي للطلاب هو 27 عامًا.

دعونا نحسب الوسيط. يقع الفاصل الزمني المتوسط في الفئة العمرية 25-30 عامًا، حيث يوجد ضمن هذا الفاصل خيار ͵ الذي يقسم السكان إلى جزأين متساويين (Σf i /2 = 3462/2 = 1731). بعد ذلك، نستبدل البيانات الرقمية اللازمة في الصيغة ونحصل على قيمة الوسيط:

وهذا يعني أن نصف الطلاب أقل من 27.4 عامًا، والنصف الآخر أكبر من 27.4 عامًا.

بالإضافة إلى الوضع والوسيط، يتم استخدام مؤشرات مثل الربعيات، وتقسيم السلسلة المرتبة إلى 4 أجزاء متساوية، والعشريات - 10 أجزاء والنسب المئوية - إلى 100 جزء.

20. مفهوم الملاحظة بالعينة ونطاقها.

الوحدات الإحصائية المختارة للمراقبة هي عينة السكانأو عينة، ومصفوفتهم بأكملها - عامه السكان(ع). حيث عدد الوحدات في العينةدل ن، وفي جميع أنحاء النظام المنسق بأكمله - ن. سلوك ن / نعادة ما يسمى الحجم النسبيأو حصة العينة.

تعتمد جودة نتائج مراقبة العينة على تمثيل العينةأي على مدى تمثيلها في قطاع غزة. ولضمان تمثيل العينة، من المهم للغاية الالتزام بها مبدأ الاختيار العشوائي للوحدات، والذي يفترض أن إدراج وحدة النظام المنسق في العينة لا يمكن أن يتأثر بأي عامل آخر غير الصدفة.

موجود 4 طرق للاختيار العشوائيلأخذ عينات:

عشوائية في الواقعالاختيار أو "طريقة اليانصيب"، عندما يتم تعيين أرقام تسلسلية للقيم الإحصائية، المسجلة على كائنات معينة (على سبيل المثال، البراميل)، والتي يتم بعد ذلك خلطها في حاوية (على سبيل المثال، في كيس) واختيارها بشكل عشوائي. ومن الناحية العملية، يتم تنفيذ هذه الطريقة باستخدام مولد أرقام عشوائية أو جداول رياضية للأرقام العشوائية.
ميكانيكيالاختيار وفقا لكل ( لا/ن)-القيمة الرابعة لعامة السكان. على سبيل المثال، إذا كانت تحتوي على 100000 قيمة، وتحتاج إلى تحديد 1000، فسيتم تضمين كل 100000 / 1000 = القيمة رقم 100 في العينة. علاوة على ذلك، إذا لم يتم ترتيبهم، فسيتم اختيار الأول عشوائيًا من المائة الأولى، وستكون أعداد الآخرين أعلى بمائة. فمثلاً إذا كانت الوحدة الأولى رقم 19 فالتالية يجب أن تكون رقم 119 ثم رقم 219 ثم رقم 319 وهكذا. وفي حالة ترتيب الوحدات السكانية، يتم اختيار رقم 50 أولاً، ثم رقم 150، ثم رقم 250، وهكذا.
يتم اختيار القيم من مجموعة بيانات غير متجانسة طبقيةالطريقة (الطبقية)، عندما يتم تقسيم السكان أولاً إلى مجموعات متجانسة يتم تطبيق الاختيار العشوائي أو الميكانيكي عليها.
وهناك طريقة خاصة لأخذ العينات مسلسلالاختيار، حيث لا يختارون بشكل عشوائي أو ميكانيكي القيم الفردية، ولكن سلسلتهم (تسلسلات من رقم ما إلى رقم ما على التوالي)، والتي يتم من خلالها إجراء المراقبة المستمرة.

تعتمد جودة ملاحظات العينة أيضًا على نوع العينة: معادأو غير قابل للتكرار.في إعادة الاختياريتم إرجاع القيم الإحصائية أو سلاسلها المتضمنة في العينة إلى عامة السكان بعد استخدامها، مع وجود فرصة لإدراجها في عينة جديدة. علاوة على ذلك، فإن جميع القيم في عموم السكان لها نفس احتمالية إدراجها في العينة. اختيار غير متكرريعني أن القيم الإحصائية أو سلسلتها المتضمنة في العينة لا تعود إلى عموم السكان بعد الاستخدام، وبالتالي بالنسبة للقيم المتبقية للأخيرة يزداد احتمال إدراجها في العينة التالية.

يعطي أخذ العينات غير المتكررة نتائج أكثر دقة، وبالتالي يتم استخدامه في كثير من الأحيان. ولكن هناك حالات لا يمكن فيها تطبيقها (دراسة تدفقات الركاب، وطلب المستهلكين، وما إلى ذلك) ثم يتم إجراء الاختيار المتكرر.

21. الحد الأقصى لخطأ المعاينة، ومتوسط خطأ المعاينة، وإجراءات حسابها.

دعونا نفكر بالتفصيل في الطرق المذكورة أعلاه لتشكيل مجتمع العينة والأخطاء التمثيلية التي تنشأ. عشوائية بشكل صحيحتعتمد عملية أخذ العينات على اختيار وحدات من المجتمع بشكل عشوائي دون أي عناصر منهجية. من الناحية الفنية، يتم الاختيار العشوائي الفعلي عن طريق القرعة (على سبيل المثال، اليانصيب) أو باستخدام جدول أرقام عشوائية.

ونادرا ما يستخدم الاختيار العشوائي الصحيح "في شكله النقي" في ممارسة الملاحظة الانتقائية، ولكنه النوع الأول من بين أنواع الاختيار الأخرى؛ فهو يطبق المبادئ الأساسية للملاحظة الانتقائية. دعونا نفكر في بعض الأسئلة المتعلقة بنظرية طريقة أخذ العينات وصيغة الخطأ لعينة عشوائية بسيطة.

أخذ العينات التحيز- ϶ᴛᴏ الفرق بين قيمة المعلمة في عموم السكان وقيمتها المحسوبة من نتائج ملاحظة العينة. ومن المهم ملاحظة أنه بالنسبة للخاصية الكمية المتوسطة، يتم تحديد خطأ أخذ العينات

يُطلق على المؤشر عادةً اسم الحد الأقصى لخطأ أخذ العينات. متوسط العينة هو متغير عشوائي يمكن أن يأخذ قيمًا مختلفة بناءً على الوحدات المضمنة في العينة. ولذلك، فإن أخطاء أخذ العينات هي أيضًا متغيرات عشوائية ويمكن أن تأخذ قيمًا مختلفة. ولهذا السبب، يتم تحديد متوسط الأخطاء المحتملة - متوسط خطأ أخذ العينات، والذي يعتمد على:

· حجم العينة: كلما زاد العدد، قل متوسط الخطأ.

· درجة التغير في الخاصية محل الدراسة: كلما قل تباين الخاصية، وبالتالي التشتت، قل متوسط خطأ العينة.

في إعادة الاختيار العشوائييتم حساب متوسط الخطأ. من الناحية العملية، التباين العام غير معروف بالضبط، ولكن في نظرية الاحتمالات ثبت ذلك . وبما أن قيمة n كبيرة بما فيه الكفاية قريبة من 1، يمكننا أن نفترض ذلك. ومن ثم ينبغي حساب متوسط خطأ المعاينة: . ولكن في حالات عينة صغيرة (مع ن<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

في أخذ العينات العشوائية غير التكراريةيتم تعديل الصيغ المعطاة بالقيمة. ومن ثم فإن متوسط خطأ أخذ العينات غير التكراري هو: و . لأن دائمًا أقل من، فإن المضاعف () دائمًا أقل من 1. وهذا يعني أن متوسط الخطأ في الاختيار المتكرر يكون دائمًا أقل من التحديد المتكرر. أخذ العينات الميكانيكيةيتم استخدامه عندما يتم ترتيب إجمالي عدد السكان بطريقة ما (على سبيل المثال، قوائم الناخبين حسب الترتيب الأبجدي، وأرقام الهواتف، وأرقام المنازل والشقق). ويتم اختيار الوحدات في فترة زمنية معينة، وهي تساوي القيمة العكسية لنسبة أخذ العينات. لذا، مع عينة 2%، يتم اختيار كل 50 وحدة = 1/0.02، مع عينة 5%، كل 1/0.05 = 20 وحدة من عموم السكان.

من حيث الدقة، فإن الاختيار الميكانيكي قريب من أخذ العينات العشوائية الفعلية. ولهذا السبب، لتحديد متوسط الخطأ في أخذ العينات الميكانيكية، يتم استخدام صيغ الاختيار العشوائي المناسبة.

في اختيار نموذجييتم تقسيم السكان الذين يتم استطلاعهم بشكل مبدئي إلى مجموعات متجانسة ومتشابهة. على سبيل المثال، عند مسح المؤسسات، هذه هي الصناعات أو القطاعات الفرعية؛ عند دراسة السكان، هذه هي المناطق أو الفئات الاجتماعية أو العمرية. بعد ذلك، يتم إجراء اختيار مستقل من كل مجموعة آليًا أو عشوائيًا تمامًا.

يؤدي أخذ العينات النموذجي إلى نتائج أكثر دقة من الطرق الأخرى. تضمن كتابة المجتمع العام تمثيل كل مجموعة نمطية في العينة، مما يلغي تأثير التباين بين المجموعات على متوسط خطأ أخذ العينات. لذلك، عند العثور على خطأ عينة نموذجية وفقًا لقاعدة إضافة التباينات ()، من المهم للغاية أن نأخذ في الاعتبار متوسط تباينات المجموعة فقط. ثم متوسط خطأ العينة: مع أخذ العينات المتكررة، مع أخذ العينات غير المتكررة ، أين - متوسط التباينات داخل المجموعة في العينة.

اختيار المسلسل (أو العش).يستخدم عندما يتم تقسيم السكان إلى سلاسل أو مجموعات قبل بدء مسح العينة. تشمل هذه السلسلة تغليف المنتجات النهائية ومجموعات الطلاب والألوية. يتم اختيار السلاسل للفحص ميكانيكياً أو عشوائياً بحتاً، وضمن السلاسل يتم إجراء فحص مستمر للوحدات. لهذا السبب، يعتمد متوسط خطأ أخذ العينات فقط على التباين بين المجموعات (بين السلاسل)، والذي يتم حسابه باستخدام الصيغة: حيث r هو عدد السلاسل المحددة؛ – متوسط السلسلة i-th. يتم حساب متوسط خطأ أخذ العينات التسلسلية: مع أخذ العينات المتكررة، مع أخذ العينات غير المتكررة حيث R هو العدد الإجمالي للسلسلة. مجموعالاختيار هو مزيج من طرق الاختيار المدروسة.

يعتمد متوسط خطأ أخذ العينات لأي طريقة من طرق أخذ العينات بشكل أساسي على الحجم المطلق للعينة، وبدرجة أقل، على النسبة المئوية للعينة. لنفترض أنه تم إجراء 225 ملاحظة في الحالة الأولى من عدد سكان يبلغ 4500 وحدة وفي الحالة الثانية من عدد سكان يبلغ 225000 وحدة. التباينات في الحالتين تساوي 25. ففي الحالة الأولى، مع اختيار 5%، سيكون خطأ المعاينة: في الحالة الثانية، مع اختيار 0.1%، سيكون مساوياً لـ:

ومع ذلك، عندما تم تخفيض نسبة أخذ العينات بمقدار 50 مرة، زاد خطأ أخذ العينات قليلاً، لأن حجم العينة لم يتغير. لنفترض أن حجم العينة قد زاد إلى 625 ملاحظة. وفي هذه الحالة يكون خطأ أخذ العينات كما يلي: إن زيادة العينة بمقدار 2.8 مرة بنفس حجم السكان يقلل من حجم خطأ العينة بأكثر من 1.6 مرة.

22. طرق وأساليب تكوين مجتمع العينة.

هناك الطرق التالية لاختيار الوحدات من عامة السكان: 1) الاختيار الفردي - يتم اختيار الوحدات الفردية للعينة؛ 2) اختيار المجموعة - تتضمن العينة مجموعات متجانسة نوعيا أو سلسلة من الوحدات قيد الدراسة؛ 3) الاختيار المشترك هو مزيج من الاختيار الفردي والجماعي. يتم تحديد طرق الاختيار من خلال قواعد تشكيل عينة السكان.

يجب أن تكون العينة:

عشوائية في الواقعيتمثل في حقيقة أن مجتمع العينة يتكون نتيجة الاختيار العشوائي (غير المقصود) للوحدات الفردية من عامة السكان. وفي هذه الحالة، عادة ما يتم تحديد عدد الوحدات المختارة في مجتمع العينة على أساس نسبة العينة المقبولة. نسبة العينة هي نسبة عدد الوحدات في مجتمع العينة n إلى عدد الوحدات في عموم السكان N، ᴛ.ᴇ.

ميكانيكييتكون من حقيقة أن اختيار الوحدات في عينة السكان يتم من عامة السكان، مقسمة إلى فترات (مجموعات) متساوية. وفي هذه الحالة، يكون حجم الفاصل الزمني في المجتمع يساوي مقلوب حصة العينة. لذلك، مع عينة 2%، يتم اختيار كل وحدة 50 (1:0.02)، مع عينة 5%، كل وحدة 20 (1:0.05)، إلخ. ومع ذلك، وفقًا لنسبة الاختيار المقبولة، يتم تقسيم عامة السكان ميكانيكيًا إلى مجموعات متساوية. ويتم اختيار وحدة واحدة فقط من كل مجموعة للعينة.
عادي -حيث يتم تقسيم عامة السكان أولاً إلى مجموعات نموذجية متجانسة. بعد ذلك، من كل مجموعة نموذجية، يتم استخدام عينة عشوائية أو ميكانيكية بحتة لاختيار الوحدات بشكل فردي في مجتمع العينة. من السمات المهمة للعينة النموذجية أنها تعطي نتائج أكثر دقة مقارنة بالطرق الأخرى لاختيار الوحدات في مجتمع العينة؛
مسلسل- حيث يتم تقسيم عامة السكان إلى مجموعات متساوية الحجم - سلسلة. يتم اختيار السلسلة في عينة السكان. ضمن السلسلة، يتم إجراء المراقبة المستمرة للوحدات المتضمنة في السلسلة؛
مجموع- يجب أن تكون عملية أخذ العينات على مرحلتين. في هذه الحالة، يتم تقسيم السكان أولاً إلى مجموعات. بعد ذلك، يتم اختيار المجموعات، وضمن الأخيرة يتم اختيار الوحدات الفردية.

في الإحصاء، يتم تمييز الطرق التالية لاختيار الوحدات في عينة السكان:

مرحلة واحدةأخذ العينات - تخضع كل وحدة مختارة للدراسة على الفور وفقا لمعيار معين (أخذ العينات العشوائية والتسلسلية المناسبة)؛
متعدد المراحلأخذ العينات - يتم الاختيار من إجمالي عدد السكان للمجموعات الفردية، ويتم اختيار الوحدات الفردية من المجموعات (أخذ عينات نموذجية بطريقة ميكانيكية لاختيار الوحدات في مجتمع العينة).

بالإضافة إلى ذلك، هناك:

إعادة الاختيار- حسب مخطط الكرة المرتجعة. في هذه الحالة، يتم إرجاع كل وحدة أو سلسلة مدرجة في العينة إلى عامة السكان، وبالتالي يكون لديها فرصة لإدراجها في العينة مرة أخرى؛
اختيار غير متكرر- حسب مخطط الكرة غير المرتجعة. لديها نتائج أكثر دقة بنفس حجم العينة.

23. تحديد حجم العينة المهم للغاية (باستخدام جدول t الخاص بالطالب).

أحد المبادئ العلمية في نظرية أخذ العينات هو التأكد من اختيار عدد كاف من الوحدات. من الناحية النظرية، يتم تقديم الأهمية القصوى لمراعاة هذا المبدأ في إثباتات نظريات الحد في نظرية الاحتمالات، والتي تجعل من الممكن تحديد حجم الوحدات التي ينبغي اختيارها من السكان بحيث تكون كافية وتضمن تمثيل العينة.

إن الانخفاض في خطأ أخذ العينات القياسي، وبالتالي زيادة دقة التقدير، يرتبط دائمًا بزيادة في حجم العينة، لذلك، في مرحلة تنظيم مراقبة العينة، من الضروري تحديد الحجم من مجتمع العينة لضمان الدقة المطلوبة لنتائج المراقبة. يتم حساب حجم العينة المهم للغاية باستخدام صيغ مشتقة من صيغ الحد الأقصى لأخطاء أخذ العينات (A)، التي تتوافق مع نوع معين وطريقة اختيار معينة. لذلك، بالنسبة لحجم العينة العشوائي المتكرر (n) لدينا:

جوهر هذه الصيغة هو أنه مع أخذ العينات العشوائية المتكررة لأرقام مهمة للغاية، يتناسب حجم العينة بشكل مباشر مع مربع معامل الثقة (ت2)وتباين الخاصية التباينية (?2) ويتناسب عكسياً مع مربع الحد الأقصى لخطأ المعاينة (?2). وعلى وجه الخصوص، مع زيادة الحد الأقصى للخطأ بعامل اثنين، ينبغي تقليل حجم العينة المطلوب بعامل أربعة. من بين المعلمات الثلاثة، تم تعيين اثنين (t و؟) من قبل الباحث. وفي الوقت نفسه، يعتمد الباحث على الهدف

ويجب أن تحل مشاكل المسح بالعينة السؤال: في أي مجموعة كمية من الأفضل تضمين هذه المعلمات لضمان الخيار الأمثل؟ في إحدى الحالات، قد يكون راضيًا عن موثوقية النتائج التي تم الحصول عليها (t) أكثر من رضاه عن مقياس الدقة (؟)، وفي حالة أخرى - والعكس صحيح. من الصعب حل المشكلة المتعلقة بقيمة الحد الأقصى لخطأ المعاينة، حيث لا يتوفر لدى الباحث هذا المؤشر في مرحلة تصميم ملاحظة العينة، لذلك من الناحية العملية، من المعتاد تحديد قيمة الحد الأقصى لخطأ المعاينة؛ ، عادةً في حدود 10% من متوسط المستوى المتوقع للسمة. يمكن الوصول إلى تحديد المتوسط المقدر بطرق مختلفة: استخدام البيانات من المسوحات السابقة المماثلة، أو استخدام البيانات من إطار أخذ العينات وإجراء عينة تجريبية صغيرة.

أصعب شيء يمكن تحديده عند تصميم عينة الملاحظة هو المتغير الثالث في الصيغة (5.2) - تباين مجتمع العينة. وفي هذه الحالة، من المهم للغاية استخدام جميع المعلومات المتاحة للباحث، والتي تم الحصول عليها في المسوحات المماثلة والتجريبية السابقة.

تصبح مسألة تحديد حجم العينة المهم للغاية أكثر تعقيدًا إذا كان مسح العينة يتضمن دراسة العديد من خصائص وحدات المعاينة. في هذه الحالة، يكون متوسط مستويات كل من الخصائص وتنوعها، كقاعدة عامة، مختلفًا، وفي هذا الصدد، تحديد التباين في أي من الخصائص التي يجب تفضيلها لا يمكن تحقيقه إلا مع مراعاة الغرض والأهداف من المسح.

بشكل عام، تسمح لنا صيغة الحد الأقصى للخطأ في متوسط العينة بتحديد:

‣‣‣ حجم الانحرافات المحتملة لمؤشرات عموم السكان عن مؤشرات عينة السكان؛

‣‣‣ حجم العينة المطلوب لضمان الدقة المطلوبة، بحيث لا تتجاوز حدود الخطأ المحتمل قيمة محددة معينة؛

‣‣‣ احتمال أن يكون للخطأ في العينة حد محدد.

توزيع الطلابفي نظرية الاحتمالات، هي عائلة ذات معلمة واحدة من التوزيعات المستمرة تمامًا.

24. المتسلسلة الديناميكية (الفاصل الزمني، العزم)، المتسلسلة الديناميكية الختامية.

سلسلة ديناميات- هذه هي قيم المؤشرات الإحصائية التي يتم تقديمها بتسلسل زمني معين.

تحتوي كل سلسلة زمنية على عنصرين:

1) مؤشرات الفترات الزمنية(السنوات أو الأرباع أو الأشهر أو الأيام أو التواريخ)؛

2) المؤشرات التي تميز الكائن قيد الدراسةلفترات زمنية أو في التواريخ المقابلة، والتي تسمى مستويات السلسلة.

يتم التعبير عن مستويات السلسلة بالقيم المطلقة والمتوسطة أو النسبية. مع الأخذ في الاعتبار الاعتماد على طبيعة المؤشرات، يتم بناء سلسلة ديناميكية من القيم المطلقة والنسبية والمتوسطة. يتم إنشاء سلسلة ديناميكية من القيم النسبية والمتوسطة على أساس سلسلة مشتقة من القيم المطلقة. هناك سلسلة زمنية ولحظية من الديناميكيات.

سلسلة الفاصل الديناميكييحتوي على قيم المؤشرات لفترات زمنية معينة. وفي سلسلة فواصل زمنية يمكن تلخيص المستويات والحصول على حجم الظاهرة على مدى فترة أطول أو ما يسمى بالمجاميع المتراكمة.

الشرط الأكثر أهمية لبناء السلاسل الزمنية بشكل صحيح هو مقارنة مستويات السلسلةتنتمي إلى فترات مختلفة. ويجب تقديم المستويات بكميات متجانسة، كما يجب أن يكون هناك اكتمال متساوي لتغطية الأجزاء المختلفة من الظاهرة.

من أجل تجنب تشويه الديناميكيات الحقيقية، يتم إجراء الحسابات الأولية في البحث الإحصائي (إغلاق سلسلة الديناميكيات)، التي تسبق التحليل الإحصائي للسلسلة الزمنية. تحت إغلاق سلسلة الديناميكياتمن المقبول عمومًا فهم المجموعة في سلسلة واحدة من سلسلتين أو أكثر، والتي يتم حساب مستوياتها باستخدام منهجية مختلفة أو لا تتوافق مع الحدود الإقليمية، وما إلى ذلك. قد يعني إغلاق سلسلة الديناميكيات أيضًا جلب المستويات المطلقة لسلسلة الديناميكيات إلى أساس مشترك، مما يحيد عدم إمكانية المقارنة بين مستويات سلسلة الديناميكيات.

25. مفهوم المقارنة بين سلاسل الديناميكيات والمعاملات والنمو ومعدلات النمو.

تحتوي سلسلة الديناميكيات على نوعين من المؤشرات. مؤشرات الوقت(سنوات، أرباع، أشهر، إلخ) أو نقاط زمنية (في بداية العام، في بداية كل شهر، إلخ). مؤشرات مستوى الصف. يمكن التعبير عن مؤشرات مستويات سلسلة الديناميكيات بالقيم المطلقة (إنتاج المنتج بالطن أو الروبل)، والقيم النسبية (حصة سكان الحضر بنسبة٪) والقيم المتوسطة (متوسط راتب العاملين في الصناعة حسب السنة ، إلخ.). في شكل جدول، تحتوي السلسلة الزمنية على عمودين أو صفين.

يتطلب البناء الصحيح للسلاسل الزمنية استيفاء عدد من المتطلبات:

يجب أن تكون جميع مؤشرات عدد من الديناميكيات مدعومة بأدلة علمية وموثوقة؛
يجب أن تكون مؤشرات سلسلة الديناميكيات قابلة للمقارنة مع مرور الوقت. يجب أن يتم حسابها لنفس الفترات الزمنية أو في نفس التواريخ؛
ويجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة في جميع أنحاء الإقليم؛
يجب أن تكون مؤشرات سلسلة الديناميكيات قابلة للمقارنة في المحتوى. وتحسب وفق منهجية واحدة وبنفس الطريقة؛
وينبغي أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر نطاق المزارع التي تؤخذ في الاعتبار. يجب إعطاء جميع مؤشرات سلسلة الديناميكيات في نفس وحدات القياس.

يمكن للمؤشرات الإحصائية أن تميز إما نتائج العملية قيد الدراسة على مدى فترة من الزمن، أو حالة الظاهرة قيد الدراسة في وقت معين، ᴛ.ᴇ. يمكن أن تكون المؤشرات فاصلة (دورية) ولحظية. وبناء على ذلك، في البداية تكون سلسلة الديناميكيات إما فاصلة أو لحظة. تأتي سلسلة ديناميكيات العزوم بدورها بفترات زمنية متساوية وغير متساوية.

عندما تنخفض القيم المطلقة للسلسلة، سيكون هناك "نقصان" أو "نقصان"، على التوالي.

وتشير مؤشرات النمو المطلقة إلى ذلك، على سبيل المثال، في عام 1998. زاد إنتاج المنتج "أ" مقارنة بعام 1997. بمقدار 4 آلاف طن، مقارنة بعام 1994ᴦ. - بمقدار 34 ألف طن؛ لسنوات أخرى، انظر الجدول. 11.5 جرام.
نشر على المرجع.rf
3 و 4.

لذلك، على سبيل المثال، في عام 1997. حجم إنتاج المنتج "أ" مقارنة بعام 1996 ᴦ. بلغت 105.5% (

T pr = T r - 100% أو T pr = النمو المطلق / مستوى الفترة السابقة * 100%

لذلك، على سبيل المثال، في عام 1996. مقارنة بعام 1995 ᴦ. تم إنتاج المنتج "أ" بنسبة 3.8% (103.8% - 100%) أو (8:210) × 100%، مقارنة بعام 1994 ᴦ. - بنسبة 9% (109% – 100%).

إذا انخفضت المستويات المطلقة في السلسلة، فإن المعدل سيكون أقل من 100٪، وبالتالي سيكون هناك معدل النقصان (معدل الزيادة بعلامة الطرح).

القيمة المطلقة للزيادة 1%(غرام.
نشر على المرجع.rf
11) يوضح عدد الوحدات المطلوب إنتاجها في فترة معينة بحيث يرتفع مستوى الفترة السابقة بنسبة 1%. في مثالنا، في عام 1995 ᴦ. كان من الضروري إنتاج 2.0 ألف طن، وفي عام 1998 ᴦ. - 2.3 ألف طن ᴛ.ᴇ. أكبر بكثير.

يمكن تحديد القيمة المطلقة للنمو بنسبة 1% بطريقتين:

§ مستوى الفترة السابقة مقسوما على 100؛

§ الزيادات المطلقة في السلسلة تقسم على معدلات نمو السلسلة المقابلة لها.

القيمة المطلقة للزيادة 1% =

إلى جانب المؤشرات التحليلية المدروسة، والتي يتم حسابها لكل عام مقارنة بالمستوى السابق أو الأولي، عند تحليل سلسلة الديناميكيات، من المهم للغاية حساب متوسط المؤشرات التحليلية للفترة: متوسط مستوى السلسلة، المتوسط السنوي المطلق الزيادة (النقصان) ومتوسط معدل النمو السنوي ومعدل النمو.

متوسط حجم الإنتاج السنوي للمنتج للأعوام 1994-1998. بلغت 218.4 ألف طن.

ويتم حساب متوسط النمو المطلق السنوي أيضًا باستخدام صيغة المتوسط الحسابي

الانحراف المعياري - المفهوم والأنواع. تصنيف ومميزات فئة "متوسط انحراف مربع" 2017، 2018.

ويسمى الجذر التربيعي للتباين بالانحراف المعياري عن المتوسط، ويتم حسابه على النحو التالي:

يؤدي التحويل الجبري الأولي لصيغة الانحراف المعياري إلى الشكل التالي:

غالبًا ما تكون هذه الصيغة أكثر ملاءمة في ممارسة الحساب.

يُظهر الانحراف المعياري، تمامًا مثل متوسط الانحراف الخطي، مدى انحراف القيم المحددة لخاصية ما عن متوسط قيمتها. يكون الانحراف المعياري دائمًا أكبر من متوسط الانحراف الخطي. وهناك العلاقة التالية بينهما:

وبمعرفة هذه النسبة يمكنك استخدام المؤشرات المعلومة لتحديد المجهول مثلا ولكن (أنا احسب a والعكس يقيس الانحراف المعياري الحجم المطلق لتباين الخاصية ويتم التعبير عنه بنفس وحدات القياس مثل قيم الخاصية (الروبل، الأطنان، السنوات، إلخ). إنه مقياس مطلق للتنوع.

ل علامات بديلة, على سبيل المثال، وجود أو عدم وجود التعليم العالي والتأمين وصيغ التشتت والانحراف المعياري هي كما يلي:

دعونا نبين حساب الانحراف المعياري وفقا لبيانات سلسلة منفصلة تميز توزيع الطلاب في إحدى كليات الجامعة حسب العمر (الجدول 6.2).

الجدول 6.2.

وترد نتائج الحسابات المساعدة في الأعمدة 2-5 من الجدول. 6.2.

يتم تحديد متوسط عمر الطالب بالسنوات من خلال معادلة المتوسط الحسابي المرجح (العمود 2):

وترد الانحرافات المربعة للعمر الفردي للطالب عن المتوسط في الأعمدة 3-4، وترد منتجات الانحرافات المربعة والتكرارات المقابلة في العمود 5.

نجد التباين في عمر الطلاب وسنواتهم باستخدام الصيغة (6.2):

ثم o = l/3.43 1.85 *oda، أي. تنحرف كل قيمة محددة لعمر الطالب عن المتوسط بمقدار 1.85 سنة.

معامل الاختلاف

في قيمته المطلقة، لا يعتمد الانحراف المعياري فقط على درجة تباين الخاصية، ولكن أيضًا على المستويات المطلقة للخيارات والمتوسط. لذلك، من المستحيل إجراء مقارنة مباشرة للانحرافات المعيارية لسلسلة التباين مع مستويات متوسطة مختلفة. لتتمكن من إجراء مثل هذه المقارنة، تحتاج إلى العثور على حصة متوسط الانحراف (الخطي أو التربيعي) في المتوسط الحسابي، معبرًا عنها كنسبة مئوية، أي. احسب التدابير النسبية للاختلاف.

معامل التباين الخطي تحسب بواسطة الصيغة

معامل الاختلاف تحددها الصيغة التالية:

في معاملات الاختلاف، لا يتم التخلص فقط من عدم القابلية للمقارنة المرتبطة بوحدات قياس مختلفة للخاصية قيد الدراسة، ولكن أيضًا عدم القابلية للمقارنة التي تنشأ بسبب الاختلافات في قيمة الوسائل الحسابية. بالإضافة إلى ذلك، فإن مؤشرات التباين تميز تجانس السكان. ويعتبر السكان متجانسين إذا كان معامل الاختلاف لا يتجاوز 33%.

حسب الجدول. 6.2 ومن خلال نتائج الحساب التي تم الحصول عليها أعلاه، نحدد معامل الاختلاف٪ وفقا للصيغة (6.3):

إذا تجاوز معامل التباين 33%، فهذا يدل على عدم تجانس المجتمع قيد الدراسة. تشير القيمة التي تم الحصول عليها في حالتنا إلى أن عدد الطلاب حسب العمر متجانس في التكوين. وبالتالي، فإن إحدى الوظائف المهمة لتعميم مؤشرات التباين هي تقييم موثوقية المتوسطات. الأقل ج1, أ2 و الخامس، كلما كانت مجموعة الظواهر الناتجة أكثر تجانسًا وكان المتوسط الناتج أكثر موثوقية. وفقا لـ "قاعدة سيجما الثلاثة" التي تعتمدها الإحصائيات الرياضية، في السلاسل الموزعة طبيعيا أو القريبة منها، فإن الانحرافات عن الوسط الحسابي لا تتجاوز ±3 تحدث في 997 حالة من أصل 1000. وبالتالي، فإن معرفة X وأ، يمكنك الحصول على فكرة أولية عامة عن سلسلة الاختلافات. على سبيل المثال، إذا كان متوسط راتب الموظف في الشركة هو 25000 روبل، ويساوي 100 روبل، فمع احتمال قريب من اليقين، يمكننا القول أن أجور موظفي الشركة تتقلب ضمن النطاق (25000 ± ± 3 × 100 ) أي من 24700 إلى 25300 روبل.

جذر متوسط المربع أو الانحراف المعياري هو مؤشر إحصائي يقيم مقدار تقلب العينة العددية حول قيمتها المتوسطة. دائمًا تقريبًا، يتم توزيع غالبية القيم ضمن انحراف معياري زائد أو ناقص واحد عن المتوسط.

تعريف

الانحراف المعياري هو الجذر التربيعي للوسط الحسابي لمجموع الانحرافات التربيعية عن المتوسط. صارمة ورياضية، ولكن غير مفهومة على الاطلاق. هذا وصف لفظي لصيغة حساب الانحراف المعياري، ولكن لفهم معنى هذا المصطلح الإحصائي، دعونا نفهم كل شيء بالترتيب.

تخيل ميدان الرماية والهدف والسهم. يطلق القناص النار على هدف قياسي، حيث إصابة المركز تعطي 10 نقاط، وبحسب المسافة من المركز ينخفض عدد النقاط، أما إصابة المناطق القصوى فتعطي نقطة واحدة فقط. كل طلقة يطلقها مطلق النار هي قيمة عددية عشوائية تتراوح بين 1 و10. الهدف المليء بالرصاص هو مثال مثالي لتوزيع متغير عشوائي.

القيمة المتوقعة

لقد تدرب مطلق النار المبتدئ لدينا على إطلاق النار لفترة طويلة ولاحظ أنه وصل إلى قيم مختلفة باحتمال معين. لنفترض أنه بناءً على عدد كبير من الطلقات، اكتشف أنه وصل إلى 10 باحتمال 15%. تلقت القيم المتبقية احتمالاتها:

9 - 25 %;
8 - 20 %;
7 - 15 %;
6 - 15 %;
5 - 5 %;
4 - 5 %.

وهو الآن يستعد لأخذ لقطة أخرى. ما هي القيمة التي من المرجح أن يصل إليها؟ سيساعدنا التوقع الرياضي في الإجابة على هذا السؤال. وبمعرفة كل هذه الاحتمالات، يمكننا تحديد النتيجة الأكثر احتمالا للطلقة. صيغة حساب التوقع الرياضي بسيطة للغاية. دعنا نشير إلى قيمة اللقطة بـ C والاحتمال بـ p. سيكون التوقع الرياضي مساوياً لمجموع حاصل ضرب القيم المقابلة واحتمالاتها:

دعونا نحدد التوقع لمثالنا:

م = 10 × 0.15 + 9 × 0.25 + 8 × 0.2 + 7 × 0.15 + 6 × 0.15 + 5 × 0.05 + 4 × 0.05
م = 7.75

لذا، فمن المرجح أن يصل مطلق النار إلى منطقة النقاط السبع. ستكون هذه المنطقة هي الأكثر كثافة، وهي نتيجة ممتازة للضربات الأكثر تكرارًا. بالنسبة لأي متغير عشوائي، القيمة المتوقعة تعني القيمة الأكثر شيوعًا أو مركز جميع القيم.

تشتت

التشتت هو مؤشر إحصائي آخر يوضح انتشار القيمة. هدفنا مليء بالرصاص بكثافة، ويسمح لنا التشتت بالتعبير عن هذه المعلمة عدديًا. إذا كان التوقع الرياضي يوضح مركز اللقطات، فإن التشتت هو انتشارها. في جوهره، يعني التشتت التوقع الرياضي لانحرافات القيم عن القيمة المتوقعة، أي متوسط مربع الانحرافات. يتم تربيع كل قيمة بحيث تكون الانحرافات موجبة فقط ولا تلغي بعضها البعض في حالة وجود أرقام متطابقة ذات إشارات متضادة.

د[X] = م − (M[X]) 2

دعونا نحسب انتشار الطلقات لحالتنا:

م = 10 2 × 0.15 + 9 2 × 0.25 + 8 2 × 0.2 + 7 2 × 0.15 + 6 2 × 0.15 + 5 2 × 0.05 + 4 2 × 0.05
م = 62.85
د[X] = م − (M[X]) 2 = 62.85 − (7.75) 2 = 2.78

إذن انحرافنا هو 2.78. وهذا يعني أنه من المنطقة على الهدف بقيمة 7.75، تنتشر ثقوب الرصاص بمقدار 2.78 نقطة. ومع ذلك، في شكلها النقي، لا يتم استخدام قيمة التباين - والنتيجة هي مربع القيمة، في مثالنا هذه نقطة مربعة، ولكن في حالات أخرى يمكن أن تكون كيلوجرامات مربعة أو دولارات مربعة. التشتت كقيمة مربعة ليس مفيدًا، لذا فهو يمثل مؤشرًا وسيطًا لتحديد الانحراف المعياري - بطل مقالتنا.

الانحراف المعياري

لتحويل التباين إلى نقاط أو كيلوجرامات أو دولارات ذات معنى، نستخدم الانحراف المعياري، وهو الجذر التربيعي للتباين. لنحسبها في مثالنا:

S = جذر(د) = جذر(2.78) = 1.667

لقد حصلنا على النقاط ويمكننا الآن استخدامها للتواصل مع التوقعات الرياضية. سيتم التعبير عن النتيجة الأكثر احتمالاً للطلقة في هذه الحالة بـ 7.75 زائد أو ناقص 1.667. هذا يكفي للإجابة، لكن يمكننا القول أيضًا أنه من شبه المؤكد أن مطلق النار سيصيب منطقة الهدف بين 6.08 و9.41.

الانحراف المعياري أو سيجما هو مؤشر إعلامي يوضح انتشار القيمة بالنسبة لمركزها. كلما كان سيجما أكبر، كلما زاد انتشار العينة. هذا معامل مدروس جيدًا وقاعدة سيجما الثلاثة المثيرة للاهتمام معروفة بالتوزيع الطبيعي. لقد ثبت أن 99.7٪ من قيم الكمية الموزعة بشكل طبيعي تقع في منطقة زائد أو ناقص ثلاثة سيجما من الوسط الحسابي.

لنلقي نظرة على مثال

تقلبات زوج العملات

ومن المعروف أن أساليب الإحصاء الرياضي تستخدم على نطاق واسع في سوق الصرف الأجنبي. تحتوي العديد من محطات التداول على أدوات مدمجة لحساب تقلب الأصول، مما يدل على قياس تقلب سعر زوج العملات. بالطبع، الأسواق المالية لديها تفاصيلها الخاصة لحساب التقلبات، مثل أسعار الافتتاح والختام لبورصات الأوراق المالية، ولكن على سبيل المثال، يمكننا حساب سيجما لآخر سبع شموع يومية وتقدير التقلبات الأسبوعية تقريبًا.

يعتبر زوج العملات جنيه/ين بحق الأصل الأكثر تقلبًا في سوق الفوركس. لنفترض نظريًا، خلال الأسبوع، أن سعر إغلاق بورصة طوكيو يأخذ القيم التالية:

145, 147, 146, 150, 152, 149, 148.

لندخل هذه البيانات في الآلة الحاسبة ونحسب سيجما يساوي 2.23. وهذا يعني أن الين الياباني يتغير في المتوسط بمقدار 2.23 ين كل يوم. إذا كان كل شيء على ما يرام، فإن التجار سيكسبون الملايين من مثل هذه الحركات.

خاتمة

يستخدم الانحراف المعياري في التحليل الإحصائي للعينات العددية. يعد هذا معاملًا مفيدًا لتقييم انتشار البيانات، نظرًا لأن مجموعتين لهما نفس القيمة المتوسطة على ما يبدو يمكن أن تكونا مختلفتين تمامًا في انتشار القيم. استخدم الآلة الحاسبة الخاصة بنا للعثور على عينة صغيرة من سيجما.