مراجعة طرق تحليل البيانات الإحصائية. الأساليب الإحصائية لتحليل المعلومات

مراجعة طرق تحليل البيانات الإحصائية.  الأساليب الإحصائية لتحليل المعلومات

يعرّف هذا المقرر الطلاب على المشاكل الأساسية وطرق الإحصاء التطبيقي.

اهداف الدورة- ربط النظرية والتطبيق، وتعليم الطلاب "رؤية" المشاكل الإحصائية في مختلف المجالات الدراسية وتطبيق أساليب الإحصاء التطبيقي بشكل صحيح، وإظهار الأمثلة العملية لإمكانيات وقيود الأساليب الإحصائية. تحتوي الدورة على تركيز منهجي وليس رياضي ولا تحتوي على أدلة على النظريات.

يتم وصف كل طريقة وفقًا لمخطط واحد:

  • صياغة المشكلة؛
  • أمثلة على المشاكل التطبيقية من مجالات علم الأحياء والاقتصاد وعلم الاجتماع والتصنيع والطب؛
  • الافتراضات الأساسية وحدود التطبيق؛
  • وصف الطريقة (لطرق اختبار الفرضيات الإحصائية: الفرضية الصفرية والبدائل، الإحصائيات، توزيعها الصفري)؛
  • المزايا والعيوب والقيود والمزالق.
  • المقارنة مع الطرق الأخرى.

تم تدريس الدورة لطلاب السنة الرابعة من قسم طرق التنبؤ الرياضي في جامعة موسكو الحكومية منذ عام 2007 ولطلاب السنة الرابعة من كلية الإدارة والرياضيات التطبيقية في MIPT منذ عام 2011. من المفترض أن يكون الطلاب قد تلقوا بالفعل دورات في نظرية الاحتمالات والإحصاء الرياضي.

برنامج الدورة

مقدمة

مراجعة المعلومات الضرورية من نظرية الاحتمالات والإحصاء الرياضي.

  • مفاهيم أخذ العينات البسيطة والإحصائيات. أمثلة على الإحصاء: العزوم، الانحراف والتفرطح، سلاسل التباين والإحصائيات الترتيبية، التوزيع التجريبي.
  • تقديرات النقاط الإحصائية وخصائصها: عدم التحيز، الاتساق، المثالية، المتانة.
  • تقديرات الفترات ومفاهيم فترة الثقة ومستوى الثقة. فترات الثقة للمتوسط ​​والوسيط.
  • التوزيعات الشائعة الاستخدام: عادي، مربع كاي، فيشر، الطالب، برنولي، ذو الحدين، بواسون.
  • اختبار الفروض الإحصائية، المفاهيم الأساسية: مستوى الدلالة، مستوى الدلالة المحقق (p-value)، الأخطاء من النوع الأول والنوع الثاني. البدائل أحادية الجانب والثنائية.
  • خصائص مستويات الأهمية المحققة. الأهمية الإحصائية والعملية.
  • خصائص المعايير: عدم التحيز، والاتساق، والقوة.

اختبار الفرضيات البارامترية

  • معايير الحالة الطبيعية: اختبار مربع كاي (بيرسون)، اختبار شابيرو-ويلك، معايير تعتمد على الاختلافات بين وظائف التوزيع التجريبية والنظرية، اختبار كولموجوروف-سميرنوف (ليلفورس). اختبار مبسط للحياة الطبيعية عن طريق الانحراف والتفرطح: اختبار جارك بيرا.
  • الاختبارات البارامترية العادية لاختبار الفرضيات: فرضيات الموضع، فرضيات التشتت.
  • فرضيات حول الوسائل: اختبارات t وz ذات العينة الواحدة والعينتين، والعينات المرتبطة
  • فرضيات حول التباينات: اختبارات كاي ومربع فيشر.
  • فرضيات حول قيم معلمة توزيع برنولي: مقارنة قيمة المعلمة بقيمة معينة، مقارنة معلمات توزيعات عينتين (حالات العينات المرتبطة والمستقلة).
  • فاصل الثقة لمعلمة توزيع برنولي: والد، ويلسون. فترات الثقة ويلسون للفرق بين معلمات عينتين.

اختبار الفرضيات اللامعلمية

اختبار الفرضيات المتعددة

تحليل التباين (ANOVA)

  • نموذج العامل الواحد. عينات مستقلة: اختبارات فيشر، كروسكال واليس، جونكهيري. العينات ذات الصلة: اختبارات فيشر وفريدمان وبيج. افتراض كروية.
  • نموذج التأثير العشوائي وتقاسم التباين.
  • نموذج التأثير الثابت، تحسين الفروق: طرق LSD وHSD، اختبارات Nemenyi وDunnett.
  • اختبار فرضية مساواة التباينات: اختبارات بارتليت وفلينر-كيليان.
  • نموذج ذو عاملين. تفاعل العوامل وتفسيرها. التحليل الطبيعي في اتجاهين. التصميم الهرمي.

تحليل التبعية

تحليل الانحدار الخطي

تعميمات الانحدار الخطي

  • النماذج الخطية المعممة. وظيفة التوصيل. تقدير المعلمات باستخدام طريقة الاحتمالية القصوى.
  • فترات الثقة وتقييم أهمية المعاملات واختبارات والد ونسب الاحتمال.
  • مقاييس الجودة للنماذج الخطية المعممة: الشذوذ، معايير المعلومات.
  • بيان مشكلة الانحدار اللوجستي. لوجيت، تفسير معاملات الانحدار اللوجستي.
  • اختبار الخطية اللوغاريتمية: مخططات التشتت المتجانسة، ومتعددات الحدود الكسرية.
  • التصنيف على أساس الانحدار اللوجستي: الحساسية والنوعية واختيار العتبة.
  • الانحدار من خاصية العد. نموذج بواسون.
  • - افتراض مساواة التوقع والتباين والتحقق منه. نموذج ذو الحدين السلبي. تقدير قوي للمعامل التشتت.

تحليل السلاسل الزمنية

التحليل التسلسلي

[والد، موخوبادهياي]

  • التطبيق في مسائل اختبار الفرضيات حول قيم معلمة التوزيع ذات الحدين: مقارنة قيمة بقيمة معينة، مقارنة قيمتين.
  • التطبيق في مسائل اختبار الفرضيات حول قيم معلمات التوزيع الطبيعي: مقارنة قيمة الوسط مع تلك المعطاة (الخيارات المتماثلة وغير المتماثلة)، مقارنة قيمة التشتت مع القيمة المعطاة.
  • فترات الثقة المتسلسلة لمجتمع عادي تعني تباين غير معروف (إجراء متسلسل من خطوتين). إجراءات الفرق بين متوسطي مجتمعين طبيعيين، حالات التباين المتساوي وغير المتساوي.
  • فترات الثقة المتسلسلة غير البارامترية للمتوسط ​​والوسيط.

تحليل السبب والنتيجة

  • عدم قابلية حل مفارقة سيمبسون في إطار الإحصاء الكلاسيكي.
  • الرسوم البيانية السببية، السلاسل، الشوك، المصادمات. د-الانفصال.
  • التدخلات. تقدير التأثير من بيانات الرصد. جراحة الرسم البياني وصيغة التعديل.
  • قاعدة الأثر السببي. خيارات للآباء الغائبين: قاعدة الباب الخلفي، قاعدة الباب الأمامي.
  • درجة الميل، الترجيح الاحتمالي العكسي.
  • الرسوم البيانية في النماذج الخطية. العلاقة مع المعادلات الهيكلية.

الأدب

  1. والد، أ.التحليل التسلسلي. - م: فيزماتليت، 1960.
  2. لاجوتين، م.ب.الإحصائيات الرياضية المرئية. في مجلدين. - م: مركز ع، 2003.
  3. كوبزار، أ.الإحصاء الرياضي التطبيقي. - م: فيزماتليت، 2006.
  4. أجرستي، أ.تحليل البيانات الفئوية. - هوبوكين: جون وايلي وأولاده، 2013.
  5. بونيني، إس، كورين، إل، ماروزي، إم، سلماسو إس.اختبار الفرضية اللامعلمية: طرق الترتيب والتبديل مع التطبيقات في R. - هوبوكين: John Wiley & Sons, 2014.
  6. بريتز، ف.، هوثورن، تي.، ويستفول، P.مقارنات متعددة باستخدام R. - بوكا راتون: تشابمان وهال/CRC، 2010.
  7. كاميرون، أ.أ.، تريفيدي، ب.ك.تحليل الانحدار لبيانات العد. - كامبريدج: مطبعة جامعة كامبريدج، 2013.
  8. ديكهاوس، T.الاستدلال الإحصائي المتزامن مع التطبيقات في علوم الحياة. - هايدلبرغ: سبرينغر، 2014.
  9. ع جيدة.التقليب، البارامترية واختبارات التمهيد للفرضيات: دليل عملي لطرق إعادة تشكيل اختبار الفرضيات. - نيويورك: سبرينغر، 2005.
  10. هاستي، ت.، تيبشيراني، آر.، فريدمان، ج.عناصر التعلم الإحصائي، الطبعة الثانية. - سبرينغر، 2009. - 533 ص. ()
  11. هوسمر، دي دبليو، ليميشو إس، ستورديفانت، آر إكس.الانحدار اللوجستي التطبيقي. - هوبوكين: جون وايلي وأولاده، 2013.
  12. هيندمان، آر جيه، أثاناسوبولوس جي.التنبؤ: المبادئ والممارسة. - أوتيكتس، 2015. https://www.otexts.org/book/fpp
  13. كانجي، ج.ك. 100 اختبار إحصائي. - لندن: منشورات SAGE، 2006.
  14. موخوبادهياي، ن.، دي سيلفا، بي. إم.الطرق المتسلسلة وتطبيقاتها. - بوكا راتون: تشابمان وهال/CRC، 2009.
  15. أولسون، يو.النماذج الخطية المعممة: منهج تطبيقي. - لوند: أدب الطلاب، 2004.
  16. بيرل جيه، جليمور إم، جيويل إن بي.الاستدلال السببي في الإحصاء: كتاب تمهيدي. - تشيتشيستر: جون وايلي وأولاده، 2016.
  17. تاباتشنيك، بي.جي.، فيدل، إل.إس.استخدام الإحصائيات متعددة المتغيرات. - بوسطن: تعليم بيرسون، 2012.
  18. وولدريدج، ج.الاقتصاد القياسي التمهيدي: نهج حديث. - ميسون: التعلم الجنوبي الغربي، 2013.

العملاء والمستهلكون - لا يقتصر الأمر على جمع المعلومات فحسب، بل دراسة كاملة. والهدف من أي بحث هو التفسير العلمي للحقائق المدروسة. يجب معالجة المواد الأولية، أي تنظيمها وتحليلها، وبعد إجراء المقابلات مع المشاركين، يتم تحليل بيانات البحث. هذه مرحلة رئيسية. وهي عبارة عن مجموعة من التقنيات والأساليب التي تهدف إلى التحقق من مدى صحة الافتراضات والفرضيات، وكذلك الإجابة على الأسئلة المطروحة. ربما تكون هذه المرحلة هي الأصعب من حيث الجهد الفكري والمؤهلات المهنية، ولكنها تتيح لك الحصول على أقصى قدر من المعلومات المفيدة من البيانات المجمعة. تتنوع طرق تحليل البيانات. يعتمد اختيار طريقة معينة، أولاً وقبل كل شيء، على الأسئلة التي نريد الإجابة عليها. يمكن التمييز بين فئتين من إجراءات التحليل:

  • أحادي البعد (وصفي) و
  • متعدد الأبعاد.

الغرض من التحليل أحادي المتغير هو وصف إحدى خصائص العينة في وقت محدد. دعونا نلقي نظرة فاحصة.

أنواع تحليل البيانات أحادية البعد

بحث كمي

التحليل الوصفي

الإحصائيات الوصفية (أو الوصفية) هي الطريقة الأساسية والأكثر شيوعًا لتحليل البيانات. تخيل أنك تجري استطلاعًا لإنشاء صورة لمستهلك منتج ما. يشير المستجيبون إلى جنسهم وعمرهم وحالتهم الاجتماعية والمهنية وتفضيلات المستهلك وما إلى ذلك، وتتيح الإحصائيات الوصفية الحصول على المعلومات التي سيتم على أساسها بناء الصورة بأكملها. بالإضافة إلى الخصائص الرقمية، يتم إنشاء مجموعة متنوعة من الرسوم البيانية للمساعدة في تصور نتائج الاستطلاع. كل هذا التنوع في البيانات الثانوية متحد بمفهوم "التحليل الوصفي". غالبًا ما يتم عرض البيانات الرقمية التي تم الحصول عليها أثناء الدراسة في التقارير النهائية في شكل جداول تكرارية. يمكن أن تظهر الجداول أنواعًا مختلفة من الترددات. لنلقي نظرة على مثال: الطلب المحتمل على المنتج

  1. يوضح التكرار المطلق عدد المرات التي تتكرر فيها استجابة معينة في العينة. على سبيل المثال، سيشتري 23 شخصًا المنتج المقترح بقيمة 5000 روبل، و41 شخصًا بقيمة 4500 روبل. و 56 شخصًا - 4399 روبل.
  2. يوضح التكرار النسبي النسبة التي تشكلها هذه القيمة من إجمالي حجم العينة (23 شخصًا - 19.2%، 41 - 34.2%، 56 - 46.6%).
  3. يوضح التكرار التراكمي أو المتراكم نسبة عناصر العينة التي لا تتجاوز قيمة معينة. على سبيل المثال، تغيير في النسبة المئوية للمستجيبين المستعدين لشراء منتج معين إذا انخفض سعره (19.2٪ من المستجيبين مستعدون لشراء منتج مقابل 5000 روبل، 53.4٪ - من 4500 إلى 5000 روبل، و 100 ٪ - من 4399 إلى 5000 روبل).

إلى جانب الترددات، يتضمن التحليل الوصفي حساب الإحصائيات الوصفية المختلفة. طبقًا لاسمهم، فإنهم يقدمون معلومات أساسية حول البيانات التي تم جمعها. دعونا نوضح أن استخدام إحصائيات محددة يعتمد على المقاييس التي يتم بها تقديم المعلومات الأولية. المقياس الإسمي يستخدم لتسجيل الكائنات التي ليس لها ترتيب مرتبة (الجنس، مكان الإقامة، العلامة التجارية المفضلة، وما إلى ذلك). بالنسبة لهذا النوع من مصفوفة البيانات، من المستحيل حساب أي مؤشرات إحصائية مهمة، باستثناء موضة- القيمة الأكثر تكرارًا للمتغير. ومن حيث التحليل، فإن الوضع أفضل إلى حد ما مع مقياس ترتيبي . هنا يصبح من الممكن، جنبا إلى جنب مع الموضة، لحساب الوسطاء- القيمة التي تقسم العينة إلى قسمين متساويين. على سبيل المثال، إذا كانت هناك عدة فترات زمنية لسعر منتج ما (500-700 روبل، 700-900، 900-1100 روبل)، فإن الوسيط يسمح لك بتحديد السعر الدقيق، الأكثر تكلفة أو الأرخص من السعر الذي يرغب المستهلكون في شرائه أو ، على العكس من ذلك، رفض الشراء. الأغنى في جميع الإحصائيات الممكنة المقاييس الكمية وهي عبارة عن سلسلة من القيم العددية المتباعدة بشكل متساوي وقابلة للقياس. ومن أمثلة هذه المقاييس مستوى الدخل، والعمر، والوقت الذي يقضيه في التسوق، وما إلى ذلك. وفي هذه الحالة، تصبح المعلومات التالية متاحة: مقاسات: المتوسط، المدى، الانحراف المعياري، الخطأ المعياري للوسط. بالطبع، لغة الأرقام "جافة" إلى حد ما وغير مفهومة للكثيرين. لهذا السبب، يتم استكمال التحليل الوصفي بتصور البيانات من خلال إنشاء مخططات ورسوم بيانية مختلفة، مثل الرسوم البيانية أو المخططات الخطية أو الدائرية أو المبعثرة.

جداول الطوارئ والارتباط

جداول الطوارئهي وسيلة لتمثيل توزيع متغيرين، تهدف إلى دراسة العلاقة بينهما. يمكن اعتبار جداول الطوارئ نوعًا خاصًا من التحليل الوصفي. من الممكن أيضًا تقديم المعلومات في شكل ترددات مطلقة ونسبية، أو تصور رسومي في شكل رسوم بيانية أو رسوم بيانية مبعثرة. تعتبر جداول الطوارئ أكثر فعالية في تحديد ما إذا كانت هناك علاقة بين المتغيرات الاسمية (على سبيل المثال، بين الجنس واستهلاك المنتج). بشكل عام، يبدو جدول الطوارئ هكذا. العلاقة بين الجنس واستخدام خدمات التأمين

إرسال عملك الجيد في قاعدة المعرفة أمر بسيط. استخدم النموذج أدناه

سيكون الطلاب وطلاب الدراسات العليا والعلماء الشباب الذين يستخدمون قاعدة المعرفة في دراساتهم وعملهم ممتنين جدًا لك.

تم النشر على http://www.allbest.ru/

  • 3. سلسلة الديناميكيات
  • الأدب

1. القيم المطلقة والنسبية

ونتيجة لتلخيص وتجميع المواد الإحصائية، يجد الباحث نفسه بين يدي مجموعة واسعة من المعلومات حول الظواهر والعمليات التي تتم دراستها. ومع ذلك، سيكون من الخطأ الكبير التركيز على النتائج التي تم الحصول عليها، لأنه حتى لو تم تجميعها حسب خصائص معينة وانعكاسها في شكل جدول أو رسوم بيانية، فإن هذه البيانات لا تزال مجرد نوع من التوضيح، وهي نتيجة وسيطة يجب تحليلها - في هذه الحالة , إحصائية . إحصائيةتحليل - هذا أداء درس هدف الخامس جودة مقطعة أنظمة, أولئك. معقد عناصر و روابط، تشكيل الخامس له تفاعل عضوي جميع.

نتيجة لهذا التحليل، ينبغي بناء نموذج للكائن قيد الدراسة، وبما أننا نتحدث عن الإحصائيات، فيجب استخدام العناصر والروابط ذات الأهمية الإحصائية عند بناء النموذج.

في الواقع، يهدف التحليل الإحصائي إلى تحديد هذه العناصر والروابط الهامة.

مطلقالمؤشرات(القيم) - القيم الإجمالية المحسوبة أو المأخوذة من التقارير الإحصائية الموجزة دون أي تحويلات. المؤشرات المطلقة هي دائما اسمية وتنعكس في وحدات القياس التي تم تحديدها عند وضع برنامج المراقبة الإحصائية (عدد القضايا الجنائية المرفوعة، عدد الجرائم المرتكبة، عدد حالات الطلاق، الخ).

والمؤشرات المطلقة هي الأساس لأي عمليات إحصائية أخرى، ولكنها في حد ذاتها ليست ذات فائدة تذكر في التحليل. باستخدام المؤشرات المطلقة، على سبيل المثال، من الصعب الحكم على مستوى الجريمة في مدن أو مناطق مختلفة، ومن المستحيل عمليا الإجابة على سؤال أين تكون الجريمة أعلى وأين أقل، لأن المدن أو المناطق يمكن أن تختلف بشكل كبير في عدد السكان والإقليم والبلد. المعلمات الهامة الأخرى.

نسبيكمياتفي الإحصاء، هي مؤشرات معممة تكشف الشكل العددي للعلاقة بين كميتين إحصائيتين مقارنتين. عند حساب القيم النسبية، غالبا ما تتم مقارنة قيمتين مطلقتين، ولكن من الممكن مقارنة القيم المتوسطة والنسبية، والحصول على مؤشرات نسبية جديدة. إن أبسط مثال لحساب القيمة النسبية هو الإجابة على السؤال: كم مرة يكون الرقم أكبر من الآخر؟

عند البدء في النظر في القيم النسبية، من الضروري مراعاة ما يلي. من حيث المبدأ، يمكنك مقارنة أي شيء تريده، حتى الأبعاد الخطية لورقة من ورق A4 مع كمية المنتجات التي ينتجها مصنع لومونوسوف للخزف. ومع ذلك، فإن مثل هذه المقارنة لن تعطينا أي شيء. ويمكن صياغة الشرط الأهم للحساب المثمر للكميات النسبية على النحو التالي:

1. يجب أن تكون وحدات قياس الكميات محل المقارنة واحدة أو متشابهة تماماً. عدد الجرائم والقضايا الجنائية والإدانات هي مؤشرات مترابطة، أي. مترابطة، ولكن غير قابلة للمقارنة في وحدات القياس. في قضية جنائية واحدة، يمكن محاكمة عدة جرائم وإدانة مجموعة من الأشخاص؛ يمكن أن يرتكب عدة مدانين جريمة واحدة، وعلى العكس من ذلك، يمكن لشخص مدان واحد أن يرتكب العديد من الأفعال. إن أعداد الجرائم والقضايا والإدانات قابلة للمقارنة مع عدد السكان وعدد العاملين في نظام العدالة الجنائية ومستوى معيشة الناس وغيرها من البيانات لنفس العام. علاوة على ذلك، على مدار عام واحد، تكون المؤشرات قيد النظر قابلة للمقارنة تمامًا مع بعضها البعض.

2. يجب أن تتوافق البيانات المقارنة بالضرورة مع بعضها البعض من حيث وقت أو منطقة استلامها، أو كلا المعلمتين معًا.

مطلق مقاس، مع أيّ تم مقارنتها آخر الخامسهتنكر, مُسَمًّى أساس أو قاعدة مقارنات, أ يقارنومنحوت فِهرِس - مقاس مقارنات. على سبيل المثال، عند حساب نسبة ديناميكيات الجريمة في روسيا في الفترة 2000-2010. وستكون بيانات عام 2000 بمثابة خط الأساس. يمكن اعتبارها واحدة (ثم يتم التعبير عن القيمة النسبية في شكل معامل)، أو 100 (كنسبة مئوية). اعتمادا على أبعاد القيم التي تتم مقارنتها، يتم اختيار الشكل الأكثر ملاءمة وإرشادية ومرئية للتعبير عن القيمة النسبية.

إذا كانت القيمة التي تتم مقارنتها أكبر بكثير من الأساس، فمن الأفضل التعبير عن النسبة الناتجة بالمعاملات. على سبيل المثال، زادت الجريمة خلال فترة معينة (بالسنوات) بمقدار 2.6 مرة. سيكون التعبير بالأوقات في هذه الحالة أكثر دلالة من النسب المئوية. يتم التعبير عن القيم النسبية كنسب مئوية عندما لا تختلف قيمة المقارنة كثيرًا عن القاعدة.

الكميات النسبية المستخدمة في الإحصاءات، بما في ذلك الإحصاءات القانونية، تأتي في أنواع مختلفة. تُستخدم الأنواع التالية من الكميات النسبية في الإحصاءات القانونية:

1. العلاقات التي تميز التركيبة السكانية، أو علاقات التوزيع؛

2. علاقة الجزء بالكل، أو علاقة الشدة؛

3. العلاقات التي تميز الديناميكيات؛

4. علاقات الدرجة والمقارنة.

نسبيضخامةتوزيع - هذا نسبي مقاس، أعربت الخامس نسبه مئويه فردي القطع مجمل درس الظواهر(الجرائم، المجرمين، القضايا المدنية، الدعاوى القضائية، الأسباب، إجراءات الوقاية، إلخ.) ل هُم عام نتيجة ل، قبلت خلف 100% . هذا هو النوع الأكثر شيوعًا (والأبسط) من البيانات النسبية المستخدمة في الإحصائيات. هذا، على سبيل المثال، هيكل الجريمة (حسب نوع الجريمة)، وهيكل السجلات الجنائية (حسب نوع الجريمة، حسب عمر المدانين)، وما إلى ذلك.

التحليل الإحصائي القيمة المطلقة

سلوكشدة(نسبة الجزء إلى الكل) - قيمة نسبية معممة تعكس مدى انتشار خاصية معينة في الملاحظة مجمل.

مؤشر الكثافة الأكثر شيوعًا المستخدم في الإحصاءات القانونية هو شدة الجريمة . عادة ما تنعكس شدة الجريمة من خلال معدل الجريمة , أولئك. عدد الجرائم لكل 100 أو 10 آلاف نسمة.

KP= (P*100000)/N

حيث P هو العدد المطلق للجرائم المسجلة، وN هو الحجم المطلق للسكان.

الشرط الأساسي الذي يحدد إمكانية حساب هذه المؤشرات، كما ذكر أعلاه، هو أن جميع المؤشرات المطلقة المستخدمة تؤخذ في منطقة واحدة ولفترة زمنية واحدة.

علاقة،وصفديناميات، يمثل تعميم نسبي كميات، عرض يتغير في وقت أولئك أو آخر المؤشرات قانوني إحصائيات. عادةً ما يتم اعتبار الفاصل الزمني عامًا.

الأساس (الأساس) الذي يساوي 1، أو 100%، يؤخذ على أنه معلومات حول الخاصية التي تتم دراستها لسنة معينة، والتي كانت بطريقة ما مميزة للظاهرة قيد الدراسة. وتعمل بيانات سنة الأساس بمثابة قاعدة ثابتة تُنسب إليها مؤشرات السنوات اللاحقة.

غالبًا ما تتطلب مهام التحليل الإحصائي مقارنات سنوية (أو فترة أخرى) متى قاعدة قبلت بيانات الجميع سابق من السنة(شهر أو فترة أخرى). تسمى هذه القاعدة متحرك. يستخدم هذا عادةً في تحليل السلاسل الزمنية (السلاسل الزمنية).

علاقةدرجاتومقارناتجعل من الممكن مقارنة المؤشرات المختلفة من أجل تحديد القيمة التي هي أكبر بكثير من الأخرى، وإلى أي مدى تختلف ظاهرة ما عن أخرى أو تتشابه مع أخرى، وما هو الشائع والمميز في العمليات الإحصائية المرصودة، وما إلى ذلك.

المؤشر هو مؤشر نسبي تم إنشاؤه خصيصًا للمقارنة (في الزمان والمكان، عند مقارنته بالتنبؤات، وما إلى ذلك)، يوضح عدد المرات التي يختلف فيها مستوى الظاهرة قيد الدراسة في ظل ظروف معينة عن مستوى نفس الظاهرة في ظل ظروف أخرى. شروط. المؤشرات الأكثر شيوعًا موجودة في الإحصاءات الاقتصادية، على الرغم من أنها تلعب أيضًا دورًا معينًا في تحليل الظواهر القانونية.

لا يمكنك الاستغناء عن المؤشرات في الحالات التي يكون فيها من الضروري مقارنة المؤشرات غير القابلة للقياس، والتي يكون جمعها البسيط مستحيلاً. ولذلك، يتم تعريف المؤشرات عادة على أنها أرقام المؤشراتلقياساتمتوسطمكبرات الصوتمجملغير متجانسةعناصر.

في الإحصاء، يُشار إلى المؤشرات عادةً بالحرف I (i). حرف كبير أو حرف كبير - يعتمد على ما إذا كنا نتحدث عن مؤشر فردي (خاص) أو مؤشر عام.

فرديالمؤشرات(ط) تعكس نسبة مؤشر الفترة الحالية إلى المؤشر المقابل للفترة المقارنة.

ملخصالمؤشراتتستخدم في تحليل العلاقة بين الظواهر الاجتماعية والاقتصادية المعقدة وتتكون من جزأين: القيمة المفهرسة الفعلية والمقياس المشترك ("الوزن").

2. القيم المتوسطة وتطبيقاتها في الإحصاء القانوني

نتيجة معالجة المؤشرات المطلقة والنسبية هي بناء سلسلة التوزيع. صف توزيع - هذاأمربواسطةجودة عاليةأوكميعلاماتتوزيعوحداتمجمل. وتحليل هذه السلاسل هو أساس أي تحليل إحصائي، مهما أصبح معقدا فيما بعد.

يمكن بناء سلسلة التوزيع على أساس الخصائص النوعية أو الكمية. في الحالة الأولى يطلق عليه عزوي، في الثانية - متغير. في هذه الحالة، يتم استدعاء الاختلافات في الخصائص الكمية تفاوتوهذه العلامة نفسها - خيار. غالبًا ما يتعين على الإحصاءات القانونية التعامل مع سلسلة الاختلافات.

تتكون سلسلة التباين دائمًا من عمودين (رسم بياني). يشير أحدهما إلى قيمة خاصية كمية بترتيب تصاعدي، والتي تسمى في الواقع خيارات، والتي يتم تعيينها س. يشير العمود الآخر (الرسم البياني) إلى عدد الوحدات المميزة لخيار أو آخر. يطلق عليها اسم الترددات ويتم الإشارة إليها بحرف لاتيني F.

الجدول 2.1

خيار س

تكرار F

يعد تكرار حدوث خاصية معينة أمرًا مهمًا للغاية عند حساب المؤشرات الإحصائية المهمة الأخرى، وهي المتوسطات ومؤشرات التباين.

سلسلة الاختلاف، بدورها، يمكن أن تكون منفصلةأو فاصلة. السلاسل المنفصلة، ​​كما يوحي اسمها، مبنية على أساس خصائص متباينة بشكل منفصل، والسلاسل الفاصلة - على أساس الاختلافات المستمرة. على سبيل المثال، يمكن أن يكون توزيع المجرمين حسب العمر إما منفصلاً (18، 19، 20 عامًا، وما إلى ذلك) أو مستمرًا (حتى 18 عامًا، و18-25 عامًا، و25-30 عامًا، وما إلى ذلك). علاوة على ذلك، يمكن بناء السلسلة الفاصلة نفسها إما على أساس منفصل أو مستمر. في الحالة الأولى، لا تتكرر حدود الفترات المجاورة؛ في مثالنا، ستبدو الفواصل الزمنية كما يلي: ما يصل إلى 18 عامًا، 18-25، 26-30، 31-35، إلخ. مثل هذه السلسلة تسمى مستمرمنفصلةصف. فاصلةصفمعمستمرتفاوتيفترض أن الحد الأعلى للفترة السابقة يتزامن مع الحد الأدنى للفترة التالية.

المؤشر الأول الذي يصف سلسلة التباين هو متوسط كميات. إنهم يلعبون دورًا مهمًا في الإحصاءات القانونية، لأنه بمساعدتهم فقط يمكن تمييز السكان بسمة متغيرة كمية يمكن مقارنتهم بها. باستخدام القيم المتوسطة، يمكننا مقارنة مجموعات من الظواهر ذات الأهمية القانونية التي تهمنا وفقًا لخصائص كمية معينة واستخلاص الاستنتاجات اللازمة من هذه المقارنات.

متوسطكمياتيعكس أكثر عام اتجاه (نمط), متأصل في كتلة الظواهر التي تتم دراستها. يتجلى في عادي الخصائص الكمية، أي. في متوسط ​​قيمة جميع المؤشرات المتاحة (المتغيرة).

وقد طورت الإحصائيات أنواعًا عديدة من المتوسطات: المتوسط ​​الحسابي، والمتوسط ​​الهندسي، والمتوسط ​​المكعب، والمتوسط ​​التوافقي، وما إلى ذلك. ومع ذلك، فهي لا تستخدم عمليا في الإحصاءات القانونية، لذلك سننظر في نوعين فقط من المتوسطات - الوسط الحسابي والوسط الهندسي.

المتوسط ​​الأكثر شيوعًا والمعروف هو متوسطعلم الحساب. ولحسابه، يتم حساب مجموع المؤشرات وتقسيمه على إجمالي عدد المؤشرات. على سبيل المثال، عائلة مكونة من 4 أفراد تتكون من والدين يبلغان من العمر 38 و40 عامًا وطفلين يبلغان من العمر 7 و10 أعوام. نجمع العمر: 38+40+7+10 ونقسم الناتج 95 على 4. متوسط ​​عمر الأسرة الناتج هو 23.75 سنة. أو دعونا نحسب متوسط ​​عبء العمل الشهري للمحققين إذا قام قسم مكون من 8 أشخاص بحل 25 قضية في الشهر. اقسم 25 على 8 وسنحصل على 3125 حالة شهريًا لكل محقق.

في الإحصاءات القانونية، يتم استخدام المتوسط ​​الحسابي عند حساب عبء العمل على الموظفين (المحققين والمدعين العامين والقضاة، وما إلى ذلك)، وحساب الزيادة المطلقة في الجريمة، وحساب العينة، وما إلى ذلك.

ومع ذلك، في المثال المذكور، يتم حساب متوسط ​​عبء العمل الشهري لكل محقق بشكل غير صحيح. والحقيقة هي أن المتوسط ​​الحسابي البسيط لا يأخذ في الاعتبار تكرارالصفة التي تتم دراستها. في مثالنا، متوسط ​​عبء العمل الشهري للمحقق صحيح وغني بالمعلومات مثل "متوسط ​​درجة الحرارة في المستشفى" من النكتة الشهيرة، والتي، كما نعلم، هي درجة حرارة الغرفة. ومن أجل مراعاة تكرار ظهور مظاهر الخاصية محل الدراسة عند حساب الوسط الحسابي يتم استخدامها على النحو التالي: متوسطعلم الحسابموزونأو متوسط ​​لسلسلة الاختلاف المنفصلة. (سلسلة التباين المنفصلة - تسلسل التغييرات في إحدى الخصائص وفقًا لمؤشرات منفصلة (متقطعة)).

المتوسط ​​الحسابي المرجح (المتوسط ​​المرجح) لا يوجد لديه اختلافات جوهرية عن المتوسط ​​الحسابي البسيط. وفيه يتم استبدال مجموع نفس القيمة بضرب هذه القيمة بتكرارها، أي. وفي هذه الحالة، يتم ترجيح كل قيمة (متغير) حسب تكرار حدوثها.

لذا، عند حساب متوسط ​​عبء عمل المحققين، يجب علينا مضاعفة عدد القضايا في عدد المحققين الذين حققوا في هذا العدد بالضبط من القضايا. عادة ما يكون من المناسب تقديم مثل هذه الحسابات في شكل جداول:

الجدول 2.2

عدد القضايا

(خيار X)

عدد الباحثين (التكرار) F)

خيار المنتج

الترددات ( XF)

2. لنحسب المتوسط ​​المرجح الفعلي باستخدام الصيغة:

أين س- عدد القضايا الجنائية، و F- عدد المحققين.

وبالتالي فإن المتوسط ​​المرجح ليس 3.125، بل 4.375. إذا فكرت في الأمر، فهذا هو ما ينبغي أن يكون عليه الأمر: يزداد عبء العمل على كل محقق فردي نظرًا لحقيقة أن أحد المحققين في قسمنا الافتراضي تبين أنه متهرب - أو على العكس من ذلك، كان يحقق في قضية مهمة ومعقدة بشكل خاص . لكن مسألة تفسير نتائج البحث الإحصائي سيتم مناقشتها في الموضوع التالي. في بعض الحالات، أي في حالات الترددات المجمعة للتوزيع المنفصل، فإن حساب المتوسط، للوهلة الأولى، ليس واضحا. لنفترض أننا بحاجة إلى حساب الوسط الحسابي لتوزيع الأشخاص المدانين بارتكاب أعمال الشغب حسب العمر. يبدو التوزيع كالتالي:

الجدول 2.3

(خيار X)

عدد المدانين (التكرار F)

منتصف الفاصل

خيار المنتج

الترددات ( XF)

(21-18) /2+18=19,5

بعد ذلك، يتم حساب المتوسط ​​وفقًا للقاعدة العامة ويبلغ 23.6 سنة لهذه السلسلة المنفصلة. في حالة ما يسمى سلسلة مفتوحة، أي في المواقف التي يتم فيها تحديد الفترات القصوى بـ "أقل من". س" او اكثر س"، يتم تعيين حجم الفواصل القصوى بشكل مشابه للفواصل الزمنية الأخرى.

3. سلسلة الديناميكيات

إن الظواهر الاجتماعية التي تدرسها الإحصائيات في تطور وتغير مستمرين. يمكن تقديم المؤشرات الاجتماعية والقانونية ليس فقط في شكل ثابت يعكس ظاهرة معينة، ولكن أيضًا كعملية تحدث في الزمان والمكان، وكذلك في شكل تفاعل بين الخصائص المدروسة. وبعبارة أخرى، تظهر السلاسل الزمنية تطور السمة، أي. تغيره في الزمان والمكان أو حسب الظروف البيئية.

هذه السلسلة عبارة عن سلسلة من القيم المتوسطة خلال فترات زمنية محددة (لكل سنة تقويمية).

ولدراسة أكثر تعمقا للظواهر الاجتماعية وتحليلها، لا تكفي المقارنة البسيطة لمستويات سلسلة من الديناميكيات؛ فمن الضروري حساب المؤشرات المشتقة لسلسلة من الديناميكيات: النمو المطلق، معدل النمو، النمو المعدل، متوسط ​​النمو ومعدلات النمو، المحتوى المطلق لواحد في المائة من النمو.

يتم حساب مؤشرات سلسلة الديناميكيات على أساس مقارنة مستوياتها. في هذه الحالة، هناك طريقتان ممكنتان لمقارنة مستويات السلسلة الزمنية:

المؤشرات الأساسية، عندما تتم مقارنة جميع المستويات اللاحقة مع مستوى أولي معين يؤخذ كأساس؛

مؤشرات السلسلة، عندما تتم مقارنة كل مستوى لاحق من سلسلة من الديناميكيات مع المستوى السابق.

يوضح النمو المطلق عدد الوحدات التي يكون مستوى الفترة الحالية فيها أكبر أو أقل من مستوى الأساس أو الفترة السابقة لفترة زمنية محددة.

يتم حساب الزيادة المطلقة (P) على أنها الفرق بين المستويات المقارنة.

قاعدة النمو المطلق:

ص ب = ذ أنا - ذقواعد . (ص.١).

الزيادة المطلقة للسلسلة:

ص نهاية الخبر = ذ أنا - ذ أنا -1 (ص.٢).

يوضح معدل النمو (Tr) عدد المرات (بأي نسبة) يكون مستوى الفترة الحالية أكبر أو أقل من مستوى الأساس أو الفترة السابقة:

معدل النمو الأساسي:

(ص.٣)

معدل نمو السلسلة:

(ص.٤)

يوضح معدل النمو (Tpr) النسبة المئوية لمستوى الفترة الحالية أكبر أو أقل من مستوى الأساس أو الفترة السابقة المأخوذ كأساس للمقارنة، ويتم حسابه كنسبة النمو المطلق إلى المستوى المطلق تؤخذ كقاعدة.

ويمكن أيضًا حساب معدل النمو بطرح 100% من معدل النمو.

معدل النمو الأساسي:

أو (ص.٥)

معدل نمو السلسلة:

أو (ص.٦)

يتم حساب متوسط ​​معدل النمو باستخدام صيغة المتوسط ​​الهندسي لمعدلات نمو السلسلة الديناميكية:

(ص.٧)

أين هو متوسط ​​معدل النمو؟

- معدلات النمو لفترات فردية؛

ن- عدد معدلات النمو.

عادةً ما يتم حل المشكلات المشابهة ذات الأس الجذري الأكبر من ثلاثة باستخدام اللوغاريتمات. ومن الجبر نعلم أن لوغاريتم الجذر يساوي لوغاريتم الجذر مقسوماً على أس الجذر، وأن لوغاريتم حاصل ضرب عدة عوامل يساوي مجموع لوغاريتمات هذه العوامل.

وبالتالي، يتم حساب متوسط ​​معدل النمو عن طريق استخراج الجذر ندرجات من أعمال الفرد ن- معدلات نمو السلسلة. متوسط ​​معدل النمو هو الفرق بين متوسط ​​معدل النمو وواحد ()، أو 100% عندما يتم التعبير عن معدل النمو كنسبة مئوية:

أو

في حالة عدم وجود مستويات متوسطة في السلسلة الديناميكية، يتم تحديد متوسط ​​معدلات النمو والزيادة بالمعادلة التالية:

(ص.٨)

أين هو المستوى النهائي للسلسلة الديناميكية؟

- المستوى الأولي للسلسلة الديناميكية؛

ن - عدد المستويات (التواريخ).

ومن الواضح أن مؤشرات متوسط ​​معدلات النمو والزيادات، المحسوبة باستخدام الصيغ (النموذج 7 والنموذج 8)، لها نفس القيم العددية.

يوضح المحتوى المطلق للنمو بنسبة 1% ما تحتويه القيمة المطلقة للنمو بنسبة 1% ويتم حسابه كنسبة النمو المطلق إلى معدل النمو.

المحتوى المطلق للزيادة 1%:

الأساسية: (النموذج 9)

السلسلة: (ص.١٠)

يساهم حساب وتحليل القيمة المطلقة لكل نسبة زيادة في فهم أعمق لطبيعة تطور الظاهرة قيد الدراسة. تظهر البيانات الواردة في مثالنا أنه على الرغم من التقلبات في معدلات النمو والمكاسب للسنوات الفردية، فإن المؤشرات الأساسية للمحتوى المطلق لـ 1% من النمو تظل دون تغيير، في حين أن المؤشرات المتسلسلة التي تميز التغيرات في القيمة المطلقة لواحد في المائة من النمو في كل منها العام اللاحق مقارنة بالعام الماضي، في تزايد مستمر.

عند إنشاء ومعالجة وتحليل السلاسل الزمنية، غالبًا ما تكون هناك حاجة لتحديد متوسط ​​مستويات الظواهر التي تتم دراستها خلال فترات زمنية معينة. يتم حساب المتوسط ​​الزمني لسلسلة فواصل زمنية على فترات متساوية باستخدام صيغة المتوسط ​​الحسابي البسيط، وعلى فترات غير متساوية - باستخدام المتوسط ​​الحسابي المرجح:

أين هو المستوى المتوسط ​​للسلسلة الفاصلة؟

- المستويات الأولية للسلسلة؛

ن- عدد المستويات.

بالنسبة لسلسلة زمنية من الديناميكيات، بشرط أن تكون الفترات الزمنية بين التواريخ متساوية، يتم حساب المستوى المتوسط ​​باستخدام الصيغة الزمنية المتوسطة:

(ص.١١)

أين هي القيمة الزمنية المتوسطة؟

ذ 1 ,., ذ ن- المستوى المطلق للسلسلة؛

ن - عدد المستويات المطلقة لسلسلة الديناميكيات.

متوسط ​​المستوى الزمني للسلسلة الزمنية للديناميكيات يساوي مجموع مؤشرات هذه السلسلة مقسومًا على عدد المؤشرات ناقص واحد؛ في هذه الحالة يجب أن يتم تقسيم المستويين الأولي والنهائي إلى النصف، حيث أن عدد التواريخ (اللحظات) عادة ما يكون أكبر بواحد من عدد الفترات.

اعتمادًا على محتوى وشكل عرض البيانات المصدر (فاصل زمني أو سلسلة زمنية من الديناميكيات، فترات زمنية متساوية أو غير متساوية) لحساب المؤشرات الاجتماعية المختلفة، على سبيل المثال، متوسط ​​العدد السنوي للجرائم والمخالفات (حسب النوع)، المتوسط حجم أرصدة رأس المال العامل، ومتوسط ​​عدد المخالفين وما إلى ذلك، استخدم التعبيرات التحليلية المناسبة.

4. الأساليب الإحصائية لدراسة العلاقات

في الأسئلة السابقة، تناولنا، إذا جاز التعبير، تحليل التوزيعات "أحادية البعد" - سلسلة التباين. وهذا أمر مهم للغاية، ولكنه ليس النوع الوحيد من التحليل الإحصائي. تحليل سلسلة التباين هو الأساس لأنواع أكثر "تقدمًا" من التحليل الإحصائي، في المقام الأول دراسةالعلاقات المتبادلة. ونتيجة لهذه الدراسة، يتم الكشف عن علاقات السبب والنتيجة بين الظواهر، مما يجعل من الممكن تحديد التغييرات في الخصائص التي تؤثر على اختلافات الظواهر والعمليات قيد الدراسة. وفي هذه الحالة تسمى الخصائص التي تسبب تغيرات في الآخرين عوامل (عوامل)، والخصائص التي تتغير تحت تأثيرها تسمى فعالة.

في العلوم الإحصائية، هناك نوعان من الروابط بين الخصائص المختلفة ومعلوماتها - الاتصال الوظيفي (الحتمية الصعبة) والإحصائي (العشوائي).

ل وظيفيروابطهناك تطابق كامل بين التغير في خاصية العامل والتغير في القيمة الناتجة. تتجلى هذه العلاقة بالتساوي في جميع وحدات أي مجموعة سكانية. أبسط مثال: الزيادة في درجة الحرارة تنعكس على حجم الزئبق في مقياس الحرارة. وفي هذه الحالة، تعمل درجة الحرارة المحيطة كعامل، ويعمل حجم الزئبق كخاصية فعالة.

العلاقات الوظيفية هي سمة من سمات الظواهر التي تدرسها علوم مثل الكيمياء والفيزياء والميكانيكا، حيث يمكن إجراء تجارب "خالصة" يتم فيها القضاء على تأثير العوامل الخارجية. والحقيقة هي أن الاتصال الوظيفي بين اثنين لا يمكن تحقيقه إلا إذا كانت القيمة الثانية (الخاصية الناتجة) تعتمد فقط و حصريامن الأول. ويلاحظ هذا نادرا للغاية في الظواهر الاجتماعية.

يتم وصف العمليات الاجتماعية والقانونية، الناتجة عن التأثير المتزامن لعدد كبير من العوامل، من خلال الروابط الإحصائية، أي الروابط عشوائيا (بطريق الخطأ) حتميةعندما تتوافق قيم مختلفة لمتغير واحد مع قيم مختلفة لمتغير آخر.

الحالة الأكثر أهمية (والشائعة) للاعتماد العشوائي هي علاقةمدمن. مع مثل هذا الاعتماد، لا يحدد السبب التأثير بشكل لا لبس فيه، ولكن فقط بدرجة معينة من الاحتمال. يتم تخصيص نوع منفصل من التحليل الإحصائي لتحديد مثل هذه الروابط - تحليل الارتباط.

رئيسي مهمةتحليل الارتباط - يعتمد على تقنيات رياضية بحتة، ويحدد تعبيرًا كميًا للعلاقة الموجودة بين الخصائص قيد الدراسة. هناك عدة طرق لكيفية حساب الارتباط بالضبط، وبالتالي، عدة أنواع من معاملات الارتباط: معامل الطوارئ A.A. تشوبروف (لقياس العلاقة بين الخصائص النوعية)، ومعامل ارتباط ك. بيرسون، وكذلك معاملات ارتباط الرتب لسبيرمان وكيندال. وبشكل عام فإن هذه المعاملات توضح احتمالية ظهور العلاقات المدروسة. وبناء على ذلك، كلما ارتفع المعامل، كلما كانت العلاقة بين الخصائص أكثر وضوحا.

يمكن أن توجد علاقات مباشرة وعكسية بين العوامل التي تتم دراستها. مستقيمعلاقةمدمنلوحظ في الحالات التي تتوافق فيها التغييرات في قيم العامل مع نفس التغييرات في قيمة السمة الناتجة، أي عندما تزيد قيمة السمة الناتجة، تزداد قيمة السمة الناتجة أيضًا، والعكس صحيح . على سبيل المثال، هناك علاقة مباشرة بين العوامل الإجرامية والجريمة (بعلامة "+"). إذا أدت الزيادة في قيم إحدى الخصائص إلى تغيرات عكسية في قيم أخرى، فتسمى هذه العلاقة يعكس. على سبيل المثال، كلما ارتفعت الرقابة الاجتماعية في المجتمع، انخفضت الجريمة (العلاقة مع علامة "-").

يمكن أن تكون كل من الاتصالات الأمامية والخلفية خطية أو منحنية.

خط مستقيم (تظهر العلاقات الخطية عندما تكون هناك زيادة (مباشرة) أو نقصان (معكوس) في قيمة السمة الناتجة، مع زيادة قيم سمة العامل. رياضياً، يتم التعبير عن هذه العلاقة بمعادلة الانحدار: في = أ + ب أين في - نتيجة الإشارة؛ أ و ب - معاملات الاقتران المقابلة؛ X - عامل الإشارة.

منحني الأضلاع الاتصالات ذات طبيعة مختلفة. إن الزيادة في قيمة خاصية العامل لها تأثير غير متساو على قيمة الخاصية الناتجة. في البداية يمكن أن يكون هذا الاتصال مباشرا، ثم عكسيا. ومن الأمثلة المعروفة العلاقة بين الجرائم وعمر الجناة. في البداية، يزداد النشاط الإجرامي للأفراد بما يتناسب بشكل مباشر مع الزيادة في عمر الجناة (حتى 30 عامًا تقريبًا)، ثم مع زيادة العمر، يتناقص النشاط الإجرامي. علاوة على ذلك، فإن الجزء العلوي من منحنى توزيع المجرمين حسب العمر ينتقل من المتوسط ​​إلى اليسار (نحو عمر أصغر) وهو غير متماثل.

الارتباطات الخطية يمكن أن تكون واحديامضروب, عند دراسة العلاقة بين علامة عامل واحدة وعلامة نتيجة واحدة (الارتباط الزوجي). قد يكونون كذلك متعددة العوامل،عندما تتم دراسة تأثير العديد من عوامل العلامات المتفاعلة على نتيجة الإشارة (الارتباط المتعدد).

ولكن بغض النظر عن معامل الارتباط المستخدم، وبغض النظر عن الارتباط الذي تتم دراسته، فمن المستحيل إنشاء علاقة بين الخصائص بناءً على المؤشرات الإحصائية فقط. التحليل الأولي للمؤشرات هو دائما تحليل نوعيحيث يتم خلالها دراسة وتوضيح الطبيعة الاجتماعية والقانونية للظاهرة. وفي هذه الحالة يتم استخدام تلك الأساليب والأساليب العلمية التي تميز فرع العلوم الذي يدرس هذه الظاهرة (علم الاجتماع والقانون وعلم النفس وما إلى ذلك). ومن ثم يتيح لنا تحليل التجمعات والمعدلات طرح الفرضيات وبناء النماذج وتحديد نوع الارتباط والاعتماد. فقط بعد ذلك يتم تحديد الخاصية الكمية للاعتماد - في الواقع، معامل الارتباط.

الأدب

1. أفانيسوف ج.أ. أساسيات التنبؤ الجنائي. درس تعليمي. م: المدرسة العليا لوزارة الداخلية في اتحاد الجمهوريات الاشتراكية السوفياتية، 1970.

2. أفروتين كي.إي.، جيلينسكي يا.آي. التحليل الجنائي للجريمة في المنطقة: المنهجية والتقنية والتقنية. ل.، 1991.

3. Adamov E. et al. اقتصاديات وإحصائيات الشركات: كتاب مدرسي / إد. إس.دي. إيلينكوفا. م: المالية والإحصاء، 2008.

4. بالاكينا ن. الإحصاء: كتاب مدرسي. - طريقة. معقد. خاباروفسك: فرع IVESEP في خاباروفسك، 2008.

5. بلوفشتاين يو.د.، فولكوف جي.آي. السلسلة الزمنية للجريمة: كتاب مدرسي. مينسك، 1984.

6. بوروفيكوف ف.ب.، بوروفيكوف آي.بي. STATISTICA - التحليل الإحصائي ومعالجة البيانات في بيئة Windows. م: دار الإعلام والنشر "فيلين"، 1997.

7. بورودين إس. مكافحة الجريمة: نموذج نظري لبرنامج شامل. م: ناوكا، 1990.

8. مسائل إحصائية // مجلة علمية وإعلامية شهرية للجنة الدولة للإحصاء في الاتحاد الروسي 2002-2009.

9. جوساروف ف.م. الإحصاء: كتاب مدرسي. دليل للجامعات. م.: الوحدة-دانا، 2009.

10. دوبرينينا إن.في.، نيمينيا آي.إن. الإحصاء: كتاب مدرسي. - طريقة. مخصص. سانت بطرسبرغ: SPbGIEU، 2009.

11. إليسيفا الثانية، يوزباشيف م.م. النظرية العامة للإحصاء: كتاب مدرسي للجامعات / تحرير I. I. إليسيفا. الطبعة الرابعة. م: المالية والإحصاء، 1999.

12. إليسيفا الثانية، يوزباشيف م.م. النظرية العامة للإحصاء: كتاب مدرسي. - م: المالية والإحصاء، 1995.

13. Eremina T.، Matyatina V.، Pluschevskaya Yu. مشاكل تطوير قطاعات الاقتصاد الروسي // أسئلة الاقتصاد. 2009. رقم 7.

14. إفيموفا إم آر، غانتشينكو أو آي، بتروفا إي في ورشة عمل حول النظرية العامة للإحصاء: Proc. دليل الطبعة الثانية، المنقحة. وإضافية م.: المالية والإحصاء، 2009.

15. إفيموفا إم آر، بتروفا إي في، روميانتسيف في إن. النظرية العامة للإحصاء: كتاب مدرسي. - م: إنفرا-م، 1998.

16. كيريلوف لوس أنجلوس الدراسة الجنائية ومنع الجريمة من قبل هيئات الشؤون الداخلية م.، 1992.

17. Kosoplechev N.P.، طرق البحث الجنائي. م، 1984.

18. لي د.أ. الجريمة في روسيا: تحليل النظام. م، 1997.

19. لي د.أ. المحاسبة الإحصائية الجنائية: الأنماط الهيكلية والوظيفية. م: وكالة الإعلام والنشر "العالم الروسي"، 1998.

20. ماكاروفا إن.في.، تروفيميتس في.يا. الإحصائيات في Excel: كتاب مدرسي. مخصص. م.: المالية والإحصاء، 2009.

21. نيستيروف إل. الاتجاهات الجديدة في إحصاءات الثروة الوطنية // أسئلة إحصائية. 2008. رقم 11.

22. بتروفا إي.في. ورشة عمل حول إحصاءات النقل: بروك. مخصص. م: المالية والإحصاء، 2008.

23. الجريمة في روسيا في التسعينات وبعض جوانب سيادة القانون ومكافحتها. م، 1995.

24. الجريمة والإحصاء والقانون // إد. البروفيسور منظمة العفو الدولية. دَين. م: جمعية علم الجريمة، 1997.

25. روستوف ك.ت. الجريمة في مناطق روسيا (التحليل الاجتماعي والإجرامي). سانت بطرسبرغ: أكاديمية سانت بطرسبرغ التابعة لوزارة الداخلية الروسية، 1998.

26. مبادئ توجيهية للقائمين بالتعداد بشأن إجراءات إجراء التعداد السكاني لعموم روسيا لعام 2002 وملء وثائق التعداد. م: بيك "أوفست"، 2003.

27. سافيوك إل.ك. الإحصاءات القانونية: كتاب مدرسي. م: يوريست، 1999.

28. سالين ف.ن.، شباكوفسكايا إي.بي. الإحصاءات الاجتماعية والاقتصادية: كتاب مدرسي للجامعات. م: محامي جاردانيكا، 2008.

29. Sidenko A.V.، Popov G.Yu.، Matveeva V.M. الإحصاء: كتاب مدرسي. م: الأعمال والخدمات، 2008.

30. منع الجريمة الاجتماعية: نصائح وتوصيات // إد. نعم. كريموفا. م، 1989.

31. الإحصاءات الاجتماعية: كتاب مدرسي للجامعات // إد. أنا. إليسيفا. الطبعة الثالثة. م.: المالية والإحصاء، 2009.

تم النشر على موقع Allbest.ru

وثائق مماثلة

    النظر في الطرق الرئيسية للتحليل الإحصائي. دراسة منطقة كونغور البلدية. إجراء الحسابات على أساس مؤشرات الكتاب السنوي. تحليل الديموغرافيا والتنمية الاجتماعية والاقتصادية للمنطقة بناء على نتائج التطبيق.

    تمت إضافة الدورة التدريبية في 24/06/2015

    القيمة المتوسطة هي خاصية حرة لقوانين العملية في الظروف التي تحدث فيها. نماذج وطرق حساب القيم المتوسطة. تطبيق المتوسطات في الممارسة العملية: حساب فروق الأجور حسب القطاعات الاقتصادية.

    تمت إضافة الدورة التدريبية في 12/04/2007

    الأساليب الإحصائية لتحليل حالات الطلاق. التحليل الإحصائي لحالات الطلاق في منطقة أمور. تحليل ديناميكيات وبنية حالات الطلاق. تجميع مدن ومناطق منطقة أمور حسب عدد حالات الطلاق في السنة. حساب القيم المتوسطة ومؤشرات التباين.

    تمت إضافة الدورة التدريبية في 12/04/2014

    جوانب التحليل الإحصائي لتوفير السكن. تطبيق الأساليب الإحصائية لتحليل المعروض من المساكن للسكان. تحليل التجانس السكاني للمديريات حسب نسبة الإعالة. تحليل الارتباط والانحدار.

    تمت إضافة الدورة التدريبية في 18/01/2009

    تنظيم إحصاءات الدولة في روسيا. متطلبات البيانات التي تم جمعها. أشكال وأنواع وطرق المراقبة الإحصائية. إعداد الملاحظة الإحصائية. أخطاء في الملاحظة الإحصائية. طرق مراقبة الإحصائيات.

    الملخص، تمت إضافته في 12/02/2007

    تطوير برنامج رصد إحصاءات القانون الجنائي مراحله الرئيسية ومتطلباته وطرقه وإجراءات تنفيذه. تحديد حالة الجريمة في منطقة الدراسة. قواعد تسجيل نتائج الملاحظة الإحصائية.

    تمت إضافة الاختبار في 18/05/2010

    تصنيف الوثائق الإحصائية. أنواع الوثائق: المكتوبة والأيقونية والإحصائية والصوتية. طرق وطرق تحليل المواد: غير رسمية (تقليدية) ورسمية. إجراءات تنفيذ تحليل المحتوى.

    تمت إضافة العرض بتاريخ 16/02/2014

    مفهوم القيمة المتوسطة. منهج المتوسطات في دراسة الظواهر الاجتماعية. وتتأكد أهمية استخدام أسلوب المتوسطات في دراسة الظواهر الاجتماعية من خلال إمكانية الانتقال من الفرد إلى العام، ومن العشوائي إلى الطبيعي.

    تمت إضافة الدورة التدريبية في 13/01/2009

    مفهوم الملاحظة الإحصائية. تحليل الارتباطات الخطية والمنحنية. الإلمام بصيغ وكميات الملاحظة الإحصائية. تحليل حسابات العلاقة بين المؤشرات، وبناء الرسم البياني، وعناصر سلسلة التوزيع.

    تمت إضافة الاختبار في 27/03/2012

    خصائص المؤشرات الرئيسية للتحليل الإحصائي للشروط الاجتماعية للصحة العامة في الاتحاد الروسي. مستويات التقييم الصحي من وجهة نظر الطب الاجتماعي. تصنيف سكان الأطفال حسب الفئات الصحية.

موضوع البحث في الإحصاء التطبيقي هو البيانات الإحصائية التي يتم الحصول عليها نتيجة للملاحظات أو التجارب. البيانات الإحصائية هي مجموعة من الأشياء (الملاحظات والحالات) والعلامات (المتغيرات) التي تميزها. تُستخدم الأساليب الإحصائية لتحليل البيانات في جميع مجالات النشاط البشري تقريبًا. يتم استخدامها عندما يكون من الضروري الحصول على وتبرير أي أحكام حول مجموعة (أشياء أو مواضيع) مع بعض عدم التجانس الداخلي.

عادةً ما تسمى الطرق الإحصائية لتحليل البيانات التي تنتمي إلى المجموعة أ) بطرق الإحصاء التطبيقي.

الإحصائيات العددية هي أرقام ومتجهات ووظائف. يمكن إضافتها وضربها بالمعاملات. لذلك، في الإحصاءات العددية، هناك أهمية كبيرة للمبالغ المختلفة. إن الجهاز الرياضي لتحليل مجموع العناصر العشوائية للعينة هو القوانين (الكلاسيكية) للأعداد الكبيرة ونظريات الحد المركزي.

البيانات الإحصائية غير الرقمية هي بيانات مصنفة، ومتجهات لأنواع مختلفة من الميزات، والعلاقات الثنائية، والمجموعات، والمجموعات الغامضة، وما إلى ذلك. ولا يمكن إضافتها أو ضربها بالمعاملات.

يتضمن تحليل البيانات الإحصائية، كقاعدة عامة، عددًا من الإجراءات والخوارزميات التي يتم تنفيذها بشكل تسلسلي أو بالتوازي أو بطريقة أكثر تعقيدًا. وعلى وجه الخصوص، يمكن تمييز المراحل التالية:

التخطيط لدراسة إحصائية؛

تنظيم جمع البيانات الإحصائية اللازمة وفق برنامج أمثل أو عقلاني (تخطيط العينات، وإنشاء هيكل تنظيمي واختيار فريق من الإحصائيين، وتدريب الموظفين الذين سيقومون بجمع البيانات، وكذلك مراقبي البيانات، وما إلى ذلك)؛

الجمع المباشر للبيانات وتسجيلها على وسائط معينة (مع مراقبة جودة جمع ورفض البيانات الخاطئة لأسباب تتعلق بمجال الموضوع)؛

الوصف الأولي للبيانات (حساب خصائص العينة المختلفة، ووظائف التوزيع، وتقديرات الكثافة اللابارامترية، وإنشاء الرسوم البيانية، ومجالات الارتباط، والجداول والرسوم البيانية المختلفة، وما إلى ذلك)،

تقييم بعض الخصائص العددية أو غير الرقمية ومعلمات التوزيعات (على سبيل المثال، تقدير الفاصل غير المعلمي لمعامل التباين أو استعادة العلاقة بين الاستجابة والعوامل، أي تقدير الوظيفة)،

اختبار الفرضيات الإحصائية (أحيانًا سلاسلها - بعد اختبار الفرضية السابقة، يتم اتخاذ قرار باختبار فرضية لاحقة أو أخرى)،

دراسة أكثر تعمقا، أي. تطبيق خوارزميات مختلفة للتحليل الإحصائي متعدد المتغيرات، وخوارزميات التشخيص والتصنيف، وإحصائيات البيانات غير الرقمية والفاصلة، وتحليل السلاسل الزمنية، وما إلى ذلك؛

التحقق من ثبات التقديرات والاستنتاجات التي تم الحصول عليها فيما يتعلق بالانحرافات المسموح بها للبيانات الأولية ومقدمات النماذج الإحصائية الاحتمالية المستخدمة، وعلى وجه الخصوص، دراسة خصائص التقديرات باستخدام طريقة ضرب العينات؛

تطبيق النتائج الإحصائية التي تم الحصول عليها للأغراض التطبيقية (على سبيل المثال، لتشخيص مواد معينة، ووضع التنبؤات، واختيار مشروع استثماري من الخيارات المقترحة، وإيجاد الوضع الأمثل لتنفيذ عملية تكنولوجية، وتلخيص نتائج اختبار عينات الأجهزة التقنية) ، إلخ.)،

إعداد تقارير موجزة، خاصة لأولئك الذين ليسوا متخصصين في الأساليب الإحصائية لتحليل البيانات، بما في ذلك الإدارة - "صناع القرار".

تشمل الطرق ما يلي:

تحليل الارتباط. قد تكون هناك علاقة وظيفية بين المتغيرات (المتغيرات العشوائية)، والتي تتجلى في حقيقة أن أحدهما يعرف على أنه دالة للآخر. ولكن قد يكون هناك أيضًا ارتباط من نوع آخر بين المتغيرات، يتجلى في حقيقة أن أحدهما يتفاعل مع التغيير في الآخر عن طريق تغيير قانون التوزيع الخاص به. وتسمى هذه العلاقة العشوائية. وكمقياس للاعتماد بين المتغيرات، يتم استخدام معامل الارتباط (r)، والذي يتراوح من -1 إلى +1. وإذا كان معامل الارتباط سالباً، فهذا يعني أنه كلما زادت قيم أحد المتغيرين، انخفضت قيم المتغير الآخر. إذا كانت المتغيرات مستقلة، فإن معامل الارتباط هو 0 (والعكس صحيح فقط للمتغيرات التي لها توزيع طبيعي). ولكن إذا كان معامل الارتباط لا يساوي 0 (تسمى المتغيرات غير مرتبطة)، فهذا يعني أن هناك اعتماد بين المتغيرات. كلما اقتربت قيمة r من 1، كان الاعتماد أقوى. يصل معامل الارتباط إلى قيمه الحدية +1 أو -1 إذا وفقط إذا كانت العلاقة بين المتغيرات خطية. يتيح لنا تحليل الارتباط تحديد قوة واتجاه العلاقة العشوائية بين المتغيرات (المتغيرات العشوائية).

تحليل الانحدار. يصمم تحليل الانحدار العلاقة بين متغير عشوائي واحد وواحد أو أكثر من المتغيرات العشوائية الأخرى. في هذه الحالة، المتغير الأول يسمى تابع، والباقي يسمى مستقل. إن اختيار أو تعيين المتغيرات التابعة والمستقلة هو أمر تعسفي (مشروط) ويقوم به الباحث حسب المشكلة التي يقوم بحلها. تسمى المتغيرات المستقلة عوامل أو تراجعات أو تنبؤات، ويسمى المتغير التابع خاصية النتيجة أو الاستجابة.

إذا كان عدد المتنبئين هو 1، يسمى الانحدار بسيطًا أو عاملًا واحدًا؛ وإذا كان عدد المتنبئين أكثر من 1، فإنه يسمى متعدد أو متعدد العوامل. وبشكل عام يمكن كتابة نموذج الانحدار على النحو التالي:

ص = و (س 1، س 2، ...، س ن)،

حيث y هو المتغير التابع (الاستجابة)، x i (i = 1,..., n) هي المتنبئون (العوامل)، n هو عدد المتنبئين.

التحليل الكنسي. تم تصميم التحليل القانوني لتحليل التبعيات بين قائمتين من الميزات (المتغيرات المستقلة) التي تميز الكائنات. على سبيل المثال، يمكنك دراسة العلاقة بين العوامل غير المواتية المختلفة وظهور مجموعة معينة من أعراض المرض، أو العلاقة بين مجموعتين من المعلمات السريرية والمخبرية (المتلازمات) للمريض. التحليل القانوني هو تعميم للارتباط المتعدد كمقياس للعلاقة بين متغير واحد والعديد من المتغيرات الأخرى.

طرق مقارنة المتوسطات. في الأبحاث التطبيقية، غالبًا ما تكون هناك حالات يختلف فيها متوسط ​​نتيجة بعض ميزات سلسلة واحدة من التجارب عن متوسط ​​نتيجة سلسلة أخرى. وبما أن المتوسطات هي نتائج قياس، كقاعدة عامة، فهي تختلف دائمًا، والسؤال هو ما إذا كان يمكن تفسير التناقض المكتشف في المتوسطات بأخطاء تجريبية عشوائية حتمية أو ما إذا كان ناجمًا عن أسباب معينة. تعد مقارنة متوسط ​​النتائج إحدى الطرق لتحديد التبعيات بين الخصائص المتغيرة التي تميز مجموعة الكائنات المدروسة (الملاحظات). إذا، عند تقسيم كائنات البحث إلى مجموعات فرعية باستخدام متغير مستقل فئوي (متنبئ)، إذا كانت الفرضية حول عدم تكافؤ وسائل بعض المتغيرات التابعة في المجموعات الفرعية صحيحة، فهذا يعني أن هناك علاقة عشوائية بين هذا المتغير التابع والمتغير الفئوي متنبئ.

تحليل التردد. تعد الجداول التكرارية، أو جداول الإدخال الفردي كما يطلق عليها أيضًا، أبسط طريقة لتحليل المتغيرات الفئوية. غالبًا ما يستخدم هذا النوع من البحث الإحصائي كأحد إجراءات التحليل الاستكشافي لمعرفة كيفية توزيع مجموعات مختلفة من الملاحظات في العينة، أو كيفية توزيع قيمة الخاصية على الفترة من القيمة الدنيا إلى القيمة القصوى. الجدولة الترافقية (الاقتران) هي عملية دمج جدولين تكراريين (أو أكثر) بحيث يتم تمثيل كل خلية في الجدول المبني بمزيج واحد من القيم أو مستويات المتغيرات المجدولة. يتيح لك الجدول المتقاطع الجمع بين ترددات حدوث الملاحظات على مستويات مختلفة من العوامل قيد النظر.

تحليل المراسلات. يوفر تحليل المراسلات، مقارنة بتحليل التكرار، طرقًا وصفية واستكشافية أكثر قوة لتحليل الجداول ذات الإدخالين والمتعددة الإدخال. تسمح لك هذه الطريقة، تمامًا مثل الجداول المحتملة، بدراسة هيكل وعلاقة متغيرات التجميع المضمنة في الجدول.

التحليل العنقودي. التحليل العنقودي هو طريقة تحليل التصنيف. والغرض الرئيسي منه هو تقسيم مجموعة الأشياء والمعالم قيد الدراسة إلى مجموعات أو مجموعات متجانسة بمعنى معين. هذه طريقة إحصائية متعددة المتغيرات، لذلك من المفترض أن تكون البيانات الأصلية ذات حجم كبير، أي. يمكن أن يكون عدد كائنات البحث (الملاحظات) والميزات التي تميز هذه الكائنات كبيرًا بشكل ملحوظ. الميزة الكبرى للتحليل العنقودي هي أنه يجعل من الممكن تقسيم الكائنات ليس وفقًا لمعيار واحد، ولكن وفقًا لعدد من الخصائص. بالإضافة إلى ذلك، فإن التحليل العنقودي، على عكس معظم الأساليب الرياضية والإحصائية، لا يفرض أي قيود على نوع الكائنات قيد النظر ويسمح للمرء بدراسة مجموعة متنوعة من البيانات الأولية ذات الطبيعة التعسفية تقريبًا.

التحليل المميز. يتضمن التحليل التمييزي أساليب إحصائية لتصنيف الملاحظات متعددة المتغيرات في موقف يكون فيه لدى الباحث ما يسمى بعينات التدريب. هذا النوع من التحليل متعدد الأبعاد، لأنه يستخدم العديد من خصائص الكائن، والتي يمكن أن يكون عددها كبيرًا بشكل تعسفي. الغرض من التحليل التمييزي هو تصنيفه بناءً على قياس الخصائص (السمات) المختلفة للكائن، أي. المخصصة لواحدة من عدة مجموعات (فئات) معينة بطريقة مثالية. من المفترض أن تحتوي البيانات المصدر، إلى جانب خصائص الكائنات، على متغير فئوي (تجميع) يحدد ما إذا كان الكائن ينتمي إلى مجموعة معينة. التحليل العاملي. يعد التحليل العاملي أحد أكثر الأساليب الإحصائية متعددة المتغيرات شيوعًا. إذا كانت الطرق العنقودية والتمييزية تصنف الملاحظات، وتقسمها إلى مجموعات متجانسة، فإن التحليل العاملي يصنف الخصائص (المتغيرات) التي تصف الملاحظات. ولذلك فإن الهدف الأساسي للتحليل العاملي هو تقليل عدد المتغيرات بناءً على تصنيف المتغيرات وتحديد بنية العلاقات بينها.

أشجار التصنيف. أشجار التصنيف هي طريقة لتحليل التصنيف تسمح للشخص بالتنبؤ بما إذا كانت الكائنات تنتمي إلى فئة معينة اعتمادًا على القيم المقابلة للميزات التي تميز الكائنات. تسمى الخصائص بالمتغيرات المستقلة، والمتغير الذي يشير إلى انتماء الكائنات إلى الفئات يسمى التابع. على عكس التحليل التمييزي الكلاسيكي، فإن أشجار التصنيف قادرة على إجراء تفرع أحادي البعد عبر متغيرات من أنواع مختلفة: الفئوية والترتيبية والفاصلة. لا توجد قيود مفروضة على قانون توزيع المتغيرات الكمية. وبالقياس على التحليل التمييزي، تتيح هذه الطريقة تحليل مساهمات المتغيرات الفردية في إجراء التصنيف.

تحليل المكونات الرئيسية وتصنيفها. تسمح لنا طريقة تحليل وتصنيف المكونات الرئيسية بحل هذه المشكلة وتخدم غرضين:

تقليل العدد الإجمالي للمتغيرات (تقليل البيانات) من أجل الحصول على المتغيرات "الرئيسية" و"غير المرتبطة"؛

تصنيف المتغيرات والملاحظات باستخدام الفضاء العامل المبني.

يتم تحقيق حل المشكلة الرئيسية للطريقة من خلال إنشاء مساحة متجهة للمتغيرات (العوامل) الكامنة (المخفية) ذات بُعد أقل من البعد الأصلي. يتم تحديد البعد الأولي بعدد المتغيرات المراد تحليلها في البيانات الأصلية.

التحجيم متعدد الأبعاد. يمكن اعتبار هذه الطريقة بديلاً للتحليل العاملي، حيث يتم تقليل عدد المتغيرات عن طريق عزل العوامل الكامنة (غير القابلة للملاحظة مباشرة) التي تشرح العلاقات بين المتغيرات المرصودة. الغرض من القياس متعدد الأبعاد هو إيجاد وتفسير المتغيرات الكامنة التي تمكن المستخدم من شرح أوجه التشابه بين الكائنات المعطاة في مساحة الميزة الأصلية. يمكن أن تكون مؤشرات تشابه الأشياء في الممارسة العملية هي المسافات أو درجات الاتصال بينهما. في التحليل العاملي، يتم التعبير عن أوجه التشابه بين المتغيرات باستخدام مصفوفة من معاملات الارتباط. في القياس متعدد الأبعاد، يمكن استخدام نوع عشوائي من مصفوفة تشابه الكائنات كبيانات أولية: المسافات، الارتباطات، وما إلى ذلك.

نمذجة المعادلات الهيكلية (النمذجة السببية). إن الهدف من نمذجة المعادلات الهيكلية هو الأنظمة المعقدة التي يكون هيكلها الداخلي غير معروف ("الصندوق الأسود"). الفكرة الأساسية لنمذجة المعادلات الهيكلية هي أنه يمكن اختبار ما إذا كانت المتغيرات Y وX مرتبطة خطيًا بواسطة Y = aX من خلال تحليل تبايناتها وتبايناتها. تعتمد هذه الفكرة على خاصية بسيطة للمتوسط ​​والتباين: إذا قمت بضرب كل رقم في ثابت k، فسيتم ضرب المتوسط ​​أيضًا في k، وسيتم ضرب الانحراف المعياري في المعامل k.

السلاسل الزمنية. السلاسل الزمنية هي المجال الواعد والأكثر تطورًا في الإحصاء الرياضي. نعني بالسلسلة الزمنية (الديناميكية) سلسلة من الملاحظات لبعض السمات X (متغير عشوائي) في لحظات متتالية متباعدة بشكل متساوٍ t. تسمى الملاحظات الفردية مستويات السلسلة ويتم تحديدها بـ xt، t = 1، …، n. عند دراسة السلاسل الزمنية يتم التمييز بين عدة مكونات:

س t = ش t +y t +c t +e t , t = 1, …, n,

حيث u t هو اتجاه، وهو عنصر يتغير بسلاسة ويصف التأثير الصافي للعوامل طويلة الأجل (انخفاض عدد السكان، وانخفاض الدخل، وما إلى ذلك)؛ - المكون الموسمي، الذي يعكس تكرار العمليات على مدى فترة ليست طويلة جدًا (يوم، أسبوع، شهر، إلخ)؛ сt - مكون دوري يعكس تكرار العمليات على مدى فترات زمنية طويلة على مدار عام واحد ؛ t هو مكون عشوائي يعكس تأثير العوامل العشوائية التي لا يمكن أخذها في الاعتبار وتسجيلها. المكونات الثلاثة الأولى هي مكونات حتمية.

الشبكات العصبية. الشبكات العصبية هي نظام حاسوبي تشبه بنيته بناء الأنسجة العصبية من الخلايا العصبية. يتم تزويد الخلايا العصبية في الطبقة السفلية بقيم معلمات الإدخال، والتي على أساسها يجب اتخاذ قرارات معينة.

تصميم التجارب. إن فن ترتيب الملاحظات بترتيب معين أو إجراء اختبارات مخططة خصيصًا من أجل استغلال إمكانيات هذه الأساليب بشكل كامل هو محتوى موضوع "التخطيط التجريبي".

بطاقات مراقبة الجودة. تتشكل جودة المنتجات والخدمات في عملية البحث العلمي والتصميم والتطوير التكنولوجي، ويتم ضمانها من خلال التنظيم الجيد للإنتاج والخدمات. لكن تصنيع المنتجات وتقديم الخدمات، بغض النظر عن نوعها، يرتبط دائمًا بتقلب معين في ظروف الإنتاج والتقديم. وهذا يؤدي إلى بعض التباين في خصائص الجودة. ولذلك، فإن قضايا تطوير أساليب مراقبة الجودة التي من شأنها أن تسمح بتحديد علامات انتهاك العملية التكنولوجية أو تقديم الخدمات في الوقت المناسب هي قضايا ذات صلة.

يتم دمج الوحدات المختلفة من السكان الإحصائيين الذين لديهم تشابه معين مع بعضهم البعض في خصائص مهمة إلى حد ما في مجموعات باستخدام طريقة التجميع. تتيح لك هذه التقنية "ضغط" المعلومات التي تم الحصول عليها أثناء الملاحظة، وعلى هذا الأساس، تحديد الأنماط المتأصلة في الظاهرة قيد الدراسة.

يستخدم أسلوب التجميع في حل مسائل مختلفة أهمها:

1. تحديد الأنواع الاجتماعية والاقتصادية

2. تحديد بنية السكان المتشابهين

3. الكشف عن الروابط والأنماط بين السمات الفردية للظواهر الاجتماعية

في هذا الصدد، هناك 3 أنواع من المجموعات: التصنيفية والهيكلية والتحليلية. تتميز المجموعات بشكل تنفيذها.

يمثل التجميع النموذجي تقسيم السكان الإحصائيين غير المتجانسين نوعيًا الذين تتم دراستهم إلى فئات وأنواع اجتماعية واقتصادية ومجموعات متجانسة من الوحدات.

تقسم التجمعات الهيكلية مجموعة متجانسة نوعياً من الوحدات وفقًا لخصائص أساسية معينة إلى مجموعات تميز تكوينها وبنيتها الداخلية.

وتضمن التجمعات التحليلية إقامة العلاقات والترابط بين الظواهر الاجتماعية والاقتصادية قيد الدراسة والخصائص التي تميزها. من خلال هذا النوع من التجميع، يتم إنشاء ودراسة علاقات السبب والنتيجة بين علامات الظواهر المتجانسة، ويتم تحديد العوامل في تطور المجتمع الإحصائي.

تحت طرق التحليل الإحصائيفهم أساليب الرياضيات التطبيقية المستخدمة لزيادة موضوعية وموثوقية البيانات التي تم الحصول عليها ومعالجة النتائج التجريبية. في علم النفس التفاضلي، يتم استخدام ثلاث طرق من هذا القبيل في أغلب الأحيان - التباين والارتباط وتحليل العوامل.

1. تحليل التباينيسمح لك بتحديد مقياس التباين الفردي في المؤشرات (نظرًا لأنه من المعروف أنه مع نفس المؤشرات المتوسطة، يمكن أن يختلف نطاق التوزيع بشكل كبير). بالنسبة لبعض المشكلات البحثية والعملية، فإن التباين هو الذي يوفر المعلومات الأساسية. على سبيل المثال، تخيل أن متوسط ​​الدرجات التي حصل عليها الطلاب في اختبار الجبر هو "4" لكل من الأولاد والبنات. لكن الأولاد لديهم كلاً من C وA، وجميع الفتيات نسخن بنشاط من بعضهن البعض ونتيجة لذلك حصلن على درجة B. ومن الواضح أن النتيجة واحدة في كل مجموعة، لكن المعنى النفسي والتربوي وراء متوسط ​​الدرجات مختلف تمامًا.

2. تحليل الارتباطيشهد بوجود ارتباط واعتماد بين المتغيرات المدروسة. وهذا يؤكد تزامن ظهور هذه العلامات، وليس سببيتها. إذا كانت أي خاصيتين تم الحصول عليهما لنفس الكائن تميلان إلى التغيير معًا، بحيث يمكن التنبؤ بواحدة منهما من قيمة الأخرى، يقال أن هذه الخصائص مرتبطة ببعضها البعض. على سبيل المثال، يلاحظ أن الرضا الزواجي بين الزوجين يرتبط سلباً بالقلق. وهذا يعني أنه كلما زاد رضاهم عن حياتهم العائلية، كلما شعروا بالهدوء. ومع ذلك، بناءً على هذه الحقيقة، لا يمكننا معرفة ما إذا كانوا هادئين لأن كل شيء على ما يرام في المنزل، أو سعداء بحياتهم معًا لأن لديهم قلقًا منخفضًا وموقفًا إيجابيًا عامًا تجاه الحياة.

رياضياً، يتم التعبير عن وجود علاقة بين الخصائص في مؤشر معامل الارتباط: هناك خاصيتان متطابقتان ترتبطان ببعضهما البعض بمعامل "1"؛ اثنان مختلفان - بمعامل "0". تتراوح درجة ارتباط الخصائص من 0.01 إلى 0.99. الارتباطات القريبة من الصفر لا يمكن أن تؤكد وجود علاقة بين المتغيرات. يمكن أن تكون النسبة موجبة (+1) أو سالبة (-1). ويعني معامل الارتباط السلبي أنه كلما زادت قيمة إحدى الخصائص، انخفضت قيمة خاصية أخرى. وقد تم اقتراح معامل الارتباط كارل سبيرمانلقياس العلاقة بين مؤشرين فكريين (1901). تم اكتشاف مماثل من قبل أحد طلاب ف. جالتون كارل بيرسون.

3. التحليل العامليهي مجموعة من الطرق المصممة لتحديد الخصائص التي لا يمكن ملاحظتها وقياسها بشكل مباشر. تعود فكرة التحليل العاملي إلى K. Spearman، الذي اقترح تحديد الأنماط العامة بناءً على تحليل مصفوفة معاملات الارتباط. إذا كان من الممكن، بناءً على نتائج حساب معاملات الارتباط، تتبع الروابط الكثيفة بشكل خاص بين عدة مؤشرات (مجرات الارتباط)، فيمكن الافتراض أن وراءها عامل مشترك - متغير بمستوى أعلى من التعميم.

عند استخدام هذه الطريقة في هيكلة وتلخيص المعلومات النفسية، يصبح من الممكن الحصول على وصف مدمج لكائن القياس وإبراز الخصائص الأكثر أهمية واستقلالية. تتيح لك هذه الميزة استخدام التحليل العاملي لحل مشكلات التشخيص النفسي التالية:

- "التطهير المفاهيمي" (توضيح المحتوى النفسي للظواهر المدروسة)؛

تصميم الاختبار؛

اختبار الخصائص السيكومترية للاستبيانات (خاصة عند استخدام الاستبيانات في ثقافات أو مجتمعات جديدة).

في علم النفس التفاضلي، تُستخدم أساليب تحليل العوامل على نطاق واسع في دراسة بنية الفردية، بالإضافة إلى مكوناتها الفردية، مثل المزاج والذكاء والشخصية. تعتبر العوامل التي تم تحديدها خصائص مستقرة ومستقلة نسبيا تميز الهيكل قيد الدراسة.

في هذه الحالة، تؤخذ في الاعتبار مستويات مختلفة من تعميم المعلومات، والتي يتم بموجبها التمييز بين ثلاثة أنواع من العوامل:

العوامل العامة التي تجمع بين كافة أبعاد خاصية معينة، مثلاً عامل الذكاء العام أو عامل النشاط العام؛

عوامل المجموعة التي لا تشمل جميع أبعاد خاصية معينة، بل عددًا كبيرًا منها؛

عوامل محددة أو فريدة تتعلق بنوع واحد فقط من القياس.

وكحد من التحليل العاملي، تجدر الإشارة إلى الذاتية النسبية لأساليبه. تعتمد نتائج التحليل على طبيعة وعدد المتغيرات التي يتم تحليلها. يتم اتخاذ قرار اختيار شكل التحليل العاملي وتلك المتغيرات التي ينبغي تضمينها في المصفوفة الأولية بناءً على هذه المعلمات، وكذلك على المواقف النظرية لكل باحث. ونتيجة لذلك، يتم إنشاء نماذج فردية تختلف ليس فقط في عدد العوامل المحددة، ولكن أيضًا في طبيعة الروابط الموجودة بينها.

وكما لاحظ الباحث البولندي جان ستريليو، فإن استخدام هذه الطريقة به عيوب كبيرة. يمتلك المؤلفون المختلفون كميات ونوعية مختلفة من العوامل المحددة، على الرغم من أن المادة المصدر التي تشكل الأساس لتحديد العوامل تظل دون تغيير. كقاعدة عامة، يختلف الباحثون عند نقطة البداية – اختيار البيانات التي ستخضع للتحليل العاملي. وهذا يؤدي إلى حقيقة أن محتوى هياكل الشخصية المحددة يختلف بشكل كبير عن بعضها البعض. الخلل يكمن في الطريقة نفسها، وهي اعتباطية وتعتمد على حدس الباحث ومثابرته.

من أجل استخدام أساليب التحليل الإحصائي بكفاءة، يجب أن تكون واثقا من صحة توزيع الجودة التي تتم دراستها.

التوزيع الطبيعيظهرت من الأبحاث في مجال الذكاء. كان F. Galton أول من اكتشف أن الاختلافات في الذكاء يمكن قياسها كميًا من خلال تحديد درجة التعبير عن هذه الخصائص لدى الأشخاص المختلفين. وافترض أن هذه الاختلافات موزعة بشكل طبيعي بين السكان، أي. تتمتع مجموعات صغيرة من الأشخاص بمستوى ذكاء مرتفع (14%) أو منخفض (14%)، وتقع غالبية العينة (68%) في المتوسط ​​(1869). المظاهر المتطرفة تمثل 4% (2% لكل قطب).

في التمثيل الرسومي، يكون التوزيع الطبيعي على شكل قبة: القيم الفردية للمتغير تقع بشكل متماثل حول المركز. في هذه الحالة، تتزامن القيمة المركزية مع الوسيط - النقطة التي يوجد فوقها نصف المتغيرات بالضبط، وتحتها أيضًا النصف بالضبط.

جنبا إلى جنب مع التوزيع الطبيعي، غالبا ما توجد توزيعات غير متماثلة وثنائية النسق. ومع ذلك، حتى مع التوزيع الطبيعي، هناك احتمال أن تكون النتائج التي تم الحصول عليها نتيجة للصدفة. ويسمى هذا الاحتمال "مستوى الدلالة او الاهميه".على سبيل المثال، على الرغم من القيم العالية، يمكن أن يكون لمعامل الارتباط مستويات مختلفة من الأهمية - تصل إلى الصفر. يعتمد مستوى الأهمية على حجم العينة وانتشار القيم.

وبالمثل، فإن المقاييس المختلفة أو المتشابهة لا تكون دائمًا ذات دلالة إحصائية. هناك طرق مختلفة لتحديد أهمية الاختلافات. ويعتمد اختيارهم على طبيعة توزيع البيانات التجريبية، واعتماد المتغيرات أو استقلالها، وكذلك درجة الدقة المطلوبة والتي تحددها أهداف الدراسة.




معظم الحديث عنه
ما هي أنواع الإفرازات التي تحدث أثناء الحمل المبكر؟ ما هي أنواع الإفرازات التي تحدث أثناء الحمل المبكر؟
تفسير الأحلام وتفسير الأحلام تفسير الأحلام وتفسير الأحلام
لماذا ترى قطة في المنام؟ لماذا ترى قطة في المنام؟


قمة