السبت، 16 أبريل، 2011

مفاهيم اساسيه لمادة الاحصاء

1 – مفاهيم أسـاسـية لمادة الاحصاء:

قبل كل شيء ، وقبل ان يمارس الطالب يدويا العمليات الحسابية ، من الضروري أن يعي لماذا يقوم بها ، وماذا تعني المفاهيم التي وردت فيها ، وماهو المنطق الرياضي الذي تستند عليه. لا نريد من الجغرافي ان يتعمق بالمنطق الرياضي ، على اهمية ذلك ، فـمعرفته له تساعده في التعامل مع الارقام بدقة وامانة ، وتفيده في مختلف اجراءات التحليل التي يمارسها في حياته الدراسية ، العامة و حتى الخاصة . و مثل هذا الفهم يساعد الطالب في تفسير النتائج ، وعدم نسيان خطوات الحل . انه ينقله من التعامل الآلي مع الارقام و النتائج الى التفاعل الحي المثمر .

1 – 1) مـعـاني ألأرقـام :

الرقم بحد ذاته (القيمة المفردة سواء أكانت معدل أم نسبة مئوية أو غيرها) ذي معنى محدود ، تزداد قيمته وضوحا عند مقارنته مع غيره من الارقام . فعندما يعلن متجر ما عن تخفيض للاسعار بقيمة (100) أو (1000) دينار ، انما يتلاعب بالالفاظ فهذه الارقام لا معنى لها ما لم تقارن بسعر السلعة ذاتها . و النسبة المئوية أداة مفيدة عند مقارنة الحجم النسبي لكميتين مع بعض . وعند تفسير النسب المئوية من الضروري الانتباه الى ان النسب الصغيرة لكمية كبيرة تعني قيما كبيرة ، على عكس النسب المئوية الكبيرة لكميات صغيرة . فالنسبة المئوية (10%) لكمية بالمئات هي غيرها لكمية بالالوف . و نمو سكان مدينة ما بنسبة (2%) سنويا قبل عشرين سنة ليس نفسه الآن نظرا للتبدلات التي قد حصلت في حجمها و تركيبها السكاني . فالرقم لا يفسر نفسه ، بل يتم ذلك من خلال ارقام أخرى ذات دلالة و معنى

وما هو صحيح عن النسب المئوية هو كذلك عن النسب الاخرى ، مثل : نسبة الولادات ، نسبة الوفياة ، نسبة الاعالة ، نسبة الخصوبة ، نسبة الجريمة ، نسبة الملكية ، وغيرها . فمقارنة هذه النسب لفترات مختلفة ، او مناطق متباينة في احجامها السكانية يعني اخفاء لبعض الحقائق و تحيز غير علمي مالم تعرض مع الارقام التي تمثلها ، او مع المقاييس الأخرى التي توضح جوانب أخرى من الحقيقة . فالعلم معني بالحقيقة ، و الاحصاء و سيلة لعرض الحقائق الرقمية بصورة سهلة الفهم و الادراك . والاحصاء كوسيلة و أداة لعرض الحقائق التي تحتويها مجموعة الارقام قد يساء استخدامه في أغراض غير موضوعية (كما هو حال معظم ان لم يكن جميع الادوات الأخرى – القلم ، الورقة ، الكتاب ، ….. الخ) . أي ، ان استخدام الاحصاء باسم العلم لاخفاء الحقيقة و تضليل القارىء ، عن قصد او بدونه ، هو دليل على فقدان للقيم الاخلاقية .

والنسب المئوية هي مقارنة نسبية تتطلب تقسيم البيانات الى مجاميع منفصلة عن بعضها طبقا لخصائص كل منها . فالارض الزراعية تصنف حسب جودتها ، ملكيتها ، طبيعة زراعتها ، نوع المحصول المزروع فيها ، ويكون تلخيص هذه المعلومات كنسب مئوية ذي فائدة كبيرة عند وصف منطقة الدراسة . وتتكون صورة ذهنية موجزة عن طبيعة الزراعه واقتصاد منطقة معينة في زمن محدد عند جدولة نسب استعمالات الارض فيها. (Theakstone & Harrison 1978 , 6) . وهذه الصورة ليست تحليلآ للبيانات ، بل ملخصا يصف اجمالي توزيع الاستعمالات في منطقة معينة في زمن محدد . انها تخفي الكثير من التفاصيل الجوهرية والعلاقات غير المنظورة بين المتغيرات قيد الدرس . انها الصورة التي يرسمها الباحث قبل التمعن والنظر بعمق لغرض التحليل و استشفاف الكوامن التي لا تبرز بصورة جلية للوهلة الأولى .

وفي العديد من الحالات تعامل النسب المئوية كمعدلات ، فالاحصاءات الرسمية (التعدادات العامة) تعامل هكذا عند دراسة المجاميع الثانوية او مقارنة نتائج الدراسات المحلية مع الحالة العامة او المعيارية . فالنسب المئوية للفئات العمرية على المستوى الوطني او الاقليمي تعامل كمعدلات تقارن معها نتائج المسوحات الميدانية المحلية و الاقليمية .


1 – 2) التوزيعات التكرارية :

بعد جمع المعلومات و البيانات يتجه الباحث الى تنظيمها و جدولتها لتهيئتها للتحليل ، وقبل التحليل من الضروري وصفها بطريقة كمية . فالتوزيعات التكرارية تمثل احد انواع هذا التنظيم ، ومن خلالها يمكن وصف البيانات و وصف توزيعها و اجراء المقارنة مع البيانات و مع التوزيعات الاخرى . وقد لا حظ الاحصائيون عددا من الخواص الاساسية للتوزيعات التكرارية للقيم والتي أصبحت ركائز لتطوير طرائق كمية متعددة شائعة الاستخدام في مختلف العلوم .

تمثلت الخاصية الاولى بتكتل البيانات ، في الغالب ، حول قيمة مركزية تقع بين القيمتين المتطرفتين في مجموعة القيم ، و الخاصية الثانية ، ان القيم تميل الى الانتشار و التوزع حول القيمة المركزية بطريقة يمكن تحديدها كميا (Haber & Runyon 1973 , 84) . وبانقاص الكم الكبير من البيانات الى عدد قليل من القيم يسهل ادراكها و التعامل معها احصائيا ، وبالتالي الاستفادة منها في اشتقاق معان و خلاصات عن الظاهرة قيد الدرس .

ان التوزيعات التكرارية يمكن وصفها من خلال قياس ثلاثة خصائص رئيسية ، هي : مواقع القيم Location ، انتشار القيم Spread ، و شكل التوزيع Shape . يشير الموقع الى النقطة التي تقع فيها القيمة في مقياس متصل للقيم من ادناها الى الاعلى ، و من مقاييس مواقع القيم : المنوال ، الوسيط و الوسط الحسابي . و يقصد بالانتشار ، تباين مواقع القيم او تبعثرها ، ويقاس بقيمتي المدى و الانحراف المعياري للقيم عن معدلها (وفي بعض الحالات عن الوسيط) . أما شكل التوزيع فهو أكثر المقاييس تعقيدا ويقارن ، عادة ، بشكل الجرس Bell المتماثل الجانبين ، و درجة قرب التوزيعات منه (Hartwig & Dearing 1979 , 13) .

1 – 3 ) البعد المكاني للتوزيع التكراري :

البيانات الجغرافية ذات بعد مكاني ، لذا فانها تسقط على الخرائط ويتم تمثيلها اما على اساس المساحة (وحدات احصائية ، ادارية) او بصيغة نقطية . وتعتمد مقاييس النزعة المركزية لوصف التوزيعات الجغرافية بغض النظر عن طبيعة التمثيل الخرائطي (الكارتوكرافي) لها . اضافة الى ذلك ، فان البيانات الجغرافية قد تنظم بصيغة قيم مفردة (غير مبوبة) ، أو يتم تصنيفها الى فئات و يحسب تكرار فئاتها (مبوبة) . يعني هذا ، أن على الجغرافي أن يتدرب على استخدام مقاييس النزعة المركزية ، وغيرها من التقنيات ، مع البيانات المبوبة و غير المبوبة ، النقطية و المساحية . الجدول رقم (4- 1) يوضح صلاحية المقياس للبيانات حسب نوعها .

الجغرافي معني بالتباين المكاني و تحليله ، ومقاييس النزعة المركزية تساعده في وصف التوزيعات الجغرافية و التباين بين الانماط المكانية ، وتعد بداية يتطلبها تطبيق الكثير من تقنيات التحليل المكاني . ولكونها البداية (ألأساس) لذا من الضروري جدا أن تكون بداية صائبة صلبة ليتسنى تطوير خبرة في التحليل الكمي و معرفة معمقة في الفكر الجغرافي .

يحدد ماكرو و زميله الهدف من استخدام مقاييس النزعة المركزية بتوفير خلاصة دقيقة ، سهلة الفهم ، عن خصائص مجموعة البيانات قيد التحليل . ففي معظم المشكلات التي يعالجها الجغرافيون تكون مثل هذه التلخيصات الرقمية و الكمية ذات فائدة جمة . و يضيف أن على الجغرافيين أن يكونوا حذرين عند تطبيق الاحصاءات الوصفية على بيانات مكانية التوزيع ، خاصة عند مقارنتها مكانيا أو زمنيا ، و ذلك لوجود مؤثرات عديدة ، مثل :-

(1)اختلاف حدود منطقة الدراسة ، و حدود الوحدات الاحصائية للبيانات ،

(2) التغيرات التي قد حصلت في حدود الوحدات الاحصائية و الادارية ،

(3)اختلاف مستويات Scales جمع البيانات (McGrew & Monroe 1993 , 40) .

للموقع Location اهمية خاصة في الجغرافيا ، واحصائيا يقصد به موقع القيمة من نقطة معينة في توزيع قيم المتغير . ولما كان لكل قيمة احصائية في البيانات الجغرافية موقع مكاني مناظر له ، لذا فقد تعززت أهمية الموقع لأن له معنيين ، احصائي و مكاني . بعبارة أخرى ، ان تحديد موقع قيم أي متغير من نقطة محددة فيه يعني تحديد مواقعها في التوزيع الجغرافي لذلك المتغير . ومن هنا جاء اهتمام الجغرافيين بمقاييس الموقع وتطويرها للاستفادة منها في رسم الخرائط ، وعند وصف الانماط المكانية التي تشكلها المتغيرات ، وتفسير النتائج .

1 – 4) تلخيص البيانات :

في العديد من الدراسات الجغرافية ، و حيثما تتوفر كمية من المعلومات الرقمية ، يرد الى الذهن السؤال : كيف يمكن تلخيص هذه المعلومات و التعبير عنها بمفاهيم بسيطة و دقيقة ، تسهل عملية وصفها والاستفادة منها ؟ و لمقاييس النزعة المركزية دور مهم في الاجابة عن هذا السؤال ، اذ تعد تلخيصا للمعلوماتSummarising information ووصفا التوزيعات الرقمية Describing Numerical Distributions ، ويطلق عليها أيضا اسم الاحصاءات الوصفية Descriptive Statistics ، فالتسميات كثيرة ولكن المقصود بها واحد .

المعدلAverage و النسبة المئويةPercentage هما أكثر الاحصاءات الوصفية شيوعا في الاستخدام ، لسهولة حساب كل منهما ، ولكن لا يعني هذا انهما سهلي الفهم ، (Conway 1976, 15) ، أو لا يتم اخفاء حقائق ورائهما . فكثيرون يعتقدون بان المعدل و النسب المئوية كافية لوصف المعلومات ، خاصة عند القيام بالمسوحات الميدانية . والأدهى ، أن العديد منهم يعتقد بانهما تحليل للبيانات قيد الدرس و ليس تلخيصا مجزوءّا لها .

1 – 5) قياس النزعة المركزية :

يحدد شحادة معنى قياس النزعة المركزية ب " قياس مدى تجمع المشاهدات أو تمركزها حول قيمة واحدة تعد نقطة ارتكاز و بؤرة تلك البيانات ، أو مركز ثقلها . وهي تصلح أكثر من غيرها ، لتمثيل بقية المشاهدات ، ولتكون تقديرا أوليا لها " . (شحادة 1997 ، 146) .

انمقاييس النزعة المركزية مفيدة لتلخيص المعلومات الرقمية ، وقد يساء استخدامها أو فهمها ايضا . فقد يكون معدل كمية المطر المتساقط واحد في منطقتين متباعدتين مكانيا (39.95 انج مثلآ) ، الا ان توزيع قيم الظاهرة قيد الدرس فيهما مختلف (انحراف معياري للقيم 13.4 و 6.7 مثلآ) . فعلى الرغم من وحدة المعدل السنوي لكمية المطر الا انهما يختلفان في درجة تذبذب كمية المطر سنويا . كذلك عند النظر الى أي مقياس لوحده ، مثل : المدى ، الوسيط . لذا ، من اجل تلخيص علمي (موضوعي) للمعلومات بصورة شافية من المهم ان تقاس درجة تكتل القيم ، درجة تبعثرها ، اتجاهها نحو التمركز . فالمعدل وحده لا يعطي فكرة كافية عن توزيع القيم و يلخصه ، انه الوسط الحسابي لمجموع القيم . و يعطي المدى فكرة عن درجة تبعثر القيم ، و يعكس الانحراف المعياري للقيم درجة تكتلها حول القيمة المركزية فيها ، وهكذا . فكل واحد منها يعرض التوزيع من زاوية مختلفة ، ومع بعض تتوضح ملامح الصورة و تتكامل جوانبها ، وحينئذ يكون التلخيص علميا ، وافيا شافيا .

ومن الضروري التذكر دوما بان مقاييس النزعة المركزية تلخص توزيع القيم وتعرض خصائصه ، وان التحليل العلمي يبدأ بالبيانات نفسها وليس بملخصاتها ، وان الملخصات ليست النهاية بل مرحلة وصفية أولية تسبق التحليل ولا يجوز الوقوف عندها و الاكتفاء بها . فمقاييس النزعة المركزية ليست تحليلآ للبيانات ، بل وصفا لتوزيع قيم المتغيرات التي تضمها البيانات .

تستخدم مقاييس النزعة المركزية مع البيانات المفردة ، و المبوبة ، مع التي تمثل على الخارطة بالنقاط و التي تمثل عليها بالوحدات المساحية ، ولكن ليس جميع هذه المقاييس صالحة للتطبيق مع جميع هذه الانواع .

في الجدول رقم (4 – 1) ، اتبعت الطريقة الثنائية Binary ، فالرقم (1) يعني صلاحية الاستعمال ، والرقم (0) يعني عدم الصلاحية . ويستدل منه ان الوسط الحسابي هو الاكثر صلاحية ، لذا شاع استعماله ، وان مركز المعدل يستخدم لتحليل الانماط النقطية ، وان المقاييس التي تعتمد الوسيط تصلح للبيانات غير النقطية بشكل خاص .



حمل بقية البحث من المرفقات



مع تحياتي الجغرافية

الجغرافي السوري

الفصل الأول : التوزيعات التكرارية
الإحصاء: الإحصاء هو العلم الذي يبحث في جمع البيانات والمعلومات الخاصة بمختلف الظواهر والتصنيفات لبيانات و تبويبها في جداول منظمة. تمثيلها بيانيا على شكل رسوم بيانية.تحليل البيانات واستخلاص النتائج منها واستخدامها في اتخاذ القرار المناسب. مقارنة الظواهر ببغضها ومحاولة استنتاج علاقات بينها.
لماذا ندرس الإحصاء؟ لترجمة الأرقام إلى معنى
الحصر الشامل: هو جمع البيانات من جميع مفردات المجتمع.
العينة: هي جزء من مفردات المجتمع تم اختيارها بحيث تكون ممثلة للمجتمع..
الفصل الثاني : مقاييس النزعة المركزية
أ/ مقاييس النـزعة المركزية:- هو ميل البيانات إلى التمركز حول قيمة معينة.
1. الوسط الحسابي ( x ) : عبارة عن مجموع قيم المشاهدات مقسوماً على عددها.
مزايا وعيوب الوسط الحسابي :
1. يعتمد في حسابه على كل المشاهدات.
2. سهل الفهم و الحساب .
3. يتأثر بالقيم الشاذة .
2. المنوال ( D ) : القيمة الشائعة أو الأكثر تكرارا ًبين المشاهدات. وقد يكون للبيانات أكثر من منوال , وقد لا يكون لها أي منوال ( لا يمكن إيجاده )
مزايا وعيوب المنوال :
• يمكن إيجاده بالحساب و الرسم .
• سهل الحساب .
• لا يتأثر بالقيم الشاذة .
• المقياس الوحيد الممكن لمتغير وصفي.
5. لا يدخل في حسابه كل المشاهدات .
6. يعاب على المنوال أنه قد لا يوجد و ذلك في الحالات التي تتساوى فيها تكرارات المشاهدات.
3.. الوسيط ( M ) : القيمة التي تقسم عدد البيانات المرتبة إلى قسمين متساويين .وهي القيمة التي عدد البيانات إلي لها قيم أقل منها مساوي لعدد البيانات التي لها قيم أكبر منها .بمعنى أن 50% من عدد البيانات لها قيم أقل أو تساوي قيمة الوسيط و 50% من عدد البيانات لها قيم أكبر من قيمة الوسيط .
مزايا وعيوب الوسيط
1. يمكن إيجاده بالحساب و بالرسم.
2. لا يتأثر بالقيم الشاذة
3. لا يعتمد في حسابه على كل المشاهدات.
ب/ مقاييس التشتت :
الاختلاف والتشتت : هو الاختلاف أو التغير بين المشــاهدات.
1. المدى : هو الفرق بين أكبر مشاهدة و أصغر مشاهدة.
مزايا و عيوب المدى :
• سهل الحساب
• يتأثر بالقيم الشاذة بسبب اعتماده على مشاهدتين فقط.
2. المدى الربيعي : هو الفرق بين الربيع الثالث Q3 و الربيع الأول Q1
3. نصف المدى الربيعي : نفس المدى الربيعي بالقسمة على 2
مزايا و عيوب نصف المدى الربيعي :
• لا يتأثر بالقيم الشاذة.
• يعتمد على قيمتين
4. الانحــراف المعياري ( S ) : هو الجذر التربيــعي للتبــاين
مزايا و عيوب الانحــراف المعياري
• سهل الحساب .
• له نفس وحدة قياس المشاهدات فإذا كانت المشاهدات متساوية فإن s=0
• يتأثر بالقيم الشاذة .
• لا يمكن إيجاده بالرسم.
5. التبــاين ( S ): هو متوسط مربعات انحرافات المشاهدات عن وسطها الحسابي
الفصل الثالث : الانحــــــــدار
1. الانحدار والذي يفيدنا في :
• تحديد شكل العلاقة بين المتغيرين رياضيا وبيانيا ( خط الانحدار ).
• توضيح اتجاه العلاقة بين المتغيرين .
• التنبؤ بقيمة أحد المتغيرين بدلالة المتغير الآخر .
2. الارتباط ويفيدنا في:* تحديد مقدار درجة العلاقة بين المتغيرين .*تحديد اتجاه العلاقة بين المتغيرين .
أنواع الانحدار :
أولاً : الانحدار الخطي البسيط : فكلمة " بسيط " تعني أن المتغير يعتمد على متغير مستقل واحد وهو وكلمة " خطي" تعني أن العلاقة بين المتغيرين علاقة خطية .
ثانيًا : الانحدار المتعدد : إذا كان المتغير يعتمد على أكثر من متغير مستقل
ثالثًا : الانحدار غير الخطي : إذا كانت العلاقة بين المتغير والمتغيرات المستقلة غير خطية كأن تكون من الدرجة الثانية أو أسية .
معامل الارتباط الخطي :أو ما يسمى: 1. بمعامل بيرسون : وهو يقيس خطية العلاقة بين المتغيرين
2. معامل سبرمان: تتلخص طريقة حسابه في إعطاء رتب لمشاهدات كل من المتغيرين
الفصل الرابـع : السلسلة الزمنية
- تعريف السلسلة الزمنية:* السلسلة الزمنية هي مجموعة القراءات التي تأخذها ظاهرة ما عند فترات زمنية غالبا ما تكون متساوية. وتختلف هذه الفترات حسب طبيعة الظاهرة فيمكن أن تكون يوما أو شهرا أو سنة
* أي سلسلة زمنية على متغيرين احدهما مستقل (x) والثاني التابع وهو قيمة y)) .ويسمى التمثيل البياني للسلسلة الزمنية ب المنحنى التاريخي للسلسلة الزمنية.
- مكونات السلسلة الزمنية
أولاً . الاتجاه العام: هو الاتجاه الذي تأخذه السلسة الزمنية خلال فترات طويلة من الزمن
ثانياً : التغيرات الموسمية :هي التغيرات التي تتكرر بانتظام خلال فترات زمنية لا تتعدى السنة . كأن تكون يومية أو أسبوعية أو شهرية أو سنوية
ثالثاً : التغيرات الدورية :هي تغيرات طويلة المدى التي تحدث حول الاتجاه العام الممثل للظاهرة وتتكرر في فترات زمنية أكثر من السنة . لذلك فهي تختلف عن التغيرات الموسمية التي تحدث بانتظام وخلال فترات زمنية اقل من سنة . وطبيعة التغيرات الدورية أنها غير عادية بمعنى أنها ربما قد تتبع أولا تتبع نفس النظام بعد فترات متساوية من الزمن
رابعاً : التغيرات العرضية أو الفجائية:هي تغيرات طارئة تحدث نتيجة حوادث فجائية غالباً لا تكون في الحسبان كالحروب والفيضانات والأوبئة . ولذلك فهي تؤثر على الاتجاه العام للسلسلة الزمنية إما زيادة أو نقصاً.

هناك تعليق واحد:

  1. السلام عليكم
    كيفك انا خلود المفرج عرفتيني
    شفت اسمك مصادفه وحبيت اتواصل معكو

    ردحذف