6 أنواع من البيانات الأكثر استخدامًا في التحليل

من المهم فهم أنواع مختلفة من البيانات لأنها واحدة من أهم الموضوعات عن الإحصاءات. 

ستساعدك معرفة أنواع البيَانات المختلفة على تطبيق القياسات الإحصائية على بياناتك وبالتالي استنتاج افتراضات محددة بشأنها. 

تعتبر أنواع البيَانات موضوعًا مهمًا للتعلم.

السبب وراء ذلك هو أنه لا يمكن استخدام الأساليب الإحصائية إلا مع أنواع معينة من البيَانات.

يجب عليك تحليل كل نوع بيانات مختلف عن نوع بيانات آخر وإلا فستصل إلى استنتاجات خاطئة. 

لذلك يتيح لك الحصول على المعرفة بأنواع مختلفة من البيَانات اختيار تقنية تحليل دقيقة.

يعد فهم أنواع البيَانات المختلفة شرطًا أساسيًا لإجراء تحليل البيَانات الاستكشافية (EDA) لأنه لا يمكنك استخدام سوى قياس إحصائي محدد لأنواع بيانات معينة.

 بالإضافة إلى ذلك يجب على المرء أن يكون على دراية بنوع البيَانات لتحديد طريقة التصور الصحيحة.

دعنا نتعرف على أنواع مختلفة من البيَانات في هذه المقالة.

أنواع البيانات - 2

1) Nominal Data:

يتم استخدام هذا النوع من البيَانات لتمثيل وحدات منفصلة وتستخدم لوضع علامات على المتغيرات.

 المتغيرات الموسومة باستخدام البيَانات الاسمية ليس لها قيمة كمية.

لا تتبع البيانات الاسمية أي ترتيب معين. وبالتالي فإن التغيير في ترتيب قيمها لا يغير المعنى.

البيَانات التي تمثل أكثر من فئتين تسمى البيَانات الاسمية.

2) Categorical Data:

يتم استخدام هذا النوع من البيانات لتمثيل الخصائص. 

لذلك باستخدام هذا النوع من البيانات يمكن للمرء أن يمثل أشياء مثل اللغة والمواطنة والجنس وما إلى ذلك بالإضافة انه يمكن أن تتلقى البيانات التصنيفية أيضًا قيمًا رقمية كمدخلات.

 على سبيل المثال ، 1 للإعاقة الجسدية و 0 لللياقة البدنية. ولكن ضع شيئًا واحدًا في الاعتبار أن هذه القيم العددية ليس لها أي معنى رياضي.

3) Ordinal Data:

هذا النوع من البيَانات هو مزيج من الاسمي والتصنيف. ومن ثم فهي تمثل قيمًا مرتبة ومميزة في طبيعتها.

أحد قيود البيَانات الترتيبية هو أنها لا تخبر عن الفرق بين القيم. لهذا السبب يتم استخدام البيانات الترتيبية لتحديد الكيانات غير الرقمية مثل رضا العميل و سعادته وفرحه وما إلى ذلك.

4) Dichotomous Data:

يستخدم هذا النوع من البيانات القيم الثنائية (1 و 0) لتمثيل قيمة. تستخدم معظم الدراسات بيانات ثنائية التفرع للتحليل التلوي. نظرًا لقيمها المحدودة يمكن استخدامها فقط لتمثيل المعلومات بقيمتين فقط.

 لا يمكنك تمثيل البيَانات حيث لديك أكثر من وحدتين. 

لهذه القيم يمكن استخدام البيانات الاسمية. مثال البيانات ثنائية التفرع هي أسئلة مثل ما هو جنسك؟ بالنسبة لهذا النوع من الأسئلة ، يتم إعطاء فئتين مثل ذكر / أنثى.

5) Continuous Data:

يستخدم هذا النوع من البيَانات لتمثيل القياسات ، وبالتالي لا يمكن حساب قيم هذا النوع من البيَانات ولكن يمكن قياسها فقط.

على سبيل المثال لا يمكن تفسير ارتفاع الشخص إلا باستخدام فواصل زمنية على سطر أرقام حقيقي. يمكن أن تكون البيَانات المستمرة من نوعين.

أ) Interval data:

يمثل هذا النوع من البيانات الوحدات المرتبة التي لها نفس الاختلاف بينها. وبالتالي ، يتم استخدام البيانات الفاصلة عندما نريد قياس متغير يحتوي على قيم رقمية مرتبة ويتم معرفة الفرق الدقيق بين القيم.

 من الأمثلة المناسبة على هذا النوع من البيَانات درجة حرارة المكان.

ولكن هناك مشكلة واحدة مع هذا النوع من البيانات. المشكلة هي أنها لا تأخذ قيمة “الصفر الحقيقي”.

مما يعني في مثالنا عدم وجود درجة حرارة. يمكن إضافة البيانات الفاصلة وطرحها ولكن لا يمكن ضربها أو تقسيمها.

بالإضافة إلى ذلك ، لا يمكنك أيضًا حساب نسب البيَانات الفاصلة ، وبسبب نقص قيمة الصفر الحقيقية ، لا يمكن تطبيق العديد من الإحصاءات الاستدلالية والوصفية.

ب) Ratio Data:

يتم استخدام هذا النوع من البيَانات لتمثيل الوحدات المرتبة وهذه الوحدات لها نفس الاختلاف. 

تتشابه قيم النسب مع القيم الفاصلة مع استثناء أن هناك نسبة صفر حقيقية في بيانات النسبة. لذلك هذا النوع من البيانات مناسب لتمثيل الوزن والطول إلخ.

6) بيانات منفصلة:

يتم استخدام هذا النوع من البيَانات لتمثيل البيَانات التي تكون قيمها متميزة ومنفصلة. 

ولكن هناك حد واحد فقط وهو أن البيانات المنفصلة لا يمكن أن تمثل سوى نوع معين من القيم. يمكن قياس البيانات المنفصلة فقط ولا يمكن حسابها أو حسابها. 

لا يمكن تمثيل المعلومات التي يمكن تصنيفها في تصنيف إلا باستخدام بيانات منفصلة.

على سبيل المثال ، لحساب فرص ظهور الرؤوس عند قلب عملة معدنية 100 مرة. يمكن للمرء أن يحدد أن المرء يتعامل مع بيانات منفصلة أو لا بالإجابة على سؤال بسيط أنه إذا كان يمكن حساب نتائج التجربة أم لا.

 إذا كان الجواب لا ، فهذا يعني أنك تتعامل مع بيانات منفصلة.

اترك رد

This site uses Akismet to reduce spam. Learn how your comment data is processed.