AnasBafaqeeh's profile picture. نشر المعرفة في مجالات #الإحصاء و #علم_البيانات

Statistician

@AnasBafaqeeh

نشر المعرفة في مجالات #الإحصاء و #علم_البيانات

Pinned

﴿رَبِّ اغفِر لي وَلِوالِدَيَّ﴾ دعاء وبر واستغفار


تم بناء خط انحدار للتنبؤ بدرجة الطالب بناءً على عدد ساعات المذاكرة عدد ساعات المذاكرة لجميع الطلاب المختارين في العينة تتراوح بين ١-٦ ساعات ودرجات تحصيلهم تتراوح بين ٥٠-٩٠ درجة وفقاً لنموذج الانحدار اذا ذاكر الطالب ١٥ ساعة فسيحصل على ١٥٠ درجة من ١٠٠ Extrapolation Issue

AnasBafaqeeh's tweet image. تم بناء خط انحدار للتنبؤ بدرجة الطالب بناءً على عدد ساعات المذاكرة

عدد ساعات المذاكرة لجميع الطلاب المختارين في العينة تتراوح بين ١-٦ ساعات ودرجات تحصيلهم تتراوح بين ٥٠-٩٠ درجة 

وفقاً لنموذج الانحدار اذا ذاكر الطالب ١٥ ساعة فسيحصل على ١٥٠ درجة من ١٠٠ 

Extrapolation Issue

من منظور علمي:

AnasBafaqeeh's tweet image. من منظور علمي:
This post is unavailable.

الجدول في الصورة يسمى جدول تكراري ثنائي Two-Way Frequency Table - كم نسبة الأولاد؟ - كم نسبة الأولاد الذين نجحوا في التصويب؟ - من الأولاد، كم نسبة الذين نجحوا في التصويب؟ ثلاثة أسئلة يمكن الإجابة عليها من الجدول. لاحظ الفرق بين السؤالين الثاني والثالث

AnasBafaqeeh's tweet image. الجدول في الصورة يسمى جدول تكراري ثنائي
Two-Way Frequency Table

- كم نسبة الأولاد؟ 
- كم نسبة الأولاد الذين نجحوا في التصويب؟
- من الأولاد، كم نسبة الذين نجحوا في التصويب؟

ثلاثة أسئلة يمكن الإجابة عليها من الجدول. لاحظ الفرق بين السؤالين الثاني والثالث

للتنبيه 🚨 هذه الطريقة خطيرة في كثير من الحالات لأنها راح تحذف الصفوف حتى لو احتوت على خلية واحدة فارغة وأحياناً يكون عندنا صفوف فيها بيانات مهمة لكن بمجرد احتواءها على خلية فارغة تُحذف لحل المشكلة ينبغي الاعتماد على عمود معرّف identifier في نفس المثال سيتم حذف الصف 5 ⬇️

AnasBafaqeeh's tweet image. للتنبيه 🚨

هذه الطريقة خطيرة في كثير من الحالات لأنها راح تحذف الصفوف حتى لو احتوت على خلية واحدة فارغة

وأحياناً يكون عندنا صفوف فيها بيانات مهمة لكن بمجرد احتواءها على خلية فارغة تُحذف

لحل المشكلة ينبغي الاعتماد على عمود معرّف identifier

في نفس المثال سيتم حذف الصف 5 ⬇️

حركه مهمه جدا اكسل هتفيدك



#إثراء_البيانات Data Enrichment أحد إجراءات تمحيص البيانات Data Wrangling يتم فيها إضافة سياق للبيانات الأساسية مثل إضافة حقول أو بيانات خارجية للوصول إلى تحليلات أعمق ⚫️دمج بيانات الطقس + بيانات المبيعات لتحليل تأثيرها ⚫️دمج بيانات تدريب الموظفين + بيانات الاداء والانتاجية

AnasBafaqeeh's tweet image. #إثراء_البيانات Data Enrichment 

أحد إجراءات تمحيص البيانات Data Wrangling
يتم فيها إضافة سياق للبيانات الأساسية مثل إضافة حقول أو بيانات خارجية للوصول إلى تحليلات أعمق 

⚫️دمج بيانات الطقس + بيانات المبيعات لتحليل تأثيرها

⚫️دمج بيانات تدريب الموظفين + بيانات الاداء والانتاجية

تسرُّب البيانات Data Leakage عندما تتم المعالجة المسبقة على البيانات قبل تقسيمها، تتسرب معلومات من بيانات الاختبار وتستخدم مع بيانات التدريب وبالتالي يكون الاداء عالي عند تطبيق النموذج على بيانات الاختبار ويتراجع الاداء بوضوح عند استخدام بيانات جديده، وهو مؤشر على حدوث التسرُّب


كتبت صحيفتين نفس الخبر 1️⃣ "الطاقة الكهربائية متاحة ل ¾ المزارع الأمريكية …" 2️⃣ "ربع المزارع الأمريكية تفتقر للطاقة الكهربائية المتاحة …" الاولى ذكرت الجانب الإيجابي والأخرى الجانب السلبي وكلاً يخدم مصالحه والطاقة الكهربائية "المتاحة" لا تعني بالضرورة وجود كهرباء


Statistician reposted

حرصًا من الجمعية على تقديم دورات تدريبية وورش عمل في المؤتمر الأول للجمعية السعودية للعلوم الإحصائية (الإحصاء والصحة) 📣 ندعو أعضاء الجمعية والخبراء الراغبين بتقديم برامج تدريبية ضمن محاور المؤتمر بالتواصل معنا عاجلًا عبر X خلال هذا الأسبوع ابتداءً من اليوم الأحد 12 نوفمبر 2023

sa_pasds's tweet image. حرصًا من الجمعية على تقديم دورات تدريبية وورش عمل في المؤتمر الأول للجمعية السعودية للعلوم الإحصائية (الإحصاء والصحة)

📣 ندعو أعضاء الجمعية والخبراء الراغبين بتقديم برامج تدريبية ضمن محاور المؤتمر بالتواصل معنا عاجلًا عبر X
خلال هذا الأسبوع ابتداءً من اليوم الأحد 12 نوفمبر 2023

معروف لدى البعض أنه يمكن التلاعب في شكل الخط البياني line chart من خلال تعديل المحور الرأسي - عندما يبدأ من الصفر أو لا كذلك يمكن التلاعب في شكل الخط البياني من خلال تعديل حجم الرسم 👇👇🤷🏻‍♂️


Granularity مصطلح يستخدم في سياق البيانات ويشير الى مستوى التفصيل وهو عكس التجميع Aggregation مثلاً يمكن جمع بيانات المبيعات يومياً ويمكن جمعها أسبوعياً أو شهرياً أو سنوياً مستوى التفصيل الأعلى، يعطي مرونة أكبر في التحليل، مثلاً يمكن حساب المبيعات الشهرية من اليومية

AnasBafaqeeh's tweet image. Granularity

مصطلح يستخدم في سياق البيانات ويشير الى مستوى التفصيل وهو عكس التجميع Aggregation

مثلاً يمكن جمع بيانات المبيعات يومياً ويمكن جمعها أسبوعياً أو شهرياً أو سنوياً 

مستوى التفصيل الأعلى، يعطي مرونة أكبر في التحليل، مثلاً يمكن حساب المبيعات الشهرية من اليومية

Loading...

Something went wrong.


Something went wrong.