Statistician
@AnasBafaqeeh
نشر المعرفة في مجالات #الإحصاء و #علم_البيانات
قد يعجبك
﴿رَبِّ اغفِر لي وَلِوالِدَيَّ﴾ دعاء وبر واستغفار
تم بناء خط انحدار للتنبؤ بدرجة الطالب بناءً على عدد ساعات المذاكرة عدد ساعات المذاكرة لجميع الطلاب المختارين في العينة تتراوح بين ١-٦ ساعات ودرجات تحصيلهم تتراوح بين ٥٠-٩٠ درجة وفقاً لنموذج الانحدار اذا ذاكر الطالب ١٥ ساعة فسيحصل على ١٥٠ درجة من ١٠٠ Extrapolation Issue
الجدول في الصورة يسمى جدول تكراري ثنائي Two-Way Frequency Table - كم نسبة الأولاد؟ - كم نسبة الأولاد الذين نجحوا في التصويب؟ - من الأولاد، كم نسبة الذين نجحوا في التصويب؟ ثلاثة أسئلة يمكن الإجابة عليها من الجدول. لاحظ الفرق بين السؤالين الثاني والثالث
للتنبيه 🚨 هذه الطريقة خطيرة في كثير من الحالات لأنها راح تحذف الصفوف حتى لو احتوت على خلية واحدة فارغة وأحياناً يكون عندنا صفوف فيها بيانات مهمة لكن بمجرد احتواءها على خلية فارغة تُحذف لحل المشكلة ينبغي الاعتماد على عمود معرّف identifier في نفس المثال سيتم حذف الصف 5 ⬇️
#إثراء_البيانات Data Enrichment أحد إجراءات تمحيص البيانات Data Wrangling يتم فيها إضافة سياق للبيانات الأساسية مثل إضافة حقول أو بيانات خارجية للوصول إلى تحليلات أعمق ⚫️دمج بيانات الطقس + بيانات المبيعات لتحليل تأثيرها ⚫️دمج بيانات تدريب الموظفين + بيانات الاداء والانتاجية
تسرُّب البيانات Data Leakage عندما تتم المعالجة المسبقة على البيانات قبل تقسيمها، تتسرب معلومات من بيانات الاختبار وتستخدم مع بيانات التدريب وبالتالي يكون الاداء عالي عند تطبيق النموذج على بيانات الاختبار ويتراجع الاداء بوضوح عند استخدام بيانات جديده، وهو مؤشر على حدوث التسرُّب
كتبت صحيفتين نفس الخبر 1️⃣ "الطاقة الكهربائية متاحة ل ¾ المزارع الأمريكية …" 2️⃣ "ربع المزارع الأمريكية تفتقر للطاقة الكهربائية المتاحة …" الاولى ذكرت الجانب الإيجابي والأخرى الجانب السلبي وكلاً يخدم مصالحه والطاقة الكهربائية "المتاحة" لا تعني بالضرورة وجود كهرباء
حرصًا من الجمعية على تقديم دورات تدريبية وورش عمل في المؤتمر الأول للجمعية السعودية للعلوم الإحصائية (الإحصاء والصحة) 📣 ندعو أعضاء الجمعية والخبراء الراغبين بتقديم برامج تدريبية ضمن محاور المؤتمر بالتواصل معنا عاجلًا عبر X خلال هذا الأسبوع ابتداءً من اليوم الأحد 12 نوفمبر 2023
معروف لدى البعض أنه يمكن التلاعب في شكل الخط البياني line chart من خلال تعديل المحور الرأسي - عندما يبدأ من الصفر أو لا كذلك يمكن التلاعب في شكل الخط البياني من خلال تعديل حجم الرسم 👇👇🤷🏻♂️
Granularity مصطلح يستخدم في سياق البيانات ويشير الى مستوى التفصيل وهو عكس التجميع Aggregation مثلاً يمكن جمع بيانات المبيعات يومياً ويمكن جمعها أسبوعياً أو شهرياً أو سنوياً مستوى التفصيل الأعلى، يعطي مرونة أكبر في التحليل، مثلاً يمكن حساب المبيعات الشهرية من اليومية
United States الاتجاهات
- 1. Eagles 162K posts
- 2. Goff 18K posts
- 3. Lions 79.8K posts
- 4. Dan Campbell 9,395 posts
- 5. Jalen 31.7K posts
- 6. Gibbs 7,445 posts
- 7. Chiefs 91.2K posts
- 8. #OnePride 5,156 posts
- 9. Nakobe Dean 1,914 posts
- 10. AJ Brown 7,941 posts
- 11. Adoree Jackson 2,469 posts
- 12. Broncos 67K posts
- 13. Patullo 11.1K posts
- 14. Collinsworth 2,649 posts
- 15. Vic Fangio 2,983 posts
- 16. #DETvsPHI 3,336 posts
- 17. #ITWelcomeToDerry 7,400 posts
- 18. NFC North 5,262 posts
- 19. Sirianni 3,460 posts
- 20. Rams 31.7K posts
قد يعجبك
-
SaudiData
@SaudiData2030 -
حمود الدوسري
@Dr_Hmood -
الجمعية السعودية لعلم البيانات
@SSDS_ksu -
منصة بيان
@bayan_data -
الجمعية المهنية للإحصائيين وعلماء البيانات
@sa_pasds -
الحساب الرسمي للجمعية السعودية للعلوم الإحصائية
@sassorgsa -
د. خالد القحطاني
@Alqahtani_khald -
إبراهيم المسلَّم
@csibrahim -
Talal Almutiri | طلال المطيري
@TALALSQL -
Ahmad_Alnafessah
@Ahmad_Alnafesah -
مريم | بيانات research
@mrym_data -
Abdullah Hamdi
@Eng_Hemdi -
مركز الدراسات المتقدمة في الذكاء الاصطناعي (ذكـاء)
@THAKAA_SA -
د. رنا المومني (تحليل احصائي)
@experts10000 -
د. منـذر الزيـد
@AlzaidMunther
Something went wrong.
Something went wrong.