نوع المستند : المقالة الأصلية
المؤلفون
1 كلية التجارة ـ جامعة لمنصورة
2 كلية التجارة ـ جامعة المنصورة
المستخلص
الموضوعات الرئيسية
1- المقدمة:
إن تحليل السلاسل الزمنية التي تتكون من قيم معدودة (أي قيم صحيحة غير سالبة) هي محل إهتمام العديد من الباحثين، وذلك لأن لها العديد من التطبيقات في عالم الواقع. يهتم هذا البحث بتقدير التباين التقاربي(أو مصفوفة التغاير التقاربيAsymptotic Covariance Matrix ) في فئة النماذج الخطية المعممة لمعلمة مشتقة Parameter-driven Generalized linear model لتحليل بيانات سلاسل زمنية معدودة والتي تعتبر أداة هامة في نمذجة السلاسل الزمنية التي لا تتبع التوزيع الطبيعي. إن تحديد نموذج لبيانات سلاسل زمنية معدودة يتطلب الأخذ في الإعتبار الإرتباط الذاتي بين المشاهدات ، ولقد قامCox (1981) بتقسيم نماذج السلاسل الزمنية إلى فئتين من النماذج، وذلك بناءاً على كيفية إدخال الإرتباط الذاتي بين البيانات إلى النموذج وهما:
- نماذج المشاهدة المشتقة Observation-driven models.
وفي هذا النوع من النماذج يتم إدخال الإرتباط الذاتي بين البيانات إلى النموذج من خلال جعل المشاهدات الحالية مُعتمدة بشكل واضح وصريح على مُشاهدات الماضي مثل AR و ARIMA و GARCH.
- نماذج المعلمة المُشتقةParameter-driven models .
وفي هذا النوع من النماذج يتم تقديم الإرتباط الذاتي بين البيانات من خلال عملية كامنة latent process تُضاف إلىى المتنبأ الخطي. ولذلك، يُمكننا القول أن النماذج الخطية المعممة لبيانات سلاسل زمنية معدودة –والتي هي محل اهتمامنا في هذا البحث- تُعد نوع من أنواع نماذج المعلمة المشتقةParameter-driven models . بحيث يتم إدخال العملية الكامنة latent process إلى النموذج الخطي المُعمم من خلال إضافتها إلى دالة الربط.
وفي هذا البحث سوف يتم تقدير التباين التقاربي في نموذج إنحدار لبيانات سلاسل زمنية معدودة، وذلك في ظل نموذج خطي معمم لمعلمة مشتقة بحيث يتم التعبيرعن الإرتباط الذاتي بين بيانات السلسلة الزمنية المعدودة من خلال عملية كامنة latent process تُضاف إلي المتنبأ الخطي. وبفرض أن التوزيع الشرطي لمتغير الإستجابة بمعلومية العملية الكامنة يتبع توزيع بواسون- أي أن .
(1-1) المشكلة:
في هذه الدراسة نحاول الحصول على مُقدّر مُتسق لمصفوفة التغاير التقاربي لـ consistent estimator for the asymptotic covariance matrix في نموذج الإنحدار البواسوني لتحليل بيانات سلسلة زمنية معدودة. وحيث أن مصفوفة التغاير التقاربي يُمكن التعبير عنها بحدود دوال التغاير الذاتي(ACVFs) للعملية الكامنة ، فقد قام (Davis and Wu (2009 بتقديم طريقة مُبتكرة لتقدير مصفوفة التغاير التقاربي في ظل نموذج إنحدار ذو حدين سالب لتحليل سلسلة زمنية معدودة، وذلك من خلال تحديد نموذج للعملية الكامنة وتقدير معلماتها وتغايراتها الذاتية(ACVFs) والحصول على مقدّر مصفوفة التغاير التقاربي من خلال التعويض بمقدّرات التغايرات الذاتية للعملية الكامنة ولكن إتساق هذا المقدّر كان مشكوك فيه، وذلك لعدم إمكانية إثباته. وهذا ما تم تداركه في دراسة Wu (2012) حيث تم تقدير مصفوفة التغاير التقاربي لـ بدون تخصيص نموذح للعملية الكامنة ، ولكن تم التعامل معها بشكل لامعلمي. وذلك من خلال استخدام الطرق اللامعلمية لتقدير التباين، وقد استخدم طريقتين هما؛ طريقة أساس كرنال Kernel-based التي قدّمها Newey and West (1987) وطريقة المعاينة الفرعيةSubsampling التي قدّمها Carlstein (1986)، وبذلك حصل على مُقدّرين لمصفوفة التغاير التقاربي لـ بالإعتماد على هاتين الطريقتين. وقد أثبت الإتساق لكلا المُقدّرين في ظل نموذج إنحدار ذو حدين سالب لتحليل بيانات سلسلة زمنية معدودة. وكان الدافع وراء هذا البحث هو أن دراسة Wu (2012) قد أوضحت أنه يمكننا الحصول على مقدر متسق لمصفوفة التغاير التقاربي لـ بإستخدام طريقة أساس كرنال Kernel-based عند استخدام نموذج خطي معمم لمعلمة مشتقة والتي يكون فيها التوزيع الشرطي لـ هو توزيع بواسون بدلأ من توزيع ذو الحدين السالب.
وفي هذه الدراسة نحاول الإجابة على السؤال: هل مقدر أساس كرنال Kernel-based يقدم أفضل تقدير متسق لمصفوفة التغاير التقاربي لـ في نموذج الإنحدار البواسوني لبيانات سلاسل زمنية ؟ وذلك من خلال مقارنته بمقدر آخر نقترح استخدامه في هذه الدراسة وهو (مقدر حاصل الضرب الخارجي لمتجهات التفاضلات الجزئية من الدرجة الأولي) outer product of gradients (OPG) estimator والذي يسمى أيضاً خوارزمية BHHH والتي قدمهاBerdent, Hall, Hall and Hausman (1974) وهي طريقة رقمية تستخدم في البحث التجريبي.
(1-2) الأهمية:
إن أهمية هذه الدراسة تنبع من ضرورة إيجاد مُقدّر متسق لمصفوفة التغاير التقاربي لـ ، وذلك بهدف إجراء الإستدلالات الإحصائية الممكنة بالنسبة لـ من إنشاء فترات ثقة وإختبارات فروض، حيث تتجه الأفكار المستقبلية فى هذا الصدد نحو الإستدلال الإحصائى ،وكخطوة أولية فى هذا الإتجاه نحاول تقديم مقدّر متسق لمصفوفة التغاير التقاربى لـ التى حصُلنا عليها من خلال تعظيم دالة الإمكان اللوغاريتمي الزائفة وذلك في ظل نموذج خطى مُعمّم لمعلمة مُشـــــتقة Parameter-driven Generalized linear model مُعتمداً على توزيع بواسون.
(1-3) أهداف البحث:
يهدف هذا البحث إلى استخدام طريقة أساس كرنالKernel-based ومقدر OPG أو ما يطلق عليه خوارزميةBHHH لتقدير التباين التقاربي لـ وذلك في ظل استخدام نموذج الإنحدار البواسوني لبيانات سلاسل زمنية معدودة، وسوف تتم المقارنة بين التقديرات الناتجة بالتطبيق على مجموعتين من البيانات، هما الأعداد الشهرية للإصابة بشلل الأطفال في الولايات المتحدة الأمريكية خلال الفترة من 1970 إلى 1983والأعداد الشهرية لحالات الحمى الروماتيزمية التي يتم استقبالها بمستشفي أطفال المنصورة خلال الفترة من 1 يناير 2010 إلي 31 ديسمبر 2021 .
2 - النموذج الخطي المعمم لمعلمة مشتقة لبيانات سلسلة زمنية معدودة
يتم تحديد النموذج الخطي المُعمم لمعلمة مشتقة Parameter-driven Generalized linear model من خلال:
المُكوّن العشوائي random component :
وفيه يتم تحديد التوزيع الشرطي لمتغيرات الإستجابة بمعلومية العملية الكامنة ، أي تحديد ، وذلك بفرض أن المشاهدات تكون مستقلة بمعلومية .
المُكوّن المنتظم systematic component:
وفيه يتم تحديد دالة الربط التي يتحدد من خلالها شكل العلاقة بين المتوسط الشرطي لـ والمتنبأ الخطي مُضافاً إليه العملية الكامنة ، وبالتالي فإن دالة الربط تأخذ الشكل التالي ، حيث تقوم العملية الكامنة بإدخال الإرتباط الذاتي في النموذج وذلك بفرض أنها تخرج بشكل مستقل من المشاهدات.
وفي هذا البحث سوف نفترض نموذج خطي مُعمم لمعلمة مشتقة وهو نموذج الإنحدار البواسوني لتحليل بيانات سلاسل زمنية معدودة.
(2-1) نموذج الإنحدار البواسوني لبيانات سلسلة زمنية
بفرض أن ترمز لبيانات سلسلة زمنية معدودة، وأن هو مُتجه المتغيرات التفسيرية والتي يُفترض أن تكون غير عشوائية ومُكونها الأول هو الواحد الصحيح، وفي بعض الحالات، قد يعتمد على حجم العينة ، ولذلك سوف يتم كتابتها بدليل سُفلى مزدوج كالتالي . وافترضنا أن المتغيرات العشوائية تكون مُستقلة بمعلومية العملية الكامنة ، وأن التوزيع الشرطي لـلمشاهدة بمعلومية العملية الكامنة هو توزيع بواسون ؛أي أن:
وأن دالة الربط هي:
حيث أن هو مُتجه معلمات الإنحدار، وأن هي عملية خطية ساكنة. فبدلاً من التعامل مع العملية الكامنة أثناء التفاضل، فإنه من الأنسب استخدام ، حيث أن ، وهي سلسلة زمنية ساكنة وغير سالبة بمتوسط واحد؛ أي أن . ومن ثم يُمكن صياغة المتوسط الشرطي لـ بمعلومية على النحو التالي:
وبالتالي، فإن متوسط هو:
وتباين هو:
ودالة التغاير الذاتي لـ هي :
وحيث أن:
فإن:
عند
وبفرض أن مُتجه معلمات الإنحدار الحقيقي هو ، فإنه يُمكن الحصول على مُقدّر النموذج الخطي المُعمم من خلال تعظيم دالة الإمكان اللوغاريتمي الزائفة pseudo log-likelihood كالتالي:
وحيث أن ، وبإهمال وجود العملية الكامنة، فإن وبالتالي نحصل على دالة الإمكان الزائفة التالية:
وفي ظل شروط الاتساق والتقارب الطبيعي الوارد ذكرها في دراسة Davis et al (2000) ، يكون التوزيع التقاربيAsymptotic distribution لـ عندما ، كالتالي:
بحيث يكون:
وذلك عندما تكون دالة التغاير الذاتي لـ عند فجوة زمنية .
وحيث أن
وذلك بفرض أن حيث أن هي مصفوفة الوحدة والتي تجعل النهايات السابقة موجودة، بحيث تكون مصفوفة التغاير التقاربي لـ لها الصيغة التالية:
3 - تقدير مصفوفة التغاير التقاربي لــ
(1-3) مشاكل التقدير:
(1-1-3) عدم ثبات التباين: Heteroskedasticity
فى حالة أن يكون تباين حد الخطأ ثابت عند المشاهدات المختلفة للمتغير التفسيري فإن هذا يسمى ثبات التباين homoskedasticity بمعنى أن تباين التوزيع الإحتمالي لحد الخطأ (وهو نفسه التباين الشرطي لـ Yi بمعلومية Xi ) يظل ثابت بغض النظر عن القيم التي يأخذها المتغير التفسيري (X) ، ونجد أن عدم ثبات تباين حد الخطأ عند المشاهدات المختلفة للمتغير التفسيري يسمى عدم ثبات التباين heteroskedasticity. وهناك عدة أسباب يمكن أن تؤدي الى عدم ثبات تباين حد الخطأ ومنها ما يلي:
وللكشف عن عدم ثبات التباين يمكن إستخدام عدد من الإختبارات الإحصائية؛ وأحد هذه الاختبارات هو إختبار Breusch-Pagan.
(2-1-3) مشكلة الإرتباط الذاتي Autocorrelation
في الحالة التي يكون فيها الإرتباط بين حدود الخطأ المتتالية في نموذج الإنحدار مساوي للصفر ، فإن هذا يعني أن حدود الخطأ مستقلة، أما في حالة أن تكون حدود الخطأ في نموذج الإنحدار مرتبطة فإن هذا يطلق عليه مشكلة الإرتباط الذاتي، ونجد أن مشكلة الإرتباط الذاتي عادة ما تظهر في بيانات السلاسل الزمنية حيث يتم جمع البيانات بشكل مرتب خلال الزمن وبالتالي فإن المشاهدات المتتالية عادة ما تكون مرتبطة خاصة إذا كانت الفترات الزمنية بين المشاهدات المتتالية قصيرة ، ونجد أن هناك عدة أسباب لوجود الإرتباط الذاتي بين حدود الخطأ في نموذج الإنحدار ومنها ما يلي:
وللكشف عن وجود الإرتباط الذاتي بين حدود الخطأ في نموذج الإنحدار يمكن إستخدام عدد من الإختبارات وأحد هذه الإختبارات هو إختبار Durbin-Watson .
ونجد أن مشكلتي الإرتباط الذاتي بين حدود الخطأ وعدم ثبات تباين حد الخطأ تؤثرعلى تباينات معاملات الإنحدارالتي نرغب في أن تكون أصغر ما يمكن لكي نحقق أقصى درجة من الدقة، فعلى سبيل المثال عند تقدير معاملات الإنحدار بإستخدام طريقة المربعات الصغرى (OLS) في ظل وجود ارتباط ذاتي بين حدود الخطأ أوعدم ثبات تباين حد الخطأ heteroskedasticity فإن مقدر OLS لن يكون له أقل تباين من بين كل المقدرات غير المتحيزة، وهذا بدوره يؤثر على دقة الإستدلالات الإحصائية الخاصة بمعاملات الإنحدار. مع ملاحظة أن مشكلتي الإرتباط الذاتي بين حدود الخطأ وعدم ثبات تباين حد الخطأ لن تؤثرعلى خصائص الإتساق وعدم التحيز لمقدرات معاملات الإنحدار. وفي حالة تجاهل وجود مشكلات التقدير، فإن هذا يتطلب استخدام طرق التقدير المتينة robust estimation لتقدير التباينات التقاربية لمقدرات معاملات الإنحدار. ولذلك، في هذا البحث سوف يتم استخدام طريقتين من طرق التقدير المتينة للتباين التقاربي وهما؛ ؛ طريقة أساس كرنال kernel-based ومقدر OPG أو خوارزمية BHHH.
(2-3) تقدير التباين التقاربي لــ باستخدام طريقة أساس كرنالKernel-based
يمكن تقدير مصفوفة التغاير التقاربي في حالة البيانات المرتبطة ذاتيا بإستخدام الطرق اللامعملية لتقدير التباين ومن بين هذه الطرق طريقة أساس كرنال kernel Based التي اقتراحها Newey and West (1987) ونجد أن التقدير المتسق لمصفوفة التغاير التقاربي هو أمرهام لبناء فترات الثقة وإجراء اختبارات الفروض التقاربية وذلك لأن تحقيق الاتساق يجعلنا نقوم بإجراء الاستدلالات الإحصائية بالقرب من القيمة الحقيقية للمعلمة. ويتم استخدام دوال كرنال لتمهيد دالة التغاير الذاتي للعينة وذلك بحيث تقل قيمة الأوزان التي تستخدم لترجيح التغايرات الذاتية للعينة كلما زادت الفجوة الزمنية.
بالنسبة لنموذج انحدار بواسون لبيانات سلسلة زمنية الذي تمت مناقشته في القسم الثاني من هذا البحث، سوف نجد أنه بأخذ تفاضل دالة الإمكان اللوغاريتمي الزائفة the pseudo log-likelihood function بالنسبة لـ ، فأننا سنحصل علي من خلال حل معادلة التقدير المعممة التالية:
حيث أن
قدمت دراسة Wu (2012) مقدر متسق لـ والتي تمثل مصفوفة التغاير التقاربي لـ بإستخدام طريقة أساس كرنال Kernel-based حيث أن المقدر المتسق لـ نحصل عليه بالتعويض المباشر في الصيغة التالية:
وأن المقدر المتسق لـ هو:
حيث أن:
وبإستخدام أوزان كرنال سوف نحصل علي المقدر التالي:
حيث أن هي دالة كرنال و هي (عرض الحزمة) bandwidth وهذا المقدر قائم علي فكرة بتر أو تقليل وزن الحدود غير المرغوب فيها، وبالتالي فأن هو مقدر متسق لـ والتي تمثل مصفوفة التغاير التقاربي لـ .
(3-3) تقدير التباين التقاربي لــ باستخدام طريقة OPG أو خوارزمية BHHH
مصفوفة التغاير التقاربي لمقدر الإمكان الأعظم هي مصفوفة في المعلمات المجهولة (أى أنها دالة في المعلمات b المجهولة) ويمكن حسابها من خلال معكوس مصفوفة المعلومات كالتالي:
وحيث أن مصفوفة المعلومات هي سالبة القيمة المتوقعة لمصفوفة هيسين Hessian (وهي مصفوفة التفاضلات الجزئية من الدرجة الثانية لدالة الإمكان اللوغاريتمي بالنسبة لـــb ) ، أى أن
وبالتالي فإن مصفوفة التغاير التقاربي لمقدر الإمكان الأعظم ستكون:
وبما أن متجه المعلمات الحقيقية b مجهولة، فإنه يمكننا استبدال b بـ وذلك لتقدير مصفوفة التغاير التقاربي لمقدر الإمكان الأعظم، إلا أن هذا المقدر نادرا ما يمكن الحصول عليه وذلك لأن القيمة المتوقعة الدقيقة للتفاضلات الجزئية من الدرجة الثانية لدالة الإمكان اللوغاريتمي ستكون غير معروفة، وهناك بديل آخر لتقدير مصفوفة التغاير التقاربي لمقدر الإمكان الأعظم عن طريق حساب سالب مصفوفة التفاضلات الجزئية من الدرجة الثانية لدالة الإمكان اللوغاريتمي بدون استخدام التوقع كالتالي:
ولكن عيب هذا المقدر هو أن التفاضلات الجزئية من الدرجة الثانية في بعض الحالات يكون من المعقد اشتقاقها وبرمجتها على الكمبيوتر. وهناك بديل آخر لتقدير مصفوفة التغاير التقاربي لـ وذلك من خلال استخدام خوارزمية BHHH او ما يطلق عليه outer product of gradients (OPG) estimator (مقدر حاصل الضرب الخارجي لمتجهات التفاضلات الجزئية من الدرجة الأولى ) والتي قدمها Berdent, Hall, Hall and Hausman (1974) والقائمة على أنه عند تحديد النموذج بشكل دقيق وعندما تكون القيمة المتوقعة للتفاضلات الجزئية من الدرجة الأولى مساوية للصفر (أى عند القيمة العظمى لدالة الإمكان) فإن سالب القيمة المتوقعة لمصفوفة هيسين Hessian سيكون مساوي لتباين التفاضلات الجزئية من الدرجة الأولى والذي يسمى (the variance of gradients) في المجتمع حيث أن:
والتي تعني أن هو متجه kx1 للتفاضلات الجزئية من الدرجة الأولى لدالة الإمكان اللوغاريتمي. وبالنسبة للعينة، نجد أنه عند تحديد النموذج بشكل دقيق، فإن تباين التفاضلات الجزئية من الدرجة الأولى سوف يكون تقريب جيد لــ كلما زادت حجم العينة؛ أى أن كلما n®¥ وذلك عند الحد الأقصى لدالة الإمكان (أى عندما يكون توقع التفاضلات الجزئية من الدرجة الأولى مساويا للصفر)
وبعبارة أخرى، فإن سالب القيمة المتوقعة لمصفوفة التفاضلات الجزئية من الدرجة الثانية يمكن تقديرها من خلال مصفوفة التغاير للتفاضلات الجزئية من الدرجة الأولى عندما تكون كبيرة بما يكفي، وبالتالي فإن:
وهذا ما يسمى (OPG) estimator outer product of gradients(مقدر حاصل الضرب الخارجي لمتجهات التفاضلات الجزئية من الدرجة الأولى) أو خوارزمية BHHH.
وهذه الطريقة تستخدم في البحث التجريبي والقائمة على إجراء مجموعة من التكرارات للحصول على تباين التفاضلات الجزئية من الدرجة الأولى عند الحد الأقصى لدالة الإمكان، والتي سبق استخدامها في العديد من الدراسات من بينها دراسةBerliana, et al (2019) ودراسة Aini 2020)) ودراسة (Wenur and Suharsono (2020.
ونجد أنه عند تحديد النموذج بشكل دقيق فإن توزيع المعاينة للفرق ما بين المقدر والقيمة الحقيقية للمعلمات سوف يكون توزيع طبيعي بشكل تقاربي بمتوسط صفر، وتغاير يساوي معكوس سالب القيمة المتوقعة لمصفوفة هيسين Hessian
كلما n®¥ حيث أن b هو متجه المعلمات الحقيقية و هو مقدر الإمكان الأعظم و هي سالب القيمة المتوقعة لمصفوفة هيسين Hessian في المجتمع. ولكن اذا كان النموذج غير محدد بشكل دقيقmisspecified ، فإن التغاير التقاربي لــ يكون أكثر تعقيدا، فنجد أنه بالنسبة لأي نموذج تكون فيه القيمة المتوقعة للتفاضلات الجزئية من الدرجة الأولى لدالة الإمكان اللوغاريتمي في المجتمع مساوية للصفر فإن:
حيث أن هو تباين التفاضلات الجزئية من الدرجة الأولى لدالة الإمكان اللوغاريتمي بالنسبة لــ في المجتمع.
وعندما يكون النموذج محدد بشكل دقيق، فإن وبالتالي فإن وهذا ما يجعلنا نحصل على نفس التغاير التقاربي في حالة أن يكون النموذج محدد بشكل دقيق. إلا أنه إذا كان النموذج غير محدد بشكل دقيق أو أن هناك مخالفات لفروض النموذج مثل وجود إرتباط ذاتي أو عدم ثبات تباين حدود الخطأ سوف تكون صيغة التغاير التقاربي هي:
ونجد أن هذه المصفوفة سوف تكون صالحة سواء كان النموذج محدد بشكل دقيق أم لا. وهذه الصيغة تسمى مصفوفة التغايرالمتينة Robust covariance matrix، وفي بعض الأحيان تسمي أيضا مقدر "sandwich" للتغاير، حيث أن معكوس سالب القيمة المتوقعة لمصفوفة هيسين Hessian تظهر على كلا الجانبين.
وبالنسبة لنموذج الإنحدار البواسوني الذي هو محل دراستنا، سيكون سالب متوسط مصفوفة هيسين في العينة كالتالي:
ويكون تباين التفاضلات الجزئية من الدرجة الأولى لدالة الإمكان اللوغاريتمي هي:
4 - الدراسة التطبيقية
(1-4) التطبيق على الأعداد الشهرية للإصابة بشلل الأطفال:
تمثل هذه البيانات الأعداد الشهرية للإصابة بشلل الأطفال في الولايات المتحدة الأمريكية خلال السنوات من 1970 الى 1983 كما هو مسجل في مركز مكافحة الأمراض بالولايات المتحدة الأمريكية وبذلك يكون لدينا سلسلة زمنية تتكون من 168 مشاهدة، والتي سبق دراستها أيضا في العديد من الدراسات، منها ؛ Davis et al (1999) و Davis et al(2000) و Wu (2007) و Safari et al (2017). وتعتبر هذه البيانات مثال نموذجي عند دراسة النماذج الخطية المعممة لمعلمة مشتقة. ونجد أن أول من إستخدم هذه البيانات هي دراسة Zeger (1988) والذي افترض نموذج معلمة مشتقة parameter-driven model بحيث يكون التوزيع الشرطي للمشاهدات بمعلومية العملية الكامنة latent process هو توزيع بواسون، واستخدام نظرية معادلات التقدير من أجل تقدير معلمات النموذج.
الشكل (4-1) يمثل الأعداد الشهرية للإصابة بشلل الأطفال في الولايات المتحدة من 1970 الى 1983
الشكل (4-1) يوضح أن هناك بعض التغيرات الموسمية في البيانات وأن هناك إحتمالية لوجود اتجاه خطي متناقص خلال الزمن. ونجد أن الكشف عن وجود إتجاه خطي متناقص هو من الأهداف الرئيسية لدراسة هذه البيانات، وعلى الرغم من أن القيمة المشاهدة في نوفمبر 1972 وهي القيمة 14 تعتبر قيمة متطرفة outlier ، إلا أنه لم يتم إستبعادها او تعديلها عند تحليل هذه البيانات وذلك لأن لها تأثير طفيف على النتائج وذلك وفقا لدراسة Chan and Ledolter (1995) حيث تم تعديل هذه القيمة المتطرفة ووجد أن هناك تغير طفيف في النتائج.
ونجد أنه في Davis et al (2000) تم دراسة هذه البيانات في إطار نموذج المعلمة المشتقة parameter-driven model وقد تم إستخدام طريقة الإمكان الزائفpseudo–likelihood method لتقدير معلمات النموذج. وذلك بفرض أن التوزيع الشرطي للمشاهدات بمعلومية العملية الكامنة latent process هو توزيع بواسون كالتالي:
وهذا هو نفس النموذج الذي سنقوم بتطبيقه والذي سبق توضيحه في القسم الثاني من هذا البحث. وسوف نقوم بإستخدام نفس متغيرات الإنحدار التي تم إستخدامها في الدراستين السابقتين وهذه المتغيرات هي حد التقاطع والإتجاه الخطي وحدود متسلسلة فورير Fourier السنوية والنصف سنوية للتعبير عن النمط الموسمي وبالتالي:
حيث أن والمستخدمة في تحديد موقع حد التقاطع عند شهر يناير 1976 . وهذا يعني أننا سوف نصل لنفس النتائج التي توصلت إليها دراسة Davis et al (2000) فيما يتعلق بالنموذج وتقدير الإنحدار إلا أننا في هذه الدراسة سنقوم بإستخدام طريقة أساس كرنال kernel-based ومقدرOPG أو خوارزمية BHHH والذي سبق توضيحهم في في القسم الثالث من هذا البحث وذلك لتقدير التباينات التقاربية لــ .
سوف نقوم بتوفيق النموذج الخطي المعمم البواسوني المعياري The standard Poisson GLM والذي سبق توضيحه في في القسم الثاني من هذا البحث لبيانات الأعداد الشهرية للإصابة بشلل الأطفال في الولايات المتحدة بإستخدام الدالة "glm.po" في البرنامج الإحصائي R وتم عرض النتائج في الجدول (4-1).
الجدول (4-1): تقديرات المعلمات لبيانات شلل الأطفال بالإعتماد على توفيق نموذج خطي معمم بواسوني معياري.
GLM |
Estimate |
Std. Error |
z value |
Pr(>|z|) |
Intercept |
0.20694 |
0.07508 |
2.75 |
0.005849 ** |
Trend |
-4.79866 |
1.40289 |
-3.421 |
0.000625 *** |
|
-0.14873 |
0.09722 |
-1.53 |
0.126037 |
|
-0.53188 |
0.10904 |
-4.878 |
1.07e-06 *** |
|
0.1691 |
0.09881 |
1.711 |
0.087013 . |
|
-0.43214 |
0.1008 |
-4.287 |
1.81e-05 *** |
تظهر تقديرات في العمود (2) من الجدول (4-1) وتظهر الأخطاء المعيارية لـ في العمود (3) من من الجدول (4-1) مع ملاحظة أن الأخطاء المعيارية لـ المحسوبة في الجدول السابق تتجاهل إمكانية وجود العملية الكامنة latent process وبالتالي فإنه لا يمكن الإعتماد عليها في الإستدلالات الإحصائية الخاصة بمعاملات الإنحدار لأنها قد تؤدي إلى إستنتاجات خاطئة.
سوف يتم إستخدام إختبار Breusch-Pagan للكشف عن عدم ثبات تباين حدود الخطأ Heteroskedasticity ونجد أن إحصاءة الإختبار و P-value لهذا الإختبار هي:
Breusch-Pagan test
BP |
Df |
p-value |
8.2776 |
3 |
0.04061 |
حيث أن P-value أقل من 0.05، فإن القرار هو رفض الفرض العدمي بأن تباينات الأخطاء متساوية. وهذا يعني أن هناك دليل كافي على عدم ثبات تباين حدود الخطأ في نموذج الإنحدار عند مستوى معنوية 0.05.
سوف يتم إستخدام إختبار Durbin-Watson للكشف عن وجود إرتباط ذاتي بين حدود الخطأ في النموذج. ونجد أن إحصاءة الإختبار و P-value لهذا الإختبار هي:
Durbin-Watson test
DW |
p-value |
1.5008 |
0.0003086 |
حيث أن P-value قيمة صغيرة جدا، فإن القرار هو رفض الفرض العدمي بأن الإرتباط الذاتي بين حدود الخطأ مساوي للصفر. وهذا يعني أن هناك دليل كافي على وجود إرتباط ذاتي بين حدود الخطأ في نموذج الإنحدار.
وبناءا على النتائج السابقة، فإنه لا يمكننا الإعتماد على الأخطاء المعيارية لـ الناتجة عن توفيق نموذج خطي معمم بواسوني معياري في ظل تجاهل وجود الإرتباط الذاتي وعدم ثبات تباين حدود الخطأ. وللحصول على مقدرات متينة robust estimators للتباينات التقاربية لـ والتي تسمح لنا بالحصول على تقديرات متسقة يمكن استخدامها في الاستدلالات الإحصائية الخاصة بمعاملات الإنحدار، سوف يتم إستخدام طريقة أساس كرنال kernel-based والتي تم توضيحها في في القسم الثالث من هذا البحث، وذلك بالإعتماد على ثلاث دوال كرنال مختلفة وهم؛ Bartlett kernel و Parzen kernel و Quadratic Spectral kernel. كما أننا سنقوم بتقدير التباينات التقاربية لـ بإستخدام مقدر OPG أو خوارزمية BHHH والتي سبق توضيحها في القسم الثالث من هذا البحث وتم عرض النتائج في الجدول (4-2) كما يلي:
الجدول (4-2): تقديرات التباينات التقاربية لـ .
|
orignal |
Bartlett |
Parzen |
Quadratic Spectral |
OPG |
Intercept |
0.0090 |
0.0139 |
0.0143 |
0.0145 |
0.0042 |
Trend |
4.6735 |
8.2279 |
8.2636 |
8.3158 |
1.0058 |
|
0.0173 |
0.0199 |
0.0205 |
0.0202 |
0.0060 |
|
0.0235 |
0.0433 |
0.0435 |
0.0447 |
0.0079 |
|
0.0180 |
0.0209 |
0.0212 |
0.0213 |
0.0058 |
|
0.0206 |
0.0218 |
0.0221 |
0.0222 |
0.0064 |
ومن خلال الجدول السابق نجد أنه لا يوجد اختلافات جوهرية بين تقديرات أساس كرنال للتباينات التقاربية لـ بإستخدام ثلاث دوال كرنال مختلفة، والتي تظهر في الأعمدة 2 و3 و4. في حين أن تقديرات OPG للتباينات التقاربية لـ و التي تظهر في العمود 5 كانت أقل بفارق كبير عن التباينات التقاربية التي حصلنا عليها بإستخدام طريقة أساس كرنال، ولذلك فإننا نوصي بإستخدام مقدر OPG لتقدير التباينات التقاربية لـ في ظل إستخدام نموذج خطي معمم بواسوني لتحليل بيانات سلاسل زمنية وذلك في ظل تجاهل مشكلات التقدير مثل وجود إرتباط ذاتي بين حدود الخطأ أو عدم ثبات تباين حدود الخطأ، حيث أن مقدر OPG يحقق أقل قيم للتباينات التقاربية.
(2-4) التطبيق على الأعداد الشهرية لحالات الحمى الروماتيزمية:
تمثل هذه البيانات الأعداد الشهرية لحالات الحمى الروماتيزمية التي يتم استقبالها بمستشفي أطفال المنصورة خلال الفترة من 1 يناير 2010 إلي 31 ديسمبر 2021 .
الشكل (4-2) يمثل الأعداد الشهرية لإستقبال حالات الحمى الروماتيزمية في مستشفي أطفال المنصورة خلال الفترة من 1 يناير 2010 إلي 31 ديسمبر 2021 .
الشكل (4-2) يوضح أن هناك بعض التغيرات الموسمية في البيانات وأن هناك إحتمالية لوجود اتجاه خطي متناقص خلال الزمن. وسوف يتم دراسة هذه البيانات من خلال نموذج المعلمة المشتقة parameter-driven model وبفرض أن التوزيع الشرطي للمشاهدات بمعلومية العملية الكامنة latent process هو توزيع بواسون كالتالي:
والذي سبق توضيحه في القسم الثاني من هذا البحث ، وقد تم إستخدام طريقة الإمكان الزائف pseudo–likelihood method لتقدير معلمات النموذج. وقد أوضح التحليل المبدئي لهذه البيانات إلي الحاجة بأن يكون النموذج متضمن إتجاه خطي متناقص محتمل خلال الزمن وحدود متسلسلة فورير Fourier للتعبير عن النمط الموسمي في البيانات،ومن خلال اختبار معنوية معاملات الإنحدار وجد أن حد الإتجاه الخطي لم يكن معنوى، ولذلك تم استبعاده من النموذج،
وبالتالي فإن استقبال حالات الحمى الروماتيزمية في مستشفي أطفال المنصورة ليس له اتجاه متناقص معنوي خلال الفترة من 1 يناير 2010 إلي 31 ديسمبر 2021، في حين أن حدود متسلسلة فوريرFourier الربع سنوية والنصف سنوية للتعبير عن النمط الموسمي كان لها معاملات معنوية، وبالتالي فإن متغيرات الإنحدار هي:
وتم توفيق النموذج الخطي المعمم البواسوني المعياري The standard Poisson GLM والذي سبق توضيحه في القسم الثاني من هذا البحث لبيانات الأعداد الشهرية لإستقبال حالات الحمى الروماتيزمية في مستشفي الأطفال بالمنصورة بإستخدام الدالة "glm.po" في البرنامج الإحصائي R وتم عرض النتائج في الجدول (4-3).
الجدول (4-3): تقديرات المعلمات لبيانات الحمى الروماتيزمية بالإعتماد على توفيق نموذج خطي معمم بواسوني معياري.
GLM |
Estimate |
Std. Error |
z value |
Pr(>|z|) |
Intercept |
0.16167 |
0.08412 |
1.922 |
0.05461 . |
|
0.34302 |
0.1035 |
-3.314 |
0.00092 *** |
|
0.66176 |
0.12664 |
5.225 |
1.74e-07 *** |
|
0.32825 |
0.10411 |
3.153 |
0.00162 ** |
|
0.24431 |
0.11478 |
2.128 |
0.03330 * |
تظهر تقديرات في العمود (2) من الجدول (4-3) وتظهر الأخطاء المعيارية لـ في العمود (3) من من الجدول (4-3) مع ملاحظة أن الأخطاء المعيارية لـ المحسوبة في الجدول السابق تتجاهل إمكانية وجود العملية الكامنة latent process وبالتالي فإنه لا يمكن الإعتماد عليها في الإستدلالات الإحصائية الخاصة بمعاملات الإنحدار لأنها قد تؤدي إلى إستنتاجات خاطئة.
سوف يتم إستخدام إختبار Breusch-Pagan للكشف عن عدم ثبات تباين حدود الخطأ Heteroskedasticity ونجد أن إحصاءة الإختبار و P-value لهذا الإختبار هما:
Breusch-Pagan test
BP |
Df |
p-value |
10.499 |
4 |
0.03281 |
حيث أن P-value أقل من 0.05، فإن القرار هو رفض الفرض العدمي بأن تباينات الأخطاء متساوية. وهذا يعني أن هناك دليل كافي على عدم ثبات تباين حدود الخطأ في نموذج الإنحدار عند مستوى معنوية 0.05.
وسوف يتم إستخدام إختبار Durbin-Watson للكشف عن وجود إرتباط ذاتي بين حدود الخطأ في النموذج. ونجد أن إحصاءة الإختبار و P-value لهذه الإختبار كالتالي:
Durbin-Watson test
DW |
p-value |
1.9775 |
0.446 |
حيث أن P-value أكبر من 0.05، فإن القرار هو عدم رفض الفرض العدمي بأن الإرتباط الذاتي بين حدود الخطأ مساوي للصفر. وهذا يعني أنه لا يوجد دليل كافي على وجود إرتباط ذاتي بين حدود الخطأ في نموذج الإنحدار.
وبناءا على النتائج السابقة، فإنه لا يمكننا الإعتماد على الأخطاء المعيارية لـ الناتجة عن توفيق نموذج خطي معمم بواسوني معياري بسبب وجود إحدى مشكلات التقدير وهي عدم ثبات تباين حدود الخطأ. وللحصول على مقدرات متينة robust estimators للتباينات التقاربية لـ والتي تسمح لنا بالحصول على تقديرات متسقة يمكن استخدامها في الإستدلالات الإحصائية الخاصة بمعاملات الإنحدار، سوف يتم إستخدام طريقة أساس كرنال kernel-based والتي تم توضيحها في القسم الثالث من هذا البحث، وذلك بالإعتماد على ثلاث دوال كرنال مختلفة وهم؛ Bartlett kernel و Parzen kernel و Quadratic Spectral kernel. كما أننا سنقوم بتقدير التباينات التقاربية لـ بإستخدام مقدر OPG أو خوارزمية BHHH والتي سبق توضيحها في القسم الثالث من هذا البحث وتم عرض النتائج في الجدول (4-4) كما يلي:
الجدول (4-4): تقديرات التباينات التقاربية لـ .
|
orignal |
Bartlett |
Parzen |
Quadratic Spectral |
OPG |
Intercept |
0.0092 |
0.0099 |
0.0104 |
0.0099 |
0.0058 |
|
0.0174 |
0.0206 |
0.0184 |
0.0183 |
0.0085 |
|
0.0213 |
0.0151 |
0.0148 |
0.0147 |
0.0149 |
|
0.0168 |
0.0184 |
0.0197 |
0.0192 |
0.0095 |
|
0.0208 |
0.0157 |
0.0155 |
0.0154 |
0.0099 |
ومن خلال الجدول السابق نجد أنه لا يوجد اختلافات جوهرية بين تقديرات أساس كرنال للتباينات التقاربية لـ بإستخدام ثلاث دوال كرنال مختلفة، والتي تظهر في الأعمدة 2 و3 و4. في حين أن تقديرات OPG للتباينات التقاربية لـ و التي تظهر في العمود 5 كانت أقل بفارق كبير عن التباينات التقاربية التي حصلنا عليها بإستخدام طريقة أساس كرنال بإستثناء تقدير التباين التقاربي لـ حيث كان التقدير بإستخدام مقدر OPG له قيمة قريبة إلى حد كبير من القيم التي حصلنا عليها بإستخدام طريقة أساس كرنال ولذلك فإننا نوصي بإستخدام مقدر OPG لتقدير التباينات التقاربية لـ في ظل إستخدام نموذج خطي معمم بواسوني لتحليل بيانات سلاسل زمنية عندما يتم تجاهل وجود إحدى مشكلات التقدير مثل وجود إرتباط ذاتي بين حدود الخطأ او عدم ثبات تباين حدود الخطأ، حيث أن مقدر OPG يحقق أقل قيم للتباينات التقاربية.
5 – النتائج والتوصيات
(1-5) النتائج:
قامت هذه الدراسة بالمقارنة بين طريقتين من الطرق المتينة لتقدير التباين التقاربي لـ وهما طريقة أساس كرنال Kernel-based التي تم اقتراحها في دراسة Wu(2012) ومقدر OPG أو خوارزمية BHHH التي نقترح إستخدامها في هذه الدراسة وذلك في ظل نموذج الإنحدار البواسوني لتحليل بيانات سلسلة زمنية، ومن خلال التطبيق العملي علي مجموعتين من البيانات توصلت الدراسة إلى النتائج التالية:
(2-5) التوصيات:
في هذه الدراسة تم استخدام طريقتين من طرق التقدير المتينة وهما طريقة أساس كرنال Kernel-based ومقدر OPG أو خوارزمية BHHH لتقدير التباين التقاربي في نموذج الإنحدار البواسوني لبيانات سلسلة زمنية وذلك في ظل وجود مخالفات لفروض النموذج مثل الإرتباط الذاتي بين حدود الخطأ وعدم ثبات تباين حدود الخطأ مع التطبيق على مجموعتين من البيانات. ويوصي الباحث استخدام مقدر OPG أو خوارزمية BHHH لتقدير التباين التقاربي لـ عند استخدام هذا النوع من النماذج حيث أن هذه الطريقة تحقق أقل قيم لتقدير التباين التقاربي.
المراجع: