مقارنة بين أسلوبي C-H والامکان الأعظم لتصنيف البيانات وذلک بالتطبيق علي مرضي الفشل الکلوي

نوع المستند : المقالة الأصلية

المؤلفون

1 کلية تجارة- جامعة المنصورة

2 کلية التجارة - جامعة المنصورة

3 کلية التجارة - جامعة کفر الشيخ

4 قسم الاحصاء والتامين - کلية التجارة - جامعة المنصورة

5 کلية طب - جامعة المنصورة

6 کلية تجارة - جامعة المنصورة

المستخلص

ملخص
استهدفت تلک الدراسة المقارنة بين طريقتين من طرق التحليل التمييزي الأول هو  أسلوب التوليفة الخطية  (C-H classifier)  Chung and Hanوهو عبارة عن دمج دالتين تمايز خطية واحدة للمشاهدات المکتملة والاخري للمشاهدات غير المکتملة, وأسلوب تصنيف الإمکان الأعظم MLE classifier وهو مشتق من دالة التمييز الخطي التقليدية ولکن اعتمد علي تقدير المعالم باستخدام دالة الامکان الأعظم . وکلا الأسلوبين  يتطلبا نمط خاص للبيانات وهو أن تحتوي البيانات على مشاهدات مفقودة علي وتيرة واحدة ويجب ان يکون للمجتمعين نفس النمط. کما تهدف الدراسة إلي التنبؤ بمتجه مشاهدات جديدة  ذو بعد  إلي إحدي المجتمعين قيد الدراسة, و قامت الدراسه لتقييم کفاءة الأسلوبين باستخدام معيارمقدر البوتستراب المعلمي لفرق معدل الخطأ المتوقع(a parametric bootstrap estimator of Expected Error Rate Difference)   لمعرفة أيهما أفضل في التصنيف, ولقد تمت الدراسة التطبيقية علي مجموعة من بيانات مرضي الفشل الکلوي المتاحة بوحدة أمراض الکلي والغسيل الکلوي بمستشفي الأطفال الجامعي (جامعة المنصورة)  وقد توصلت الدراسه إلى أن  أسلوب C-H هو الأفضل .
 
 
This study aims to comparing two discriminant analysis methods, namely the linear combination classifier of Chung and Hun (C-H classifier), which  is a linear combination of two discriminant functions, one based on the complete observations and the other based on the incomplete observations. Also, the Maximum Likelihood Estimation substitution classifier is the general rule of discrimination based on parameters estimators via MLE estimator. It will be assumed that there are two populations are multivariate normal with equal covariance matrix; one of them is with the same monotone pattern. We consider the problem of classifying a



















 observation into one of two population. We examine the two classifiers to know which is better in the classification by using a parametric bootstrap estimator of the Expected Error Rate Differences, The applied study was done on a set of data of patients with kidney failure available in the Kidney Diseases and Kidney Dialysis Unit at the University Children's Hospital (Mansoura University) the result shows that the C-H classifier is more efficiency to the MLE classifier when the proportion of observations with missing data is substantial.
 

الكلمات الرئيسية

الموضوعات الرئيسية


المراجع
أولا: المراجع العربية
[1] أحمد. أحمد شمس الدين (2018) تقدير معلمات نموذج الانحدار الخطي البسيط باستخدام طريقة البوتستراب في حالة عدم ثبات التباين بنمطي الدالة التربيعية والجذرية. مجلة کلية التجارة للبحوث العلمية, جامعة الاسکندرية.
 [2] صبري. حنين ناجي (2015) المداخل البديلة للتعامل مع مشاکل القيم المفقودة في البيانات الطولية. رسالة دکتوراة في الإحصاء التطبيقي  کلية التجارة, جامعة المنصورة.
[3] مصطفي. مها وائل البکري (2014) مقارنة النماذج الخطية والمختلطة لتحليل التمايز في تصنيف البيانات وذللک بالتطبيق علي مرضي حصوات الکلي. رسالة ماجستيرفي الإحصاء التطبيقي, کلية التجارة, جامعة المنصورة.
ثانيا: المراجع الإنجليزية
[4] Anderson, T.W. and Olkin, I. (1985) Maximum-Likelihood Estimation of the Parameters of a Multivariate Normal Distribution. Linear Algebra and Its Applications, 70, 147-171.
 
 [5] Batsidis, A. and Zografos, K. (2006) Discrimination of Observations into one of two Elliptic Populations Based on Monotone Traning Samples, Metrika, 64: 221–241
[6] Chung, H.-C. and Han, C.-P. (2000) Discriminant Analysis When a        Block of Observations Is Missing. Annals of the Institute of Statistical Mathematics, 52, 544-556
 [7] Chung, H-C. and Han, C-P. (2009) Bootstrap confidence intervals for classification error rate in circular models when a block of observations is missing Journal of the Korean data and information   science society 24(4), 757-764
[8] Chung, H-C. and Han, C-P. (2013) Conditional bootstrap confidence intervals for classification error rate when a block of observations is missing. Journal of the Korean data and information   science society 24(1), 189-200.
[9] Hocking, R.R. and Smith, W.B. (2000) Estimation of Parameters in the Multivariate Normal Distribution with Missing Observations. Journal of the American Statistical Association, No. 63, 159-173.
 [10]Young, P.D., Young, D.M. and Ounpraseuth, S.T.(2016) A Comparison of  Two Linear Discriminant  Analysis Methods That Use Block Monotone Missing Training Data. Open Journal of Statistic, 6, 172-185