المدقق النحوي العربي
يهدف المشروع إلى إنشاء مدقق نحوى عربي، يمكن دمجه فى مختلف الاصدارات الخاصه بمحررات النصوص و ذلك لدعم وجود الكيان العربى و دعم اللغه العربيه فى مختلف نظم التشغيل.
التصميم
يعتمد التصميم الأساسي للمشروع على استخدام لغة البرمجه Python و ذلك لإنشاء محرك لمعالجة النص العربي، وإخضاعه لمجموعه من القواعد المنطقيه التي تختص بضمان توافق النص مع القواعد النحويه للغه العربيه، واضعا في الاعتبار التعرف على نوع الكلمه، من خلال اخضاعها لمجموعه من المقارنات، بحيث يتم التعرف على نوع الكلمه من حيث كونها اسم أو فعل ..... ، يستفيد التصميم من امكانيات لغة Python فى معالجة اللغة العربيه بترميز UTF-8 و هو ما يساعد على دمج البرنامج فى مختلف محررات النصوص سواء كملحق له أو كجزء منه، باعتبار أن معظم محررات النصوص قادره على معالجة النصوص بترميز UTF-8.
يتم تصميم النظام للتعامل مباشرة على النصوص العربيه، و ذلك عن طريق استخدام قاعدة بيانات للكلمات، يتم عن طريقها تحديد نوع الكلمه و من ثم تحديد القواعد النحويه اللازمه للتعامل مع الجمله كلها، بحيث تطبق القواعد النحويه بشكل متتابع، أى أن الكلمات اللاحقه للكلمه هى التى يتم تطبيق القواعد النحويه عليها.
يتم استخدام لغة Python لإمكانية معالجة نصوص UTF-8 عن طريقها و فى نفس الوقت لكونها لغة تفسيرية، مما يسهل دمجها كملحق للعديد من محررات النصوص.
خطة العمل
1- دراسة كيفية تطبيق القواعد النحويه على اللغه العربيه , و تحويل القواعد النحويه الى قواعد منطقيه يمكن برمجتها داخل بيئة البرمجه
2- تطبيق القواعد النحويه داخل بيئة البرمجه واضعا فى الاعتبار فكرة نموذج العمل الخاص بتطبيق البرمجيات التزايديه Incremental method بحيث يتم تطبيق القواعد النحويه كنقاط , بحيث يكون الاهم فالمهم
3- اصدار ملحق خاص ب OpenOffice يتم اصداره بشكل تتابعى كملحق مع كل قاعده نحويه يتم تطبيقها داخله
1- يتم فيه دراسة تطبيق القواعد النحويه داخل بيئة البرمجه Languagetool او باستخدام لغة البرمجه Python و ما ينتج عنه اما تطبيق تلك القواعد داخل Langaugetool باستخدام XML او Java او يتم انشاء محرك خاص بالعربيه نفسها بلغة Python
2- يتم وضع تخطيط مبدئى لمعالجة اللغه نفسها , مع الوضع فى الاعتبار ان تطبيق القواعد النحويه يجب ان يكون بالاساس منطقيا , بحيث يكون قابلا للتعديل فى المستقبل عند حدوث تعديلات على البرنامج نفسه سواء للتعديل او لسد ثغرات به
محتوى الكلمات
السيناريو الاول : عند تطبيق نموذج عمل Language Tool
عن طريقه يتم تطبيق القواعد النحويه مباشرة داخل Langauge Tool و ذلك عن طريق اما XML للقواعد البسيطه و اما Java للقواعد النحويه المتقدمه
السيناريو الثانى عند تطبيق لغة البرمجه Python
يتم تسجيل المحتوى الكلمى الخاص بالاسماء و الافعال فى ملفات منفصله , مجمعه تبعا للنوعيه , بحيث يتم تجميع الاسماء التى ينطبق على جمعها مثلا نفس القواعد النحويه و يتم تجميع الكلمات التى لها مثلا جمع تكسير فى ملفات اخرى , و ذلك تبعا للتقييم الذى سيضعه المختصون بالجانب اللغوى بالمشروع تتم تبعا لنوع الكلمه المتعرف عليه تطبيق القواعد النحويه المختلفه والتعرف على مناطق الخطأ فى الجمله او الكلمه و الاشاره اليها
--Melsakhawy 04:11, 14 ديسمبر 2007 (PST)