Feeds:
المقالات
تعليقات

Posts Tagged ‘المحتوى العربي المفتوح’

سنحت لي الفرصة لحضور اليوم الثاني من ورشة عمل المحتوى العربي المفتوح وهي أحد فعاليات مبادرة الملك عبدالله للمحتوى العربي والتي أقيمت في مدينة الملك عبدالعزيز للعلوم والتقنية في الرياض. كانت تجربة فريدة من نوعها حيث تمكنت من التعرف على الجهود المبذولة في هذا الصدد، إضافة الى اكتساب معلومات قيمة ولقاء أناس بالفعل لهم بصمات رائدة في هذا المجال.

كانت أول محاضرة من تقديم الأستاذ أنس طويلة الذي يحمل درجة الماجستير في هندسة البرمجيات من جامعة كارديف في المملكة المتحدة ومؤسس مجموعة GNU/Linux في سوريا. يعمل الأستاذ أنس حاليا كنائب رئيس في قسم تطوير المنتجات لدى شركة “ميدان” بجانب تحضيره لدرجة الدكتوراة.

p118181010

كعادتي، دائما ما أسمع الاسم وأتذكر أني صادفته يوما ما، ولكني لا أتذكر الرابط بينهما الا متأخرا.. وهذا ما حدث مع الأستاذ أنس.. فقد تذكرت أنني قرأت اسمه على كتاب مررت عليه.. ولكن ماذا كان اسمه؟ وبعد عودتي الى البيت، تذكرت.. الأستاذ أنس قام مشكورا بترجمة كتاب “الشبكات اللاسلكية في الدول النامية” بطبعتيه الأولى والثانية.

المهم، عودة الى المحاضرة التي كانت بعنوان: الترجمة التشاركية والمحتوى الرقمي العربي. سأذكر أهم النقاط والحقائق التي ذكرها الأستاذ أنس:

· أهم الابداعات التي تحققت في مجال المحتوى الفكري هي:

o التخلص من الناقل الفيزيائي (الورقي) والتحول الى الرقمي.

o استخدام الانترنت للتواصل والنشر (التناقل).

o التحرير التشاركي (التفاعل التشاركي) للمحتوى.

· البيانات المتوقع توليدها هذه السنة فقط تعادل 1.5 اكزابايت (15 بجانبها 17 صفرا) وهو يعادل البيانات التي تم توليدها خلال الخمسة آلاف سنة الماضية مجتمعة!!!

· النمو الذي طرأ على عدد المستخدمين العرب للانترنت في السبع سنوات الماضية بلغ 950%

· العرب يشكلون 2.5% من مستخدمي الانترنت.

· المحتوى العربي يبلغ 0.3% من المحتوى الانترنتي!

ذكر الأستاذ أنس أن المشاكل المواجهة وراء ضعف وقلة المحتوى العربي هي:

· قلة الأدوات اللغوية.

· قوانين حفظ الملكية (مع أنها موضوعة ولكنها غير مطبقة بشكل فعال)

· مشاكل البحث والفهرسة.

· ضعف فلسفة العمل المشترك والتطوعي.

· ضعف في القراءة (قلة عدد القراء العرب).

· حركة ترجمة ضعيفة.

اقترح الأستاذ أنس طريقة فعالة جدا لاثراء المحتوى العربي وهي عبارة عن اطار عمل يتكون من الخطوات التالية:

p1181807

1- جلب المصدر الانجليزي للموضوع المراد تعريبه (مقال في الويكيبيديا أو أحد المدونات مثلا).

2- استخلاص المحتوى المحدد المراد تعريبه وترجمته من المصدر (جزء معين من المقال مثلا).

3- تجزيء نص المحتوى الى عدة نصوص (أجزاء).

4- توزيع النصوص على عدة مترجمات آلية (مترجمات آلية متخصصة بالهندسة أو الطب أو الرياضيات أو … بحسب موضوع المحتوى).

5- توزيع النصوص المترجمة آليا لشبكة من المترجمين البشريين لتعديل الترجمة وتنقيحها (يتم التوزيع بناء على التخصصات بما يتوافق وطبيعة المحتوى).

6- جمع ماتم ترجمته وتنقيحه ومن ثم إضافة المصطلحات والعبارات الى ما يسمى بالذخيرة اللغوية (lingual corpus) والتي تستخدم كمرجع لتحسين أداء المترجمات الآلية وحتى البشرية.

7- نشر المحتوى المترجم.

8- إعطاء القارىء ميزة التقييم والتي يمكننا من خلالها استقراء أداء المترجمين البشريين.

كما لاحظتم، فإن هذا الاطار يتطلب مكونات عديدة ذكرها الأستاذ أنس وهي كالتالي:

p1181812

· شبكة حواسب للترجمة الآلية.

· مجتمع مترجمين:

o متطوعين.

o محترفين يتقاضون رواتبا وأحد أهداف تواجدهم هو الابقاء على وتيرة العمل أو To keep the momentum

· الذخيرة والخوارزميات اللغوية.

· بروتوكول للتواصل (لتوزيع المهام على المترجمين المتواجدين بناء على مجالاتهم).

· آلية لإدارة تقييم المترجمين و”سمعتهم”.

· المحاسبة وإدارة الدفعات الصغيرة.

· آلية ادارة تواجد المترجمين والحواسيب.

· آلية لتقييم الترجمة نفسها.

من الملاحظ أن ميزات إطار العمل المذكور تكمن في أن الترجمة آلية وبشرية معا إضافة الى قابليتها للتطور وتحسين جودة الترجمة. ما يميز الإطار برمجيا، هو إمكانية استخدامه والتعامل معه عبر الـ API.

ختاما، ذكر الأستاذ أنس أن الذخيرة اللغوية لموقع ميدان مفتوحة الترخيص، بمعنى أنها متاحة للجميع ويمكن التواصل معه للحصول على طريقة استعمالها. من الممكن أن تتساءلوا، لماذا لم يتم تجميع الذخائر اللغوية العربية لدى الجهات الحكومية والخاصة مع بعضها؟ أجاب الأستاذ أنس بأن معظم الشركات التي تملك Translation memory و Lingual Corpus لا تعطي رخص استعمالها للعموم، أي أنها مغلقة الترخيص.

المحاضرة الثانية كانت من تقديم الدكتور نايل الشافعي بعنوان: مشروع مجتمع وموسوعة “المعرفة”.

p1181817

عندما بدأ الدكتور نايل بالكلام، أسرني بطريقته المميزة في الالقاء.. قد لا تروق للبعض، ولكنني رأيتها تجمع بين الجرأة والثقة. أول ما تكلم عنه د. نايل كان عن زميله في المكتب في جامعة الـ MIT الشهيرة عندما كان يحضر لدرجة الماجستير.. ببساطة زميله كان.. ريتشارد ستالمان!!!! عندما قالها تفاجأت فعلا!! وتكلم عن بعض ما هو معروف عن ستالمان كعدم إيمانه بالملكية الفكرية وكرهه الشديد للماء (= لا يستحم!) وتطويره لمشروع الـ GNU والذي كان أحد أفرعه مشروع الـ GNUPedia وهو تكوين موسوعة معرفية مفتوحة المصدر وقابلة للتحرير التشاركي.

قام جيمبو ويلز بالاتفاق مع ستالمان لتوظيف هذه الفكرة.. وظهرت ويكيبيديا. وذكر د. نايل معلومة بصراحة لم أكن أعرفها وهي أن جيمي ويلز يملك أكبر محرك بحث إباحي، وقام بإنشاء الويكيبيديا لتخفيض الضرائب عن تجارته المربحة!


بغض النظر عن شخصية جيمبو ويلز وتاريخه العملي، ويكيبيديا هي من أهم المصادر المعرفية التي أستخدمها، فشكرا له.

على العموم موضوع المحاضرة كان للتعريف بأكبر موسوعة عربية مفتوحة المصدر وهي “معرفة” والتي أسسها د. نايل بجهود أقل ما توصف بأنها جبارة خصوصا في عملية الحصول على تراخيص النشر (كترخيص نشر مقالات مجلة العربي الكويتية). الموسوعة يزورها 11 ألف زائر يوميا وأهم ما يميز مواضيعها الدقة والحيدة. كما يشرف عليها مجلس أمناء مكون من مثقفين عرب معروفين وأحدهم هو الدكتور المسيري رحمه الله.

أدعوكم لزيارة الموسوعة والتعرف على أجزائها والمشاريع المنضوية تحتها كبريد المعرفة، مدونات المعرفة، منتديات المعرفة، المناهج الجامعية،…

ركز وأعاد وكرر د. نايل على أن المعرفة تلقى الدعم المناسب وكل ما هو محتاج موجود ولكن المشكلة الأكبر هي في قلة وجود العامل البشري! نعم، المعرفة بحاجة الى أناس لديهم روح التطوع ليعملوا على إغناء محتواها.

حضرت بعدها محاضرتين:

إدارة مشروعات المحتوى المفتوح ومقومات النجاح (د. محمد اللهيبي- جامعة أم القرى)

حلول Google لإثراء المحتوى العربي على الانترنت (أحمد جاب الله- شركة Google– كاليفورنيا)

لن أتحدث عن المحاضرة الأولى لأنها تهم من هم في صدد إقامة مشروع متكامل لمحتوى عربي، ولكني سأستعرض بعض الاحصائيات المثيرة التي ذكرها المهندس أحمد جاب الله الذي عمل على مشروع Knol :

1 مليار بحث يقوم بها محرك بحث Google يوميا.

لو تم توزيع عدد المقالات العربية المنشورة على الانترنت على المتحدثين باللغة العربية، لوجدنا أن كل 3 عرب يكتبون صفحة واحدة. بينما الألماني يكتب 6 صفحات!

السعوديون كتبوا 1213 مقالة في knol يوم افتتاحها وهو أكبر عدد عربي.

يوجد حاليا في knol 10 آلاف مقالة عربية.

عدد المدونات العربية هو 490 ألف مدونة.

الى هنا انتهت تغطيتي للورشة..

أعزائي القراء، الموضوع مهم جدا جدا! ولا يجب المرور عليه مرور الكرام، يجب أن يفعل كل منا شيئا لإثراء المحتوى العربي على الانترنت.. وأنا على يقين أن المشاريع الناجحة كموسوعة معرفة ومشروع ميدان هي مفتاح البداية لكل منا.. ما يلزمنا هو تواجد الروح الجادة للإسهام في هذه المشاريع، والتواصل مع مسؤوليها.. ومن خلال ما رأيت، فإن الأستاذ أنس طويلة والدكتور نايل الشافعي يرحبون بتواصل المستخدمين العرب معهم ممن لديهم الروح التطوعية العالية والإيمان بسمو الهدف الذي يعملون من أجله.

بالنسبة لي، فقد تحمست جدا لهذا الموضوع وسأقوم بالتواصل قريبا جدا مع الأساتذة الأفاضل بمجرد انتهائي من بعض الالتزامات..

أتمنى أن تكون التغطية قد أعجبتكم..

دمتم بود..

وائل

Read Full Post »