.
من السهل العثور على الخوارزميات التي تستخدمها أجهزة الكمبيوتر لترجمة شيء مكتوب بلغة ما إلى لغة أخرى. فإن ذلك فقط يحتاج بعض الوقت و الجهد.
و لكن كل كاتب له أسلوب فريد - ما يطلق عليه كاتب المقال مفهوم "الصوت" - الذي يُعرِّفهم و يميزهم عن غيرهم من الكتّاب. و سيكون من الصعوبة بمكان الاستعانة بأجهزة الكمبيوتر لاختيار كلمات أسلوب أحد المؤلفين وتحويلها إلى أسلوب آخر مع ترك المعنى سليماً.
و يمكن استخدام خوارزميات ترجمة الأنماط للمساعدة في جعل بعض النصوص مقروءة إذا كانت صعبة القراءة -بشكل طبيعي- ، مثل برنامج يترجم مستنداً قانونياً إلى لغة بسيطة ، أو جعل عمل في الأدب الإنجليزي مفهوماً لشخص يتعلم الإنجليزية كلغة ثانية ، أو أنه صغير العمر ليفهم العديد من الكلمات.
خوارزمية جديدة من خلال طبعات مختلفة من الكتاب المقدس
وقد اتخذت مجموعة صغيرة من علماء الكمبيوتر في كلٍ من: كلية دارتماوث Dartmouth College ، في هانوفر-ألمانيا ، ونيوهامبشاير New Hampshire في أمريكا ، و جامعة إنديانا Indiana University في بلومنجتون Bloomington (في الولايات المتحدة الأمريكية) خطوة نحو إنتاج (ابتكار) مثل هذه الخوارزمية ، وذلك باستخدام طبعات مختلفة من الكتاب المقدس. فقد استخدموا 34 نسخة من العهدين الجديد والقديم (باللغة الإنجليزية) لتدريب واختبار النظام الجديد.
و كما هو معلوم فإن العهد القديم -في الأصل- كان قد كُتبَ بالعبرية الكلاسيكية ، مع بعض الأجزاء باللغة الآرامية. و كتب العهد الجديد باللغة اليونانية. و تعكس بعض الترجمات الفترة الزمنية التي تم إنتاجها فيها ، لذا فإن إصدار الملك جيمس ، الذي نشر لأول مرة في إنجلترا عام 1611 ، مليء بـ "thees" و "thous"، وبينما لا تحتوي تلك الحديثة على ذلك .
ويقول دان روكمور Dan Rockmore ، أستاذ الرياضيات وعلوم الحاسوب في جامعة دارتماوث Dartmouth : " لقد كان الهدف هو معرفة فيما إذا كان بإمكاننا استخدام إطار الترجمة بشكل أساسي لإنتاج شكل من أشكال ترجمة الأسلوب " الترجمة النمطية " " .
ولقد اختار الباحثون الكتاب المقدس للدراسة لأنه ربما يكون النص الأدبي الأكثر تفسيراً وفهرسة في الوجود . وهو يضم 31,000 آية ، وقد تمكن من بناء 1,5 مليون تزاوج فريد من الكلمات من نسخة واحدة مع كلمات من إصدارات أخرى ، والتي وفرت البيانات اللازمة لتدريب النظام. فعلى سبيل المثال ، يتطابق سفر التكوين بنسبة 1:1 في ترجمة واحدة للكتاب المقدس مع سفر التكوين 1:1 في جميع اللغات الأخرى.
ويقول شلومو أرجامون Shlomo Argamon ، و هو ، عالم اللغويات الشرعي وعالم الكمبيوتر في معهد إلينوي للتكنولوجيا Illinois Institute of Technology في شيكاغو : " ومع ذلك ، فإن استخدام الكتاب المقدس كنصوص - أو كجزء أساسي أي كهيكل - لتدريب واختبار النظام من خلاله قد يكون نقطة ضعف في الدراسة ". " إذ أن لدى الكتاب المقدس أساليب متعددة ، و ربما يكون ذلك أحياناً في كتاب واحد " .
و يتابع العالم شلومو قائلاً : "لديك الكتب النبوية prophetic books ، و التي يمتلىء بعضها بشعر رفيع سام ، وقصص متعلقة بزواج البغايا . هذا بالإضافة إلى الأمثال Proverbs ، والتي تمتلك أساليباً كثيرة بحد ذاتها " .
ويقول كيث كارلسون Keith Carlson ، طالب الدكتوراه في علوم الكمبيوتر في دارتماوث Dartmouth والذي عمل في هذا المشروع : " إننا نعامل كل نسخة من الكتاب المقدس كنمط واحد لعملنا "
و لتدريب الخوارزمية ، استخدم الباحثون في Dartmouth و Indiana تعريفاً للنمط أو للأسلوب و الذي يشتمل على خصائص معينة كطول الجملة ، واستخدام صيغة نائب الفاعل أو صيغة المبني للمجهول، بالإضافة إلى المفردات.
.
و يتابع روكمور Rockmore قائلاً : " إن التجربة هي دليل على الفكرة " .
وقد تم نشر البحث في مجلة الجمعية الملكية المفتوحة للعلوم the journal
Royal Society Open Scienceوفي تصريح آخر يقول روكمور : " وإلى جانب تغيير الأسلوب أو النمط بالنسبة للجمهور ، فإن هناك هدفاً آخر بعيد المدى ، وهو أن تكون الخوارزمية قادرة على تعلم أسلوب كاتب واحد ، وترجمته إلى أسلوب مؤلف آخر كاختبار لرشاقة النص . إن هذا ليس سهلاً ، ولا تستطيع خوارزمية دارتماوث Dartmouth القيام بذلك حتى الآن " .
و بشكل عام يقوم القراء بتجاهل أو عدم ملاحظة أسلوب كاتب معين لأنه في كثير من الحالات لا يكون أسلوبه قوياً جداً ، أو أن الكتّاب قد تعلموا التحكم به عند الضرورة.
ويقول أرغامون Argamon في السياق ذاته : " إن محاولة تحديد مؤلف من خلال أسلوب كتابته هو أكثر صعوبة مما يمكن للمرء أن يتصوره . و هنا سيكون من الممكن ترشيح رواية هرمان ميلفيل Herman Melville "موبي ديك" Moby Dick لذلك من خلال خوارزمية مصممة لتحديد الأساليب الشخصية للكاتب و التي يخلص القارئ في نهايتها وبشكل خاطىء أن للرواية كاتبين إثنين " ...... " لأنه يبدو أن هناك نمطين أي أسلوبين للكتابة " .
البدء بتطبيق التجارب على أسلوب همنغواي
ربما يبدو الكاتب الأمريكي الشهير إرنست همنغواي Ernest Hemingway أسهل. و قد اشتهر (قد يقول البعض أنه سيء السمعة) بأسلوب كتابته الفريد والواضح.
و قد قامت الكاتبة جوان ديديون Joan Didion ، و التي كانت تمتلك أيضاً أسلوباً خاصاً بها ، بشرح الفقرة الافتتاحية الشهيرة في رائعة همنغواي وتحفته الفنية "وداعاً للسلاح" "A Farewell to Arms,
"لصحيفة النيو يوركر New Yorker في عام 1998.
و لدى تحليلها للفقرة الافتتاحية، لاحظت الكاتبة جوان أن الفقرة كانت تحتوي على أربع جمل بسيطة ، و 126 كلمة. و كانت كلمة واحدة فقط تتألف من ثلاثة مقاطع ، و 22 كلمة كانت تتألف من مقطعين ، في حين أن باقي الكلمات كانت مؤلفة من مقطع واحد فقط . و 24 كلمة كانت عبارة عن أداة التعريف “the” ، و 15 خمسة عشر حرف عطف "و" “and”. كما كانت هناك سبع صفات فقط . و وضعت كل كلمة عمداً و بترو لخلق إيقاع معين .
و من هذا المنطلق يمكن لخوارزمية الحاسوب أن تقوم باستخدام هذه المعلومات لإعادة خلق أسلوب همنغواي من جديد و ذلك بشرط تدريبها على القيام بذلك. و لسوء الحظ لم تستطع الخوارزمية الجديدة القيام بذلك حتى الآن ، ولكن بناء على طلب
Inside Science، وجه الباحثون أمراً إلى الخوارزمية لتقوم بفعل العكس تماماً : إذ قاموا بإدخال بعضاً من أساليب كتابة همنغواي Hemingway إلى الحاسوب وغيروا الأسلوب إلى طبعات مختلفة من الكتاب المقدس. لقد كانت التغييرات بارعة و غاية في الدقة و الاتقان .
ففي رواية همنغواي "لمن تقرع الأجراس" "For Whom the Bell Tolls,"، يصف همنغواي رجلاً وقع في حب إمرأة قابلته للتو ، و لكن الأمر كان وكأنه كان يعرفها طوال حياته.
يقول همنغواي HEMINGWAY على لسان بطل الرواية :" إنني أحبك عندما رأيتك اليوم وأحببتك دائماً على الرغم من أنني لم أرك من قبل".
و بتطبيق خوارزمية همنغواي على إنجيل جنيف تصبح الآية 1599 : "لقد أحببتك ، عندما رأيتك هذا اليوم ، وأحببتك دائماً ، على الرغم من أنني لم أرك من قبل".
و على إنجيل الأطفال الدوليين the international children bible : "لقد أحببتكم عندما رأيتكم اليوم. لقد أحببتكم دوماً ، على الرغم من أنني لم أركم من قبل".
و يقول أرجامون Argamon - وهو عالم اللغويات الشرعية (الجنائية) و المعروف بعمله في الأساليب الحسابية computational stylistics ( و هو علم دراسة الأنماط المميزة الموجودة في الأنواع الأدبية الخاصة و في أعمال الكتاب الشخصية ) - أنه كان من الممكن أنه سيجد أن الهيكل الأساسي للكتاب المقدس الذي قام باحثو دارتماوث Dartmouth وإنديانا Indiana بتأليفه مفيد في بحثه ، ولكن الأمر كان خطيراً و حاسماً حيث قام الباحثون بمعاملة هذا الهيكل كبيانات غير متمايزة - نموذجية لعلماء الكمبيوتر كما يقول - وليس ككلمات ضمن السياق context – و حتى اللغويون الضعفاء (و المتخصصون بدراسة اللغة الإنجليزية) سيفهمون ذلك .
و في النهاية يشير أرماجون بقوله إلى أنه توجد هناك أشياء متعلقة بالكلمات أكثر من مجرد وجودها ككلمات .
المصدر