إذا كنت تفكر في استبدال فريق اللغويين لديك بأنظمة معالجة لغوية تعمل بالذكاء الاصطناعي، فننصحك بالانتظار قليلاً. فبالرغم من أن تكنولوجيا الذكاء الاصطناعي حققت تقدّماً هائلاً على مدار السنوات الماضية وتمكّنت من التفوق على البشر في العديد من المجالات، كتشخيص الأمراض، وقيادة السيارات، إلّا أنها لا تزال عاجزة عن التفوق عليهم في المجال اللغوي. لكن ذلك لا يعني أن تقنيات الذكاء الاصطناعي المتخصصة بمجال اللغات ضعيفة، بل على العكس تمامًا، فالآلات قادرة على ترجمة كميات كبيرة من النصوص في وقت قصير، وإجراء محادثات بسيطة، وإعداد نصوص مكتوبة، وتنفيذ عدد متنوع من المهام التي تُسهل حياتنا اليومية بشكل كبير. لكن بالرغم من ذلك، يقول الخبراء أن الوقت لا يزال مبكرًا جدًا للاعتماد بشكل كلي على تقنية الذكاء الاصطناعي في مجال اللغة. البشر كانوا ولا يزالون العنصر الأساسي في منظومة اللغة، وسيبقون كذلك في المستقبل القريب. لهذا قد يكون من السابق لأوانه الاعتماد بشكل كامل على تقنيات الذكاء الاصطناعي في المجال اللغوي.
السؤال الذي يجب طرحه هنا هو، لِمً يُعد البشر عنصرًا أساسيًا في أنظمة الذكاء الاصطناعي المتخصصة بمجال اللغة؟ وما هي الجوانب التي لم تُتقنها الآلات بعد؟ نُناقش في هذا المقال المساهمات القيّمة التي يقدّمها البشر للغة، والأسباب التي تدعو لإشراكهم في المشاريع المتعلقة باللغات ومدى مساهمتهم في تحقيق مخرجات واضحة وذات جودة عالية في هذه المشاريع.
١. البشر قادرون على فهم السياق
تتأثر اللغة بالسمات الشخصية بشكل كبير، أي أن استخدامها يمكن أن يختلف من مكان إلى آخر، ومن فرد لآخر. والطريقة التي تُستخدم فيها الكلمات يمكن أن تُغيّر معناها الأصلي إلى حد كبير، ما يمنحها معاني وعمقًا جديدًا. يتمتع البشر بقدرة عالية على ملاحظة هذه الاختلافات الدقيقة بفضل قدرتهم على فهم الإيحاءات والإشارات غير اللفظية، ونبرات الكلام، وغيرها من التفاصيل الدقيقة التي تساعدهم على فهم المغزى من النصوص. أما برمجيات الذكاء الاصطناعي فتستند بشكل كبير إلى الواقع الموضوعي، ما يعني أنها تتّبع مجموعة من القواعد والتعليمات الجامدة (سواء المادية أو الرياضية) التي تتحكم بعمليات اتخاذ القرارات التي تقوم بها هذه البرمجيات.
تتميز تقنية الذكاء الاصطناعي بقدرتها الكبيرة على أداء مهام مُحددة بفضل اعتمادها على أنظمة متطورة للغاية مدربة على التعامل مع كمية هائلة من البيانات. لكن نظرًا لصعوبة وضع قواعد محددة للتعامل مع اللغة، يواجه المُطورون تحديات كبيرة في تصميم برامج قادرة على معالجة المدخلات اللغوية بدقة وبشكل مستمر. ولا يعني ذلك أن اللغات لا تخضع لقواعد محددة، على العكس تمامًا، فاللغة تتضمن قواعد خاصة بها، مثل قواعد تصريف الأفعال، لكن هذه القواعد محكومة بالأعراف السائدة وليس الواقع الموضوعي. تتطور اللغة بشكل مستمر، لذا يجب أن تواكب عملية تدريب أنظمة الذكاء الاصطناعي هذا التطور والتغيّر. بالإضافة إلى ذلك، البشر هم وحدهم من يمكنهم تحديد ما إذا كان النص مكتوبًا بواسطة إنسان أو آلة. وبالرغم من أن الآلات تستطيع إعداد نصوص ذات دلالات معنوية سليمة تمامًا، إلاّ أن هذه النصوص قد لا تبدو سلسة أو طبيعية كالنصوص التي يكتبها البشر، ما يُضعف من كفاءة النص.
لِمَ يعتبر السياق مهمًا في اللغة؟
حتى وقت قريب، لم تكن أجهزة الحاسوب قادرة على إعداد نصوص مُحكمة الصياغة. لكن بفضل تقنيات معالجة اللغة الطبيعية والتعلم العميق والتنميط الإحصائي، أصبحت هذه الأجهزة قادرة بشكل مبهر على إعداد نصوص ذات صياغة أكثر ترابطًا وسلاسة. وهذا هو السبب وراء النجاح الواسع الذي حققته تكنولوجيا اللغة مؤخرًا حيث ساهمت هذه التكنولوجيا بدور أساسي في عمليات تصميم روبوتات المحادثة وأنظمة المساعدة الشخصية التي نستخدمها في حياتنا اليومية، سواء على المستوى الشخصي أو المهني. من جهة أخرى، أظهرت الدراسات التي أجريت مؤخرًا أن الآلات قد تكون عاجزة عن فهم ما تقوم بقراءته أو كتابته، ما يجعلها أكثر عُرضة لارتكاب الأخطاء. وهذا النوع من الأخطاء قد يُثني الشركات عن الاعتماد بشكل كامل على روبوتات المحادثة للتواصل مع مُتعامليها لأن الأخطاء التي ترتكبها هذه الروبوتات قد تكون في بعض الأحيان كبيرة لدرجة أنها قد تتسبب بإثارة غضب المُتعامل، وقد تُكلّف الشركة كثيرًا خاصة إذ لم يكن هناك موظف خاص يتولى الرد على المتعاملين في حل فشل روبوت المحادثة في ذلك.
ولإثبات هذا الأمر، صمّم بعض الباحثين اختبارًا لتقييم المهارات المنطقية لأنظمة معالجة اللغة الطبيعية باستخدام 44000 سؤالاً وقاموا بتقسيمها إلى أزواج متطابقة من الجُمل، وتم إدراج كلمة واحدة مختلفة في كل جملة (الكلمة المُحفزة للتحليل) بهدف إعطاء معنى مختلف لكل جملة. أمثلة على الجُمل:
● رفض أعضاء مجلس المدينة منح المتظاهرين تصريحًا خشية قيامهم بأعمال عُنف.
● رفض أعضاء مجلس المدينة منح المتظاهرين تصريح لأنهم كانوا يدعمون أعمال عنف.
تحمل هاتان الجملتان معنيين مختلفين، وفي هذا المثال طُلب من الآلات تحديد الفاعل في كل جملة. الفاعل في الجملة الأولى هم أعضاء المجلس، أما في الجملة الثانية فالفاعل هم المُتظاهرون. أظهرت نتائج البحث أن أحدث التقنيات وأكثرها تطورًا لم تتمكن من اجتياز الاختبار، حيث تراوحت درجاتها بين 59.4% و 79.1%، مقارنة بالبشر الذين سجلوا في المتوسط درجة 94%. تظهر هذه النتائج أن الآلات لم تصل بعد للمستوى الذي يسمح لها بفهم سياق النصوص اللغوية وإدراكها.
أهمية السياق في الترجمة
التحديات والصعوبات التي تواجهها تقنيات الذكاء الاصطناعي في مجال الترجمة لا تقل عن تلك التي تواجهها في مجال معالجة النصوص والتعامل معها. وعلى الرغم من أن استخدام هذه التقنيات في الترجمة مفيد وفعّال، كترجمة الأدلة الطويلة التي تكون فيها فرصة ارتكاب الأخطاء أقل، إلّا أن أداءها ينخفض وكفاءتها تقل عند ترجمة نصوص أخرى. من ناحية أخرى، إذا كانت نصوصك الأصلية تحتوي على مفردات من اللغة العامية أو اللهجات المحلية فقد لا تتمكن الآلات من ترجمتها بدقة. إضافة إلى ذلك، لا تُراعي الآلات الاعتبارات الثقافية وتعجز عن فهم علاقتها بالنصوص المراد ترجمتها، على عكس المترجم البشري. على سبيل المثال، يقتصر استخدام اللغة الرسمية في كلّ من ألمانيا واليابان على قطاع الأعمال، وهي جزئية قد لا تستطيع الآلات إدراكها أو مراعاتها. للتغلب على هذه العقبة، يعتمد معظم مزودي خدمات اللغات على الآلات في المرحلة الأولى من عملية الترجمة، ثم يُرسلون النصوص المترجمة إلى الأخصائيين اللغويين لتصحيح الأخطاء التي قد تحتوي عليها تلك النصوص ضمن عملية يُطلق عليها تحرير النصوص ما بعد الترجمة الآلية. من خلال هذه الطريقة، يمكن إنجاز الترجمات بشكل أسرع وبأقل قدر ممكن من الأخطاء.
٢. سلوكيات التحيّز في تقنيات الذكاء الاصطناعي
على الرغم من أن أداء تقنيات معالجة اللغة الطبيعية أصبح أكثر كفاءة وفاعلية في الآونة الأخيرة، إلا أن المُطّلعين على هذا المجال أفادوا بأن هناك نوعًا من التحيّز في نتائج أداء خوارزميات اللغة. فبحسب دراسة أجريت على نموذج اللغة (GPT-3)، تبين أن الآلات تُظهر نوعًا من التحيز نحو جنس دون آخر في نتائجها.
فيما يلي أمثلة على الجُمل الافتتاحية التي اشتملت عليها الدراسة:
● كان هذا الشخص…..
● يمكن وصفه بأنه……….
بعدها تم تحليل النصوص التنبؤية لتسليط الضوء على عبارات الوصف والعبارات الظرفية المشتركة التي تم اختيارها لكلا الجنسين. أظهرت نتائج الدراسة أن البرنامج اختار كلمات محددة لوصف مظهر الأنثى (مثل كلمة “رشيقة القوام” و”جميلة”)، في حين استخدم كلمات عامة أكثر لوصف الرجال، مثل كلمة “كبير” أو “جذاب”.
سلوك التحيّز الذي تُظهره تقنيات الذكاء الاصطناعي ليس جديدًا ولا يقتصر على التحيز لجنس دون آخر، بل يمتد ليشمل العرق. ففي الآونة الأخيرة، تعرّض مُصممو برامج التعرّف على ملامح الوجه لانتقادات واسعة لأن الخوارزميات التي قاموا بتطويرها فشلت في التعرّف على وجوه الأشخاص من غير البشرة البيضاء. لكن لا يمكننا لوم الآلات في أيّ من هذه الحالات. فالمخرجات الناتجة في هاتين الحالتين ما هي إلا انعكاس للبيانات التي أدخلت في النظام والتحيزات التي تحكُم العلاقة بين البشر.
آليات الحد من التحيز في سلوكيات الذكاء الاصطناعي المتخصص بحلول اللغات
أظهرت العديد من الأبحاث أن الآلات لا تستطيع الكشف عن التحيزات وتعجز عن تحديد الأسباب الكامنة وراءها أو المخاطر المرتبطة بها. لهذا السبب، يجب التركيز على إدراج العُنصر البشري بشكل دائم في دورة تعلّم الآلة من أجل الحد من التحيّز في أداء برمجيات اللغة.
تُستخدم العديد من البرامج، مثل GPT-3 وغيرها من الروبوتات المتخصصة باللغات، في مختلف نواحي الحياة، لذا فتأثيرها على رفاهية المجتمع كبير جدًا. الجدير بالذكر أن الهدف من تحليل سلوكيات التحيّز لدى أنظمة الذكاء الاصطناعي لا يقتصر فقط على تحسين مستوى جودة المنتج النهائي، بل يتجاوز ذلك ليشمل الحد من الضرر الذي قد يتعرض له البشر نتيجة سلوكيات التحيّز التي تتبعها الأنظمة التكنولوجية. وبما أن اللغة أداة من صُنع البشر، فإن البشر هم وحدهم من يستطيع إحداث التغيير المطلوب الذي سيساهم في تعزيز مبادئ التسامح، والعدل، وتقبل الآخر في مجتمعات المستقبل. ونظرًا لأن أنظمة الذكاء الاصطناعي تميل عادة لنشر الأخبار المزيفة والتعبيرات اللغوية السلبية أو المؤذية التي يمكن أن تتطور إلى أحداث على أرض الواقع، لا بُد من السعي لإشراك العنصر البشري لضمان استخدام هذه الأنظمة بشكل مسؤول ومُقنّن.
٣. تفتقر الآلات لحسّ الفكاهة
وعلى الرغم من أن المترجمين يواجهون تحديات أحيانًا لاستيعاب النكات والتلميحات التي ترد في النصوص، إلّا أنهم قادرون على التغلب عليها من خلال محاولة تفسير لغة الجسد أو مقاصد الجُملة، من أجل استيعاب معنى النص. وهي ميزة لا تتمتّع بها الآلات حاليًا. فعلى سبيل المثال، عند عرض نص غير مفهوم على برنامج Google Translate، يقوم البرنامج بعرض ترجمات لا علاقة لها بالنص الذي يتم إدخاله، والسبب في وراء حدوث هذا الخطأ هو أن الآلة تُعطي الأولوية للطلاقة في الصياغة على حساب الدقة في الترجمة، بحسب ما يقول الخبراء.
قيام الآلة باستبدال النصوص يمكن أن يكون له تبعات على المدى البعيد في حال كان السبب في حدوث أخطاء في الترجمة النهائية منسوبًا لمحتوى النص الأصلي وليس لخلل في برنامج الترجمة.
دور البشر في سدّ الفجوة في خوارزميات اللغة
عادة ما يتم تدريب نماذج اللغة على التعامل مع نصوص نظرية لا أساس لها في واقع الحياة، وهذا هو أكبر عيوبها. بالتالي، فالمعارف التي تكتسبها هذه الأنظمة والنماذج محكومة بالنصوص التي يتم تدريبها عليها. فعلى سبيل المثال، من السهل جدًا إجراء محادثة مباشرة مع أجهزة المساعدة الشخصية، مثل أليكسا وسيري، لأن هذا النوع من المحادثات محكوم بمجموعة محددة من الظروف، ومفردات محدودة وفي بيئة خاضعة للرقابة. لكن عند الاستعانة بها لأداء مهام أكثر تعقيدًا، مثل الترجمة الفورية المباشرة، تفشل معظم البرامج في التعامل مع هذا النوع من المهام.
هناك الكثير من الجدل الدائر حول قدرة الآلات على استنباط المعاني من النصوص البحتة، إذ يميل معظم الخبراء للاعتقاد بأن الآلة لا تمتلك هذه القدرة، ويؤكدون على ضرورة إشراك العنصر البشري في التعامل مع اللغات. لذلك، لا بُد من وجود مشرفين يتولون مهمة مراقبة أداء نماذج اللغة الآلية القائمة على الذكاء الاصطناعي بشكل وثيق لضمان الالتزام بالمسؤولية الأخلاقية وسلامة المخرجات.
هل أنت مستعد للاستفادة من مزايا تقنيات الذكاء الاصطناعي والبشري؟ اضغط هنا لمعرفة المزيد حول حلول اللغة التي تقدمها شركة ترجمة والتي تجمع بين الإبداع البشري وسرعة الذكاء الاصطناعي.
https/www.weforum.org/agenda/2018/10/3-reasons-why-ai-wont-replace-human-translators-et/
https/www.technologyreview.com/2020/01/31/304844/ai-common-sense-reads-human-language-ai2/amp/
https/insidebigdata.com/2020/11/11/why-humans-sill-need-to-be-involved-based-ai/