ساهم 120 طالب مدرسة ثانوية في إيطاليا في حل مشكلة عمرها قرون: كيفية منح الباحثين إمكانية الوصول إلى أرشيف الفاتيكان السري، وهو مجموعة ضخمة من الوثائق التي تفصّل أنشطة الفاتيكان منذ القرن الثامن. ويبلغ طول أرفف أرشيف الفاتيكان السري نحو 85 كيلومترًا، ويضم 35 ألف مجلد من الفهارس. لكن الوثائق التي مسحها الباحثون ضوئيًا وحملوها مخزنة على بطاقة ذاكرة صغيرة، والوثائق المنقولة التي يمكن البحث فيها بالحاسوب أقل بكثير، ويبدو أن إدارة الفاتيكان لم ترغب في تقديم المعلومات. ولا تستطيع برمجيات التعرف البصري على الحروف قراءة النصوص المكتوبة بخط سيئ أو غريب.
وإذا أراد الباحثون الاطلاع على الوثائق، فلا خيار لهم سوى زيارة الأرشيف شخصيًا (على افتراض أن الفاتيكان سيوافق على طلبهم). ويعمل اليوم فريق من الباحثين من الأرشيف وجامعة روما تري على مشروع بحثي مصمم لحل هذه المشكلة، ويستخدم الذكاء الاصطناعي لتدوين الوثائق. ونُشر بحثهم في مجلة أخبار الاتحاد الأوروبي لأبحاث المعلوماتية والرياضيات.
والمشكلة أن الحواسيب غير مهيئة لقراءة الكتابة اليدوية، لذلك كانت الخطوة الأولى في مشروع «كودايس ريشو» تدريبها على ذلك. وباستخدام منصة أنشأها الباحثون على الإنترنت، صوت الطلاب على كل حرف مكتوب بخط اليد إذا كان مطابقًا لشكل حرف حدده علماء الكتابة اليدوية القديمة أم لا.
فمثلًا، يقارن الطالب حرف «إم» مع سلسلة من حروف إم مكتوبة بخط اليد، ومؤكدة سابقًا. فإن رأى الطالب أن الحرفين متطابقان بما فيه الكفاية، يصوّت «نعم،» وإن لم يكن، فيصوت «لا.» وإن حصل الحرف على نسبة تأييد كافية، يسجل على أنه حرف إم. واستغرق العمل 120 طالبًا بضع ساعات فحسب لإنهاء مجموعة التدريب كاملةً. لكن الذكاء الاصطناعي يحتاج إلى تدريب أكثر. ثم علّم الباحثون الذكاء الاصطناعي التعرف على الأحرف المكتوبة بخط اليد باستخدام طريقة «تجزئة القطع.» فبدلًا من النظر إلى خط اليد كسلسلة من الكلمات أو حتى مجموعة من الحروف، بحث الذكاء الاصطناعي عن أشكال ضربات القلم أو ريشة الكتابة. فلا يبدو الحرف إم المكتوب بخط اليد حرفًا واحدًا، بل ثلاث ضربات متتالية. وبناءً على ما تعلمه الذكاء الاصطناعي من مجموعة بيانات طلاب المدرسة الثانوية، فقد تعني هذه الضربات الثلاث الحرف إم «M» أو ربما الرقم 3 «III.»
وأعطى الباحثون الذكاء الاصطناعي مجموعة بيانات من 1.5 مليون كلمة باللغة اللاتينية، وهي اللغة التي كتبت بها النصوص، لمساعدته على قراءة هذه الضربات. وعندما شاهد الذكاء الاصطناعي الضربات الثلاثة، استنتج أنها الحرف إم وليست الرقم 3، فمن غير المحتمل وجود الرقم 3 أو III في كلمة لاتينية. وعندما اختبر الباحثون الذكاء الاصطناعي بأربع صفحات من سجلات الفاتيكان، استطاع التعرف على 65% من الكلمات ونسخها. وعلى الرغم من أن النسبة ليست مثالية، فهي مقبولة. ووفقًا للباحثين، فهذه النسخ دقيقة بما يكفي لتزويد علماء الكتابات القديمة بأساس متين يمكن أن يسرع عملية النسخ، وما زال الباحثون يعملون على تحسين النظام.
وسيكون ذلك مفيدًا لأن إدارة الفاتيكان تمنح حق الوصول إلى نحو ثلاث وثائق في اليوم. وقد يعتقد أحد الباحثين أنه يعرف المستندات التي يريد رؤيتها، ليزور الفاتيكان، ثم يدرك لاحقًا أن تلك الوثائق غير مفيدة لها. وإن استطعنا نسخ كل الوثائق، فربما يستطيع الباحثون في جميع أنحاء العالم البحث في المجموعة كلها عن كلمة مفتاحية (مثل مايكل آنجلو) ومعرفة المستندات التي تتضمنها، ثم يطلبون الوصول إليها، أو يحصلون على المعلومات التي يحتاجونها من الأرشيف السري للفاتيكان دون السفر إليه.
نقلاً عن مرصد المستقبل