بسم الله الرحمن الرحیم

دسته‌ها
روش شناسی

احیاء نسخ خطی را یک گام به پیش ببریم

بسم الله الرحمن الرحیم

احیاء نسخ خطی را یک گام به پیش ببریم.

(ایجاد امکان جستجوی الکترونیکی در محتوا، با نمایه‌زنی بر متن)

چکیده:

احیاء نسخ خطی توسط کتابخانه‌ها و اشخاص، در مرحلهٔ شناسائی و ثبت و رده‌بندی آنها متوقف شده است. تمام تلاش احیاء‌گران به هدفِ استفاده از محتوا صورت می‌پذیرد که امروزه زمینه دسترسی به محتوا، فقط با بررسی تمامِ متن به‌صورت مستقیم، میسور است. لکن با استفاده از روش نمایه‌ بر متن، می‌توان امکان جستجو در محتوای کتب خطی را فراهم ساخت و نقاط نفوذ برای آگاهی از محتوا، را گسترش داد.

کلیدواژه‌ها: کتابخانه دیجیتال، نسخ خطی، امکان جستجو، تحلیل محتوا، نمایه بر متن

مقدمه:

حجم عظیم نسخه‌های خطی در کتابخانه‌ها، اعجاب‌آور است. انبوهی از اطلاعات و معارف، دفن شده است که عمق و دقت مولفانِ قدیم، حسرت انسان را نسبت به این دفینة گرانبها صد چندان می‌کند. احیاء‌‌گران بزرگوار نسخ خطی، تلاشی طاقت‌فرسا برای حفظ و نگهداری و ثبت این آثار نموده‌اند و این مجموعه‌های نفیس را تا به‌ امروز رسانیده‌اند. اما برای چه مقصود و منظوری؟ آیا به هدفِ ایجاد موزه‌های تصویری یا به هدفِ انتقال محتوای کتاب‌ها به نسل امروز و فرداها؟!

امروز یک محقق برای کشف معارف و اطلاعاتِ موجود در منابع خطی، باید ابتدا به فهرست‌نامه‌هایی که از این کتاب‌ها منتشر شده است مراجعه کند و از روی عناوین کتاب‌ها، احتمالاتی را نسبت به اطلاعات مورد نظر خود داده و کتاب یا کتاب‌هایی را انتخاب کند و سپس به‌صورت فیزیکی به محل نگهداری این منابع مراجعه نماید، تاییدیه‌های لازم برای در اختیار گرفتن کتاب‌ها را ارائه دهد و پس از عبور از موانع متعدد، وقتی به کتاب دست یافت، خود را با صفحاتی انبوه روبرو ببیند که یافتن مطلب در آن ساعت‌ها و روزها دقت و موشکافی می‌طلبد. و اگر کتاب‌های متعددی را در نظر گرفته باشد که باید رحل اقامت در آن کتابخانه انداخته و با بررسی منابع روزها را به شب رساند.

تلاش ارزشمند کتابخانه‌ها و شخصیت‌های علمی و فرهنگی و فنی، برای الکترونیکی کردن کتابخانه‌های چاپی و خطی، و توفیق‌هایی که قدم‌به‌‌قدم باید حاصل شود، سبب حذف بسیاری از موانع گشته و منابع را مستقیم در اختیار محقق قرار می‌دهد. سیستم‌های جستجو، روز به روز قوی‌تر شده و ارزش خود را برای دست‌یابی به حداکثر اطلاعاتِ مرتبط با بیشترین قابلیت مقایسه، آشکار می‌کنند. قدرت تمرکز محققینی که براساس روش‌های تحلیل محتوا عمل می‌کنند بالا رفته است. اما تمام این قابلیت‌ها فقط در فضای منابع چاپی است آنهم در مواردی که به‌قالب الکترونیکی تبدیل یا از ابتدا در آن قالب تولید شده‌اند و آنهم فقط به‌صورت جستجوی لفظی و نَه موضوعی.

در منابع چاپی و خطی‌ایی که فقط به صورت تصویر در محیط الکترونیکی منتشر می‌شوند، در زبان فارسی، نرم‌افزاری که قابلیت جستجو در متن را ارائه دهد، هنوز تکمیل و کارآمد نشده است و در زبان انگلیسی نیز هنوز فراگیر نگشته و اطلاعات تصویری منتشره در اینترنت کمتر حاوی این قابلیت هستند، که امیدواریم هر چه زودتر این ابزار فراهم شود و جهشی واقعی در دست‌یابی به محتوای علوم و معارف بشری صورت گیرد.

لکن، چه این نرم‌افزار کارآیی لازم بیابد چه نیابد، نیاز به جستجوهای غیرلفظی برای رسیدن به نتایجی با حداکثر ارتباط به موضوعِ جستجو، همیشه باقی است. این نیاز با تکنیک نمایه‌زنی بر متن برطرف می‌شود.

ضرورت تحلیل موضوعی نسخ خطی

تکنیک نمایه‌زنی بر متن، هر پاراگراف از متن را در کلیدواژه‌هایی فشرده‌سازی می‌کند و جوهره و روح مطلب را در قالب چند کلمه به‌صورت عبارت یا عنوان بیان می‌کند و بدین وسیله نقطه نفوذ‌های موضوعی را در محتوا ایجاد می‌کند.

در کتب چاپی به سبب وجود فهرست‌ و سرصفحه‌ها و بخش‌بندی‌ و فصل‌گذاری‌ها و پاراگراف‌بندی‌ها و توپر کردنِ برخی کلمات، می‌توان تا حدودی بافت متن را تفکیک کرده و تشخیص داد و فضاهای موضوعی را به‌دست آورد. و البته این کار در حجم محدود و با صرف زمان انجام پذیر است، کافی است حجم صفحات زیاد شود یا مولف دارای تالیفات متعدد باشد و بخواهیم نظر مولف را نسبت به موضوعی به‌دست آوریم آنگاه خواهیم دید که عملیات فردی و فیزیکی طاقت‌فرسا خواهد شد.

برای کشف شبکه موضوعات در یک تالیف یا هندسه فکری یک مولف در مجموعه تالیفات، تحلیل محتوای تمام متن لازم است که با تکنیک نمایه‌زنی بر متن، این مهم به نقطه قابل استفاده‌ایی می‌رسد.

در کتب خطی، به‌سبب نبود فهرست و فصل‌بندی و سرصفحه و پاراگراف‌بندی، کشف فضاهای موضوعی نیازمند مطالعه دقیق تمام متن است. عملیات جستجوی لفظی در تصاویر نیز فعال نیست تا بتوان با حدس و احتمالاتی که از نتایج جستجوی لفظی به‌دست می‌آید قدری به فضاهای موضوعی نزدیک‌ شد.

اگر کتابخانه‌ها و مجموعه‌دارانی که زحمت ارزشمندِ ثبت و رده‌بندی آثار خطی را متحمل هستند و اهمیت انتشار الکترونیکی آنها را نیز اذعان داشته و در تلاش برای آماده‌سازی نسخ خطی به‌جهت نشر در فضای الکترونیکی هستند، مرحلهٔ نمایه‌زنی را به فعالیت‌های خود بیفزایند، تحولی بزرگ در احیاء حقیقی نسخ خطی صورت خواهد گرفت و کتاب‌هایی که به‌مانند جعبة سیاه شده‌اند و تنها نمایی از آنها دیده می‌شود، به لایه‌های اصلی فضای تحقیق و علم وارد شده و در گردش و تولید فکر در جامعه سهیم خواهند شد.

شیوه عمل در فضای الکترونیکی

قدم اول:

نرم‌افزارهای جستجو در فضای اینترنت، رفتارهای خاصی را دنبال می‌کنند که عمدتا تابعی از منطق طبیعی و ساختارهای حاکم بر فضای تالیف و نگارش است.

یک مولف، به‌طور منطقی و طبیعی، پس از عنوانِ تالیف که بیشترین ضریب را در کشف موضوع بحث دارد، بخش‌ها و سرفصل‌های تالیفش را هماهنگ با موضوعِ‌ مورد نظر تنظیم می‌کند و در هر قسمت از متن، نقطه مرکزیی را انتخاب کرده و حول و حوش آن، مطالب را پردازش می‌کند. و در پردازش مطالب از مفاهیم خاصی استفاده می‌کند که محورهای اصلی توصیف و توضیح او هستند. فلسفه توجه کتابداران به مفهومِ “چکیده” و “واژگان کلیدی” و رواج آن در فضای علمی معاصر، ناشی از همین روند منطقی حاکم بر تالیف است.

نرم‌افزارهای الکترونیکی، در صورتی موفق عمل خواهند کرد که بیشترین تطبیق را با عملکرد طبیعی ذهن منطقی، داشته باشند. بر این اساس طراحان سیستم‌های جستجو، در جستجوهای هوشمند و موضوعی، به‌سوی طراحی حداقل چهار لایه در تحلیل محتوای متن گرایش پیدا کرده‌اند:

عنوان هر قسمت (Titel)

توصیفِ هر قسمت (Page Discription)

واژگان کلیدی در هر قسمت (Keywords)

جایگاه و ارتباط این قسمت با کل مجموعه (Categories)

نمونه این قسمت‌بندی را در تصویر زیر ملاحظه می‌کنید که برگرفته از نرم‌افزار Front Page است که از نرم‌افزارهای رایج در طراحی صفحات وب و رایج‌تر در هنماهنگی با سیستم‌های جستجوی اینترنتی است: [۱]

در صورتی که ناشران الکترونیک، از منطق موجود در این برنامه‌ها پیروی کنند و برای هر یک از صفحات، فیلدهای موجود را پُر کنند، جستجوگران را یک قدم به نفوذ به متن نزدیک می‌کنند. اما این مقدار کافی نیست و با انجام یک حرکتِ دیگر، دروازه‌های بزرگی را برای نفوذ به متن می‌توان گشود.

قدم دوم:

نرم‌افزارهای جستجو در اینترنت، بیشترین ضریب اهمیت را برای عنوانِ صفحات (Title) قائل هستند و ابتدا به این فیلد مراجعه می‌کنند.

آنچه قدم بعدی را در نفوذ به متن برمی‌دارد مرحله‌بندی و ساختارسازی در عنوان است. توضیح اینکه:

هر عنوانی در طبقه‌بندی علوم، دارای جایگاه و مرحله‌ای است و همچنین دارای زیرشاخه‌ها و محورهای فرعی است. اگر در ارائه یک عنوان فقط به آن عنوانِ خاص اکتفا نشود و سرشاخه‌ها و زیرشاخه‌های آن نیز تعیین و ثبت شود، محتوای صفحه در تمام این عناوین قابل بازیابی است. فلسفه نمایه‌زنی بر محتوای اسناد و مدارک نیز بازیابی حداکثر مطالب موجود در محتوا بوده است. به مثال زیر که از پایگاه علوم و معارف اسلام به نشانی www.maarefislam.net  اخذ شده است توجه کنید:

این حرکت در نشر غیر خطی نیز ضروری است. به نمونه زیر توجه فرمایید:

در صورتیکه دست‌اندرکاران نسخ خطی و نشر الکترونیک آنها، این قدم را نیز در فعالیت احیاگری خود منظور کنند و هر صفحه‌ایی که روند تبدیل به فرمت الکترونیکی را می‌گذراند، توسط محققِ مرتبط با موضوع، ساختاردهی و نمایه‌زنی شود و این ساختار و نمایه در فیلدهای نرم‌افزاری که محتوا توسط آن منتشر خواهد شد درج گردد، صفحه‌ای که فقط تصویر غیرقابل جستجو از آن در اینترنت منتشر می‌شد، تبدیل به صفحه‌ایی با قابلیت جستجو در محورهای اصلی محتوا خواهد شد. نمونه درج نمایه‌های استخراج شده از متن، در فیلد نرم‌افزار را در زیر ملاحظه کنید:

اثر دیگر این فعالیت اینکه می‌توان به‌طور خودکار، نقشه موضوعی از محتوای پایگاه به‌دست آورد. صفحه زیر نمونه‌ایی از نقشه موضوعی پایگاهی است که فقط به عنوان صفحه اکتفا نکرده و بر صفحه نمایه نیز زده است:

امید است احیاء‌گران بزرگوار نسخ خطی، برای نزدیک‌تر شدن به هدف احیاء این آثار ارزشمند، برنامه و تدبیرِ نمایه‌‌زنی بر متن را نیز با جدیت دنبال کنند و ضرورت نمایه بر متن را از محورهای پروتکل استاندارسازی نشر نسخ خطی در فضای الکترونیک قرار دهند.

شیخ عبدالحمید واسطی

مدرس و محقق حوزه علمیه مشهد مقدس

طراح و مدیر سایت‌های سه‌گانهٔ علوم و معارف اسلام

www.maamrefislam.com (فارسی)

www.maarefislam.org (عربی)

www.maarefislam.net (مکتوبات خطی)[۲]

ربیع‌الاول ۱۴۲۷ هجری قمری


  1. سیستم‌های پیشرفته‌ انتشار روی وب، با قابلیت‌های جستجوی بالا نیز وجود دارند که در این مقاله تنها به این نرم‌افزار اکتفا می‌شود که نیاز به قابلیت‌های حرفه‌ایی نیز ندارد و تمام افراد می‌توانند با مختصر آموزشی، به نحو احسن مطالب خود را در اینترنت منتشر کنند.[]
  2. برای رؤیت تاثیر این فرآیند بر سیستم‌های جستجوی اینترنتی، کلیدواژه‌های عامی مانند معاد، روح، ولایت،‌ توحید، امامت، ملکوت، اسلام، معارف را در جستجوگر گوگل وارد نمایید تا در اولین گزینه یا گزینه‌های موجود در صفحه اول، نشانی و محتوای این سایت‌ها مشاهده شوند. با این فرآیند، تقریبا در تمام زمینه‌های علوم و معارف اسلام و زمینه‌های علوم مرتبط با این فضا، کلیدواژه‌های جستجوگران، ربطی به این سایت پیدا می‌کنند و دروازه این سایت‌ها بر اکثر فضاهای معرفتی گشوده شده است.[]

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.