بسم الله الرحمن الرحیم
احیاء نسخ خطی را یک گام به پیش ببریم.
(ایجاد امکان جستجوی الکترونیکی در محتوا، با نمایهزنی بر متن)
چکیده:
احیاء نسخ خطی توسط کتابخانهها و اشخاص، در مرحلهٔ شناسائی و ثبت و ردهبندی آنها متوقف شده است. تمام تلاش احیاءگران به هدفِ استفاده از محتوا صورت میپذیرد که امروزه زمینه دسترسی به محتوا، فقط با بررسی تمامِ متن بهصورت مستقیم، میسور است. لکن با استفاده از روش نمایه بر متن، میتوان امکان جستجو در محتوای کتب خطی را فراهم ساخت و نقاط نفوذ برای آگاهی از محتوا، را گسترش داد.
کلیدواژهها: کتابخانه دیجیتال، نسخ خطی، امکان جستجو، تحلیل محتوا، نمایه بر متن
مقدمه:
حجم عظیم نسخههای خطی در کتابخانهها، اعجابآور است. انبوهی از اطلاعات و معارف، دفن شده است که عمق و دقت مولفانِ قدیم، حسرت انسان را نسبت به این دفینة گرانبها صد چندان میکند. احیاءگران بزرگوار نسخ خطی، تلاشی طاقتفرسا برای حفظ و نگهداری و ثبت این آثار نمودهاند و این مجموعههای نفیس را تا به امروز رسانیدهاند. اما برای چه مقصود و منظوری؟ آیا به هدفِ ایجاد موزههای تصویری یا به هدفِ انتقال محتوای کتابها به نسل امروز و فرداها؟!
امروز یک محقق برای کشف معارف و اطلاعاتِ موجود در منابع خطی، باید ابتدا به فهرستنامههایی که از این کتابها منتشر شده است مراجعه کند و از روی عناوین کتابها، احتمالاتی را نسبت به اطلاعات مورد نظر خود داده و کتاب یا کتابهایی را انتخاب کند و سپس بهصورت فیزیکی به محل نگهداری این منابع مراجعه نماید، تاییدیههای لازم برای در اختیار گرفتن کتابها را ارائه دهد و پس از عبور از موانع متعدد، وقتی به کتاب دست یافت، خود را با صفحاتی انبوه روبرو ببیند که یافتن مطلب در آن ساعتها و روزها دقت و موشکافی میطلبد. و اگر کتابهای متعددی را در نظر گرفته باشد که باید رحل اقامت در آن کتابخانه انداخته و با بررسی منابع روزها را به شب رساند.
تلاش ارزشمند کتابخانهها و شخصیتهای علمی و فرهنگی و فنی، برای الکترونیکی کردن کتابخانههای چاپی و خطی، و توفیقهایی که قدمبهقدم باید حاصل شود، سبب حذف بسیاری از موانع گشته و منابع را مستقیم در اختیار محقق قرار میدهد. سیستمهای جستجو، روز به روز قویتر شده و ارزش خود را برای دستیابی به حداکثر اطلاعاتِ مرتبط با بیشترین قابلیت مقایسه، آشکار میکنند. قدرت تمرکز محققینی که براساس روشهای تحلیل محتوا عمل میکنند بالا رفته است. اما تمام این قابلیتها فقط در فضای منابع چاپی است آنهم در مواردی که بهقالب الکترونیکی تبدیل یا از ابتدا در آن قالب تولید شدهاند و آنهم فقط بهصورت جستجوی لفظی و نَه موضوعی.
در منابع چاپی و خطیایی که فقط به صورت تصویر در محیط الکترونیکی منتشر میشوند، در زبان فارسی، نرمافزاری که قابلیت جستجو در متن را ارائه دهد، هنوز تکمیل و کارآمد نشده است و در زبان انگلیسی نیز هنوز فراگیر نگشته و اطلاعات تصویری منتشره در اینترنت کمتر حاوی این قابلیت هستند، که امیدواریم هر چه زودتر این ابزار فراهم شود و جهشی واقعی در دستیابی به محتوای علوم و معارف بشری صورت گیرد.
لکن، چه این نرمافزار کارآیی لازم بیابد چه نیابد، نیاز به جستجوهای غیرلفظی برای رسیدن به نتایجی با حداکثر ارتباط به موضوعِ جستجو، همیشه باقی است. این نیاز با تکنیک نمایهزنی بر متن برطرف میشود.
ضرورت تحلیل موضوعی نسخ خطی
تکنیک نمایهزنی بر متن، هر پاراگراف از متن را در کلیدواژههایی فشردهسازی میکند و جوهره و روح مطلب را در قالب چند کلمه بهصورت عبارت یا عنوان بیان میکند و بدین وسیله نقطه نفوذهای موضوعی را در محتوا ایجاد میکند.
در کتب چاپی به سبب وجود فهرست و سرصفحهها و بخشبندی و فصلگذاریها و پاراگرافبندیها و توپر کردنِ برخی کلمات، میتوان تا حدودی بافت متن را تفکیک کرده و تشخیص داد و فضاهای موضوعی را بهدست آورد. و البته این کار در حجم محدود و با صرف زمان انجام پذیر است، کافی است حجم صفحات زیاد شود یا مولف دارای تالیفات متعدد باشد و بخواهیم نظر مولف را نسبت به موضوعی بهدست آوریم آنگاه خواهیم دید که عملیات فردی و فیزیکی طاقتفرسا خواهد شد.
برای کشف شبکه موضوعات در یک تالیف یا هندسه فکری یک مولف در مجموعه تالیفات، تحلیل محتوای تمام متن لازم است که با تکنیک نمایهزنی بر متن، این مهم به نقطه قابل استفادهایی میرسد.
در کتب خطی، بهسبب نبود فهرست و فصلبندی و سرصفحه و پاراگرافبندی، کشف فضاهای موضوعی نیازمند مطالعه دقیق تمام متن است. عملیات جستجوی لفظی در تصاویر نیز فعال نیست تا بتوان با حدس و احتمالاتی که از نتایج جستجوی لفظی بهدست میآید قدری به فضاهای موضوعی نزدیک شد.
اگر کتابخانهها و مجموعهدارانی که زحمت ارزشمندِ ثبت و ردهبندی آثار خطی را متحمل هستند و اهمیت انتشار الکترونیکی آنها را نیز اذعان داشته و در تلاش برای آمادهسازی نسخ خطی بهجهت نشر در فضای الکترونیکی هستند، مرحلهٔ نمایهزنی را به فعالیتهای خود بیفزایند، تحولی بزرگ در احیاء حقیقی نسخ خطی صورت خواهد گرفت و کتابهایی که بهمانند جعبة سیاه شدهاند و تنها نمایی از آنها دیده میشود، به لایههای اصلی فضای تحقیق و علم وارد شده و در گردش و تولید فکر در جامعه سهیم خواهند شد.
شیوه عمل در فضای الکترونیکی
قدم اول:
نرمافزارهای جستجو در فضای اینترنت، رفتارهای خاصی را دنبال میکنند که عمدتا تابعی از منطق طبیعی و ساختارهای حاکم بر فضای تالیف و نگارش است.
یک مولف، بهطور منطقی و طبیعی، پس از عنوانِ تالیف که بیشترین ضریب را در کشف موضوع بحث دارد، بخشها و سرفصلهای تالیفش را هماهنگ با موضوعِ مورد نظر تنظیم میکند و در هر قسمت از متن، نقطه مرکزیی را انتخاب کرده و حول و حوش آن، مطالب را پردازش میکند. و در پردازش مطالب از مفاهیم خاصی استفاده میکند که محورهای اصلی توصیف و توضیح او هستند. فلسفه توجه کتابداران به مفهومِ “چکیده” و “واژگان کلیدی” و رواج آن در فضای علمی معاصر، ناشی از همین روند منطقی حاکم بر تالیف است.
نرمافزارهای الکترونیکی، در صورتی موفق عمل خواهند کرد که بیشترین تطبیق را با عملکرد طبیعی ذهن منطقی، داشته باشند. بر این اساس طراحان سیستمهای جستجو، در جستجوهای هوشمند و موضوعی، بهسوی طراحی حداقل چهار لایه در تحلیل محتوای متن گرایش پیدا کردهاند:
عنوان هر قسمت (Titel)
توصیفِ هر قسمت (Page Discription)
واژگان کلیدی در هر قسمت (Keywords)
جایگاه و ارتباط این قسمت با کل مجموعه (Categories)
نمونه این قسمتبندی را در تصویر زیر ملاحظه میکنید که برگرفته از نرمافزار Front Page است که از نرمافزارهای رایج در طراحی صفحات وب و رایجتر در هنماهنگی با سیستمهای جستجوی اینترنتی است: [۱]


در صورتی که ناشران الکترونیک، از منطق موجود در این برنامهها پیروی کنند و برای هر یک از صفحات، فیلدهای موجود را پُر کنند، جستجوگران را یک قدم به نفوذ به متن نزدیک میکنند. اما این مقدار کافی نیست و با انجام یک حرکتِ دیگر، دروازههای بزرگی را برای نفوذ به متن میتوان گشود.
قدم دوم:
نرمافزارهای جستجو در اینترنت، بیشترین ضریب اهمیت را برای عنوانِ صفحات (Title) قائل هستند و ابتدا به این فیلد مراجعه میکنند.
آنچه قدم بعدی را در نفوذ به متن برمیدارد مرحلهبندی و ساختارسازی در عنوان است. توضیح اینکه:
هر عنوانی در طبقهبندی علوم، دارای جایگاه و مرحلهای است و همچنین دارای زیرشاخهها و محورهای فرعی است. اگر در ارائه یک عنوان فقط به آن عنوانِ خاص اکتفا نشود و سرشاخهها و زیرشاخههای آن نیز تعیین و ثبت شود، محتوای صفحه در تمام این عناوین قابل بازیابی است. فلسفه نمایهزنی بر محتوای اسناد و مدارک نیز بازیابی حداکثر مطالب موجود در محتوا بوده است. به مثال زیر که از پایگاه علوم و معارف اسلام به نشانی www.maarefislam.net اخذ شده است توجه کنید:


این حرکت در نشر غیر خطی نیز ضروری است. به نمونه زیر توجه فرمایید:

در صورتیکه دستاندرکاران نسخ خطی و نشر الکترونیک آنها، این قدم را نیز در فعالیت احیاگری خود منظور کنند و هر صفحهایی که روند تبدیل به فرمت الکترونیکی را میگذراند، توسط محققِ مرتبط با موضوع، ساختاردهی و نمایهزنی شود و این ساختار و نمایه در فیلدهای نرمافزاری که محتوا توسط آن منتشر خواهد شد درج گردد، صفحهای که فقط تصویر غیرقابل جستجو از آن در اینترنت منتشر میشد، تبدیل به صفحهایی با قابلیت جستجو در محورهای اصلی محتوا خواهد شد. نمونه درج نمایههای استخراج شده از متن، در فیلد نرمافزار را در زیر ملاحظه کنید:

اثر دیگر این فعالیت اینکه میتوان بهطور خودکار، نقشه موضوعی از محتوای پایگاه بهدست آورد. صفحه زیر نمونهایی از نقشه موضوعی پایگاهی است که فقط به عنوان صفحه اکتفا نکرده و بر صفحه نمایه نیز زده است:

امید است احیاءگران بزرگوار نسخ خطی، برای نزدیکتر شدن به هدف احیاء این آثار ارزشمند، برنامه و تدبیرِ نمایهزنی بر متن را نیز با جدیت دنبال کنند و ضرورت نمایه بر متن را از محورهای پروتکل استاندارسازی نشر نسخ خطی در فضای الکترونیک قرار دهند.
شیخ عبدالحمید واسطی
مدرس و محقق حوزه علمیه مشهد مقدس
طراح و مدیر سایتهای سهگانهٔ علوم و معارف اسلام
www.maamrefislam.com (فارسی)
www.maarefislam.org (عربی)
www.maarefislam.net (مکتوبات خطی)[۲]
ربیعالاول ۱۴۲۷ هجری قمری
- سیستمهای پیشرفته انتشار روی وب، با قابلیتهای جستجوی بالا نیز وجود دارند که در این مقاله تنها به این نرمافزار اکتفا میشود که نیاز به قابلیتهای حرفهایی نیز ندارد و تمام افراد میتوانند با مختصر آموزشی، به نحو احسن مطالب خود را در اینترنت منتشر کنند.[↩]
- برای رؤیت تاثیر این فرآیند بر سیستمهای جستجوی اینترنتی، کلیدواژههای عامی مانند معاد، روح، ولایت، توحید، امامت، ملکوت، اسلام، معارف را در جستجوگر گوگل وارد نمایید تا در اولین گزینه یا گزینههای موجود در صفحه اول، نشانی و محتوای این سایتها مشاهده شوند. با این فرآیند، تقریبا در تمام زمینههای علوم و معارف اسلام و زمینههای علوم مرتبط با این فضا، کلیدواژههای جستجوگران، ربطی به این سایت پیدا میکنند و دروازه این سایتها بر اکثر فضاهای معرفتی گشوده شده است.[↩]