الخميس، 8 يناير، 2009

إطلالة على محركات البحث.. مع تركيز على كيفية استخدام محرك البحث جوجل بفاعلية

بدهي أن نقول إن الإنترنت لن تكون ذات فائدة كبيرة بالنسبة لنا لو لم تكن محركات البحث موجودة. فمحركات البحث تصنف المعلومات وتجمعها وتضع لها علامات تيسر لنا الحصول على المعلومة في ثوان معدودة. يوجد على إنترنت اليوم تريليونات الصفحات، وحسب المصادر المتوفرة فإنه قد تم حتى اليوم فهرسة ما يزيد قليلا على عشرة بلايين صفحة. وتتسابق الشركات التي تقوم بفهرسة هذه الصفحات في إتاحتها لمستخدمي إنترنت، والحفاظ على سرعة الاستجابة التي يحصل عليها المستخدم. وإضافة إلى السرعة فإن على قواعد البيانات هذه أن تثبت وجودها بتقديم أجوبة "طازجة"، ومتناسقة، وذات علاقة بما يبحث عنه المستخدم.

في بادئ الأمر، كانت محركات البحث عبارة عن أدلاء تقوم بفهرسة مواقع الإنترنت الجديدة، وقد كان ذلك فعالا عندما كان حجم إنترنت يقدر بملايين الصفحات، غير أن الإنترنت تطورت، وانضم إليها الملايين من مؤسسات القطاع الحكومي والقطاع الاقتصادي الخاص والقطاع الثالث (منظمات المجتمع المدني)، ومليارات الصفحات المرتبطة بالأشخاص والمنظمات والأفكار والأشياء، وغير ذلك من المعلومات. ومع هذا النمو أصبح من الضروري، بل ومن الحتمي إضافة محرك بحث فعال؛ يقوم بفهرسة وتصنيف المعلومات الموجودة ضمن هذه المواقع كي تتمكن من خدمة زوارها بشكل فعال. واليوم، هناك العشرات من الشركات التي تعمل في مجال إنتاج التطبيقات، والتقنيات، وأساليب البحث الجديدة الموجهة لخدمة الإنترنت وغيرها من الشبكات الخاصة (إنترانت).

كيف تعمل محركات البحث
تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الويب، والتي تحصل عليها من الإنترنت بواسطة تطبيقات زاحفة Crawlers تتبع كل رابط تتعرف عليه. بعد ذلك يجري تحليل كل صفحة لتحديد كيف ينبغي فهرستها؛ حيث يتم استخلاص الكلمات من العناوين ورؤوس الموضوعات أو حقول خاصة تعرف بـ"ميتا تاجز" (حقول لا تظهر للقارئ لكن تقرأها زواحف محركات البحث). وبعد ذلك يجري تخزين هذه البيانات في قاعدة بيانات تستخدم في عمليات البحث لاحقا.

بعض محركات البحث، مثل جوجل، تخزن كل أو بعض الصفحة المصدر، وتشير لها باعتبارها (صفحة مختفية Cached)، وبعضها تخزن كل كلمة من كل صفحة تجدها. هذه الصفحة المختفية تمسك بنص البحث الفعلي بما أنه هو الذي تمت فهرسته فعليا، لذا فقد تكون مفيدة جدا عندما يكون محتوى الصفحة الحالية قد جرى تحديثه ولم تعد ألفاظ البحث فيه.
عندما يتوجه مستخدم الإنترنت لمحرك البحث طلبا للمعلومات عبر استخدام كلمات مفتاحية، يقوم محرك البحث بالتفتيش في الفهرس، ويقدم للمستخدم قائمة بأكثر صفحات الإنترنت توافقا مع الكلمات التي بحث بها؛ ووفق معايير محرك البحث نفسه؛ ويرفقها بملخص قصير يحتوي على عنوان الوثيقة وأحيانا أجزاء من النص. وعندما نتحدث عن معايير المحرك فإن هذا يعني أن هناك تفاوت بين محركات البحث.
فقيمة أو فائدة أي محرك بحث تعتمد على مدى صلة النتائج التي يفيد بها المستخدم. ومن بين الملايين من الصفحات التي تحتوي على الكلمة أو العبارة المبحوث بها، نجد أن بعضها أوثق صلة بالموضوع من غيرها. ولهذا، فإن معظم محركات البحث توظف أساليب لوضع مراتب النتائج لتقدم أفضل النتائج قبل غيرها من النتائج التي تقل فيها الصلة. والكيفية التي يقرر بها محرك بحث أي الصفحات هي الأفضل تختلف بشكل شاسع من محرك لآخر؛ كما أن الأساليب والتقنيات أيضا تتطور عبر الزمن.
وينبغي أن نلفت إلى أن كثيرا من محركات البحث تعتمد على المضاربات التجارية التي يدعمها عائد إعلاني، حيث يوظف البعض الممارسة المثيرة للجدل بالسماح للمعلنين بدفع النقود ليرفعوا لهم قوائهم في مراتب نتائج البحث.

مشكلات تتعلق بمحركات البحث وطرق تلافيها 
إن مفتاح النجاح في الحصول على نتائج بحث جيدة، تكمن في نوعية العبارات، أو الكلمات المفتاحية أو الاستفسارات، أو الأسئلة التي نقوم بإدخالها في محركات البحث. لكن المشكلة الأساسية هنا تكمن في أن الغالبية العظمى من المستخدمين لا يقومون عادة بإدخال الاستفسارات أو الكلمات المفتاحية الصحيحة، والتي تؤدي إلى الحصول على النتائج المطلوبة، وسنستعرض فيما يلي عدد من الأخطاء في عالم البحث عن المعلومات، والطرق التي يحاول بها الباحثون معالجة هذه المشكلات.

أ - التباسات الكلمات المفتاحية: بعض مستخدمي محركات البحث يستخدمون كلمات مفتاحية Key Words تحمل أكثر من معنى، ومعظم محركات البحث المستخدمة اليوم تقوم بمطابقة الكلمات عينها لا معانيها، ولذلك فإن نتائج عمليات البحث التي نحصل عليها عبر الكلمات المفتاحية الملتبسة تحتوي غالبا على الكلمات المفتاحية الصحيحة، ولكنها ذات المعنى الخاطئ. فإذا جربت مثلا أن تبحث عن معنى كلمة الأزهر باللغة الإنجليزية ستجدها تترجم إلى أزهار (Azhar). وفي هذه الحالة لابد من البحث عن حل بديل يقوم على خطوتين: أولاهما البحث عن الكلمات المفتاحية نفسها في المصادر المستهدفة؛ فننظر كيفية كتابتها؛ وفي حالة الأزهر وجدنا أن بعض المصادر تستخدمها (Al Azhar, Al-Azhar). وعلى من يرغب في اختبار كلمات مفتاحية فعالة فعليه أن يختبرها ليخرج بقائمة من الكلمات الفعالة.
ب - عدم طرح الأسئلة الصحيحة: من الأمور التي يؤكدها خبراء نظم المعلومات كأسباب وراء إخفاقات محركات البحث أن كثير من المستخدمين لا يطرحون الأسئلة التي تعبر عما يريدونه فعلا. والسبب الأساسي في ذلك هو الافتقار إلى الفهم الصحيح للموضوع قيد البحث، وبالتالي عدم استخدام الكلمات المفتاحية الصحيحة، والتي تؤدي إلى تكوين استعلامات وأسئلة صحيحة.
ومعالجة هذه المشكلة تتمثل في مساعدة المستخدمين على طرح الأسئلة الصحيحة وتكوين الاستعلامات الملائمة. ومن مظاهر هذه المشكلة أيضا هي صغر حجم الاستعلامات التي يكونها المستخدم عادة للاستفسار عن موضوع معين. فإذا كان مستخدم ما يريد معلومات عن "السفر" مثلا، فإنه يبدأ بإدخال كلمة عامة في محرك البحث، ومن ثم، واعتمادا على النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثه إلى أن يصل إلى ما يريده. والسبب في أن العديد من مستخدمي إنترنت يستعملون هذا الأسلوب يكمن في أنهم لا يعرفون حقا الحجم المهول للمعلومات الموجودة في قواعد البيانات الخاصة بمحركات البحث، والتي تفوق عادة ما يمكن لأي إنسان التعامل معه.
ج - الموازنة بين الكم والنوع: عند التعامل مع تقنيات البحث فلا بد من الموازنة بين الكم والنوع، أو ما يدعوه الخبراء بالدقة والقدرة على الاسترجاع. وهي علاقة عكسية تماما، فكلما تم تضييق نطاق البحث سعيا عن نتائج أكثر دقة، كلما قل مقدار البيانات التي يمكن استرجاعها. ولذلك فإن ثمة حاجة لوجود محركات بحث تقدم دقة عالية دون التضحية بمقدار النتائج "الدقيقة" التي نسترجعها. وفي هذا الإطار تجدر الإشارة إلى أن دقة محركات البحث تتعلق بنوعيتها بقدر ما تتعلق بارتفاع درجة فهم المستخدم لطبيعة الموضوع الذي يبحث عنه، أو حتى مدى دقة قائمة الكلمات المفتاحية التي يعتمد عليها في بحثه، وهو ما ينتقل بنا للحديث عن درجة دقة محركات البحث انطلاقا من تصنيفها.

تصنيف محركات البحث 
هناك معايير كثيرة لتصنيف محركات البحث، أغلبها معايير فنية، لكننا في هذا الإطار سنقدم المعلومات التي تفيد المستخدم العادي في الحصول على المعلومة التي يريدها من دون الدخول في تفاصيل فلسفة عمل المحركات.
أ - محركات البحث العامة: وهي محركات تتسم بالعمومية في منهج بحثها، ولا تدخل في المواقع التي تتطلب مستويات خصوصية عالية مثل شبكات التواصل الاجتماعي، وتكتسب شهرتها من قدرتها على فهرسة أكبر قدر من النتائج، ويتم استخدامها على نطاق واسع يحدد شهرتها. وأبرز هذه المحركات وأكثرها شعبية على الإطلاق محرك بحث جوجل Google، يليه محرك بحث ياهو Yahoo، يليهما محرك بحث بينج Bing. وهناك عدد كبير من المحركات الهامشية التي لا تتمتع بميزة كبيرة مقارنة بهذه المحركات الثلاث، وبعض هذه المحركات إقليمي لا يعمل خارج حدود الدولة التي يتخصص فيها مثل محرك Go.
ويأتي ترتيب محرك بحث جوجل الأول عالميا؛ بسبب فلسفته العالية في البحث والتصنيف والاستدعاء، فضلا عن كونه متاحا بأكثر من 80 لغة يعمل فيها بكفاءة عالية لا تتاح لنظيريه ياهو وبينج، بالإضافة لقدرته العالية على التكيف مع سعة وسرعة الاتصال المتوفر لدى مستخدم الإنترنت؛ حيث يوفر نسخة قياسية للمستخدمين ذوي السرعة العالية؛ ونسخة هتمل HTML للمستخدمين ذوي السرعات البطيئة، هذا بالإضافة لارتباطه بشبكة اجتماعية قوية هي Google+.
ب - محركات البحث العامة: وهي محركات تنشئها شركات معينة للبحث في قواعد البيانات الداخلية الخاصة بها، أو للبحث في نطاق معين يغلب عليه التخصص، أو يغلب عليه التزامه بإطار خصوصية ينغلق دون المحركات العالمية. وأبرز هذه المحركات محرك Foupas المتخصص في البحث في شبكة فيسبوك. وثمة محرك Zotero المتخصص في البحث العلمي. وثمة محرك Mobilesign المتخصص في لغة الإشارة؛ والذي يضم في قاعدة بياناته أكثر من 5000 مقطع فيديو تفسر المصطلحات العامة للغة المنطوقة بلغة الاشارة. وهناك أيضا محرك pogofrog المتخصص في البحوث الطبية. ولا نفوت محرك Ebookbrowse المتخصص في استعراض الكتب الإليكترونية.

ملحوظات لاستخدام محرك بحث جوجل بفاعلية 
يعد محرك البحث جوجل أقوى محركات البحث العام، وزيارة واحدة لأحد مواقع قياس أداء المواقع مثل موقع Alexa.com تبين لك مرتبة هذا المحرك مقارنة بغيره من المحركات. وهناك عدة طرق لتفعيل البحث عبر هذا المحرك للوصول إلى نتائج أكثر دقة وأكثر ارتباطا بمراد الباحث على هذا المحرك، ومن هذه الطرق اخترنا المجموعة التالية:
أ – الحصول على البدائل: جوجل يبحث عادة عن الصفحات التي تحتوي على جميع الكلمات التي يتم كتابتها في مربع البحث، ولكن إذا كنت ترغب في الصفحات التي تحتوي على مصطلح واحد أو آخر (أو كليهما)، استخدم كلمة or الإنجليزية لكي تتيح لك البحث عن أي من الكلمتين من دون استعراض النتائج التي تظهر بها كل كلمة على حدة.
ب – الاقتباس: إذا كنت ترغب في البحث عن عبارة بالتحديد فمن الأفضل أن تستخدم علامات الاقتباس. إذا قمت بكتابة عبارة (شيخ الأزهر يلتقي) فقط بدون علامات اقتباس فسوف يعرض لك ملايين النتائج التي تتعلق بكل كلمة على حدة من كلمات العبارة، أما إذا بحثت بإضافة علامات اقتباس ("شيخ الأزهر يلتقي")، فسوف تحصل على النتائج التي تتضمن هذه العبارة فقط دون غيرها من التراكيب.
ج – البحث في موقع محدد: لهذا الغرض يمكنك استخدام كلمة موقع بالإنجليزية على النحو المحدد بين الأقواس (Site:)، ثم تكتب بعدها رابط الموقع بدون ترك مسافة، وتترك مسافة ثم تكتب الكلمة التي تريد البحث عنها. مثال: (www.alazhar.gov.eg:Tayyeb)، سوف يجلب لك كل النتائج عن الطيب في هذا الموقع فقط.
د – أنواع الملفات: ففي حالة البحث عن ملفات من نوع معين مثل PDF أو مستندات Word أو جداول بيانات Excel؛ في هذه الحالة يمكن استخدام أمر ":filetype". وبعدها اكتب الكلمة التي تريد البحث عنها، مثال (PDF:Azhar) أو(DOC:Azhar).
هـ - المصطلحات الغير مرغوبة: إذا كان مصطلح بحثك يحتمل أكثر من معنى؛ مثل كلمة جامعة (مؤسسة الأزهر) أو (جامعة الأزهر)، وتريد أن تستبعد نتائج كلمة جامعة؛ فيمكنك تركيز بحثك عن طريق وضع علامة الطرح "-" أمام الكلمات المرتبطة بالمعنى الذي تريد تجنبه. فعلى سبيل المثال؛ يمكنك العثور على صفحات حول الأزهر كمشيخة وليس جامعة بالطريقة التالية: (الأزهر –جامعة).
و – النتائج المماثلة: إذا أردت توسيع نطاق بحثك للحصول على نتائج مماثلة قد لا تكون أدخلتها في مربع كلمات البحث فما عليك سوى وضع علامة (~). مثال (مشيخة الأزهر~) سوف يتيح لك الحصول على كل النتائج المرتبطة بمؤسسة الأزهر والطرق الصوفية والكنائس المشيخية.
ز – التعريفات: للحصول على تعريف قاموسي أو اصطلاحي لمفهوم معين يمكنك استخدام كلمة (:definition) للحصول على تعريف سريع. فعلى سبيل المثال؛ (definition: Azhar] يوفر لك مجموعة كاملة من التعريفات من مصادر وروابط مختلفة أولها سيكون من قواميس الدلالات أو الموسوعات.
ح - البحث عن عبارة كاملة لا تتذكرها بالضبط: يمكنك استخدام الرمز (*). مثال: لو أنك نسيت عنوان المحاضرة في عبارة (الإمام الأكبر يلقي محاضرة مهمة عن فلسفة الأخلاق عند متصوفة مصر في الدولة العباسية)؛ يمكنك البحث هكذا (الإمام الأكبر يلقي محاضرة مهمة عن الأخلاق * العباسية)؛ وسيأتي لك المحرك بالعبارة كاملة.
ط - النسخ المخبأة من الصفحات: بعض المواقع تزيل صفحاتها بعد فترة من الزمن. وللحصول على نسخة مخبأة من صفحة ما قام جوجل بتخزينها على الخوادم الخاصة به؛ يمكنك استخدام الأمر (cached:).
ومن نافلة القول أن نشير إلى أن الاستعمال المتكرر لهذه النصائح يؤدي لزيادة خبرتك مع جوجل، وربما تكتشف بعض الحيل الجديدة التي تساعدك على البحث بشكل أفضل بدلا من تبعثر النتائج والوصول في النهاية إلى سراب.
وتقبلوا فائق التقدير،،