What is search engine and how it works? { सर्च इंजन क्या है और कैसे काम करता है? }

What is search engine and how it works? { सर्च इंजन क्या है और कैसे काम करता है ?}

सर्च इंजन ऐसे कम्प्यूटर प्रोग्राम होते हैं, जो किसी कम्प्यूटर सिस्टम पर भण्डारित (Stored) सूचना में से वांछित सूचना को ढूँढने हेतु प्रयुक्त होते हैं।

Search Engine (सर्च इंजन) :- ऐसे कम्प्यूटर प्रोग्राम/सॉफ्टवेयर होते हैं जो वर्ल्ड वाइड वेब पर भण्डारित सूचना में से वांछित सूचना (Stored Information में से required Information) को सर्च करने हेतु प्रयुक्त होते हैं। सर्च इंजन web based सॉफ्टवेयर होते हैं जो इंटरनेट उपयोगकर्ताओं (Internet users) को WWW (वर्ल्ड वाइड वेब) पर स्थित किसी भी जानकारी को प्राप्त करने हेतु प्रयुक्त होते हैं| वर्ल्ड वाइड वेब पर मौजूद जानकारियों को सर्च इंजन Keyword के जरिए ढूँढ़ते हैं। सर्च इंजन एक ऐसी सर्विस (Service) है, जिसे यूजर इंटरनेट के माध्यम से एक्सेस कर सकता है।

Search Engine (सर्च इंजन) :- इंटरनेट का ऐसा उपयोगी टूल (tool) होता है जिसके द्वारा बहुत सारी अलग-अलग वेबसाइटों से यूजर अपने लिये उपयोगी जानकारी प्राप्त करते हैं एवं Search Engine द्वारा अलग-अलग वेबसाइटों को एक्सेस भी कर सकते हैं। Search Engine (सर्च इंजन) के माध्यम से इंटरनेट को access करना बहुत आसान है। इसके माध्यम से इंटरनेट पर किसी भी वेबसाइट को आसानी से access (एक्सेस) कर सकते हैं।

Working of Search Engine (सर्च इंजन की कार्यप्रणाली)

सर्च इंजन ऐसा कम्प्यूटर प्रोग्राम है जो वर्ल्ड वाइड वेब पर मौजूद जानकारियों (Informations) को विभिन्न प्रकार के Keywords के जरिए ढूँढने हेतु प्रयुक्त होता है। यूजर जब कोई कीवर्ड सर्च बॉक्स (Search Box) में enter करके submit करता है तो सर्च इंजन उस की-वर्ड से जुड़ी जानकारियों को खोजकर व्यवस्थित तरीके से SERP (Search Engine Result Page) पर दिखाता है। प्रत्येक सर्च इंजन के कार्य करने का तरीका अलग-अलग होता है। प्रत्येक सर्च इंजन का एक Secreat (गुप्त) Mathematical formula होता है, जो Algorithm (एल्गोरिथम) कहलाता है। किसी Result page पर किसी भी वेबसाइट की रैकिंग कितनी होगी। यह एल्गोरिथम के माध्यम से ही निर्धारित होता है अर्थात्  एल्गोरिथम यह तय करता है कि सर्च करने पर कौनसी वेबसाइट सबसे पहले एवं कौनसी वेबसाइट सबसे बाद में दिखाई देगी। Search Engine वर्ल्ड वाइड वेब पर सूचनाओं को सर्च करने के लिए Boolean Operator (AND, OR, NOT) का प्रयोग करते हैं। 58 सर्च इंजन के पास ऐसे automatic programs होते हैं, जो इंटरनेट पर मौजूद विभिन्न वेबसाइट एवं वेबपेजेज को Visit करके जानकारियों को व्यवस्थित तरीके से अपने Database (डेटाबेस) में store (स्टोर) करता है, ताकि आवश्यकता पड़ने पर इन्हें आसानी से ढूँढ़ा जा सके।

नोट:-

  1. Search Engine (सर्च इंजन) का मुख्य कार्य अलग-अलग Web Pages पर जाकर विभिन्न प्रकार की जानकारियों को खोजना, उन्हें organise करना और Content की quality के अनुसार उन्हें Ranking प्रदान करना होता है
  2. किसी भी सर्च इंजन की प्राथमिकता यूजर को सही जानकारी शीघ्रता से उपलब्ध कराना है।

सर्च इंजन कार्य करने हेतु निम्नलिखित Step का प्रयोग करता है—

  1. Crawling

किसी भी सर्च इंजन के कार्य करने का प्रथम चरण क्राउलिंग Crowling होता है। क्राउलिंग ऐसी प्रक्रिया (Process) है जिसमें कुछ automatic प्रोग्राम इंटरनेट पर उपलब्ध विभिन्न वेबसाइटों को Visit करके उन वेबसाइटस का डाटा एकत्रित करके इस डाटा को लाकर अपने database में स्टोर कर देते हैं। ऐसे automatic program जो वर्ल्ड वाइड वेब पर घूम-घूमकर विभिन्न वेबसाइटस का डाटा Collect करते हैं, ये प्रोग्राम Crawler, bot या Spider कहलाते हैं। हैं तो ये क्रॉलर (Crawler) जब किसी भी वेबसाइट को विजिट करते हैं।

निम्न प्रकार की सूचनाएँ एकत्रित करते हैं—

उस वेबवसाइट के विभिन्न Pages का title और उन पेजेज का Description. Website में कितने कब page है तथा Website के Pages को अपडेट (Update) किया गया है तथा कौनसा पेज नया जोड़ा गया है, किस Page को delete किया गया है। वेबसाइट के Page में image, Video, link उपलब्ध है या नहीं। वेबसाइट के किसी पेज में कौन-कौनसे Keyword प्रयोग में लिए जाते हैं। Crawler प्रत्येक सेकण्ड में सैकड़ों वेबसाइटस के पेजों को scan करता है। किसी पेज में उपलब्ध किसी भी लिंक के द्वारा यह दूसरे पेज पर पहुँच जाता है तथा ये पूरे इंटरनेट पर लगातार घूमता रहता है। क्राउलिंग जानकारियों को collect करने की प्रक्रिया है। इस प्रक्रिया द्वारा डाटा को लाकर डेटाबेस सर्वर में Collect किया जाता है

2. Indexing :- क्राउलिंग की प्रक्रिया द्वारा जो Data डेटाबेस में स्टोर होता है, उस डेटा को डेटाबेस में सूचीबद्ध करना इंडेक्सिंग (Indexing) कहलाती है। इंडेक्सिंग की Step में Crawl की गई विभिन्न प्रकार की सूचनाओं/जानकारियों को सही क्रम में व्यवस्थित (Arrange) करके सर्च इंजन के डेटाबेस में store किया जाता है, ताकि जब यूजर (user) इन्हें सर्च करे तो इन Informations को तेजी से यूजर को दिखाया जा सके। उदाहरण इस प्रक्रिया को समझने हेतु इसकी तुलना एक Book के Index page से की जा सकती है, जैसे किसी Book में कोई Specific Topic ढूँढ़ना है तो सर्वप्रथम पुस्तक (Book) की Index पर जाकर यह पता करते हैं कि वो Specific Topic कौनसे पेज पर है। इसी प्रकार गूगल भी एक इंडेक्स (Index) तैयार करता है जिसमें एक टेबल के फॉर्मेट में सभी Web pages की जानकारी को store करता है। Web Pages की जानकारी में पेज का title, description, Keywords, Internal-external, links आदि को स्टोर करता है।

3. Ranking :-

रैकिंग (Ranking) इस प्रक्रिया का सबसे अंतिम चरण (last step) है। इस स्टेप में यह निर्धारित किया जाता है कि किसी query या keyword सर्च करने पर Search Engine Result Page में कौन-कौनसे पेजेज दिखाई देंगे एवं किस क्रम में दिखाई देंगे। किसी Web Page का उसकी क्वालिटी एवं विश्वसनीयता के आधार पर उसका क्रम निर्धारित किया जाता है। सर्च इंजन में रैकिंग की प्रक्रिया को Implement करने हेतु Ranking algorithm का प्रयोग किया जाता है। रैकिंग एल्गोरिथम का मुख्य कार्य विभिन्न Pages को उनकी quality content के अनुसार रैंक करना होता है ताकि User को सही एवं सटीक सूचना (Information) उपलब्ध कराई जा सके।

Searching algorithm भी विभिन्न प्रकार की Steps को follow करता है, ये steps निम्नानुसार हैं

★ Search (सर्च) की गई query को समझना।

★ Search (सर्च) किए गए keyword या query को समझने के बाद इसे Index में store किए गए डेटा से match किया जाता है।

★ इंटरनेट पर किसी query से संबंधित Web Pages होते हैं, इन वेब पेजेज को उनकी quality के अनुसार Ranking प्रदान की जाती है तथा Search Engine Result Page (SERP) में सबसे बेहतर पेज का URL सबसे पहले दिखाया जाता है।

इस स्टेप में यूजर की extra Informations जैसे Location, Country, area, Search history आदि के अनुसार डाटा को फिल्टर किया जाता है ताकि जो Result मिले वो यूजर की requirement के अनुसार मिले। जब अन्त में जो Result दिखाया जाता है तो रिजल्ट यूजर के चाहे अनुसार दिखाया जाता है, इस Result में Text Content के साथ Images, Videos भी दिखाए जाते हैं।

नोट:- रैकिंग (Ranking) की प्रक्रिया में पेज की quality विभिन्न factors को ध्यान में रखते हुए decide की जाती है। ये Facters निम्नानुसार हैं — जिस की-वर्ड को search किया गया है, वो की-वर्ड पेज में कितनी बार Repeat होता है। वो वेबपेज एवं वेबसाइट कितनी विश्वसनीय है। वेवसाइट की स्पीड, यूजर एक्सपीरियंस आदि को भी ध्यान में रखा जाता है। किसी वेब पेज की जानकारी कितनी सही एवं सटीक है।

Types of Search Engine (सर्च इंजन के प्रकार) सर्च इंजनों को उनके कार्य करने के आधार पर निम्नलिखित Categories में बाँटा गया है—

  1. Crawler-Based Search Engine :

क्रॉलर बेस्ड सर्च इंजन वे सर्च इंजन है जो विशेष प्रकार के Computer Program जैसे Spiders, Crowlers या bots की मदद से चलते हैं। क्रॉलर बेस्ड सर्च इंजन को चलाने हेतु किसी व्यक्ति की आवश्यकता नहीं होती है। क्रॉलर बेस्ड सर्च इंजन द्वारा Crowling, indexing एवं Ranking steps को follow किया जाता है। इस प्रकार के सर्च इंजन Google, Yahoo, Bing, Duck Duckgo, Ask आदि हैं।

Web Directories Based Search Engine – इस प्रकार के सर्च इंजन में लोगों की एक team के द्वारा।

2. Directory Based Search Engine :

डायरेक्टरी बेस्ड सर्च इंजन वे सर्च इंजन होते हैं जिनमें सिर्फ ऐसी वेबसाइट दिखाई देती हैं जो लोगों की एक टीम द्वारा select की गई हो। इस प्रकार के Search Engine (सर्च इंजन) में कोई भी वेबसाइट स्वतः (automatically) show नहीं होती है।इस प्रकार के सर्च इंजन में कैटेगिरी के आधार पर वेबसाइट की एक लिस्ट दी जाती है। वेबसाइट किस विषय पर है इसका एक छोटा डिस्क्रिप्शन भी दिया जाता है। किसी वेबसाइट का ओनर इन डायरेक्टरीज में खुद अपनी वेबसाइट सबमिट कर सकता है। इस प्रकार के सर्च इंजन के उदाहरण Yahoo, DMoz (Directory Mozilla), BOTM आदि हैं।

3. Hybrid Search Engine :

हाइब्रिड सर्च इंजन ऐसे सर्च इंजन होते हैं जो Crawler/bots का इस्तेमाल तो करते ही हैं इसके साथ ही मानव द्वारा चयनित चीजों का इस्तेमाल भी करते हैं।

Leave a Comment