सर्च इंजन क्या है (What is search engine), सर्च इंजन के प्रकार (types of search engine), सर्च इंजन list, सर्च इंजन का इतिहास (Search Engine history), सर्च इंजन कैसे काम करता है (How Search Engine work)
आपने सर्च इंजन के बारे में तो सुना ही होगा लेकिन क्या आप जानते है सर्च इंजन क्या है और कैसे काम करता है। इस पेज पर सर्च इंजन से जुड़े सभी जानकारी हम आपको देंगे।
सर्च इंजन एक ऐसा tool है जिसकी मदद से हम इंटरनेट पर आसानी से किसी भी तरह की जानकारी प्राप्त कर सकते है। जब हम google पर कोई प्रश्न सर्च करते है गूगल server से जुड़कर उस प्रश्न से related बेस्ट answer हमारे सामने दिखाता है, जो एक सर्च इंजन है।
इंटरनेट पर लाखों, करोड़ो Website है जो किसी ना किसी के प्रश्न के answer समेटे हुए है और जब हम इंटरनेट पर कोई Question सर्च करते है किसी ब्राउज़र के माध्यम से जैसे (Chrome ,Firefox etc) तो सर्च इंजन उन लाखों Website को filter करके हमारे सामने हमारे Question से related बेस्ट वेबसाइट दिखाता है और हम उस वेबसाइट पर जाकर हमारे प्रश्न का उत्तर पाते हैं।
सर्च इंजन क्या है?- What is Search Engine in Hindi
सर्च इंजन एक ऐसा सॉफ्टवेयर है जिसके द्वारा इंटरनेट से इच्छा अनुसार सूचनाओं को खोजा जाता है सबसे पहले सर्च इंजन का निर्माण कार्य McGill University ने वर्ष 1990 में आरम्भ किया था।
जिसे WAIS (Wide Area Information Server) तथा Gopher ने मिलकर आगे बढ़ाया।इन्होंने इंटरनेट पर उपलब्ध सूचनाओं को क्रमबद्ध करने का कार्य किया. गोफर (Gopher) अविष्कार अमेरिका के मिनिसोटा नामक विश्वविद्यालय में हुआ था।
यह एक यूजर फ्रेंडली इंटरफेस है. जिसके माध्यम से यूजर इंटरनेट पर प्रोग्राम तथा सूचनाओं का आदान प्रदान कर सकता है. Gopher यूजर की इक्छानुसार सूचनाओं तथा प्रोग्राम को खोज पर यूजर के सामने प्रस्तुत करता है।
सर्च इंजन कैसे काम करते हैं (How Search Engine work)
उपयोगकर्ता को
उत्तर प्रदान करने के अपने तरीकों में खोज इंजन एक से दूसरे में भिन्न हो सकते हैं
लेकिन वे सभी 3 मूलभूत
सिद्धांतों पर बनाए गए हैं:
Crawling
इंटरनेट पर नए वेबपेजों की वास्तविक खोज क्रॉलिंग नामक प्रक्रिया से शुरू होती है। खोज इंजन वेब क्रॉलर (कभी-कभी बॉट या स्पाइडरबॉट कहा जाता है) नामक छोटे कार्यक्रमों का उपयोग करते हैं जो पहले से ज्ञात पृष्ठों से नए लोगों के लिंक का अनुसरण करते हैं जिन्हें खोजने की आवश्यकता होती है।
हर बार जब कोई
वेब क्रॉलर एक लिंक के माध्यम से एक नया वेबपेज ढूंढता है, तो वह स्कैन करता है और अपनी सामग्री को आगे की
प्रक्रिया (इंडेक्सिंग कहा जाता है) के लिए पास करता है और नए वेबपेजों की खोज में
जारी रहता है।
Indexing
एक बार जब बॉट्स डेटा को क्रॉल कर लेते हैं, तो यह अनुक्रमण का समय होता है - खोज इंजन के डेटाबेस में वेबपेजों से सामग्री को "इंडेक्स" के रूप में मान्य और संग्रहीत करने की प्रक्रिया। यह मूल रूप से सभी वेबसाइटों का एक बड़ा पुस्तकालय है।
खोज इंजन परिणाम पृष्ठ पर प्रदर्शित होने के लिए आपकी वेबसाइट को अनुक्रमित करना होगा। ध्यान रखें कि क्रॉलिंग और इंडेक्सिंग दोनों निरंतर प्रक्रियाएं हैं जो डेटाबेस को ताज़ा रखने के लिए बार-बार होती हैं।
एक बार वेबपेज का
विश्लेषण और अनुक्रमणिका में सहेजे जाने के बाद, इसे संभावित खोज क्वेरी के लिए खोज परिणाम के
रूप में उपयोग किया जा सकता है।
Ranking
यही वो data है, जो search engine में जानकारी खोजने के दौरान आपको search result के रूप में दिखाई देता है. यह data और web pages के द्रव्यमान को व्यवस्थित करने की प्रकिया है, ताकि खोज इंजन आपके search query के लिए relevant result को जल्दी से ढूंढ पाये।
अंतिम चरण में सर्वोत्तम परिणाम चुनना और परिणाम पृष्ठ पर दिखाई देने वाले पृष्ठों की सूची बनाना शामिल है।
प्रत्येक खोज
इंजन दर्जनों रैंकिंग संकेतों का उपयोग करता है और उनमें से अधिकांश को गुप्त रखा
जाता है, जो जनता के लिए
अनुपलब्ध है।
सर्च इंजन के प्रकार (Types of Search Engine)
- Yahoo
- Web Crawler
- Being
- Altavista
- Infoseek
- Ask.com
- Hot Bot
- Excite
- Lycos
पहले सर्च इंजन में ज्यादा फीचर नहीं होते थे, लेकिन केवल फाइल ट्रांसफर प्रोटोकॉल का इस्तेमाल किया जाता था। जितने भी सर्वर इससे जुड़े थे, उनसे जुड़कर नया डेटा खोजना था।
उस समय वर्ल्ड वाइड वेब इंटरनेट से जुड़ने का एकमात्र तरीका था, जिससे नई खोजें और किसी भी तरह की जानकारी प्राप्त की जा सकती थी।
इसके माध्यम से काम करना न तो आसान था और न ही कोई वेब सर्वर और फाइल ढूंढना। लेकिन जब सर्च इंजन का अविष्कार हुआ तो ये सब चीजें धीरे-धीरे आसान होने लगीं। तो आइए जानते हैं सर्च इंजन कैसे बने और उनकी लोकप्रियता कैसे आई।
गूगल का नाम आज हर कोई जानता है। आज यह एक ट्रिलियन ट्रिलियन कंपनी बन गई है। इसका आविष्कार भी दो पीएचडी छात्रों के हाथों किया गया था। इस इंजन की खोज करने वाले लोग सर्गेई ब्रिन और लैरी पेज थे, जिन्होंने कैलिफोर्निया के स्टैनफोर्ड विश्वविद्यालय में कॉलेज में पढ़ाई की थी।
जिसने सिर्फ कॉलेज प्रोजेक्ट को पूरा करने के लिए गूगल का आविष्कार किया था। उसके लिए Google द्वारा खोजा गया हर किसी की भाषा में है, यही कारण है कि वह आज की खोज इंजन सूची में नंबर एक पर सूचीबद्ध है।
Google पर खोज इंजनों की सूची की कोई सीमा नहीं है, जिसमें किसी भी प्रकार के समाचार, उत्पाद, YouTube, फ़ोटो, Google अनुवाद, Google ड्राइव, Google डॉक्स, Google पत्रक, Google स्लाइड, Google कैलेंडर और आज आने वाली कई अन्य चीज़ें शामिल हैं। इस समय सभी Android फ़ोन पर पाए जाते हैं।
इसकी मदद से फोन पर मौजूद सभी निजी जानकारी को पूरी तरह से सुरक्षित रखा जा सकता है और इसे हर तरह के एप्लिकेशन से जोड़कर इस्तेमाल किया जा रहा है। अनुमानित आंकड़ों के आधार पर जब Google मूल्यों की गणना की गई, तो Google का उपयोग करने वाले लोगों के आंकड़े हिल गए।
Yahoo
आपने Yahoo का नाम आम तौर पर सुना होगा और आप इसे सर्च इंजन के तौर पर इस्तेमाल भी करते होंगे। Yahoo को 1994 में बनाया गया था, इसे बनाने वाले 2 छात्र इलेक्ट्रिकल इंजीनियरिंग के स्नातक छात्र थे। उनके नाम जेरी यांग और डेविड फिलियो थे।
कॉम डोमेन को वर्ष 1995 में 18 जनवरी को पूरी तरह से सार्वजनिक रूप से पंजीकृत किया गया था। Yahoo को आज के समय में सबसे बड़ा और सबसे महत्वपूर्ण Domain माना जाता है।
इस डोमेन की मदद से, हम आसानी से याहू मेल, याहू न्यूज, याहू फाइनेंस, याहू ग्रुप्स, याहू आंसर, एडवरटाइजिंग, ऑनलाइन मैपिंग, वीडियो शेयरिंग, फैंटेसी स्पोर्ट्स और कई अन्य सोशल मीडिया वेबसाइटों को किसी भी तरह की संबंधित खोज के लिए आसानी से उपयोग कर सकते हैं।
2016 के आंकड़ों के अनुसार, Yahoo मीडिया वेबसाइट को विश्व स्तर पर छठे नंबर की वेबसाइट के रूप में देखा जाता है, जिसे प्रति माह 7 बिलियन से अधिक बार देखा जाता है।
Web Crawler
वेब क्रॉलर भी एक सर्च इंजन था जिसे साल 1994 में 20 अप्रैल को बनाया गया था। जब भी हमें गूगल और याहू जैसे बड़े सर्च इंजन पर कुछ भी ढूंढना होता है तो उसमें वेब क्रॉलर बहुत मददगार होता है।
(web crawler) इस सर्च इंजन में एक रोबोट की सहायता से पूरे वेब के डॉक्यूमेंट में से keyword को लेकर एक डेली इण्डेक्स का निर्माण किया जाता है।
वेब क्रॉलर को वेब स्पाइडर (Web Spider) या वेब रोबोट (Web Robot) भी कहा जाता है। यह रोबोट HTML डॉक्यूमेंट के शीर्षक और टेक्स्ट को इंडेक्स करके नए डॉक्यूमेंट को प्राप्त करने का प्रयास करता है।
वेब क्रॉलर कई URL की एक सूची के साथ शुरू होता है, जिसे इसका मूल कहा जाता है। वे उस URL पर खोजे जाने वाले हाइपरलिंक को ढूंढते हैं और सभी संबंधित URL हमें प्रस्तुत करते हैं। इस पूरी प्रक्रिया को क्रॉल फ्रंटियर कहा जाता है।
इस सर्च इंजन को इस तरह से बनाया गया है कि अगर कोई व्यक्ति इस पर अवैध संसाधन खोजता है तो वह अपने आप ही अपना डेटा बंद कर देता है।
AltaVista
सर्च इंजन में सबसे ज्यादा इस्तेमाल किया जाने वाला इंजन AltaVista हुआ करता था, जिसे साल 1995 में खोजा गया था। साल 2003 में कुछ समय बाद इस सर्च इंजन की स्थापना Yahoo ने की थी। Altavista (अल्टाविस्ता) का निर्माण USA की डिजिटल इक्विपमेंट कारपोरेशन (DEC) की रीसर्च सुविधा के द्वारा किया गया था।
इस सर्च इंजन में इंडेक्सिंग, एक डॉक्यूमेंट के फुल टेक्स्ट पर आधारित होता है, जिसके अंतर्गत पहली कुछ लाइन्स एक एब्स्ट्रैक्ट (Abstract) के रूप में सर्च टाइप्स के दो मोड्स होते है , जो निम्नलिखित हैं
1 सिम्पल सर्च (Simple Search)
2 एडवांस्ड सर्च (Advanced Search)
याहू द्वारा खरीदे जाने के बाद भी अल्टाविस्टा ब्रांड और सेवाओं के अधिकार अल्टाविस्टा के पास ही रहे।
Infoseek
Infoseek भी लोकप्रिय इंजनों में से एक है, जिसे केवल वर्ष 1994 में शुरू किया गया था। इसके खोजकर्ता स्टीव किर्च ने Infosys Corporation का संचालन किया। इसे पे फॉर न्यूज के नाम से भी जाना जाता है। वर्ष 1994 में इसकी कई सेवाएं बंद कर दी गईं, लेकिन बाद में वर्ष 1995 में इसे इन्फोसीक नाम से फिर से शुरू किया गया।
11 जून, 1996 को, इन्फोसेक ने नेटडेस्क पर सार्वजनिक रूप से ₹12 प्रति शेयर पर व्यापार करना शुरू किया। लेकिन सितंबर 1997 तक इन्फोसेक ने 30 लाख प्रति माह का कारोबार करना शुरू कर दिया।
बहुत जल्द वेबसाइट ने अपने लिए एक नाम बनाया और सातवें नंबर पर पहचान बनाई गई, लेकिन 1996 में यह जल्दी से पांचवें नंबर पर पहुंच गई। दुर्भाग्य से, 1998 में, इसकी स्थिति दसवें स्थान पर आ गई।
Ask.com
Ask.com का जवाब नाम में ही छिपा है, यानी अगर आप किसी सवाल का जवाब ढूंढना चाहते हैं तो इस सर्च इंजन पर जाएं। इसका आविष्कार गैरेट ग्राइंडर वॉर डेविड वर्थेन कैलिफोर्निया नाम के 2 लोगों ने मिलकर किया था।
2007 में Ask.com का नया 3D लुक लॉन्च किया गया था। लेकिन 2010 में इस पर काम करने वाले 130 इंजीनियरों ने पद छोड़ दिया। इस कंपनी का दिवाला इसलिए आया क्योंकि Google जैसे बड़े सर्च इंजन के सामने इस कंपनी का टिकना आसान नहीं था।
Hot Bot
इस सर्च इंजन का प्रयोग वेब डॉक्यूमेंट को रिट्रीव और उन्हें इंडेक्स करने के उद्देश्य से किया जाता है जिसके लिए यह सर्च इंजन एक रोबोट एवं वर्क स्टेशंस के एक पैरलल नेटवर्क का प्रयोग करता है
यह सर्च इंजन विशेष प्रकार के शब्दों या वाक्यांशों (Phrase) को search करने के लिए अधिक उपयुक्त है इस सर्च इंजन में प्रयोगकर्ताओं के लिए एक टेक्स्ट बॉक्स होता है जिसमें वे अपनी query-string प्रविष्ट करते हैं और साथ ही एक लिस्टबॉक्स (List box) भी होता है जिसमें से किसी सही शब्द या वाक्यांश को चुना जा सकता है अपने सर्च को फाइन करने के लिए भी हॉट बट का प्रयोग करते हैं
Excite
एक्साइड का गठन वर्ष 1993 में हुआ था। लेकिन इसे सार्वजनिक करने में पूरा एक साल लग गया। इसलिए, वर्ष 1994 में, एक्साइड को सार्वजनिक रूप से एक कंपनी के रूप में घोषित किया गया था। उस समय यह इंटरनेट पर सबसे सम्मानित ब्रांड बन गया था। इस इंजन को भी कॉलेज के कुछ छात्रों ने कॉलेज प्रोजेक्ट की तरह ही बनाया था, जिसने बाद में 1995 में क्रॉलिंग सर्च इंजन का रूप ले लिया।
Lycos
लाइकोस का अविष्कार कार्नेगी मेलन यूनिवर्सिटी नाम के एक कॉलेज से हुआ था। 1994 तक सर्च इंजन सीमित रूप में था, लेकिन लाइकोस की शुरुआत के साथ, ईमेल लाभ, होस्टिंग, सोशल नेटवर्किंग और मनोरंजन जैसी सुविधाएँ भी इसकी मदद से मुमकिन हुईं। 2006 के दौरान, लाइकोस ने कार्नेगी मिल्स विश्वविद्यालय द्वारा लाइकोस्ट रेड मार्क का पूर्ण स्वामित्व हासिल कर लिया।
वर्ष 2006 में लाइकोस द्वारा इस सर्च इंजन के तहत कई और सेवाएं शुरू की गईं। उन्होंने इससे जुड़ा एक फोन भी बनाया, जो वीडियो चैट एमपी3 प्लेयर जैसे कई एप्लिकेशन चला सकता था। लाइकोस मिक्स जैसे मोबाइल ने सामाजिक नेटवर्क और स्थान-आधारित सेवाओं पर अधिक ध्यान केंद्रित किया और इसके लिए इसके कॉर्पोरेट पुनर्गठन किया।
इस सर्च इंजन के डेटाबेस (Database) में लगभग 66 मिलियन पृष्ठ होते हैं , जिसमे नेविगेशन (Navigation) का कार्य एक वेब रोबोट द्वारा होते हैं , जो Heuristics विधि का प्रयोग कर
नेविगेशन करता है और सर्च करने योग्य इंडेक्स बनाता है।
वेब रोबोटेक प्रत्येक डॉक्यूमेंट की इंडेक्सिंग कर उसके आउटगोइंग लिंक्स को कतार में रखता है और इसमें से एक URL का select करता है। लाइकोस , टाइटल्स , हेडिंग्स और HTML की सब- हेडिंग्स, FTP और Gopher डाक्यूमेंट्स को इंडेक्स करता है।
इस सर्च इंजन में इमेज और साउंड को सर्च करने की छमता होती है। यह (News), साइट रिव्यु (Site Review) जैसी बहुत सी सामग्रियां प्रदान करता है।
सर्च इंजन का इतिहास
आज के समय में बहुत सारे सवाल हैं, लेकिन अगर हम बात करें कि उनका उत्तर कहाँ दिया जा सकता है, तो सबसे पहले सर्च इंजन का नाम आता है। 90 के दशक की बात करें तो उस समय इंटरनेट और सर्च इंजन जैसी सुविधाएं नहीं थीं।
कॉलेज के दिनों में छात्रों को उनके ज्ञान और उनकी समझ को जानने के लिए कई प्रोजेक्ट दिए जाते हैं, कुछ ऐसा ही प्रोजेक्ट कॉलेज में पढ़ने वाले छात्रों को दिया गया, जिन्होंने इस प्रोजेक्ट के नाम पर सर्च इंजन का आविष्कार किया। उसका नाम एलेन अमटगे था। जी हाँ, उन्होंने एक कॉलेज प्रोजेक्ट के कारण सर्च इंजन का आविष्कार किया था।
0 टिप्पणियाँ