Search Engine क्या है और कैसे काम करता है? |What is Search Engine and How its Works

Search Engine क्या है और कैसे काम करता है? |What is Search Engine and How its Works

Search Engine क्या है और कैसे काम करता है?

क्या आपको पता है सर्च इंजन क्या है (What is Search Engine in Hindi) और ये कैसे काम करता है. इसके साथ इसके साथ साथ मैं आपको कुछ और जानकारी हिंदी में देने वाला हूँ आज के इस लेख में. जमाना तो Internet का है और Internet बिना Information के कुछ भी नहीं है. जब भी आपके मन में कोई सवाल आता है तो इस 21 Century में कौई भी इनसान आस पास के लोगों से या, उनके teachers से नहीं पूछ ते हैं. वो सीधा अपना मोबाइल निकालते है और जो भी उनके मन में सवाल है वो लिख देते हैं. उनको कुछ seconds के अंदर जवाब मिल जाता है.

जब भी दोस्तों के बिच में कोई सवाल को लेके Argument हो जाता है, तो उसका जवाब भी Internet में मतलब कोई search engine जैसे Google, Yahoo, Bing पे Search करते हो. लेकिन हम 1990 की बात करें तो एसा कोई concept नहीं था जहाँ आप कुछ search करो और तुरंत मिल जाये. उस दौर में तो Internet भी नहीं था.
बात की जाये आजकल की लोगों के मन में हजारों सवाल आते हैं और हर कोई बोलता है Internet में ढूंड मिल जाये गा. ये युवा पीढ़ी इसे कहती है Google कर लो भाई. यही वो Search Engine है जिसकी आज हम हमारे Readers को इस लेख में बताएँगे. Google, Yahoo और Bing की जानकारी इस लेख में देंगे तो चलिए सुरु करते हैं।

सर्च इंजन क्या है – What is Search Engine in Hindi

सर्च इंजन एक प्रोग्राम है. या, सर्च इंजन एक एसा प्रोग्राम है जो इन्टरनेट के असीमित डेटाबेस से यूजर के सवाल को खोजता है (जिसको Keyword/Phrase बोला जाता है), और उसके संभंधि जो जानकारी मिलती है उसको सर्च रिजल्ट पेज में दिखाता है. जैसे Google करता है. हर सवाल को world wide web में सर्च किया जाता है।

Internet में जो भी search किया जाता है उसको ढूंड के search engine Exact Result दिखाने का काम करता है. कुछ search engine के नाम है “Google, Yahoo, Bing “. आपको एक example से अच्छे से समझाता हूँ. आपके मन में एक सवाल आया तो आप तुरंत Google जो एक search engine है उसमे search करने लगते हो. आपका सवाल है “Computer क्या है और ये कैसे काम करता है” .

Search engine Internet पे जितने भी websites है उनमे इस सवाल को search करता है. जहाँ जहाँ ये सवाल मैच होगा उन websites के नाम मतलब search result के पहले पेज में दिखाइ देगा. उसके बाद कोई एक link पे आप click करके “Computer क्या है और ये कैसे काम करता है” इसका जवाब पढ़ सकते हो.

जो सवाल है उसी को INTERNET की भाषा में keyword कहते हैं. तो चलिए अब आपके मन में एक सवाल जरुँर आया होगा की वैसे ये Search engine मतलब Google, yahoo, Bing, काम कैसे करता है. जो information search करते हैं उसका पुरा सही सही जवाब भी देती है तो चलिए जानते हैं कैसे.

प्रमुख सर्च इंजन के नाम – सर्च इंजन लिस्ट

ऐसे देखा जाये तो दुनिया में बहुत सारे सर्च इंजन है, पर यहाँ हम आपके लिए सबसे ज्यादा इस्तिमाल किया जाने वाला लोकप्रिय सर्च इंजन लिस्ट प्रस्तुत कर रहे है.

  1. Google
  2. Bing
  3. Yahoo
  4. Ask.com
  5. AOL.com
  6. Baidu
  7. Wolframalpha
  8. DuckDuckGo
  9. Internet Archive
  10. Yandex.ru

इंडियन सर्च इंजन नाम

जहाँ इतना सारे सर्च इंजन है, वहां हमारा देश कैसे पीछे हटता? यहाँ आपके लिए कुछ इंडियन सर्च इंजन की हमने लिस्ट बनाया है. ये सारे इतना लोकप्रिय नहीं है, पर कुछ हद तक अच्छा काम करते है.

  1. 123Khoj
  2. Epic Search
  3. Bhanvad
  4. GISASS
  5. Guruji

सर्च इंजन कैसे काम करता है-How Search Engine Work in Hindi

जैसे कि दोस्तों मैंने आपको बताया जो भी सवाल हम सर्च इंजन पर लिखते हैं उसे इंटरनेट की भाषा में keyword बोला जाता है. तो दोस्तों पहले के उदाहरण को देखेंगे तो सर्च इंजन क्या है और यह कैसे काम करता है यह इंटरनेट के लिए एक Keyword हुआ. Keyword के जरिए से ही यह यूजर को इंफॉर्मेशन दिखाता है. पहले World Wide Web मे ढूंढेगा और जब यह keyword किसी वेबसाइट के टाइटल (Title Of The Website) से या किसी आर्टिकल के कंटेंट (Content Of The Article) से या फिर किसी tags से मैच होगा तो सर्च वेब पेज में डिस्प्ले कराएगा.

दोस्तों वास्तव में सर्च इंजन 3 स्टेप(Steps) में काम करता है . पहला है CRAWLING दूसरा है INDEXING और तीसरा है RANKING. मैं इन्हीं तीनों के बारे में आपको विस्तार से बताती हूं.

1. Crawling

इसका मतलब होता है स्कैनिंग (scanning) और दूसरे तरीके से समझाऊं तो crawling मतलब वेबसाइट के सारे डेटा को स्कैन(scan) करना और एक वेबसाइट की पूरी जानकारी प्राप्त करना.पेज का टाइटल (title of the page) क्या है , कितने keywords का इस्तेमाल किया गया है, उसके images, कितने पेज और कौन-कौन से पेज उस वेबसाइट के साथ जुड़े हुए हैं. यह सभी जानकारी रखने का काम crawling प्रोसेस में किया जाता है. इसके साथ-साथ पेज लेआउट(page layout) कैसा है, लिंक कहां दिए गए हैं, और इसके एडवर्टाइज(advertise) कहां कहां है . यह सब भी इसी प्रोसेस में स्टोर किया जाता है.

Crawling प्रोसेस के लिए यह एक स्वयंचलित बोट (automated bot) का इस्तेमाल करता है.जिसे स्पाइडर (spider) भी बोला जाता है. Bot हर दिन करोड़ों की तादाद में पेज को विजिट(visit) करता है. रिसर्च के मुताबिक 1 सेकंड में 100 से 1000 पेजो को विजिट करता है.
जब भी बोट यानी स्पाइडर को कोई नया पेज मिलता है, तो वह उसे बैकेंड प्रोसेसिंग(backend processing) के लिए भेज देता है. Backend processing मतलब पेज के टाइटल, कीवर्ड, इमेज ,लिंक (title, keyword, Image, backlink) यह सब का डिटेल(detail) कलेक्ट(collect) करना.

इसके बाद होता है दोस्तों पेज इंडेक्सिंग (page indexing). बिना इंडेक्सिंग के सही रिजल्ट दिखाना नामुमकिन है. जब भी bot को नया पेज मिलता है तो यही प्रोसेस दोहराया जाता है.

CRAWLING –>BACKEND PROCESSING–> INDEXING
अभी आपको इंडेक्सिंग के बारे में विस्तार से जानकारी देती हूं.

2. Indexing

Crawling प्रोसेस के दौरान जो भी डाटा मिलता है उन सभी डाटा को एक डेटाबेस(Database) में Store करके रखने की प्रक्रिया को इंडेक्सिंग(Indexing) कहते हैं. उदाहरण के तौर पर समझाती हूं दोस्तों , आप सभी देखे होंगे कि हर Book में एक Index Page रहता है. उसी पर से हम यह जानकारी प्राप्त कर सकते हैं कि इस बुक में कौन-कौन से डाटा है या कौन-कौन से चैप्टर(Chapters) हैं .सभी चेप्टर के नाम को एक ही पेज में लिखा जाता है , उसी प्रकार सभी डेटा को एक डेटाबेस में रखा जाता है. उसे ही इंडेक्सिंग कहते हैं. इंडेक्स पेज को एक तरीके से बुक का डेटाबेस माना जाएगा.

Google डाटा का बहुत बड़ा सरवर (Server) है . हर रोज Google bots 3 trillion pages को crawl करके इंडेक्स करता है . दुनिया भर मे जितना भी इंफॉर्मेशन है उन सबका लाइब्रेरी (Library) Google के पास है.

इसके बाद होता है रैंकिंग(Ranking) . इस प्रोसेस के जरिए ही दोस्तों आप पूरा सही इंफॉर्मेशन अपने सर्च रिजल्ट पेज पर आ सकते हो. तो चलिए आपको रैंकिंग के बारे में विस्तार से बताती हु.

3. Ranking

हम जब Google में कुछ भी सर्च करते हैं तो सर्च इंजन का काम यह है कि वह यूजर को exact इनफार्मेशन उनके सर्च रिजल्ट पेज पर दिखाएं. मतलब कि यूज़र जो चाहता है पूरा वही इंफॉर्मेशन और कुछ कुछ उसके संबंधित जानकारी भी यूजर को प्रदान करें. तब ही यूज़र खुश होंगे. रैंकिंग सर्च इंजिन का आखरी स्टेप है. इस step के जरिए से हमको relevant (जरुरत) डाटा/इनफार्मेशन मिलता है.

Website को रैंक करने के लिए अलग-अलग सर्च इंजन के अपने अलग-अलग अल्गोरिदम(Algorithms) होते हैं. जैसे कि Google के अल्गोरिदम कुछ पैरामीटर्स(parameters) के मुताबिक काम करती है. और वह पैरामीटर्स है – Content Page Title, Content Keywords , Content Age , Back links आदि. रैंकिंग अल्गोरिदम को समझना बहुत ही मुश्किल है. लेकिन एल्गोरिदम को हैक(hack) करने के लिए बहुत hackers है. कुछ सालों से Google रैंकिंग फेक्टर्स(FACTORS) को ढूंढना बहुत ज्यादा मुश्किल हो गया है . कुछ साल पहले Keywords और Back links के जरिए से ही बड़ी आसानी से साइट को हैक कर दिया जाता था.

Rank करने के लिए Google करीबन 200 से ज्यादा keywords का इस्तेमाल करता है. जिनके माध्यम से हम यह जान सकते हैं कि सर्च करने पर Google home के किस पोजीशन(position) में search result दिखाना चाहिए.

दोस्तों कुछ इस तरह से इन 3 steps मे सर्च इंजिन काम करती है.

आखिर सर्च इंजन का ranking algorithm कैसे काम करता है?

जैसा की मैंने ऊपर बताया की इसे समझना काफी मुश्किल काम है, मुश्किल इसलिए क्योंकि कोई भी सर्च इंजन अपने एल्गोरिथम के बारे में पूरी जानकारी नही देता और कई सारी चीजों को गोपनीय रखा जाता है।

Google अपने SERP में किसी वेबसाइट की रैंकिंग को निर्धारित करने के लिए 200 से भी अधिक rules का पालन करता है। लेकिन किसी को भी निश्चित तौर पर यह नही पता की वे rules क्या-क्या हैं। इसे हमेशा secret रखा जाता है।

किसी भी रैंकिंग एल्गोरिथम का मुख्य काम pages को उनकी quality content के अनुसार रैंक करना होता है। ताकि उपयोगकर्ताओं को सही और सटीक information provide किया जा सके।

सही तरीके से रैंकिंग करने के लिए गूगल को अपने algorithm को समय-समय पर update करना पड़ता है।

हर साल गूगल अपने एल्गोरिथम में 500 से 600 बार बदलाव करता है।

यही वजह है की यदि हम कुछ साल पहले की बात करें तो किसी के लिए भी अपनी वेबसाइट को रैंक कराना आसान काम होता था। लेकिन अब यह बहुत ही जटिल काम हो गया है।

अब कुछ भी सर्च करने पर सिर्फ वही websites top 10 पर आते हैं जिनके content में quality हो और जो users को सही जानकारी दे रहा हो।

खैर, चलिए वापस लौटते हैं अपने पॉइंट पर और एक मोटे तौर पर समझने की कोशिश करते हैं की search algorithm कैसे काम करता है।

गूगल के अनुसार search algorithm नीचे दिए गये कुछ steps को follow करता है:

1. सर्च किये गये शब्दों (query) को समझना: सबसे पहला और महत्वपूर्ण काम होता है आपके द्वारा search bar में enter किये गये शब्दों को समझना।

शब्द कौन सी भाषा में है और उसका क्या अर्थ है, उसके और कौन-कौन से समानार्थी शब्द हो सकते हैं यह जानना जरुरी है ताकि सही परिणाम दिखाया जा सके।

कई बार user अपनी query में speling mistakes भी करता है जिसे समझना और ठीक करने का काम भी किया जाता है।

कई बार एक ही शब्द के कई सारे meanings होते हैं, ऐसी स्थिति में sentance को समझकर उससे सम्बन्धित रिजल्ट दिखाने का काम भी एल्गोरिथम द्वारा किया जाता है।

इसके अलावा कई सारे keywords ऐसे भी होते हैं जिनके search results कुछ अलग format में दिखाए जाते हैं जैसे यदि आप "restaurant near me" search करें तो आपको आपके आसपास में उपलब्ध रेस्टोरेंट की जानकारी उनकी rating और map के साथ दिखाई जाती है।

यदि आप "40+50" सर्च करें तो इसे समझ आ जाता है की यह गणित का सवाल है और इसका सर्च रिजल्ट कुछ ऐसा दिखाई देता है:

Search query में ऐसे keywords को पहचानने और उससे जुड़े data को विशेष format में दिखाने का काम भी इसी algorithm का ही होता है।

2. Index से मिलान करना: सर्च किये गये Keywords को समझने के बाद इसे index में store किये गये data से match किया जाता है और इससे जुड़े हुए pages को खोजा जाता है।

यहाँ ध्यान रखा जाता है की आप कौनसे भाषा में सर्च कर रहे हैं और उसी भाषा में लिखे गये pages को खोजा जाता है।

किसी पेज को select करते समय यह देखा जाता है की वह शब्द उस पेज में कितनी बार और कहाँ-कहाँ उपयोग किया गया है, देखा जाता है की ये keywords page के title में लिखा गया है या headline में या body में use किया गया है। इससे यह समझने में आसानी होती है की जो information user द्वारा serach किया जा रहा है उसके बारे में जानकारी उस page में यह या नही।

3. उपयोगी web pages की ranking करना: 
इन्टरनेट पर करोड़ों websites हैं ऐसे में यह बिलकुल सम्भव है की उस query से सम्बन्धित सैकड़ों webpages हों। इस स्थिति में webpages को उनकी quality के अनुसार rank किया जाता है और SERP में सबसे बेहतर पेज के URL को पहले दिखाया जाता है।

पेज की quality तय करने के लिए कई सारे factors ध्यान में रखे जाते हैं जैसे:

  • Search की गयी कीवर्ड पेज में कितनी बार repeat हो रही है।
  • पेज की जानकारी कितनी fresh है।
  • वेबसाइट की विश्वसनीयता कितनी है।
  • User experience (UX) का ध्यान रखा गया है या नही 
  • Site की speed सही है या नही आदि।

इन सबके अलावा और भी सैकड़ों factors होते हैं जिनका पेज रैंकिंग के समय ध्यान रखा जाता है।

4. Context का ध्यान रखना:
इस स्टेज में कुछ extra information जैसे आपकी location, country, area, past search history और search settings का ध्यान में रखकर data को इस प्रकार से filter किया जाता है की दिखाई देने वाला result आपके लिए उपयुक्त हो।

5. Result show करना
अब आखिर में रिजल्ट show किया जाता है जिसमे ध्यान रखा जाता है की यूजर के सवाल का जवाब सही तरह से दिखाया जाय इसमें सिर्फ text content ही नही बल्कि images, videos जो भी उस query के बारे में बेहतर हो उसे दिखाया जाता है।

Massage (संदेश) : आशा है की "Search Engine क्या है और कैसे काम करता है? |What is Search Engine and How its Works" आपको पसंद आयी होगी। कृपया अपने बहुमूल्य सुझाव देकर हमें यह बताने का कष्ट करें कि Motivational Thoughts को और भी ज्यादा बेहतर कैसे बनाया जा सकता है? आपके सुझाव इस वेबसाईट को और भी अधिक उद्देश्यपूर्ण और सफल बनाने में सहायक होंगे। आप अपने सुझाव निचे कमेंट या हमें मेल कर सकते है!
Mail us : jivansutraa@gmail.com

दोस्तों अगर आपको हमारा post पसंद आया हो तो अपने दोस्तों के साथ share करे और उनकी सहायता करे. आप हमसे Facebook Page से भी जुड़ सकते है Daily updates के लिए.

इसे भी पढ़े :

Leave a Reply

Please enter your comment!
Please enter your name here