Het werk van zoekmachines

Veel beginnende webmasters en gewoon fans van internet surfen houden zich bezig met de vraag: hoe werken zoekmachines? De basisprincipes van de zoekmachines vandaag zal het land van raden overwegen.




De moderne zoekmachine is een heel complex bestaande uit de meest ingewikkelde programma's en algoritmen die werken met verbazingwekkende snelheid. Stel je voor, het nieuwe zoekalgoritme Cafeïne van Google is in staat om informatie te verwerken die gelijk is aan 3 km A4-vellen in slechts 1 seconde!



In alle zoekmachines kunnen softwarecomponenten worden onderverdeeld in vijf hoofdgroepen:



  • "Spinnen"

  • "Reizende spinnen"

  • indexeerders

  • databank

  • resultaten systemen



programma's spider - spiders (spiders) - door het algoritme van hun werk lijken op browsers, maar hebben geen visuele componenten. De spider laadt de html-code van de pagina met behulp van http-protocollen.



Een robotverzoek naar de server bevat een opdracht"Get / path / document" en enkele andere http-verzoekopdrachten. Aan dit verzoek ontvangt de spin een reactie van de server als een tekststroom die de service-informatie over het document en het document zelf bevat. De spider is een onderdeel van de indexeringsmodule voor zoekmachines.



"The Traveling Spider" - crawler - is een ander onderdeelindexeringsmodule. Crawler navigeert automatisch door alle hyperlinks die door de spider op de pagina zijn gevonden en zoekt dus naar documenten die nog niet bekend zijn bij de zoekmachine.



robot indexer (indexer) werkt rechtstreeks met de inhoud van de pagina's die worden geladen door spiderrobots. De indexeerder voert een morfologische, lexicale analyse uit van de pagina's en verdeelt deze in afzonderlijke delen.



databases (database) zijn speciale software ontworpen om de geïndexeerde documenten die zijn verzameld en geïndexeerd door componenten op te slaan.



Zoekmachine motor resultaten - het systeem voor het afgeven van resultaten is een van de belangrijkstecomponenten van de zoekmachine. Met het uitvoersysteem dat de eindgebruiker te maken heeft, wordt de zoekopdracht in de zoekreeks ingevoerd. Het systeem van output van resultaten op basis van meer dan tweehonderd verschillende criteria voert de selectie uit van de resultaten die het meest voldoen aan de zoekdoelstellingen.



Het algoritme van een dergelijke selectie wordt meestal een algoritme of ranking mechanisme. Om fraude door webmasters te voorkomen om de resultaten van de uitgifte te beïnvloeden, worden de exacte zoekmachines voor het rangordeningsalgoritme in de striktste geheimhouding bewaard.



Desalniettemin zijn er een aantal bekende criteria waarmee rekening wordt gehouden in het werk van zoekmachines, waarbij de webmaster de zoekresultaten "juridisch" kan beïnvloeden. Bijvoorbeeld De zoekmachine houdt bij het analyseren van de pagina rekening met:




  • of er een trefwoord in de titel van de pagina staat (titel)

  • Verschijnt het trefwoord in de URL van de pagina?

  • of er een trefwoord is in de headers H1-H6, tags STRONG, B, EM, I

  • wat is de dichtheid van de zoekwoorden op de pagina (Density)

  • Bestaat het sleutelwoord in de metatags: trefwoorden, beschrijving

  • Zijn er interne en externe links op de pagina?



De gebruiker communiceert met de zoekmachine via de zoekserver. Ontvangen zoekopdracht van gebruikerDe server verwerkt en geeft de klasseringsmodule door als invoer voor de parameter. De module voert op zijn beurt de verwerking van documenten uit, informatie die is opgeslagen in de database van het zoeksysteem en maakt een beoordeling van pagina's die overeenkomen met het verzoek van de gebruiker.



Vervolgens genereert het systeem snippet-tekstinformatie die aan de gebruiker wordt getoond in de vorm van SERP (Search Engine Result Page) - pagina's met zoekresultaten.



Dus zelfs een korte beschrijving van de mainprincipes van het werk van zoeksystemen laten zien hoe nauw alle softwarecomponenten van het systeem met elkaar zijn verbonden en hoe goed de zoekmachine moet werken en duidelijk moet werken om de gebruiker de snelste en meest betrouwbare informatie over zijn zoekopdracht te bieden.



Het werk van zoekmachines
Comments 0