Soláthraíonn Saineolaí Semalt Athbhreithniú ar Innill Chuardaigh Inniúil

Sular tugadh an gréasán isteach i rangú, bhí innill chuardaigh ann a d’oibrigh go príomha ar chabhrú le húsáideoirí ar líne a gcuid faisnéise tosaíochta a fháil ar líne. Bhailigh cláir atá ann cheana mar “Archie’ agus “Gopher” faisnéis agus choinnigh siad an fhaisnéis ar fhreastalaithe a bhí ceangailte leis an idirlíon.

Roinneann Michael Brown, saineolaí den scoth ó Semalt , roinnt ceisteanna láidre san alt a chabhróidh le feachtas Sinsearach a threisiú duit.

Conas a oibríonn innill chuardaigh

Braitheann innill chuardaigh go hiomlán ar damháin alla gréasáin chun cáipéisí agus comhaid a aisghabháil ón ngréasán. Oibríonn crawlers gréasáin ar na leathanaigh ghréasáin go léir atá le fáil ar an ngréasán a iniúchadh agus liosta doiciméad agus clár a thógáil trí phróiseas ar a dtugtar crawling gréasáin.

Tosaíonn crawlers gréasáin ag bailiú faisnéise ó na leathanaigh is mó a úsáidtear agus ó na freastalaithe a bhfuil trácht ard orthu. Trí chuairt a thabhairt ar an suíomh is fearr leat, leanann damháin alla gach nasc laistigh de shuíomh agus innéacsú a dhéanamh ar gach focal ar a leathanaigh.

Breith Inneall Cuardaigh Google

Tá Google ar cheann de na hinnill chuardaigh is fearr a thosaigh mar ardán acadúil. De réir eisiúna a rinneadh maidir leis an gcaoi ar forbraíodh Google, tugann Lawrence Page agus Sergey Brin le tuiscint gur tógadh an córas tosaigh chun dhá nó trí chraoltóir gréasáin a úsáid ag an am. Forbraíodh gach crawler chun thart ar 320 nasc a choinneáil leis na leathanaigh Ghréasáin a reáchtáiltear ag an am céanna.

Bhuail Google na ceannlínte nuair a d’úsáid sé ceithre damhán alla, agus d’fhéadfadh a gcóras gearradh thar 99 leathanach in aghaidh an tsoicind. Le linn na tréimhse sin, ghin an córas thart ar 600 cileavata tuairiscí in aghaidh an tsoicind. D'oibrigh an chéad chóras Google ar roinnt URLanna a sholáthar do na damháin alla gréasáin trí fhreastalaí. Chun an t-uasmhéid ama a thógann sé sula bhfaigheann úsáideoir ar líne a chuid doiciméad agus clár, bhí a Fhreastalaí Ainm Fearainn (DNS) ag Google.

Trí leathanach HTML a chuardach agus a anailísiú, thug Google faoi deara líon na bhfocal laistigh de leathanach, agus suíomh sonrach na bhfocal. Tugadh tosaíocht d’fhocail a léiríonn sna meta-chlibeanna agus fotheidil le linn cuardaigh úsáideora. Forbraíodh damhán alla Google chun innéacsú a dhéanamh ar fhocail atá thar a bheith tábhachtach gan ailt "the," "a," agus "an" a áireamh. Mar sin féin, glacann crawlers gréasáin eile cur chuige difriúil maidir le focail shuntasacha a innéacsú i gcomparáid le Google.

Chun an t-eispéireas cuardaigh a dhéanamh iontach, d’úsáid Lycos an cur chuige chun an frása atá sna meta-chlibeanna a rianú agus na 100 focal is mó a úsáidtear a mharcáil. Maidir le AltaVista, tá an cur chuige go hiomlán difriúil. Cuimsíonn an próiseas innéacsaithe gach focal a chuimsítear ar leathanach, gan trácht ar ailt “an,” “a,” agus “the”.

An cuardach amach anseo

De réir oibreoirí Boole, seiceálann an t-inneall na frásaí agus na focail agus iad á iontráil ag úsáideoir. Cuidíonn cuardach liteartha a oibríonn ar chuardach nach dteastaíonn a dhíchur an toradh is fearr a fháil ar an nGréasán. Tá cuardach coincheap-bhunaithe thar a bheith tábhachtach maidir le faisnéis a chuardach. Oibríonn an taighde seo ar anailís staitistiúil a úsáid ar na leathanaigh ina bhfuil na frásaí a bhfuil suim agat iontu.

Tionchair meta-chlibeanna ar chuardach gréasáin

Tá ról ríthábhachtach ag meta tags maidir le margaíocht ábhair . Ligeann meta-chlibeanna d’úinéirí láithreán gréasáin eochairfhocail agus frásaí tiontaithe atá le hinnéacsú a shonrú. Aithníonn damháin alla meta-chlibeanna nach bhfuil comhghaolmhar leis an ábhar agus a mhalairt. Ní féidir an tábhacht a bhaineann le meta-chlibeanna a shníomh. Tá ról acu in aithint na bhfrásaí cearta a mheaitseálann cuardach an úsáideora.

Oibríonn innill chuardaigh gréasáin tríd an am a theastaíonn do chuairteoirí ar líne ábhar agus cláir ríomhaire a laghdú. San am atá caite, le faisnéis agus cláir luachmhara a fháil ón ngréasán, tugadh le tuiscint go gcaithfeadh tú a bheith ar an eolas faoi conas a d’oibrigh Veronica agus Archie. I saol an lae inniu, cuireann líon maith úsáideoirí idirlín iad féin go hiomlán ar an nGréasán, príomhfhachtóir a chuir le fás innill chuardaigh gréasáin.