對于搜索引擎你了解多少?搜索引擎(search engine),萬維網(wǎng)環(huán)境中的信息檢索系統(tǒng)(包括目錄服務(wù)和關(guān)鍵字檢索兩種服務(wù)方式),按照工作原理的不同,可以分為全文搜索引擎(Full Text Search Engine)和分類目錄(Directory),通常所說的搜索引擎主要是指全文搜索引擎。為了更深入的了解搜索引擎我們通過搜索引擎的起源,搜索引擎的工作原理以及搜索引擎商務(wù)模式三個方面來更深入的了解搜索引擎。
1、搜索引擎的起源
1990年由Montreal的McGill University 三名學(xué)生(Alan Emtage、Peter Deutsch、Bill Wheelan)發(fā)明的Archie(Archie FAQ),被公認(rèn)為現(xiàn)代搜索引擎的鼻祖,Archie是第一個自動索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站的程序。
2、搜索引擎工作原理
抓取網(wǎng)頁:每個獨立的搜索引擎都有自己的網(wǎng)頁抓取程序(spider),Spider順著網(wǎng)頁中的超鏈接,連續(xù)的抓取網(wǎng)頁,被抓取的網(wǎng)頁被稱為網(wǎng)頁快照。
處理網(wǎng)頁:由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進(jìn)行分析,根據(jù)一定的算法提取相關(guān)信息并建立網(wǎng)頁索引數(shù)據(jù)庫。
檢索服務(wù):當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁,根據(jù)相關(guān)度數(shù)值排序,并由頁面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁面內(nèi)容摘要等內(nèi)容組織起來返回給用戶。
3、搜索引擎商務(wù)模式
在搜索引擎發(fā)展早期,多是作為技術(shù)提供商為其他網(wǎng)站提供搜索服務(wù),網(wǎng)站付錢給搜索引擎。后來,隨著2001年互聯(lián)網(wǎng)泡沫的破滅,大多轉(zhuǎn)向競價排名方式,這種模式最早是Bill Gross提出的。競價排名模式有兩個特點,一是點擊付費,二是競價排序。