搜索引擎
此條目或其章節極大或完全地依賴於某個單一的來源。 (2019年5月12日) |
本條目屬於網路搜索引擎系列 |
網路搜索引擎 |
元搜索引擎 |
國際性搜索引擎(多語言) |
Yahoo! Search |
Bing |
僅中文搜索引擎 |
百度 |
360搜索 |
搜狗 |
yam蕃薯藤 |
其他搜索引擎 |
DuckDuckGo |
Ecosia |
Exalead |
Naver |
Yandex |
Alexa Internet |
AOL |
Ask.com |
Qwant |
其他鏈接 |
工作方式
搜索引擎為一組項目提供了一個接口,使用戶能夠指定關於感興趣的項目的標準,並讓引擎找到匹配的項目,這些標準稱為搜索查詢。在文本搜索引擎的情況下,搜索查詢通常表示為識別一個或多個文檔可能包含的期望概念的一組單詞。[1]有多種樣式的搜索查詢語法在嚴格性上有差異。它也可以在以前的站點中搜索搜索引擎中的名稱。而一些文本搜索引擎要求用戶輸入由白色空格分隔的兩個或三個字,其他搜索引擎可以使用戶能夠指定整個文檔,圖片,聲音和各種形式的自然語言。一些搜索引擎對搜索查詢進行改進,以增加通過稱為查詢擴展的過程提供質量集合的可能性。查詢理解方法可用於標準化查詢語言。
基於索引的搜索引擎符合查詢指定條件的項目列表通常會排序或排名。按相關性排列項目(從最高到最低)減少查找所需信息所需的時間。概率搜索引擎根據相似性度量(每個項目和查詢之間,通常以1到0,1的比例最相似)和有時受歡迎程度或權限或使用相關性反饋來評估項目。布爾搜索引擎通常只返回匹配的項目,而不考慮排列順序,為了提供根據一些標準快速排序的一組匹配項目,搜索引擎通常將通過稱為索引的過程來收集關於所考慮的一組項目的元數據。索引通常需要較少量的計算機存儲,這就是為什麼一些搜索引擎僅存儲索引的信息而不是每個項目的完整內容,而是提供導航到搜索引擎結果頁面中的項目的方法。或者,搜索引擎可以將每個項目的副本存儲在高速緩存中,使得用戶可以在索引時或為了歸檔目的看到該項目的狀態,或者使得重複的進程更有效和更快地工作。其他類型的搜索引擎不存儲索引。抓取器或蜘蛛型搜索引擎(也稱為實時搜索引擎)可以在搜索查詢時收集和評估項目,基於起始項目的內容(稱為種子或種子URL)動態考慮附加項目互聯網爬蟲的情況)。元搜索引擎既不存儲索引也不存儲緩存,而只是重新使用一個或多個其他搜索引擎的索引或結果來提供聚合的最終結果集。
類型
按來源
- 桌面搜索(Desktop search)
- 聯合搜索(Federated search)
- 人類搜索引擎(Human search engine)
- 元搜索引擎(Metasearch engine)
- 多搜索(Multisearch)
- 搜索聚合器(Search aggregator)
- 網頁搜索引擎(Web search engine)
- 實體搜索引擎(Physical search engine)
按內容類型
按界面
- 增量搜索(Incremental search)
- 即時回答(Instant answer)
- 語義檢索(Semantic search)
- 基於選擇的搜索(Selection-based search)
- 語音搜索(Voice Search)
按主題
另見
參考文獻
- ^ Voorhees, E.M. Natural Language Processing and Information Retrieval. National Institute of Standards and Technology. March 2000.