|簡體中文

比思論壇

 找回密碼
 按這成為會員
搜索



查看: 281|回復: 0
打印 上一主題 下一主題

SEOER要了解搜索引擎抓取原理

[複製鏈接]

1053

主題

45

好友

6035

積分

教授

Rank: 8Rank: 8

  • TA的每日心情

    8 小時前
  • 簽到天數: 2390 天

    [LV.Master]伴壇終老

    推廣值
    0
    貢獻值
    1205
    金錢
    3720
    威望
    6035
    主題
    1053

    回文勇士 文明人 中學生 高中生 文章勇士 附件高人 簽到勳章 簽到達人 附件達人

    樓主
    發表於 2013-5-4 17:53:58
      一、什么是搜索引擎?
      搜索引擎的定义:搜索引擎就是指按照一定的策略、运用特定的计算机程序从互联网上搜集信息,在对搜索到的信息进行组织和处理后,为用户提供检索服务,将用 户搜索相关的信息展示给用户的系统。简单通俗的来讲就是我们日常获 取信息的一种工具。像百度和谷歌等是搜索引擎的代表。
      搜索引擎就像是我们平常在网络上获取信息的窗口,它根据我们给出的一些 关键词或是少量的信息来进行检索,给我们提供更多我想要或是与我们搜索相关的信息的工具,平常我们使用最多的就是百度、google、雅虎等一些搜索引 擎,以及最近新推出的360。做为seoer所有工作都是围绕搜索引擎在进行的,就是让搜索引擎更多地收录seo优化网站中的信息,从 而被更多用户搜索到,满足用户的搜索需求。seo优化网站更新最新的信息,操作一些外链,引导搜索引擎来检索站点,从而让搜索引擎收录seo优化网站中的信息,用搜索引擎来检查文章的质量,像一篇文章的重复性,一些关键词的火热 度,通过这些搜索结果给软文编辑工作提供参考,另一方面就是利用搜索引擎来检查工作的有效性就是被搜索引擎收录信息有多少(被搜索引擎认 可的信息)。seoer每天或多或少也都和搜索引擎这样的接触,所以做为seoer的我们不仅要知道什么是搜索引擎,还应该掌握搜索引擎的抓取 原理。
      二、搜索引擎的抓取原理是怎样的?
      当用户在搜索引擎中搜索信息时侯,搜索引擎就会派出一个能够发现新网页并抓取文件的程序这个程序通常被称为搜索引擎“蜘蛛”也就是机器人,搜索引擎 “蜘蛛”从数据库中已知的网页开始出发,就像是平常用户的浏览器一样访问这些网页并抓取文件,搜索引擎“蜘蛛”在互联网中抓取网页,然后将抓取的网页放到 临时数据库中,在抓取的网页中若还有其他的链接,搜索引擎“蜘蛛”会顺着这个链接进入下一个页面,再把这个页面抓取放入临时库中,就这样不断的循环抓取; 就像是一个超市一样,在超市开业前超市的采购员回去市场上采集一些产品,在采集这些产品过程发现有新的产品,他会将这个新的产品一起采集回来,放在超市 中,搜索引擎的临时数据库就相当于超市一样,搜索引擎“蜘蛛”就相当于超市的采购员,通常我都知道超市中如果有一些商品是劣质的或是没有客户购买的,超市 的负责人会将该商品退出超市,合格的商品就会按照商品的类别进行分类,摆放,将合格的产品呈现给客户。就像临时数据库中的网页信息一样如果有不符合规则, 就被清除掉;若符合规则,就放入索引区,再通过分类、整理、排序等过程,将符合规则的网页放到主索引区,也就是用户直接看到查询的结果。
     
    重要聲明:本論壇是以即時上載留言的方式運作,比思論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,讀者及用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,讀者及用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本論壇受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者及用戶發現有留言出現問題,請聯絡我們比思論壇有權刪除任何留言及拒絕任何人士上載留言 (刪除前或不會作事先警告及通知 ),同時亦有不刪除留言的權利,如有任何爭議,管理員擁有最終的詮釋權。用戶切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。

    手機版| 廣告聯繫

    GMT+8, 2024-6-1 20:19 , Processed in 0.018242 second(s), 27 queries , Gzip On.

    Powered by Discuz! X2.5

    © 2001-2012 Comsenz Inc.

    回頂部