﻿<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/">
  <channel>
    <title>★B-boy★</title>
    <description>CENYA（C-E-N-Y-A）</description>
    <link>http://www.cenya.com/社区/橙鸭博客/tabid/10462/BlogId/13/Default.aspx</link>
    <language>zh-CN</language>
    <managingEditor>zxy032449@126.com</managingEditor>
    <webMaster>kurt@cenya.com</webMaster>
    <pubDate>Mon, 08 Sep 2008 05:46:35 GMT</pubDate>
    <lastBuildDate>Mon, 08 Sep 2008 05:46:35 GMT</lastBuildDate>
    <docs>http://backend.userland.com/rss</docs>
    <generator>Blog RSS Generator Version 3.2.0.29758</generator>
    <item>
      <title>Google工程师谈Google的网页排名技术</title>
      <description>大家可能听说过，Google 革命性的发明是它名为 “Page Rank” 的网页排名算法，这项技术彻底解决了搜索结果排序的问题。其实最先试图给互联网上的众多网站排序的并不是 Google。Yahoo！ 公司最初第一个用目录分类的方式让用户通过互联网检索信息，但由于当时计算机容量和速度的限制，当时的 Yahoo！ 和同时代的其它搜索引擎都存在一个共同的问题： 收录的网页太少，而且只能对网页中常见内容相关的实际用词进行索引。那时，用户很难找到很相关信息。我记得 1999 年以前查找一篇论文，要换好几个搜索引擎。后来 DEC 公司开发了 AltaVista 搜索引擎，只用一台 ALPHA 服务器，却收录了比以往引擎都多的网页，而且对里面的每个词进行索引。AltaVista 虽然让用户搜索到大量结果，但大部分结果却与查询不太相关，有时找想看的网页需要翻好几页。所以最初的 AltaVista 在一定程度上解决了覆盖率的问题，但不能很好地对结果进行排序。
&lt;p style="LINE-HEIGHT: 150%"&gt;    Google 的 “Page Rank” （网页排名）是怎么回事呢？其实简单说就是民主表决。打个比方，假如我们要找李开复博士，有一百个人举手说自己是李开复。那么谁是真的呢？也许有好几个真的，但即使如此谁又是大家真正想找的呢？:-)如果大家都说在 Google 公司的那个是真的，那么他就是真的。&lt;br /&gt;
&lt;br /&gt;
&lt;font style="FONT-FAMILY: arial,sans-serif"&gt;      &lt;/font&gt;在互联网上，如果一个网页被很多其它很多网页所链接，说明它受到普遍的承认和信赖，那么它的排名就高。这就是Page Rank 的核心思想。 当然 Google 的 Page Rank 算法实际上要复杂得多。比如说，对来自不同网页的链接对待不同，本身网页排名高的链接更可靠，于是给这些链接予较大的权重。Page Rank 考虑了这个因素，可是现在问题又来了，计算搜索结果的网页排名过程中需要用到本身网页的排名，这不成了先有鸡还是先有蛋的问题了吗？&lt;br /&gt;
&lt;br /&gt;
&lt;font style="FONT-FAMILY: arial,sans-serif"&gt;      &lt;/font&gt;Google 的两个创始人拉里•佩奇 （Larry Page ）和谢尔盖•布林 (Sergey Brin) 把这个问题变成了一个二维矩阵相乘的问题，并且用迭代的方法解决了这个问题。他们先假定所有网页的排名是相同的，并且根据这个初始值，算出各个网页的第一次迭代排名，然后再根据第一次迭代排名算出第二次的排名。他们两人从理论上证明了不论初始值如何选取，这种算法都保证了网页排名的估计值能收敛到他们的真实值。值得一提的事，这种算法是完全没有任何人工干预的。&lt;br /&gt;
&lt;br /&gt;
&lt;font style="FONT-FAMILY: arial,sans-serif"&gt;      &lt;/font&gt;理论问题解决了，又遇到实际问题。因为互联网上网页的数量是巨大的，上面提到的二维矩阵从理论上讲有网页数目平方之多个元素。如果我们假定有十亿个网页，那么这个矩阵 就有一百亿亿个元素。这样大的矩阵相乘，计算量是非常大的。拉里和谢尔盖两人利用稀疏矩阵计算的技巧，大大的简化了计算量，并实现了这个网页排名算法。今天 Google 的工程师把这个算法移植到并行的计算机中，进一步缩短了计算时间，使网页更新的周期比以前短了许多。&lt;br /&gt;
&lt;br /&gt;
&lt;font style="FONT-FAMILY: arial,sans-serif"&gt;      &lt;/font&gt;我来 Google 后，拉里 (Larry) 在和我们几个新员工座谈时，讲起他当年和谢尔盖(Sergey) 是怎么想到网页排名算法的。他说："当时我们觉得整个互联网就像一张大的图 （Graph)，每个网站就像一个节点，而每个网页的链接就像一个弧。我想，互联网可以用一个图或者矩阵描述，我也许可以在用这个发现做个博士论文。" 他和谢尔盖就这样发明了 Page Rank 的算法。&lt;br /&gt;
&lt;br /&gt;
&lt;font style="FONT-FAMILY: arial,sans-serif"&gt;      &lt;/font&gt;网页排名的高明之处在于它把整个互联网当作了一个整体对待。它无意识中符合了系统论的观点。相比之下，以前的信息检索大多把每一个网页当作独立的个体对待，很多人当初只注意了网页内容和查询语句的相关性，忽略了网页之间的关系。 &lt;br /&gt;
&lt;br /&gt;
&lt;font style="FONT-FAMILY: arial,sans-serif"&gt;      &lt;/font&gt;今天，Google 搜索引擎比最初的复杂、完善了许多。但是网页排名在 Google 所有算法中依然是至关重要的。在学术界, 这个算法被公认为是文献检索中最大的贡献之一，并且被很多大学引入了信息检索课程 (Information Retrieval) 的教程。&lt;/p&gt;</description>
      <link>http://www.cenya.com/社区/橙鸭博客/tabid/10462/EntryID/17/Default.aspx</link>
      <author>zxy032449@126.com</author>
      <comments>http://www.cenya.com/社区/橙鸭博客/tabid/10462/EntryID/17/Default.aspx#Comments</comments>
      <guid isPermaLink="true">http://www.cenya.com/Default.aspx?tabid=10462&amp;EntryID=17</guid>
      <pubDate>Sat, 31 Mar 2007 04:49:00 GMT</pubDate>
      <slash:comments>0</slash:comments>
      <trackback:ping>http://www.cenya.com/DesktopModules/Blog/Trackback.aspx?id=17</trackback:ping>
    </item>
    <item>
      <title>十个网页设计师必去网站</title>
      <description>1.网页制作大宝库&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.dabaoku.com/"&gt;http://www.dabaoku.com/&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;2.素材精品屋&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.sucaiw.com/"&gt;http://www.sucaiw.com/&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;3.模板天下&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.mbsky.com/"&gt;http://www.mbsky.com&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;4.先飞电脑技术网&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.mbsky.com/"&gt;http://www.mbsky.com&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;5.我爱素材&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.52sucai.com/"&gt;http://www.52sucai.com&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;6.丁定家园&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.citk.net/"&gt;http://www.citk.net/&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;7.素材中国&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.sucai.cn/"&gt;http://www.sucai.cn/&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;8.我爱设计网&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.52design.com/"&gt;http://www.52design.com/&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;9.设计无限&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.sj00.com/"&gt;http://www.sj00.com/&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;10.蓝色理想&lt;/p&gt;
&lt;br /&gt;
&lt;p&gt;&lt;a target="_blank" href="http://www.blueidea.com/"&gt;http://www.blueidea.com/&lt;/a&gt;&lt;/p&gt;</description>
      <link>http://www.cenya.com/社区/橙鸭博客/tabid/10462/EntryID/15/Default.aspx</link>
      <author>zxy032449@126.com</author>
      <comments>http://www.cenya.com/社区/橙鸭博客/tabid/10462/EntryID/15/Default.aspx#Comments</comments>
      <guid isPermaLink="true">http://www.cenya.com/Default.aspx?tabid=10462&amp;EntryID=15</guid>
      <pubDate>Sat, 31 Mar 2007 04:48:00 GMT</pubDate>
      <slash:comments>0</slash:comments>
      <trackback:ping>http://www.cenya.com/DesktopModules/Blog/Trackback.aspx?id=15</trackback:ping>
    </item>
    <item>
      <title>设计师必备法宝</title>
      <description>设计师必备法宝</description>
      <link>http://www.cenya.com/社区/橙鸭博客/tabid/10462/EntryID/13/Default.aspx</link>
      <author>zxy032449@126.com</author>
      <comments>http://www.cenya.com/社区/橙鸭博客/tabid/10462/EntryID/13/Default.aspx#Comments</comments>
      <guid isPermaLink="true">http://www.cenya.com/Default.aspx?tabid=10462&amp;EntryID=13</guid>
      <pubDate>Sat, 31 Mar 2007 04:44:00 GMT</pubDate>
      <slash:comments>0</slash:comments>
      <trackback:ping>http://www.cenya.com/DesktopModules/Blog/Trackback.aspx?id=13</trackback:ping>
    </item>
  </channel>
</rss>