这跟谷/歌的历史有很大的关系。谷/歌之所以能有今天很大程度是因为PageRank算法。
在互联网早期,随着网络上的网页逐渐增多,如何从海量网页中检索出我们想要的页面,变得非常的重要。
当时著名的雅/虎和其它互联网公司都试图解决这个问题,但都没能有一个很好的解决方案。
直到1998年前后,两位斯坦福大学的博士生,拉里·佩奇和谢尔盖·布林一起发明了著名的PageRank算法,才完美的解决了网页排名的问题。
正是因为这个算法,诞生了谷/歌公司。
PageRank是一种通过网页之间的超链接来计算网页重要性的技术。
以谷/歌创办人LarryPage之姓来命名,谷/歌用它命名也体现了该算法的重视程度。
该算法可以通过计算计算出数值体现网页的相关性和重要性。
PageRank通过网络浩瀚的超链接关系来确定一个页面的等级,把从A页面到B页面的链接解释为A页面给B页面投票,谷/歌根据A页面(甚至链接到A的页面)的等级和投票目标的等级来决定B的等级。
简单的说,一个高等级的页面可以使其他低等级页面的等级提升。
该算法把整个互联网可以看作是一张有向图图,网页是图中的节点,网页之间的链接就是图中的边。
借助该算法可以衡量不同网页的根搜索关键词的关联程度从而对网页排序。
在很长一段时间内,当你在谷/歌键入关键词后得到的搜索信息。
搜索信息里那一系列网页对应着的网页排列顺序就是依托PageRank算法进行排序的。
这个算法的重要性可见一斑。
PageRank算法不止用于搜索引擎领域。
还跨界进入了自然语言处理(NLP)领域。
在NLP方面大名鼎鼎的TextRank算法就是在PageRank算法之上而来的。
而TextRank算法一向是抽取式摘要算法的核心算法。
虽然目前TextRank算法主要用于自然语言处理方面。
但并不代表这个算法不能应用于搜索方面。
毕竟TextRank算法和用于搜索的PageRank算法本是同根生。
而林灰搞得生成式文本摘要算法(GTSA)虽然表面上看是文本处理算法。
但事实上也有作用于未来搜索领域的潜质。
在互联网早期,随着网络上的网页逐渐增多,如何从海量网页中检索出我们想要的页面,变得非常的重要。
当时著名的雅/虎和其它互联网公司都试图解决这个问题,但都没能有一个很好的解决方案。
直到1998年前后,两位斯坦福大学的博士生,拉里·佩奇和谢尔盖·布林一起发明了著名的PageRank算法,才完美的解决了网页排名的问题。
正是因为这个算法,诞生了谷/歌公司。
PageRank是一种通过网页之间的超链接来计算网页重要性的技术。
以谷/歌创办人LarryPage之姓来命名,谷/歌用它命名也体现了该算法的重视程度。
该算法可以通过计算计算出数值体现网页的相关性和重要性。
PageRank通过网络浩瀚的超链接关系来确定一个页面的等级,把从A页面到B页面的链接解释为A页面给B页面投票,谷/歌根据A页面(甚至链接到A的页面)的等级和投票目标的等级来决定B的等级。
简单的说,一个高等级的页面可以使其他低等级页面的等级提升。
该算法把整个互联网可以看作是一张有向图图,网页是图中的节点,网页之间的链接就是图中的边。
借助该算法可以衡量不同网页的根搜索关键词的关联程度从而对网页排序。
在很长一段时间内,当你在谷/歌键入关键词后得到的搜索信息。
搜索信息里那一系列网页对应着的网页排列顺序就是依托PageRank算法进行排序的。
这个算法的重要性可见一斑。
PageRank算法不止用于搜索引擎领域。
还跨界进入了自然语言处理(NLP)领域。
在NLP方面大名鼎鼎的TextRank算法就是在PageRank算法之上而来的。
而TextRank算法一向是抽取式摘要算法的核心算法。
虽然目前TextRank算法主要用于自然语言处理方面。
但并不代表这个算法不能应用于搜索方面。
毕竟TextRank算法和用于搜索的PageRank算法本是同根生。
而林灰搞得生成式文本摘要算法(GTSA)虽然表面上看是文本处理算法。
但事实上也有作用于未来搜索领域的潜质。