正排计算与数组
藏书人摘要:正排计算是承接全文检索的开始。(1)text文档的提取策略。以板块为范围。形成localid编码。提取其中的字符串。(2)提取后的计算。实际所有的字符串还是进行主题的计算。具体的实施以数组的形式产于计算:--------words--------(1)woredid======Red...
正排计算是承接全文检索的开始。
(1)text文档的提取策略。
以板块为范围。形成localid编码。
提取其中的字符串。
(2)提取后的计算。
实际所有的字符串还是进行主题的计算。
具体的实施以数组的形式产于计算:
--------words--------
(1)woredid
======Reduce weight========/* ---------关键步骤 */
---------hit----------
(2)nhits
(3)hitlist
(4)Features
这样实际是以统计为主,在统计中获得重要信息的比特值。作为倒排的基础。
下一篇:排序的的计算规则 摘要:原来我讲过什么是关键词,这次我说说搜索对于关键词的计算。
首先确认三个因素:
【1】web(网络,实际准确的说是搜索已经收录页面的集合)
【2】site(网站的集合,指的是快照中,搜索收录页面的集合)
【3】page(网页)
第一步计算:
由于搜索是网页排
相关文章:
网页信噪比
关于WEB日志里的"200 0 64"
排序的的计算规则
链接节点安排之贝叶斯网络
正排计算与数组
seo的链接分析计算