正排计算与数组

藏书人摘要:正排计算是承接全文检索的开始。(1)text文档的提取策略。以板块为范围。形成localid编码。提取其中的字符串。(2)提取后的计算。实际所有的字符串还是进行主题的计算。具体的实施以数组的形式产于计算:--------words--------(1)woredid======Red...
正排计算是承接全文检索的开始。

(1)text文档的提取策略。

以板块为范围。形成localid编码。
提取其中的字符串。

(2)提取后的计算。

实际所有的字符串还是进行主题的计算。

具体的实施以数组的形式产于计算:

--------words--------

(1)woredid

======Reduce weight========/* ---------关键步骤  */

---------hit----------

(2)nhits

(3)hitlist

(4)Features



这样实际是以统计为主,在统计中获得重要信息的比特值。作为倒排的基础。

下一篇:排序的的计算规则 摘要:原来我讲过什么是关键词,这次我说说搜索对于关键词的计算。 首先确认三个因素: 【1】web(网络,实际准确的说是搜索已经收录页面的集合) 【2】site(网站的集合,指的是快照中,搜索收录页面的集合) 【3】page(网页) 第一步计算: 由于搜索是网页排
相关文章:
  • 网页信噪比
  • 关于WEB日志里的"200 0 64"
  • 排序的的计算规则
  • 链接节点安排之贝叶斯网络
  • 正排计算与数组
  • seo的链接分析计算