1. 书籍
  2. 详情

《开发自己的搜索引擎:Lucene+Heritrix》第2版

基本信息

  • 书籍大小:未知
  • 书籍语言:简体中文
  • 书籍类别:编程开发
  • 书籍标签:编程开发
  • 购买链接: 京东   淘宝

打开支付宝首页搜“673273051”领红包,领到大红包的小伙伴赶紧使用哦!

相关书籍

内容介绍

[开发自己的搜索引擎:Lucene.Heritrix(第2版)].邱哲.扫描版.pdf  87.2MB
87.2MB
中文名开发自己的搜索引擎:Lucene+Heritrix
作者邱哲
图书分类软件
资源格式PDF
版本第2版
出版社人民邮电出版社
书号9787115215291
发行时间2010年01月01日
地区大陆
语言简体中文
简介



内容介绍:

开 发自己的搜索引擎:Lucene+Heritrix(第2版)》是一本介绍搜索引擎开发的书籍,通过《开发自己的搜索引 擎:Lucene+Heritrix(第2版)》,读者可以独立构建一个企业级的搜索引擎网站。《开发自己的搜索引 擎:Lucene+Heritrix(第2版)》讲解了搜索引擎与信息检索基础,Lucene入门实例,索引的建立,使用Lucene来搜索,排序,分析 器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式,爬虫 Heritrix,HTMLParser,DWR等内容。最后综合这些技术,构建了一个典型的垂直搜索系统,具有很强的商业实用价值。
  《开发 自己的搜索引擎:Lucene+Heritrix(第2版)》是一本使用Lucene和Heritrix来讲解搜索引擎构建的书,通过对API和源代码的 分析,力求使读者在应用的基础上,能够深入其核心,自行扩展和开发相应组件,发挥想象力,开发出更具有创意的搜索引擎产品。


  《开发自己的搜索引擎:Lucene+Heritrix(第2版)》适合Java程序员和从事计算机软件开发的编程人员阅读,同时也可以作为搜索引擎爱好者的入门书籍。

内容截图:




目录

第1章 搜索引擎与信息检索 1
1.1 搜索引擎的历史 1
1.1.1 萌芽:Archie、Gopher 1
1.1.2 起步:Robot(网络机器人)的出现与Spider(网络爬虫) 3
1.1.3 发展:Excite、Galaxy、Yahoo等 4
1.1.4 繁荣:Infoseek、AltaVista、Google和Baidu 6
1.2 信息检索系统的基本知识 9
1.2.1 信息检索系统 9
1.2.2 信息检索的过程 11
1.2.3 传统查找的优点和不足 12
1.2.4 使用索引提高检索速度 12
1.2.5 倒排索引 13
1.2.6 评价信息检索系统的标准 14
1.3 Lucene的简介 14
1.4 小结 15

下载地址

打赏