博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬虫书籍
阅读量:6878 次
发布时间:2019-06-26

本文共 327 字,大约阅读时间需要 1 分钟。

hot3.png

爬虫书籍 博客分类: java

1,网络机器人Java编程指南,浅显易懂,有点过时,但适合新手

2,自己动手写网络爬虫,有点基础还可以看看,写的有点乱,很多内容交代不清楚,并且大篇幅代码抄袭。。。

3,搜索引擎 ——原理、技术与系统,北大天网为案例,很好很强大,有点学术味道

4,Web数据挖掘 Bing Liu,刘兵的书,强烈推荐

5,搜索引擎:信息检索实践,很好的书,强烈推荐

 

6.解密搜索引擎技术实战:Lucene & Java精华版

 

还有一些论文,自己去找吧

案例的话,可以研究下Nutch爬虫部分代码,写的很清晰

有了以上这些,应该算是入门了

转载于:https://my.oschina.net/xiaominmin/blog/1597678

你可能感兴趣的文章
HTML 5 <input> placeholder 属性
查看>>
应用场景是什么?怎样判断、描述一个产品的应用场景?
查看>>
Winform基础知识
查看>>
【ClickOnce】自定义前提条件 Creating Bootstrapper Packages
查看>>
css格式与布局
查看>>
但那不是爱
查看>>
Codeforces 935 C Fifa and Fafa
查看>>
浏览器根对象document之方法概述
查看>>
纯小白入手 vue3.0 CLI - 3.1 - 路由 ( router )
查看>>
ActiveMQ相关背景(转)
查看>>
深入理解Linux修改hostname(转)
查看>>
对TCP/IP网络协议的深入浅出归纳(转)
查看>>
北京,北京!
查看>>
有序的组合
查看>>
MySQL----基本数据类型
查看>>
wpgcms---详情页面数据怎么渲染
查看>>
oracle数据库存储过程中NO_DATA_FOUND不起作用解决
查看>>
node之版本号升级和管理
查看>>
Java与设计模式-策略模式
查看>>
tengine 的优化
查看>>