nutch-1.2在搜索HDFS过程中高并发的处理

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 1801 次

锁定老帖子主题：nutch-1.2在搜索HDFS过程中高并发的处理精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
p_x1984 等级: 性别: 文章: 207 积分: 850 来自: 北京	发表时间：2011-07-14 相关推荐: 解析 Linux 内核的 Initrd 机制及编程实践 initramfs 在内核中的作用与实现 linux 内核启动Initramfs与initrd 及其挂载详解Linux Initrd 详解linux的initrd 更多相关推荐编程综合紧接着昨天的一篇文档写下去。nutch-1.2结合hadoop搜索，在高并发的情况下，搜索的速度如何提升。 1、其实通过看nutch-1.2中的NutchBean源码程序不难发现，它在搜索的时候，有几个实现类，RPCSearchBean、DistributedSearchBean、SolrSearchBean。在RPCSearchBean中还有LuceneSearchBean，和NutchBean.这里我是使用的NutchBean.在搜索过程中，发出一个search的请求，hadoop接受到这个请求后，会从各个的slaves节点上收集信息，然后返回给master。master返回给nutch.原理是这个样子的。这里我是把FetchedSegments 中的getParseData 方法的同步代码去掉了，可以让大量的请求过来搜索。因为我在初始化的时候只打开一次HDFS的 index. 希望这些对大家的工作过程中有所帮助！声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

论坛首页 → 综合技术版

跳转论坛: