您的位置:澳门402永利com > 澳门402永利com网络 > 0的汤姆cat安顿及Solrj的粗略利用教程,搜索引擎

0的汤姆cat安顿及Solrj的粗略利用教程,搜索引擎

发布时间:2019-11-07 02:09编辑:澳门402永利com网络浏览(101)

    Solr简介

    Solr是一个不行流行的,高质量的开源公司级寻找引擎平台,归于Apache Lucene项目。首要意义包含强盛的全文字笔迹核查索、结果高亮、切面检索、动态聚类、数据库整合、富文本(譬如Word,PDF卡塔尔的管理,以致地理消息寻觅。Solr是惊人可扩张的,提供分布式检索和目录复制,并为世界上不菲的特大型网址提供查找和导航成效。
    Solr使用Java编写,可运转于servlet容器(如Tomcat卡塔尔作为一个独门的全文字笔迹核准索服务器。Solr以Lucene 为主导来创建索引和进展检索,并提供雷同REST的HTTP / XML和JSON API,这个API能够在其他编制程序语言中央银行使。通过Solr强盛的扩展配置可适应大约任何类型非Java编写应用程序,同期持有足够的插件来扩大高端功用。

    Solr服务器采纳java5支付的,是基于Lucene全文找出的。要想搭建Solr,首先举办java情形的布局,安装相应的jdk以致tomcat,在那就十分少讲。

    Solr特性

    • Red Banner的全文检索成效
    • 专为MTK量的互连网流量实行的优化
    • 依照专门的学问的开放接口 - XML,JSON和HTTP
    • 综述的HTML管理界面
    • 暴光JMX接口以利于监督服务器总结
    • 可扩充性 - 有效地复制到其余Solr搜索服务器
    • 利用XML配置达到灵活性和适配性
    • 可扩张的插件种类布局

    以下是在jdk1.7和tomcat1.7的情状下搭建最新版本的solr4.10.3。

    Solr使用Lucene并拓宽了扩张

    • 一个的确的全部动态域(Dynamic Field)和唯风流倜傥键(Unique Key)的多少情势(Data Schema)
    • 对Lucene的查询语言举办了强盛的强大
    • 断面找出和过滤
    • 地理空间消息寻觅
    • 学好的,可配置的文书剖判
    • 中度可安顿、可扩充的缓存机制
    • 品质优化
    • 支撑通过XML配置
    • 提供管理分界面
    • 可监察和控制日志记录
    • 支撑高速增量式更新(法斯特 incremental Updates)和快速照相公布(Snapshot Distribution)
    • 可观可扩充的布满式寻找,片式指数在多台主机
    • JSON,XML,CSV /分隔的文书和二进制更新格式
    • 接受简单的办法就可以从数据库、XML文件数量、本地球磁性盘、HTTP等源于获取数据
    • 依照Apache Tika对富文本举行深入分析和目录(PDF,WO陆风X8D,HTML等卡塔尔国
    • Apache UIMA集成的可计划的元数据提取
    • 支撑七个找出索引

    上述的介绍翻译自:

    具体步骤如下:

    Solr的运行

    从Solr的官方网站上下载的Solr包里面有二个基于jetty的身体力行运转情状。下载Solr包,张开当中的example目录,点击里面包车型地铁start.jar。在浏览器里面输入

    图片 1

    如上是Solr管控台的主页,左侧是导航。能够采纳

    1.到官网下载.

    在Tomcat中部署Solr

    上面包车型客车运作是Solr暗中认可绑定的七个jetty,若是急需在tomcat中运作solr,方法如下:

    1、将Solr/dist/apache-solr-4.0.0.war此war包复制到tomcat的webapps目录上面,同仁一视命名成solr。

    2、点击tomcat/bin/startup.bat运转tomcat,这个时候tomcat会解压solr.war包到webapps目录上面。见到调控台里面会有报错提醒,是找不到solr的实例运维情状。这时候关闭tomcat。

    3、删除webapps目录上边包车型客车solr.war包。将下载的solr目录下边包车型地铁example下边包车型大巴solr目录复制到tomcat的webapps/solr上面。下边的目录结构大要上是这么的webapps/solr/solr/collection1肖似那样的。

    4、张开webapps/solr/WEB-INF/web.xml文件,在里面增加如下内容。env-entry-value那些目录是指向上叁个步骤中的目录。这里运用的是争执目录(相对于tomcat的bin目录卡塔尔,也足以使用相对路线,如d:/solr等。步骤3中的目录不必然要放在tomcat中,只要此步骤上将路线配置不错即可。

    <env-entry>
     <env-entry-name>solr/home</env-entry-name>
     <env-entry-value>../webapps/solr/solr</env-entry-value>
     <env-entry-type>java.lang.String</env-entry-type>
     </env-entry>
    

    5、再度运营tomcat,输入

    2.建目录/webapps/mysolr/solr

    使用Solrj操作Solr

    从上边的步子中得以见见Solr提供了一个商厦索求引擎平台的主干,能够通过她的接口进行索引的创设、改过、删除。并付出关键字张开查找。但若是要真的的投入使用,依然有不和劳作亟待做,如:

    1、对向Solr提交索引进行自然的包装以有益专门的职业系列开展操作

    2、对寻觅举行李包裹装,以便于结果的表现解析等等。

    Solrj是应用java编写的三个操作Solr的工具,方便于实行索引的翻新、找出结果的获得等等。

    在Solr的发表包里面有Solrj的有关jar包。Solrj必要的jar包为:

    apache-solr-solrj-4.0.0.jar和他的凭借包solr/dist/solrj-lib

    倘就算行使maven,能够加上:

    <dependency>
     <groupId>org.apache.solr</groupId>
     <artifactId>solr-solrj</artifactId>
     <version>4.0.0</version>
    </dependency>
    

    越来越多详细情形见请继续读书下风流倜傥页的精粹内容: http://www.linuxidc.com/Linux/2014-05/102135p2.htm

     

    Solr3.6.1 在汤姆cat6下的意况搭建 http://www.linuxidc.com/Linux/2013-01/77664.htm

    基于汤姆cat的Solr3.5集群布置 http://www.linuxidc.com/Linux/2012-12/75297.htm

    在Linux上利用Nginx为Solr集群做负载均衡 http://www.linuxidc.com/Linux/2012-12/75257.htm

    Linux下安装使用Solr http://www.linuxidc.com/Linux/2012-10/72029.htm

    在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http://www.linuxidc.com/Linux/2012-09/71158.htm

    Solr完毕Low Level查询深入深入分析(QParser卡塔 尔(阿拉伯语:قطر‎ http://www.linuxidc.com/Linux/2012-05/59755.htm

    据他们说Solr 3.5搭建寻找服务器 http://www.linuxidc.com/Linux/2012-05/59743.htm

    Solr 3.5支付使用学科 PDF高清版 http://www.linuxidc.com/Linux/2013-10/91048.htm

    Solr 4.0 安顿实例教程 http://www.linuxidc.com/Linux/2013-10/91041.htm

    Solr 的详实介绍:请点这里
    Solr 的下载地址:请点这里

    图片 2

    3.解压压缩包solr-4.10.3,找到example下的webapps中的solr.war包,并将其解压。

    4.将解压完的war包(solr文件夹卡塔尔国拷贝到第2步建的目录:/webapps/mysolr下

    5.拷贝八个地点的jar包到/webapps/mysolr/solr/WEB-INF/lib下

    (1卡塔 尔(英语:State of Qatar)example下lib包的具备jar包

    (2卡塔 尔(英语:State of Qatar)example下lib包下的ext包中的全部jar包

    6.拷贝example/resource下的log4j.properties文件到/webapps/mysolr/solr/classpath 下

    7.solrhome的配置:

    先创设三个solrhome目录:/webapps/mysolr/solrhome,然后将example/solr下的装有文件拷贝到/webapps/mysolr/solrhome下

    接下来改革配置文件/webapps/mysolr/solr/WEB-INF/web.xml,将solr/home的解说放手并布署如下:

    <env-entry> 
      <env-entry-name>solr/home</env-entry-name> 
      <env-entry-value>/webapps/mysolr/solrhome</env-entry-value> 
      <env-entry-type>java.lang.String</env-entry-type> 
    </env-entry> 

    8.把/webapps/mysolr/solr部署到tomcat下,并启动tomcat。

    如上就到位了solr情形的主干搭建,访谈  可看见如下分界面:

    图片 3

     

    Solr3.6.1 在汤姆cat6下的碰到搭建 http://www.linuxidc.com/Linux/2013-01/77664.htm

    依照Tomcat的Solr3.5集群安顿 http://www.linuxidc.com/Linux/2012-12/75297.htm

    在Linux上采纳Nginx为Solr集群做负载均衡 http://www.linuxidc.com/Linux/2012-12/75257.htm

    Linux下安装使用Solr http://www.linuxidc.com/Linux/2012-10/72029.htm

    在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http://www.linuxidc.com/Linux/2012-09/71158.htm

    Solr实现Low Level查询深入深入分析(QParser卡塔尔国 http://www.linuxidc.com/Linux/2012-05/59755.htm

    依靠Solr 3.5搭建搜索服务器 http://www.linuxidc.com/Linux/2012-05/59743.htm

    Solr 3.5支付使用学科 PDF高清版 http://www.linuxidc.com/Linux/2013-10/91048.htm

    Solr 4.0 布署实例教程 http://www.linuxidc.com/Linux/2013-10/91041.htm

    Solr 的详细介绍:请点这里
    Solr 的下载地址:请点这里

    正文永恒更新链接地址:http://www.linuxidc.com/Linux/2015-01/112393.htm

    图片 4

    本文由澳门402永利com发布于澳门402永利com网络,转载请注明出处:0的汤姆cat安顿及Solrj的粗略利用教程,搜索引擎

    关键词: