R是统计计算的强大工具,JAVA是做应用系统的主流语言。JAVA负责系统的构建,R用来做运算引擎,从而实现应用型和分析性相结合的系统。
一、Rserve(远程通信模式)
Rserve是一个基于TCP/IP的服务器,通过二进制协议传输数据,可以提供远程连接,使得客户端语言能够调用R。
Rserve作为一个package发布在CRAN上,可以直接使用install.packages("Rserve")进行安装。需要使用时在R控制台下加载该包,然后输入命令Rserve(),开启服务器就可以供客户端调用。首先建立一个新的连接,然后就可以使用eval之类的方法将R中的表达式传到服务器端,通过R求值后传回JAVA中REXP类型的变量,然后打印出来,整个过程非常简单。由于不需要对R进行初始化,因此速度会比较快。在其他系统下可以同时建立多个连接,但是在Windows下只允许同时打开一个连接,后续的连接都会共有相同的命名空间。
1、Rserve安装和启动(windows环境)
方法一:前提:安装并配置了R语言
第一次启动安装Rserve包:
install.packages("Rserve")
第一次启动加载Rserve包:
library(Rserve)
启动Rserve服务:
Rserve()
关闭Rconnection连接:
关闭Rconnection连接用rc.close()
;
方法二:点击R工具栏上的“程序包”--》“设定CRAN镜像”--》China(xxx) —》确定
点击【程序包】—》安装程序包—》选择 rJava —>OK
点击【程序包】—》安装程序包—》选择 Rserve —>OK
点击【程序包】—》加载程序包—》选择 rJava —>OK
点击【程序包】—》加载程序包—》选择 Rserve —>OK
安装命令:install.packages("packageName")
加载命令:library(packageName)
启动命令:Rserve()
2.Java调用R
基本方法:
Rconnection
:连接R服务
eval()
:执行R语句
assgin()
:声明变量
REXP
:
asInteger(), asIntegers(), asString(), asDouble(), asDoubles(), asList()
获取相应类型的数据
引用R架包或者添加maven配置:
<!--REngine Java Interface to R --> <dependency> <groupId>org.rosuda.REngine</groupId> <artifactId>REngine</artifactId> <version>2.1.0</version> </dependency> <dependency> <groupId>org.rosuda.REngine</groupId> <artifactId>Rserve</artifactId> <version>1.8.1</version> </dependency>
实例1:求一个数组里面的最大值
//建立连接 RConnection rc=new RConnection(); //构建数据 int[] datas={314,451,56,24,631}; //声明变量,相当于在R命令行中输入data<-datas命令 rc.assign("data",datas); //执行R语句,相当于在R命令行中输max(data)命令 REXP rexp=rc.eval("max(data)"); //REXP. asXxx()返回相应类型的数据,如果结果类型不符会出错 System.out.println(rexp.asInteger()); rc.close();
实例2:调用自定义函数
创建R文件test.R myFunc<-function(data){ x<-data+2; }
RConnection rc = new RConnection(); // test.R的路径 String fileName = "D:\\test.R"; rc.assign("fileName", fileName); //执行test.R脚本,执行这一步才能调用里面的自定义函数myFunc,如果不行,就在R工具上也执行一下test.R脚本 rc.eval("source(fileName)"); String num = "3"; //调用myFunc函数 REXP rexp=rc.eval("myFunc("+num+")"); //返回类型是一个整数类型,所以用asInteger System.out.println(rexp.asInteger()); rc.close();
在R-x.x.x\library\Rserve\client\java\Rserve\test目录下有测试用例可以参考。(StartRserve.java是用java启动Rserve服务,而不用打开R语言来手动启动。test.java里包含了基本方法的调试)
二、JRI(嵌入式模式)
JRI,全名是Java/R Interface,是通过调用R的动态链接库从而利用R中的函数等。通过install.packages("rJava")安装rJava就行,在安装文件夹中,可以看到一个jri的子文件夹,里面有自带的例子可以用来测试。
配置环境变量:在PATH中添加%R_HOME%/bin和%R_HOME%/library/rJava/jri,注意R_HOME的路径要正确。
安装rJava
install.packages("rJava")
设置环境变量:PATH后添加 %R_HOME%\library\rJava\jri
获取jar包:把安装目录jri文件夹下的JRI.jar、REngine.jar和JRIEngine.jar放进Java工程添加到工程中。
两种方式优缺点比较:
JRI(嵌入式模式)我体会到最大的优点是它对中文的支持较好,但是使用JRI模式下很容易造成整个系统的崩溃,比如在java调用R的时候,中间出现了异常或者错误,这些错误大致都是致命的,导致java虚拟机崩溃,从而导致整个系统崩溃
Rserve(远程通信模式) 在这种通信模式下,最大的优点是javaWeb项目不需要去维护R的运行,通过TCP/IP协议直接进行通讯,但是有一个很大的缺点是它对中文的支持很弱,尤其是在windows的环境中。基本是不支持中文的,在linux环境下,似乎对中文的支持稍微好些。不是完全支持中文的话,对返回有中文或者输入有中文的系统将是不可用的。