Poder utilizar la potencia de R desde Java u otros lenguajes de programación puede facilitar el desarrollo de soluciones. Para esto, existe el paquete Rserve
que permite crear un servicio en una máquina mediante el cual se puede ejecutar código R desde en remoto. Gracias a esto se puede llevar la potencia de análisis de R a otros lenguajes que no disponen de librerías equivalentes.
Introducción
R es un entorno fantástico para el análisis estadístico de datos al permitir realizar complejos estudios de una forma fácil y sencilla. Además, con los más de 10.000 paquetes que existen actualmente en el CRAN los casos de uso aumentan considerablemente. En muchas ocasiones puede ser interesante disponer de esta potencia analítica a la hora de desarrollar una aplicación en otro lenguaje, por ejemplo, en Java o C#. Para estas situaciones el paquete Rserve
es una solución ya que permite acceder la potencia de R desde los lenguajes más populares como Java, Python, C#, .NET o Ruby.
Rserve
es un paquete de R que permite comunicar R con otras aplicaciones mediante TCP/IP o sockets UNIX locales. Gracias a lo que se pueden publicar aplicaciones las funcionalidades de R a aplicaciones en otros lenguajes de programación.
Instalación de Rserve
Para poder utilizar Rserve
se ha de instalar el paquete del mismo nombre que se puede encontrar en el CRAN. El proceso de instalación es como cualquier otro paquete, para lo que se ha de escribir:
install.packages("Rserve")
Una vez instalado el paquete, para levantar un servidor de Rserver
en el que se ejecutará el código se ha de escribir la siguiente instrucción en la línea de comandos:
R CMD Rserve
Las opciones de ejecución del paquete se pueden configurar mediante la línea de comandos. Aunque es más interesante realizar estas mediante el archivo de configuración. Este archivo se sitúa en los sistemas UNIX en la ruta /etc/Rserv.conf
. Las opciones que pueden configurar en este archivo y sus valores por defecto son:
workdir [/tmp/Rserv] pwdfile [none=disabled] remote enable|disable [disable] auth required|disable [disable] plaintext enable|disable [disable] fileio enable|disable [enable] interactive yes|no [yes] socket [none=disabled] port [6311] maxinbuf [262144] maxsendbuf [0=unlimited] uid [none] gid [none] su now|server|client [none] source eval chroot [none] sockmod [0=default] umask [0] encoding native|utf8|latin1 [native]
Es importante notar que tanto el acceso remoto como autenticación no se encuentran habilidades por defecto. Siendo necesario modificar estas opciones en el archivo para permitir el acceso desde otros sistemas.
Utilización desde un cliente Java
La utilización de Rserve en un proyecto Java requiere la importación de los siguientes archivos jar:
Ambos se encuentran disponibles en es la página del proyecto Rserve.
Para poder utilizar Rserve
en una clase de Java es necesario importar los siguientes espacios de nombres:
import org.rosuda.REngine.REXP; import org.rosuda.REngine.Rserve.RConnection; import org.rosuda.REngine.Rserve.RserveException;
Conexión al servidor R desde Java
Ahora se ha de crear una conexión con el servidor R. Esto se realiza mediante la clase RConnection
, en su configuración básica se puede crear mediante
RConnection con = new RConnection();
ahora en el objeto con
se le pueden ejecutar el código R que se desee como generar un vector de números aleatorios
con.eval("d = rnorm(10)");
la recuperación de estos datos también se realiza con el método eval
del objeto con
double[] d = con.eval("d").asDoubles();
con lo que se ha creado un vector de dobles en Java con los datos de R
.
Asignar datos a variables desde Java
El uso de Rserve
se vuelve más interesante si se pueden enviar los datos de las variables Java a R. La asignación de los valores se realiza mediante el comando assign
, por ejemplo, para sumar dos vectores Java en R:
double [] x = {1,2,3,4,5}; double[] y = {1,2,3,4,5}; con.assign("x", x); con.assign("y", y); con.eval("z = x + y"); double[] z = con.eval("z").asDoubles();
Al finalizar la sesión con el servidor R es aconsejable cerrar este mediante el método close()
Uso de Rserve en otros lenguajes
con.close();
Los servicios que proporciona Rserve
se pueden utilizar también desde otros lenguajes de programación para los que existe clientes, algunos de los más populares se pueden encontrar en:
Conclusiones
En esta entrada se ha visto cómo utilizar la potencia de R desde Java con el paquete Rserve
. La utilización de este paquete permite configurar un servidor de R en el que se puede realizar cualquier análisis de los existentes en R. En una futura entrada se explicará cómo llamar a Rserve
desde Python.
Imágenes: Pixabay