Revista Informática

Utilización de R desde Java con Rserve

Publicado el 12 septiembre 2018 por Daniel Rodríguez @analyticslane

Poder utilizar la potencia de R desde Java u otros lenguajes de programación puede facilitar el desarrollo de soluciones. Para esto, existe el paquete Rserve que permite crear un servicio en una máquina mediante el cual se puede ejecutar código R desde en remoto. Gracias a esto se puede llevar la potencia de análisis de R a otros lenguajes que no disponen de librerías equivalentes.

Introducción

R es un entorno fantástico para el análisis estadístico de datos al permitir realizar complejos estudios de una forma fácil y sencilla. Además, con los más de 10.000 paquetes que existen actualmente en el CRAN los casos de uso aumentan considerablemente. En muchas ocasiones puede ser interesante disponer de esta potencia analítica a la hora de desarrollar una aplicación en otro lenguaje, por ejemplo, en Java o C#. Para estas situaciones el paquete Rserve es una solución ya que permite acceder la potencia de R desde los lenguajes más populares como Java, Python, C#, .NET o Ruby.

Rserve es un paquete de R que permite comunicar R con otras aplicaciones mediante TCP/IP o sockets UNIX locales. Gracias a lo que se pueden publicar aplicaciones las funcionalidades de R a aplicaciones en otros lenguajes de programación.

Instalación de Rserve

Para poder utilizar Rserve se ha de instalar el paquete del mismo nombre que se puede encontrar en el CRAN. El proceso de instalación es como cualquier otro paquete, para lo que se ha de escribir:

install.packages("Rserve")

Una vez instalado el paquete, para levantar un servidor de Rserver en el que se ejecutará el código se ha de escribir la siguiente instrucción en la línea de comandos:

R CMD Rserve

Las opciones de ejecución del paquete se pueden configurar mediante la línea de comandos. Aunque es más interesante realizar estas mediante el archivo de configuración. Este archivo se sitúa en los sistemas UNIX en la ruta /etc/Rserv.conf. Las opciones que pueden configurar en este archivo y sus valores por defecto son:

workdir  [/tmp/Rserv]
pwdfile  [none=disabled]
remote enable|disable [disable]
auth required|disable [disable]
plaintext enable|disable [disable]
fileio enable|disable [enable]
interactive yes|no [yes]
socket  [none=disabled]
port  [6311]
maxinbuf  [262144]
maxsendbuf  [0=unlimited]
uid  [none]
gid  [none]
su now|server|client [none]
source
eval
chroot  [none]
sockmod  [0=default]
umask  [0]
encoding native|utf8|latin1 [native]

Es importante notar que tanto el acceso remoto como autenticación no se encuentran habilidades por defecto. Siendo necesario modificar estas opciones en el archivo para permitir el acceso desde otros sistemas.

Utilización desde un cliente Java

La utilización de Rserve en un proyecto Java requiere la importación de los siguientes archivos jar:

Ambos se encuentran disponibles en es la página del proyecto Rserve.

Para poder utilizar Rserve en una clase de Java es necesario importar los siguientes espacios de nombres:

import org.rosuda.REngine.REXP;
import org.rosuda.REngine.Rserve.RConnection;
import org.rosuda.REngine.Rserve.RserveException;

Conexión al servidor R desde Java

Ahora se ha de crear una conexión con el servidor R. Esto se realiza mediante la clase RConnection, en su configuración básica se puede crear mediante

RConnection con = new RConnection();

ahora en el objeto con se le pueden ejecutar el código R que se desee como generar un vector de números aleatorios

con.eval("d = rnorm(10)");

la recuperación de estos datos también se realiza con el método eval del objeto con

double[] d = con.eval("d").asDoubles();

con lo que se ha creado un vector de dobles en Java con los datos de R.

Asignar datos a variables desde Java

El uso de Rserve se vuelve más interesante si se pueden enviar los datos de las variables Java a R. La asignación de los valores se realiza mediante el comando assign, por ejemplo, para sumar dos vectores Java en R:

double [] x = {1,2,3,4,5};
double[] y = {1,2,3,4,5};

con.assign("x", x);
con.assign("y", y);
con.eval("z = x + y");
double[] z = con.eval("z").asDoubles();

Al finalizar la sesión con el servidor R es aconsejable cerrar este mediante el método close()

Uso de Rserve en otros lenguajes

con.close();

Los servicios que proporciona Rserve se pueden utilizar también desde otros lenguajes de programación para los que existe clientes, algunos de los más populares se pueden encontrar en:

Conclusiones

En esta entrada se ha visto cómo utilizar la potencia de R desde Java con el paquete Rserve. La utilización de este paquete permite configurar un servidor de R en el que se puede realizar cualquier análisis de los existentes en R. En una futura entrada se explicará cómo llamar a Rserve desde Python.

Imágenes: Pixabay


Volver a la Portada de Logo Paperblog