En una entrada reciente se ha creado una función para importar datos en Matlab desde una hoja de cálculo a través del portapapeles del sistema. Observándose que existe un problema cuando el separador de decimales no es punto. Para convertir cadenas de texto en números Matlab dispone de la función str2double
, la cual no tiene en cuenta la configuración local del ordenador. En esta entrada se verá cómo leer la configuración local del ordenador en Matlab con Java. Posteriormente se usará esta información para convertir cadenas de texto en números en Matlab teniendo con diferentes separadores de decimales.
Importar Java
Una función poco conocida de Matlab es la posibilidad de trabajar directamente con la librería de Java. Para acceder a un constructor solamente se tiene importar como hace en cualquier programa de Java. Así para importar e instanciar la clase Calendar
solamente es necesario escribir
import java.util.Calendar; rightNow = Calendar.getInstance();
En donde se puede observar que rightNow
es un objeto de tipo java.util.GregorianCalendar
con el que se puede trabajar de forma similar a como se haría en Java.
Identificación del separador de decimales
En Java existe una clase a la que se puede preguntar cuáles son los separadores de decimales y de miles que se utilizan. La clase DecimalFormatSymbols
que se puede encontrar en java.text
. Los dos métodos de la clase que interesan son getGroupingSeparator
, el cual devuelve el separador de miles, y getDecimalSeparator
, el cual devuelve el separador de decimales. Así, para conocer la configuración del ordenador en el que se ejecuta el código simplemente se tiene que escribir:
import java.text.DecimalFormatSymbols; df = DecimalFormatSymbols(); gs = df.getGroupingSeparator(); ds = df.getDecimalSeparator();
En este punto en gs
se encuentra el separador de miles y en ds
el separador de decimales. Si ds
es un punto str2double()
funciona correctamente, pero si no es así los valores no se convertirán correctamente. Siendo necesario cambiar los separadores.
Cambiar el símbolo de separador de decimales
Al conocer el separador de decimales usado en el ordenador es posible saber si es necesario cambiarlo. Para lo que se puede utilizar la función strrep()
. Aquí hay que tener en cuenta una cosa, para Matlab el separador de miles no es necesario. Pero, como sucede en español, este puede ser punto, por lo que, para evitar posibles confusiones, la mejor solución es eliminarlo de las cadenas. Así los pasos a dar son dos: eliminar el separador de miles y reemplazar el separador de decimales. Siendo necesario reemplazar los valores por este orden para evitar problema. En Matlab esto se puede hacer con
str = strrep(str, gs, ''); str = strrep(str, ds, '.');
Asumiendo que str
contienen la cadena de texto. Una vez hecho esto se puede llamar directamente a la función str2double()
para convertir la cadena de texto a un valor doble.
Función que convierte cadenas de texto en números en Matlab teniendo en cuenta los separadores
Como es obvio todos estos pasos se pueden incluir en una función, en la que además se puede tener en cuenta el hecho de que la entrada sea una celda. Esta función se puede llamar localstr2double()
y quedando como:
function num = localstr2double(str) % localstr2double - Convert strings to double precision values using culture % % This function converts the text in strings to double precision % values using local culture. % Copyright 2019 Daniel Rodriguez % Import the Java text namespace import java.text.DecimalFormatSymbols; % Obtain group and decimal separator df = DecimalFormatSymbols(); gs = df.getGroupingSeparator(); ds = df.getDecimalSeparator(); % Change separator symbols only if there are no the used by Matlab if ds ~= '.' if iscell(str) str = cellfun(@(s) strrep(s, gs, ''), str, 'UniformOutput', false); str = cellfun(@(s) strrep(s, ds, '.'), str, 'UniformOutput', false); else str = strrep(str, gs, ''); str = strrep(str, ds, '.'); end end % Convert the strings to numbers num = str2double(str); end
Convertir números a cadenas de texto teniendo en cuenta los separadores
En otras ocasiones lo necesario es exportar números como cadenas de texto con el separador de decimales correcto. Algo que no permite directamente la función num2str()
de Matlab. Como esta función no utiliza el separador de miles solamente es necesario dar un paso, cambiar el separador de decimales una vez realizada la conversión. En Matlab esto se puede hacer con
strrep(str, '.', ds)
Función que convierte números en cadenas de texto teniendo en cuenta el separador
Al igual que en el caso anterior se puede crear una función que permita factorizar este proceso. Esta se puede llamar num2localstr()
y quedará de la siguiente forma:
function str = num2localstr(num, precision) % num2localstr - Convert numbers to character array using local culture % % This function converts a numeric array into a character array that % represents the numbers using local culture. % Copyright 2019 Daniel Rodriguez % Import the Java text namespace import java.text.*; % Default value for the precision if nargin == 1 precision = 5; end % Convert numbers to strings str = num2str(num, precision); % Obtain decimal separator df = DecimalFormatSymbols(); ds = df.getDecimalSeparator(); % Change separator symbol only if it is no the used by Matlab if ds ~= '.' str = arrayfun(@(s) strrep(s, '.', ds), str); end end
En el código se puede ver como inicialmente se hace la conversión y, solamente sin el separador de decimales no es un punto, se cambia este por el local. Aquí se utiliza la función arrayfun()
porque si la entrada es un matriz la función str
que se obtienen de num2str()
es una matriz y strrep()
únicamente funciona sobre vectores.
Aplicación al importador de Excel a través del portapapeles
Al principio de la entrada motivado la creación de la función localstr2double()
por los problemas encontrados en una entrada anterior para importar datos desde Excel a través del portapapeles. Ahora, para que funcione en cualquier ordenador la función pasteFromSpreadsheet()
solamente se tiene que cambiar la función str2double()
por localstr2double()
. Por lo que pasteFromSpreadsheet()
queda de la siguiente forma
function data = pasteFromSpreadsheet() % pasteFromSpreadsheet - Paste a matrix from a spreadsheet % % This function pastes the data from the clipboard into a matrix, % assuming that it comes from a spreadsheet. % Copyright 2019 Daniel Rodriguez % Get the data from the clipboard data = clipboard('paste'); % Remove carriage return data = strrep(data, char(13), ''); % Split the string in rows with new line data = strsplit(data, '\n'); % Remove empty values at the end of the data if cellfun(@isempty, data(end)) data(end) = []; end % Separate the values in the column values with the tab data = cellfun(@(s) strsplit(s, '\t'), data', 'UniformOutput', false); % Convert the cells to matrix data = cellfun(@localstr2double, data, 'UniformOutput', false); data = cell2mat(data); end
Conclusiones
En esta entrada se ha visto un método para convertir cadenas de texto en números en Matlab, y el proceso inverso, teniendo en cuenta los posibles separadores de decimales. Esto permite importar y exportar datos con hojas de cálculo como Microsoft Excel sin tener que cambiar la configuración del ordenador. Como se ha visto al modificar la función pasteFromSpreadsheet()
que se había creado en una entrada anterior.
En una futura entradas se mostrará como utilizando num2localstr
se pueden exportar los valores desde Matlab a una hoja de cálculo a través del portapapeles. Con lo que se puede mejorar considerablemente la productividad trabajando con Matlab y Excel.
Imágenes: Pixabay (Rudy and Peter Skitterians)
No te olvides valorar esta entrada
Suscríbete a nuestro boletín
Suscríbete al boletín semanal para estar al día de todas las publicaciones de Analytics Lane.