Revista Informática

Convertir cadenas de texto en números en Matlab con diferentes separadores de decimales

Publicado el 01 julio 2019 por Daniel Rodríguez @analyticslane

En una entrada reciente se ha creado una función para importar datos en Matlab desde una hoja de cálculo a través del portapapeles del sistema. Observándose que existe un problema cuando el separador de decimales no es punto. Para convertir cadenas de texto en números Matlab dispone de la función str2double, la cual no tiene en cuenta la configuración local del ordenador. En esta entrada se verá cómo leer la configuración local del ordenador en Matlab con Java. Posteriormente se usará esta información para convertir cadenas de texto en números en Matlab teniendo con diferentes separadores de decimales.

Importar Java

Una función poco conocida de Matlab es la posibilidad de trabajar directamente con la librería de Java. Para acceder a un constructor solamente se tiene importar como hace en cualquier programa de Java. Así para importar e instanciar la clase Calendar solamente es necesario escribir

import java.util.Calendar;
rightNow = Calendar.getInstance();

En donde se puede observar que rightNow es un objeto de tipo java.util.GregorianCalendar con el que se puede trabajar de forma similar a como se haría en Java.

Identificación del separador de decimales

En Java existe una clase a la que se puede preguntar cuáles son los separadores de decimales y de miles que se utilizan. La clase DecimalFormatSymbols que se puede encontrar en java.text. Los dos métodos de la clase que interesan son getGroupingSeparator, el cual devuelve el separador de miles, y getDecimalSeparator, el cual devuelve el separador de decimales. Así, para conocer la configuración del ordenador en el que se ejecuta el código simplemente se tiene que escribir:

import java.text.DecimalFormatSymbols;

df = DecimalFormatSymbols();
gs = df.getGroupingSeparator();
ds = df.getDecimalSeparator();

En este punto en gs se encuentra el separador de miles y en ds el separador de decimales. Si ds es un punto str2double() funciona correctamente, pero si no es así los valores no se convertirán correctamente. Siendo necesario cambiar los separadores.

Cambiar el símbolo de separador de decimales

Al conocer el separador de decimales usado en el ordenador es posible saber si es necesario cambiarlo. Para lo que se puede utilizar la función strrep(). Aquí hay que tener en cuenta una cosa, para Matlab el separador de miles no es necesario. Pero, como sucede en español, este puede ser punto, por lo que, para evitar posibles confusiones, la mejor solución es eliminarlo de las cadenas. Así los pasos a dar son dos: eliminar el separador de miles y reemplazar el separador de decimales. Siendo necesario reemplazar los valores por este orden para evitar problema. En Matlab esto se puede hacer con

str = strrep(str, gs, '');
str = strrep(str, ds, '.');

Asumiendo que str contienen la cadena de texto. Una vez hecho esto se puede llamar directamente a la función str2double() para convertir la cadena de texto a un valor doble.

Función que convierte cadenas de texto en números en Matlab teniendo en cuenta los separadores

Como es obvio todos estos pasos se pueden incluir en una función, en la que además se puede tener en cuenta el hecho de que la entrada sea una celda. Esta función se puede llamar localstr2double() y quedando como:

function num = localstr2double(str)
% localstr2double - Convert strings to double precision values using culture
%
%     This function converts the text in strings to double precision
%     values using local culture.

% Copyright 2019 Daniel Rodriguez 

% Import the Java text namespace
import java.text.DecimalFormatSymbols;

% Obtain group and decimal separator
df = DecimalFormatSymbols();
gs = df.getGroupingSeparator();
ds = df.getDecimalSeparator();

% Change separator symbols only if there are no the used by Matlab
if ds ~= '.' 
    if iscell(str)
        str = cellfun(@(s) strrep(s, gs, ''), str, 'UniformOutput', false);
        str = cellfun(@(s) strrep(s, ds, '.'), str, 'UniformOutput', false);
    else
        str = strrep(str, gs, '');
        str = strrep(str, ds, '.');
    end
end

% Convert the strings to numbers
num = str2double(str);

end

Convertir números a cadenas de texto teniendo en cuenta los separadores

En otras ocasiones lo necesario es exportar números como cadenas de texto con el separador de decimales correcto. Algo que no permite directamente la función num2str() de Matlab. Como esta función no utiliza el separador de miles solamente es necesario dar un paso, cambiar el separador de decimales una vez realizada la conversión. En Matlab esto se puede hacer con

strrep(str, '.', ds)

Función que convierte números en cadenas de texto teniendo en cuenta el separador

Al igual que en el caso anterior se puede crear una función que permita factorizar este proceso. Esta se puede llamar num2localstr() y quedará de la siguiente forma:

function str = num2localstr(num, precision)
% num2localstr - Convert numbers to character array using local culture
%
%     This function converts a numeric array into a character array that
%     represents the numbers using local culture.

% Copyright 2019 Daniel Rodriguez 

% Import the Java text namespace
import java.text.*;

% Default value for the precision
if nargin == 1
    precision = 5;
end

% Convert numbers to strings
str = num2str(num, precision);

% Obtain decimal separator
df = DecimalFormatSymbols();
ds = df.getDecimalSeparator();

% Change separator symbol only if it is no the used by Matlab
if ds ~= '.'
    str = arrayfun(@(s) strrep(s, '.', ds), str);
end

end

En el código se puede ver como inicialmente se hace la conversión y, solamente sin el separador de decimales no es un punto, se cambia este por el local. Aquí se utiliza la función arrayfun() porque si la entrada es un matriz la función str que se obtienen de num2str() es una matriz y strrep() únicamente funciona sobre vectores.

Aplicación al importador de Excel a través del portapapeles

Al principio de la entrada motivado la creación de la función localstr2double() por los problemas encontrados en una entrada anterior para importar datos desde Excel a través del portapapeles. Ahora, para que funcione en cualquier ordenador la función pasteFromSpreadsheet() solamente se tiene que cambiar la función str2double() por localstr2double(). Por lo que pasteFromSpreadsheet() queda de la siguiente forma

function data = pasteFromSpreadsheet()
% pasteFromSpreadsheet - Paste a matrix from a spreadsheet
%
%     This function pastes the data from the clipboard into a matrix,
%     assuming that it comes from a spreadsheet. 

% Copyright 2019 Daniel Rodriguez 

% Get the data from the clipboard
data = clipboard('paste');

% Remove carriage return
data = strrep(data, char(13), '');

% Split the string in rows with new line
data = strsplit(data, '\n');

% Remove empty values at the end of the data
if cellfun(@isempty, data(end))
    data(end) = [];
end

% Separate the values in the column values with the tab
data = cellfun(@(s) strsplit(s, '\t'), data', 'UniformOutput', false);

% Convert the cells to matrix
data = cellfun(@localstr2double, data, 'UniformOutput', false);
data = cell2mat(data);

end

Conclusiones

En esta entrada se ha visto un método para convertir cadenas de texto en números en Matlab, y el proceso inverso, teniendo en cuenta los posibles separadores de decimales. Esto permite importar y exportar datos con hojas de cálculo como Microsoft Excel sin tener que cambiar la configuración del ordenador. Como se ha visto al modificar la función pasteFromSpreadsheet() que se había creado en una entrada anterior.

En una futura entradas se mostrará como utilizando num2localstr se pueden exportar los valores desde Matlab a una hoja de cálculo a través del portapapeles. Con lo que se puede mejorar considerablemente la productividad trabajando con Matlab y Excel.

Imágenes: Pixabay (Rudy and Peter Skitterians)

No te olvides valorar esta entrada

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones de Analytics Lane.

Contenido relacionado


Volver a la Portada de Logo Paperblog