Cómo obtener información de salud de tu sistema Linux o tu servidor en C y C++ (I. Memoria)

Publicado el 17 abril 2017 por Gaspar Fernández Moreno @gaspar_fm

Es algo necesario para el buen funcionamiento de nuestras aplicaciones. Para añadir robustez a nuestros sistemas, haciendo que éstos se comporten de manera adecuada en situaciones imprevistas. Por ejemplo, si necesitamos crear un archivo y añadir cierta información, podemos, a priori, comprobar que el dispositivo en el que vamos a escribir tiene suficiente espacio libre, lo que nos puede ahorrar suplicios si los ficheros son demasiado grandes. También deberíamos ser capaces de comprobar que un disco de red está conectado antes de trabajar con él y, en muchos casos, anticiparnos a largas esperas y bloqueos por parte del sistema operativo. O incluso tomar una decisión ante una tarea intensiva que no es prioritaria comprobando primero cómo de ocupado está nuestro sistema.

La serie de posts sobre salud del sistema

El post me ha salido enorme por lo que he decidido dividirlo en varias partes que se publicarán una cada dos semanas. Como siempre, voy intercalando posts sobre otras temáticas relacionadas, para no estar siempre hablando de lo mismo.
Si sois impacientes y queréis ver mucha información y resultados con código, podéis ver este proyecto en GitHub (linuxmon) donde se tratan muchos de estos temas. Aunque, en esta serie de posts me gustaría completar algo más la información obtenida y, estará todo explicado.

C y C++ en los ejemplos

Muchos ejemplos son básicamente acceso a ficheros o utilización de funciones de C de bibliotecas de Linux y POSIX. Aunque he utilizado C++ para facilitar un poco la salida de datos y pelearme un poco menos con la memoria en algunos casos utilizando string, vector, map y alguna cosa más. De todas formas, para aclaraciones sobre cómo hacer todo esto en C puro, podéis preguntar en los comentarios.

Para el código C++, he utilizado algunas de las novedades disponibles a partir de la especificación de 2011 que, como ya tiene 6 años, considero que todos podremos compilarlo.

Por tanto, para compilar estos ejemplos, debemos hacer:


La biblioteca pthread la necesito sólo para un par de ejemplos en los que utilizo hilos y alguna que otra guarrada de la que no me siento orgulloso, pero que a lo mejor puede resultar de ayuda para alguien.

Algunas funciones que nos serán de ayuda

Está claro que como programadores, no es difícil pelearnos nos bytes, por ejemplo para comprobar que el espacio libre es mayor a un tamaño determinado. Lo malo es que imprimir en pantalla números más o menos grandes (del orden de miles de millones) para expresar tamaños puede resultar difícil de leer, así que utilizaremos funciones como size() para obtener el tamaño en formato humano.

De forma parecida, con el objetivo de simplificar nuestro código, la función extractFile() leerá un archivo en su totalidad y lo almacenará en un buffer.
Ambas funciones las pongo aquí junto con un ejemplo de uso:

En ambas funciones podría haber utilizado utilidades de C++ para la lectura de ficheros, o para transformar los números en cadena de caracteres y presentar la información. En este caso no lo hice así por cuestión de velocidad, ya que pienso utilizar estas funciones muchas veces y necesito que se ejecuten bien en sistemas pequeños. En mis pruebas, incluso con la optimización de compilador, he conseguido que estas funciones se ejecuten entre un 40% y un 60% más rápido. Y es normal, las bibliotecas de streams de C++ son muy complejas, no tendríamos limitación por tamaño de cadenas, por ejemplo, para el caso de size(). Y en el caso de extractFile(), utilizo directamente las funciones de unistd. Están más cerca del sistema operativo y se comportan más rápido que las de C y mucho más que las de C++.

Pongo aquí una versión en C puro de la función size() que también utilizaré en algunos ejemplos:

Información de memoria y uso del sistema: sysinfo()

En Linux, tenemos la función sysinfo() dentro de sys/sysinfo.h, que devuelve en una estructura homómina (struct sysinfo) la siguiente información:

  • long uptime : Segundos desde el arranque del ordenador.
  • unsigned long loads[3] : Carga media en 1, 5 y 15 minutos (que podemos ver con el comando uptime). La carga del sistema está expresada en la medida que diga la constante SI_LOAD_SHIFT, es decir, el 100% de carga podría ser por ejemplo 65536 por lo que para encontrar el % real debemos dividir por ese número.
  • unsigned long totalram : Memoria RAM total
  • unsigned long freeram : Memoria RAM libre
  • unsigned long sharedram : Memoria RAM compartida
  • unsigned long bufferram : Memoria RAM usada en buffers
  • unsigned long totalswap : Memoria SWAP total
  • unsigned long freeswap : Memoria SWAP libre
  • unsigned short procs : Número de procesos en marcha actualmente. Aunque en este caso indica los hilos en ejecución, que serán muchos más.
  • unsigned int mem_unit : Tamaño de la unidad de memoria en bytes

Como ejemplo podemos hacer lo siguiente:

En el ejemplo anterior, lo que puede que no quede muy claro es la memoria alta total y libre. Este tipo de memoria se utiliza en sistemas que tienen que dividir la memoria principal para poder acceder a ella correctamente. Como ejemplo, podemos indicar dispositivos con un ancho de bus inferior a la cantidad de memoria a la que pueden acceder, hace unos años era muy común esto, por ejemplo en CPUs de 16bit que necesitaban poder acceder a varios megabytes de RAM (cuando con 16bit no podríamos expresar números mayores de 65535). O, hace algunos años menos, cuando CPUs de 32bit con arquitectura Intel debían acceder a más de 4Gb de RAM, lo que se conocía como PAE o Physical Address Extension. La memoria alta sería aquella a la que no podíamos acceder tan directamente.

Información sobre paginado de memoria

Existen tres funciones más para averiguar:

  • Tamaño de páginas de memoria. getpagesize() o sysconf(_SC_PAGESIZE) como veremos más adelante.
  • Total de páginas en RAM (páginas físicas). get_phys_pages(). Este número de páginas será la cantidad total de memoria entre el tamaño de página.
  • Total de páginas físicas disponibles. get_avphys_pages(). Que debe ser la cantidad de memoria libre entre el tamaño de página.

Vemos un pequeño ejemplo aquí:

Más información sobre la memoria: /proc/meminfo

Con el comando anterior vemos mucha información sobre la memoria aunque, no toda la información que nos da Linux. Si hemos curioseado proc veremos que existe el archivo /proc/meminfo con mucha información más. Eso sí, tenemos que parsear el fichero para extraer la información. Afortunadamente no es un fichero físico, sino un vínculo en nuestro sistema de archivos que se actualiza en tiempo real. Y podemos acceder a él como si fuera un archivo, y eso es muy bueno, muy filosofía unix y nos facilita el acceso a la información desde cualquier lenguaje. Aunque ahora vamos a hacerlo en C++ para facilitarnos un poco la vida:

Además, si queremos, podemos crear una función que almacene todo en un mapa de C++ con lo que podremos acceder muy fácilmente a cada uno de los elementos leidos:

Memoria utilizada por nuestro programa

Aunque trataremos el tema en profundidad en un futuro post, podemos averiguar la memoria total del programa, tamaño del código, datos y pila leyendo el fichero /proc/self/statm, también podríamos leer el fichero /proc/self/stat (que analizaremos más adelante) o incluso /proc/self/status que deberemos parsear como /proc/meminfo . Por ahora podemos quedarnos con lo siguiente:

Los tamaños vienen expresados en páginas, por lo que para extraer la información en bytes debemos multiplicar el valor obtenido por el tamaño de las páginas (el valor que nos devuelve getpagesize()). En Linux 2.6 o superior vemos que los valores de lib y de dt valen siempre 0, pero el sistema sigue utilizándolos para garantizar la retrocompatibilidad con programas más antiguos. Si queremos hacer este parseo del archivo en C puro podemos utilizar sscanf() que también nos dará muy buen resultado.

Siguiente post

Hablaremos de la CPU, definiciones del sistema, como el tamaño de página y cosas así que pueden resultar interesantes y utilización de recursos por parte de nuestras aplicaciones. Todo esto, a partir del 1 de mayo.

Foto principal: William Stitt

También podría interesarte...