Truco: Validar palabras con acentos mediante expresiones regulares

Publicado el 12 mayo 2021 por Daniel Rodríguez @analyticslane

Uno de los problemas con los que nos podemos encontrar a la hora de validar nombres mediante el uso de expresiones regulares son los acentos. Debido a que las expresiones regulares nacieron pensando únicamente para trabajar en inglés. Generalmente para validar las cadenas que contienen letras se usa el patrón a-zA-Z, pero éste ignora los acentos y otros caracteres, como ç, que sí existen en otros idiomas. Veamos cómo podemos identificar y validar palabras con acentos mediante expresiones regulares.

El uso de Unicode para identificar acentos

Para identificar los acentos en una cadena de texto se puede usar el estándar Unicode. En este estándar los caracteres acentuados que se emplean en los idiomas latinos se pueden encontrar en el rango \u00C0-\u017F. Así si se incluyen estos valores en la expresión regular se pueden conseguir validar nombres con acentos. Así se puede validar nombres latinos que contengan acentos u otros caracteres, algo que se puede ver en el siguiente ejemplo.

const name = "Champiñón"

console.log(/^[a-zA-Z]+$/.test(name)) // false
console.log(/^[a-zA-Z\u00C0-\u017F]+$/.test(name)) // true

donde se puede ver que la palabra champiñón no sería válida en el primer caso y sí en el segundo.

Agregar espacios en blanco

En el caso de necesitar que también se tengan en cuenta los estaciones en blanco se puede conseguir añadiendo simplemente \s a la cadena. Funcionamiento que se pueden comprobar en el siguiente ejemplo.

const name = "Champiñón común"

console.log(/^[a-zA-Z]+$/.test(name)) // false
console.log(/^[a-zA-Z\u00C0-\u017F]+$/.test(name)) // false
console.log(/^[a-zA-Z\u00C0-\u017F\s]+$/.test(name)) // false

Conclusiones

En esta entrada hemos visto cómo validar palabras con acentos mediante expresiones regulares, para lo que hemos necesitado usar el estándar Unicode.

Imagen de Theodor Moise en Pixabay