Herramientas para limpiar, validar y verificar el número de cédula de identidad Chilena en R. Estas funciones ayudan a realizar operaciones frecuentes para datos de ciudadanos chilenos que incluyen el RUT como identificador único.
Las funciones del paquete son calcular_digito() para el dígito verificador, validar_rut() que te puede ayudar a revisar si los RUT vienen correctos, y limpiar_rut(), que tranforma o limpia los RUT de distintos formatos a una estructura en común.
Instalación
Puedes instalar el paquete en tu R con una de las siguientes opciones:
# install.packages("pak")
pak::pkg_install("bastianolea/rutera")
# install.packages("devtools")
devtools::install_github("bastianolea/rutera")Calcular dígito verificador
El dígito verificador del RUT permite confirmar que se escribió correctamente usando el algoritmo módulo 11. En resumen, este algoritmo:
- Toma los dígitos previos al guión
- Multiplica cada dígito, de derecha a izquierda, por la secuencia cíclica
2, 3, 4, 5, 6, 7y suma los resultados - A esta suma se le calcula el módulo (resto de la división entera) de 11, y el resultado se le resta a 11
- El resultado de lo anterior es el dígito verificador; pero si el resultado es
11o10, el dígito será0oK, respectivamente
La función calcular_digito() implementa el cálculo del código verificador de cualquier RUT sin código verificador:
library(rutera)
calcular_digito(24324110)
#> [1] "3"
calcular_digito(
c(11111111,
1111111,
8519622)
)
#> [1] "1" "4" "7"Validar un RUT
Otra cosa que podemos necesitar hacer con los RUT es verificar si vienen en un formato determinado. En este caso, el formato apropiado será xxxxxxxx-y, y esta función verificará: que el RUT contiene un guión, que se sigue el formato xxxxxxxx-y, y que el dígito verificador que trae sea el correcto (usando la función calcular_digito()):
validar_rut("17505116-3")
#> [1] TRUE
validar_rut("23376940-1")
#> [1] TRUE
validar_rut(c("23376940-1", "24444145-9"))
#> [1] TRUE TRUE
validar_rut("11111111")
#> ! RUT 11111111 no incluye guión
#> [1] FALSE
validar_rut(c("hola", "11111111", "19413730-3"))
#> ! RUT HOLA no incluye guión
#> ! RUT 11111111 no incluye guión
#> [1] FALSE FALSE TRUELimpiar RUT
Si las personas ingresan sus RUT manualmente a una encuesta o formulario, o si son digitados por otras personas, lo más probable es que vengan mal escritos o al menos no estandarizados. La función limpiar_rut() realiza varios pasos de limpieza sobre los textos para retornar RUTs que siguen el formato xxxxxxx-y.
rut_sucios <- c("24.444.145-9",
"24444145 9",
"24 444 145 9",
"24,444,145,9",
"2M4A4P4A4C1H4E59",
"244441459",
"hola hola")
limpiar_rut(rut_sucios)
#> ! algunos RUT no tienen últimos dígitos
#> ! algunos RUT vacíos luego de la limpieza
#> [1] "24444145-9" "24444145-9" "24444145-9" "24444145-9" "24444145-9"
#> [6] "24444145-9" NAExiste otro paquete de R que hace lo mismo, {clrutr}, de Joshua Kunst, y que probablemente sea mejor. Yo hice este paquete solamente para aprender.
Más información en este post de mi blog.
