Ir al contenido principal

Horarios de atención

De lunes a viernes:
8:00 AM – 5:00 PM

Whatsapp: (+57) 317 599 0862
Teléfono: (+57) 313 7845820
Email: [email protected]

Confidencial Noticias 2025

| Columnista |

En la era de la información, la calidad de los datos es crucial para el éxito de cualquier investigación u organización. Sin embargo, la realidad es que los datos en su forma natural, normalmente denominados “datos crudos”, están lejos de ser perfectos y, por el contrario, pueden presentar múltiples incoherencias o errores en sus distintas variables. Uno de los principales métodos para garantizar la calidad de la información es el data wrangling que busca limpiar, transformar y consolidar los datos para enriquecer procesos de análisis con grandes volúmenes de información.

Al estar involucrado en el trabajo de ingeniería de sistemas y análisis de datos, puedo decirles que hay situaciones en las que esta práctica puede garantizar que se mantenga la calidad dentro de grandes volúmenes de información no estructurada.

Es importante comprender que aunque los datos provengan del mismo registro, pueden presentar inconsistencias en las variables, haciéndolos muy diferentes. Es entonces que el data wrangling adquiere valor, eliminando estas inconsistencias y asegurando que los datos procesados sean confiables y de calidad antes de ser sometidos al análisis.

Las actividades de limpieza de datos requieren gran cantidad de recursos, pero traen consigo beneficios en la calidad de la información, logrando el aprovechamiento de todos los datos consolidados por parte de las diferentes áreas de las organizaciones. Lo cual, sin duda, vale la inversión.

Para hacer frente a los problemas de calidad de los datos, las empresas han implementado prácticas que ayudan a agilizar el proceso de limpieza de datos. Pero, aún con la implementación de dichas medidas, en la mayoría de los casos es necesario desarrollar los siguientes pasos para eliminar datos incorrectos o defectuosos:

Descubrimiento: Es el proceso de familiarización con los datos, enfocándose en el propósito y metas del análisis, así como en los requerimientos de información del negocio más que en las especificaciones técnicas.

Estructuración: Es la transformación de “datos crudos” en una estructura organizada y consistente, extrayéndolos de diversas fuentes hacia un repositorio centralizado.

Limpieza: Es la evaluación y corrección de errores en los datos para asegurar la calidad de los análisis, abordando datos nulos, registros duplicados y aplicando transformaciones necesarias.

Enriquecimiento: Es la integración de múltiples fuentes de datos para mejorar la utilidad en informes y análisis, evaluando la necesidad de añadir conjuntos adicionales.

Validación: Es la verificación de la consistencia y calidad de los datos mediante procesos automatizados y programación, asegurando que estén listos para su análisis.

Publicación: Es la distribución de datos validados a los interesados dentro de la organización para su análisis y uso.

Visualización: Es el uso de técnicas y herramientas para graficar y comunicar resultados de manera efectiva para la interpretación de los tomadores de decisiones.

Para concluir, puedo afirmar que la manipulación de datos o el data wrangling es, quizás, la fase más vital e importante en el proceso de aseguramiento de la calidad de la información

para los proyectos de análisis de datos. El éxito de los proyectos puede depender de que se hayan ejecutado correctamente las fases de la data wrangling, llevando un proyecto de análisis del caos a la precisión.

Yobany Forero

Ingeniero de Sistemas e Ingeniero de Datos

PORTADA

El Centro Democrático hizo el anuncio de la senadora Paloma Valencia como su candidata presidencial, respaldada por la militancia del partido, por encima de bancada en el Senado, Paola Holguín y María Fernanda Cabal. El anuncio lo hizo el director del…
Ante las versiones de diferentes funcionarios públicos sobre posibles irregularidades en el Fondo Adaptación, la Procuraduría General de la Nación, abrió investigación disciplinaria contra funcionarios por determinar de la entidad. El órgano de control…
El exalcalde de Medellín, Daniel Quintero, intentará de nuevo oficializar su candidatura presidencial, la misma que no ha podido iniciar por los obstáculos jurídicos que ha tenido que enfrentar por su inscripción en la consulta del Pacto Histórico, tema que…
La candidata presidencial y exalcaldesa de Bogotá, Claudia López, rechazó la decisión de la Corte Constitucional de avalar la decisión de la Sala Plena de la Corte Suprema de Justicia en la que se modifica uno de los numerales del código penal que incluía la…
El Ejército de Liberación Nacional anunció un paro armado en todo el país que comenzará el 14 de diciembre a las 6:00 a.m. y se extenderá hasta el 17 de diciembre a la misma hora. La guerrilla advirtió a los colombianos abstenerse de salir de sus ciudades…