Data Profiling (Parte 2)

[sg_popup id=1]

Hola a todos, continuando con nuestro post de Data Profiling, en la primera parte terminanos generando el archivo XML (Employee_Profile.xml). Ahora, ¿Qué utilidad concreta nos dará el Data Profiling? Imaginemos que requerimos analizar a los clientes que nos han generado una venta, y el data profiling nos arroja que solamente tenemos el 10% de datos poblados. Ello nos llevaría a replantear el uso de este campo o el poblar previamente este dato para nuestro análisis.

Evaluemos el resultado de nuestro caso planteado, para ello utilizaremos la herramienta Data Profile Viewer, el cual lo encontraremos en la siguiente ruta: All Programs, Microsoft SQL Server 2008 R2, Integration Services, Data ProfilerViewer.

Seleccionamos la opción Openy buscamos nuestro archivo XML, y le damos clic en Abrir:

clip_image002

A continuación […]

Data Profiling (Parte 1)

Dentro de las técnicas ETL (léase Extracción, Transformación y Carga de datos, en español), un paso previo es todo proyecto de Inteligencia de Negocios es verificar la calidad de la data, esta técnica es llamada Data Profiling.

Microsoft ha introducido desde la versión 2008 esta tarea muy útil en la verificación de la calidad de los datos. En esta primera parte veamos su configuración, y su interpretación será abordada en una segunda parte:

NOTA: Para obtener las fuentes del proyecto hacer clic en la imagen: 

1.- Creamos a través del Business Intelligence Development Studio, un proyecto utilizando la plantilla Integration Services Project con el nombre Data Warehouse ETL y un paquete al cual llamaremos Profile_Employee_Data.dtsx.

clip_image002 […]