Primer cuatrimestre 2016
93
artículo técnico
Privacidad y Compliance
un subconjunto de datos que compar-
tan características comunes, de forma
que pueda evaluarse su calidad.
La calidad de datos debe describirse
empleando los elementos de la cali-
dad de datos. Éstos y sus descriptores
describen el grado de adecuación de
un conjunto de datos a los criterios es-
tablecidos en sus especificaciones de
producto, o a los requerimientos de
usuario, y proporcionan información
cuantitativa sobre la calidad.
Riesgos y preocupaciones
Las empresas invierten considerables
cantidades de dinero para desarro-
llar e implementar la revisión analí-
tica y la medición de grandes conjun-
tos de datos con el fin de obtener una
ventaja competitiva anticipada. Si bien
los grandes conjuntos de datos pue-
den brindar una ventaja competitiva
y otros beneficios, también conllevan
riesgos importantes.
Ahora que las empresas tienen enor-
mes cantidades de datos estructura-
dos y no estructurados disponibles,
la gerencia se debe preguntar lo si-
guiente: ¿dónde debemos almacenar
los datos?, ¿cómo vamos a protegerlos?
y ¿cómo vamos a utilizarlos de manera
segura y legal?
Datos inferidos
: datos acerca de las
personas, basados en el análisis de
información voluntaria u observada
(por ejemplo, capacidad crediticia).
El objetivo principal de analizar gran-
des conjuntos de datos es respaldar a
las empresas en la toma de mejores de-
cisiones de negocio. Los investigadores
que estudian los datos, y otros usuarios,
analizan grandes cantidades de datos,
de transacciones y de otras fuentes de
datos que pueden ser ignorados por el
software
de inteligencia financiera tra-
dicional, como registros de servidores
web, informes de actividad de redes so-
ciales, registros de teléfonos celulares y
datos obtenidos a través de sensores. La
revisión analítica de datos puede permi-
tir un enfoque de
marketing
orientado
que proporciona a la empresa un me-
jor entendimiento de sus clientes –un
entendimiento que influirá en los pro-
cesos internos y, finalmente, aumentará
las ganancias–; esto brinda la ventaja
competitiva que la mayoría de las em-
presas buscan.
Calidad de datos
Una evaluación de la calidad de datos
puede aplicarse a una serie de conjun-
tos de datos, a un conjunto de datos o a
La gestión y el pro-
cesamiento del con-
junto de datos, cada
vez mayor, requieren la
ejecución de
software
especializado en múl-
tiples servidores. Para
algunas empresas, los
grandes conjuntos de
datos se cuentan en
cientos de
gigabytes
,
para otras en
terabytes
e incluso en
petabytes
,
con una tasa de creci-
miento y cambio fre-
cuente y rápido (en al-
gunos casos, casi en
tiempo real).
Esencialmente, el tér-
mino Big Data se re-
fiere a conjuntos de da-
tos que son demasiado
grandes o que cambian demasiado rá-
pido como para ser analizados mediante
técnicas tradicionales de bases de da-
tos relacionales o multidimensionales, o
a través de herramientas de
software
co-
múnmente utilizadas para capturar, ad-
ministrar y procesar los datos en una
ventana de tiempo razonable.
Los datos se recopilan para ser ana-
lizados y para buscar patrones y corre-
laciones que inicialmente pueden no
ser evidentes, pero que pueden ser úti-
les en la toma de decisiones de nego-
cio. Este proceso se denomina revisión
analítica de grandes conjuntos de datos.
Con frecuencia, son datos personales úti-
les desde una perspectiva de
marketing
para el entendimiento de las preferen-
cias y aversiones de los posibles compra-
dores y para el análisis y la predicción de
su comportamiento de compra.
Los datos personales se pueden clasi-
ficar en las siguientes categorías:
Datos voluntarios
: creados y compar-
tidos de forma explícita por las per-
sonas (por ejemplo, perfiles de redes
sociales).
Datos observados
: capturados me-
diante el registro de las acciones de
las personas (por ejemplo, datos de
ubicación cuando utilizan teléfonos
celulares).