Introducción:
El manejo fluctuante de los datos en el mundo, ¿qué
hacer ante ellos?, tenemos dos soluciones que, al mismo tiempo, acarrean el
mismo problema.
Esas soluciones serían el Big Data y la Minería de
Datos, cuyo problema principal es el manejo fluctuante de los datos y que es al
mismo la veracidad de estos mismos. Estos paradigmas modernos, mediante su
manejo de datos, se desglosa y universaliza para así buscar la mayor veracidad
o la mejor predicción, a un panorama cercano.
En el siguiente ensayo hablaremos sobre el problema
principal de cada uno de manera simple y la solución práctica para ambos.
Desarrollo:
El concepto de minería de datos es un proceso rápido y
eficaz para el descubrimiento de relaciones, tendencias, desviaciones,
comportamientos atípicos, patrones y trayectorias ocultas, con el propósito de
soportar los procesos de toma de decisiones con mayor conocimiento. Es por eso,
que, en una realidad variante y fluctuante, la minería de datos se ve
debilitada ya que no es capaz de analizar una cantidad nueva de datos.
Big data o macrodatos es un término que hace
referencia a una cantidad de datos tal que supera la capacidad del software
convencional para ser capturados, administrados y procesados en un tiempo
razonable, es por eso por lo que pierde la noción representativa de la realidad
al buscar el mayor uso de datos.
Big data es el proceso que busca que el problema se
acapare de forma global y no como la ciencia tradicional lo viene llevando, de
manera específica, y al mismo tiempo evitando la dispersión de datos y
supuestos.
Es por eso por lo que, bajo una representación real de
los datos, ambos tienen problemas en sus precisiones, sea en los resultados o
en el manejo de datos. Ya que tratan de solucionar de manera mediata al caso
suscitado.
En el caso de la minería de datos, la precisión
predictiva es su finalidad, y para lograrlo busca de manera exhaustiva una
evaluación de sus herramientas bajo tres puntos principales:
A) Precisión: La herramienta de la minería de datos
debe generar un modelo lo más preciso posible, pero reconociendo que las
pequeñas diferencias en las distintas técnicas pueden deberse a fluctuaciones
en muestreo aleatorio o pueden ser despreciables en la dinámica del mercado en
el que se despliegan los modelos.
B) Explicación: La herramienta de la minería de datos
tiene que ser capaz de explicar al usuario final, de un modo claro, cómo funciona
el modelo para que pueda desarrollar la intuición.
C) Integración: La herramienta de la minería de datos
debe integrarse en el proceso real de negocio, flujos de datos e información de
la empresa.
Si estos tres requisitos se cumpliesen debidamente,
las herramientas de la minería de datos producirán modelos de alto rendimiento
y larga duración.
Big data trata de universalizar la mayor cantidad de
supuestos con una mayor cantidad de datos, por eso que los datos
representativos ya están inmersos en los supuestos, es más, en su exposición al
final se esclarecen y se expresan de manera de gráficos para ser una
representación dinámica de la realidad. Como diría Edward Tufte “El mundo es
complejo, dinámico, multidimensional, el papel es estático y plano. ¿Cómo vamos
a representar la rica experiencia visual del mundo en la mera planicie?”
Entonces al analizar ambas soluciones, podemos inferir
que: Mientras que la Minería de Datos trata de ser lo más estricta en su
evaluación de herramientas y modelos, para ser lo más preciso en el tiempo; Big
Data trata de universalizar y captar en totalidad la realidad mediante su
masivo uso de datos.
Por lo tanto, el manejo de datos de una manera rápida,
eficaz y precisa si es posible, ya que la minería de datos y el Big Data te
ofrecen esas facilidades, mediante su precisión al desglosar y su masivo uso de
datos, respectivamente.
La solución de minería de datos radica en su problema,
ya que al saber muy bien que la realidad es tan variable y fluctuante, lo único
que queda es tratar de buscar una manera más exhaustiva en la evaluación de sus
herramientas y sus modelos.
La solución de Big Data radica en la representación
dinámica y global de los datos, entonces por eso pierde la importancia y la noción
representativa de la realidad y, buscamos que la ciencia sea más global a la
hora de solucionar problemas.
No hay comentarios.:
Publicar un comentario