BIG DATA
INTRODUCCIÓN
Big Data es el conjunto de
elementos que representan la información existente en las compañías creciendo
diariamente en dimensiones; el volumen es la información de datos almacenada en
las empresas, puede ser un factor muy importante en la toma de decisiones
siendo benéfica para escuelas como la ingeniería industrial. El volumen suele
crecer a medida que los datos se generan con cierta velocidad y variedad, ocasionando
incremento en el volumen, también llamado las” 3v s” una las características
que definen el procesamiento del BigData.
El blog también refiere al
significado del Big data, sus tecnologías y sus aprovechamientos en el sector
empresarial.
DEFINICIÓN
Sobre Big Data se tiene significativas
definiciones aproximándose, Gartner [1] define el Big Data como “un gran
volumen, velocidad o variedad de información que demanda formas costeables e
innovadoras de procesamiento de información que permita ideas extendidas, toma
de decisiones y automatización del proceso”.
Big data reúne una serie de
información que es transportado a un almacenamiento en forma de “bytes”
incrementándose el volumen de contenido ingresado, el volumen se encuentra
relacionado en la velocidad a medida que viajan los datos y la variedad de
información que pueda llegar a obtener de diversas fuentes.
Si cuestionamos ¿Cómo analizar
esta información y provechar de sus recursos?
Ha habido una gran variedad en la aplicación de distintas ramas de las
ciencias. Adquiriendo una gran importancia en la ingeniería industrial, en la
toma de decisiones las empresas están logrando marcar una diferencia en la
competencia. Sin embargo, en una encuesta del realizada por Log Logic del
estado del Big Data se encuentra que [2] “el 49% de las organizaciones están
algo o muy preocupados por la gestión de Big Data, pero que el 38% no entiende
lo que es, y el 27% dice que tiene una comprensión parcial; además, a la
encuesta encontró que el 59% de las organizaciones carecen de las herramientas
necesarias para gestionar los datos de sus sistemas de TI”
Estos datos muestran el poco
entendimiento del BigData en las empresas, los beneficios de acceder a la
información obtenida generan una nueva toma de decisiones basadas a datos
estadísticos y reales de cada uno sus usuarios; siendo de utilidad en los
ámbitos de la relación cliente – empleado (aplicación de modelos de gestión),
operación y producción(simulación dinámica de escenarios, predicción de la
demanda, detección de patrones, mantenimiento predictivo) generando así los servicios digitales un
dinamismo de toma de decisiones en la empresa.
Para el manejo de datos de esta
tal magnitud es necesario la tecnología del Big Data, donde con estas se podrá
procesar elementos masivos de datos estructurados, no estructurada o
semiestructurada.
Apache Hadoop
[3] “Hadoop puede manejar todos
los tipos de datos de sistemas dispares: estructurado, no estructurado, los
archivos de registro, imagines, archivos de audio, archivos de correo
electrónico, las comunicaciones…, casi cualquier cosa que se pueda imaginar,
sin importar su formato nativo”
Hadoop es un espacio donde puede
ejecutar aplicaciones de código abierto que procesan la cantidad de datos que
ingresa sus ventajas: (i) fue diseñado para trabajarse en software y hardware grandes.
(ii) permite crear nodos auxiliares con relativa facilidad. (iii) permite a los
usuarios escribir código con eficiencia, para software distribuidos.
El Hadoop está compuesto por dos
módulos
1) Hadoop Distributed File System (HDFS:
Sistema de archivos distribuidos Hadoop)
HDFS
permite procesar archivos con tamaños de gigabytes(GB) hasta petabytes(PB), lee
datos a grandes velocidades, capacidad para ser ejecutado en una máquina, sin
necesitar hardware especial.
Hadoop MapReduce: según [4] “es un sistema basado en hilados para el procesamiento paralelo de grandes conjuntos de datos” es un software permitiendo que se dividan de una manera independiente y de manera distribuida.
Fuente: Departamento
de investigación Marca2.0
Fuente: aggity
CONCLUSIONES
Sin duda el Big Data es una nueva tecnología que ha entrado
a nuestras vidas y avanza a pasos agigantados en los estudios de las industrias
y las ciencias aplicables, siendo una oportunidad para el desarrollo de nuevas
tecnologías y especialistas para ello se es necesario aplicar sus usos y
estudios en el bien de la sociedad ya que tener acceso a una infinidad de
información es igual a poder. Para una implementación eficiente del Big Data es
necesario entender el negocio y los datos, determinar problemas y como es que
ayudan los datos, tener expectativas razonables, para la implementación del Big
Data es necesario un estudio e inversión en este tipo de tecnologías.
REFERENCIAS
[1] M. Salgado, Oracle apuesta por Big Data con tecnología y
proyectos. Disponible en: http://www.computerworld.es/big-data/ Oracle-apuesta-por-big-data-con-tecnología-y
proyectos, 2014.
[2] S.
Montoro, Server and Cloud Platform. Disponible en: http://lapastillaroja.net/2012/02/
nosql-for-non-programmers/, 2012.
[3]
Cloudera.com, Cloudera, Inc. Disponible en:
http://www.cloudera.com/content/cloudera/en/
why-cloudera/hadoop-and-big-data.html, 2013.
[4] hadoop.apache.org, Disponible en: http://
hadoop.apache.org/, 2013.
http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0122-82852016000400972&lang=es
Comentarios
Publicar un comentario