BIG DATA

INTRODUCCIÓN

Big Data es el conjunto de elementos que representan la información existente en las compañías creciendo diariamente en dimensiones; el volumen es la información de datos almacenada en las empresas, puede ser un factor muy importante en la toma de decisiones siendo benéfica para escuelas como la ingeniería industrial. El volumen suele crecer a medida que los datos se generan con cierta velocidad y variedad, ocasionando incremento en el volumen, también llamado las” 3v s” una las características que definen el procesamiento del BigData.

El blog también refiere al significado del Big data, sus tecnologías y sus aprovechamientos en el sector empresarial.

DEFINICIÓN

Sobre Big Data se tiene significativas definiciones aproximándose, Gartner [1] define el Big Data como “un gran volumen, velocidad o variedad de información que demanda formas costeables e innovadoras de procesamiento de información que permita ideas extendidas, toma de decisiones y automatización del proceso”.

Big data reúne una serie de información que es transportado a un almacenamiento en forma de “bytes” incrementándose el volumen de contenido ingresado, el volumen se encuentra relacionado en la velocidad a medida que viajan los datos y la variedad de información que pueda llegar a obtener de diversas fuentes.

Si cuestionamos ¿Cómo analizar esta información y provechar de sus recursos?  Ha habido una gran variedad en la aplicación de distintas ramas de las ciencias. Adquiriendo una gran importancia en la ingeniería industrial, en la toma de decisiones las empresas están logrando marcar una diferencia en la competencia. Sin embargo, en una encuesta del realizada por Log Logic del estado del Big Data se encuentra que [2] “el 49% de las organizaciones están algo o muy preocupados por la gestión de Big Data, pero que el 38% no entiende lo que es, y el 27% dice que tiene una comprensión parcial; además, a la encuesta encontró que el 59% de las organizaciones carecen de las herramientas necesarias para gestionar los datos de sus sistemas de TI”

Estos datos muestran el poco entendimiento del BigData en las empresas, los beneficios de acceder a la información obtenida generan una nueva toma de decisiones basadas a datos estadísticos y reales de cada uno sus usuarios; siendo de utilidad en los ámbitos de la relación cliente – empleado (aplicación de modelos de gestión), operación y producción(simulación dinámica de escenarios, predicción de la demanda, detección de patrones, mantenimiento predictivo)  generando así los servicios digitales un dinamismo de toma de decisiones en la empresa.

Para el manejo de datos de esta tal magnitud es necesario la tecnología del Big Data, donde con estas se podrá procesar elementos masivos de datos estructurados, no estructurada o semiestructurada.

Apache Hadoop

[3] “Hadoop puede manejar todos los tipos de datos de sistemas dispares: estructurado, no estructurado, los archivos de registro, imagines, archivos de audio, archivos de correo electrónico, las comunicaciones…, casi cualquier cosa que se pueda imaginar, sin importar su formato nativo”

Hadoop es un espacio donde puede ejecutar aplicaciones de código abierto que procesan la cantidad de datos que ingresa sus ventajas: (i) fue diseñado para trabajarse en software y hardware grandes. (ii) permite crear nodos auxiliares con relativa facilidad. (iii) permite a los usuarios escribir código con eficiencia, para software distribuidos.

El Hadoop está compuesto por dos módulos

1)     Hadoop Distributed File System (HDFS: Sistema de archivos distribuidos Hadoop)

HDFS permite procesar archivos con tamaños de gigabytes(GB) hasta petabytes(PB), lee datos a grandes velocidades, capacidad para ser ejecutado en una máquina, sin necesitar hardware especial.

Hadoop MapReduce: según [4] “es un sistema basado en hilados para el procesamiento paralelo de grandes conjuntos de datos” es un software permitiendo que se dividan de una manera independiente y de manera distribuida.

Fuente: Departamento de investigación Marca2.0

Fuente: aggity

CONCLUSIONES

Sin duda el Big Data es una nueva tecnología que ha entrado a nuestras vidas y avanza a pasos agigantados en los estudios de las industrias y las ciencias aplicables, siendo una oportunidad para el desarrollo de nuevas tecnologías y especialistas para ello se es necesario aplicar sus usos y estudios en el bien de la sociedad ya que tener acceso a una infinidad de información es igual a poder. Para una implementación eficiente del Big Data es necesario entender el negocio y los datos, determinar problemas y como es que ayudan los datos, tener expectativas razonables, para la implementación del Big Data es necesario un estudio e inversión en este tipo de tecnologías.

REFERENCIAS

[1] M. Salgado, Oracle apuesta por Big Data con tecnología y proyectos. Disponible en: http://www.computerworld.es/big-data/ Oracle-apuesta-por-big-data-con-tecnología-y proyectos, 2014.

[2] S. Montoro, Server and Cloud Platform. Disponible en: http://lapastillaroja.net/2012/02/ nosql-for-non-programmers/, 2012.

[3] Cloudera.com, Cloudera, Inc. Disponible en: http://www.cloudera.com/content/cloudera/en/ why-cloudera/hadoop-and-big-data.html, 2013.

[4] hadoop.apache.org, Disponible en: http:// hadoop.apache.org/, 2013.

http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0122-82852016000400972&lang=es



Comentarios

Entradas populares