Big Data. Análisis de grandes volúmenes de información

En la época en que vivimos, es muy difícil pensar en el hogar de alguno de nuestros conocidos que no tenga acceso a internet, ya que esta herramienta llego para quedarse y es algo que queramos o no, usamos Big Data todos los días para diversas actividades, desde ocio, hablar con nuestros familiares que viven lejos de nosotros, para nuestras actividades laborales o simplemente hacer cualquier tipo de búsqueda.

Con todas estas actividades que realizamos, se forman una cantidad de datos impresionantes, que son de suma importancia para las organizaciones, ya que saben lo que está pasando en la actualidad, respecto a intereses de los consumidores o como poder entrar a diversos mercados, con esto pueden hacer un pronóstico de que pasara a futuro, es difícil fijar todo lo que pueden hacer las organizaciones con esta información.

En el pasado, era algo imposible de pensar que las organizaciones pudieran hacer todo lo antes mencionado, ya que, aunque ya los ordenadores estaban a su disposición, aún no eran lo suficientemente potentes. Pero con la evolución de las tecnologías, ahora esto es una realidad y se tiene que agradecer a big data, el cual es el concepto central en el que se basara este artículo, para poder comprender el poderío y alcance que tiene para las organizaciones, ya que ha elevado de forma importante la competitividad y es un factor determinante para la toma de decisiones.

Como se mencionó anteriormente, la cantidad de datos que se generan es abismal, lo que hace que sea compleja de procesar. Pero las empresas necesitan esos datos prácticamente en tiempo real y es donde Big Data será la clave.

Conceptos clave.

A continuación, se mencionaran algunos conceptos clave, para que el lector pueda tener una mejor comprensión del artículo.

Dato.

“Es una representación simbólica (numérica, alfabética, algorítmica, espacial, entre otras.) de un atributo o variable cuantitativa o cualitativa. Los datos describen hechos empíricos, sucesos y entidades. Es un valor o referente que recibe el computador por diferentes medios, los datos representan la información que el programador manipula en la construcción de una solución o en el desarrollo de un algoritmo.”  (Wikipedia , 2018 )

Tecnología. 

“Es el conjunto de conocimientos con las que el hombre desarrolla un mejor entorno, más saludable, agradable y sobre todo cómodo para la optimización de la vida.” (Definista , 2011)

Responde esta encuesta sobre consumo de redes sociales. Nos ayudará a brindarte mejor información.

¿Usas sitios de redes sociales para encontrar información académica o laboral?*

¿Usas sitios de redes sociales para encontrar información académica o laboral?*

¿Qué sitios de redes sociales utilizas para investigación académica o laboral*

¿Qué sitios de redes sociales utilizas para investigación académica o laboral*

Puedes seleccionar las opciones que quieras.

Que tipo de dispositivo usas al utilizar redes sociales*

Que tipo de dispositivo usas al utilizar redes sociales*

¿Cuántas cuentas de redes sociales tienes?*

¿Cuántas cuentas de redes sociales tienes?*

¿Cuántas horas a la semana le dedicas a las redes sociales?*

¿Cuántas horas a la semana le dedicas a las redes sociales?*

Big Data

“Conjunto de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.” (PowerData, 2018).

El origen de Big Data

Desde que se inventó la escritura el hombre ha almacenado información de diferente índole, esto no ha cambiado, ya que en la actualidad con los avanzados sistemas de captura de datos, se ha vuelto un procedimiento cotidiano pero muy importante.

Datos estiman que para la siguiente década se tendrán cerca de 40 zettabytes[1] de información generados en todo el mundo, lo que equivaldría a multiplicar cada grano de arena cincuenta y siete veces de cada costa del mundo.

A continuación se presentan algunos acontecimientos, que junto al surgimiento de internet, dieron lugar a lo que ahora conocemos como Big data, de acuerdo con Ciampagna (2015) los mas representativos son los siguientes:

  • o El costo de acumular información digital cae estrepitosamente, por lo cual ahora es más barato de esta forma que acumularla en papel.
  • o Google lanza su buscador de información, que pronto se volvería el más popular en el mundo.
    • Michael Lesk pronostica que la velocidad en que crecerá la información digital será de diez veces por año.

1999

  • Se emplea por primera vez el termino Big Data en el trabajo de investigación titulado como: “Exploración visual de conjuntos de datos de gigabytes en tiempo real”.

2001 o Doug Laney establece las tres V de Big Data, las cuales son: “Volumen, Velocidad y Variedad”.

2005

  • Se crea la Web 2.0, una página web en la que los usuarios crean su propia información.
  • Creación de Hadoop, que es un sitio con un entorno Big Data y que es totalmente gratis para los usuarios.

2007 o El concepto de que es Big Data llega de manera “oficial” a las masas por medio de un artículo de la revista Wired.

2010 o El CEO de la empresa Google Eric Schmidt habla en una ponencia que la información que se genera en dos días, es mayor que la que se generó desde el inicio de la humanidad hasta el año 2003

2014

  • Los celulares sobresalen en el uso de internet sobre las computadoras por primera vez, esto provoca que haya una conexión continua y el tráfico de datos aumente.
  • Una encuesta realizada entre CEO´s de diferentes partes del mundo, da como conclusión que un 88% asegura que el análisis de BIG Data es algo primordial para sus organizaciones.

2017 o Los datos están al alcance de todo el mundo, podemos saber el ritmo de nuestros ejercicios con una pulsera, todos nuestros datos al alcance de un clic o donde va nuestro producto que acabamos de comprar en una tienda en línea.

¿Cómo se capturan los datos en Big Data?

Nos podríamos preguntar,  ¿Cómo es que llega toda  esa cantidad de información a las corporaciones? Pues la respuesta es que nosotros como consumidores se las estamos proporcionado ya sea consiente o inocentemente a cada instante del día. Hoy en día un celular promedio tiene mejores especificaciones en cuanto a poder de almacenamiento o velocidad de procesamiento, que las computadoras de la NASA que usaron para llevar al hombre a la luna, así que la información que se genera hoy en día es demasiado cuantiosa. De acuerdo con Wikipedia (2018) se pueden catalogar en las siguientes categorías, como es que se proporciona la información:

Creados por los consumidores.

Hoy en dia las redes sociales se han convertido en algo que es viltal para poder llevar nuestro dia a día , al momento de mandar un e-mail[2], dar “me gusta” a determinado producto o fotografía en Facebook o Instagram, mandar un mensaje a alguien por WhatsApp o desde realizar cualquier encuesta en un restaurante para medir nuestro grado de satisfacción, estamos creando nuevos datos para las organizaciones, se calcula que en un minuto se envían 200 millones de e-mails o se realizan 2 millones de búsquedas en Google, lo que se traduce como una cantidad de datos inimaginable.

Por medio de transacciones. 

Al hacer transferencias bancarias, facturar diversas compras, entre otras actividades, generan informacion que tal vez asi dispersa no puede significar mucho, pero ya que se procesa puede ser de gran importancia para las organizaciones.

Mercadotecnia electrónica y uso del internet.

Cuando estamos en la comodidad de nuestro hogar, visitando diversas paginas web, haciendo clic en cualquier lugar, por irrelevante que parezca, estamos generando datos que le estamos dando a las organizaciones que posteriormente les servirá para poder usarlos como su herramienta de mercadotecnia electrónica.

Máquina a Máquina.

Con la nueva tecnología, también se cambió la forma en que obtenemos diferentes medidas, ahora con los nuevos aparatos de medición podemos tener sensores de temperatura, energía, presión, entre otras magnitudes físicas, que serán capturadas y posteriormente procesadas en datos. Con la implementación del WIFI u otras herramientas de conectividad, es mucho más sencillo que dispongamos de estos datos.  Biométrica. 

Estos datos son los que son contenidos por escáneres de retina, huellas de los dedos  o más sofisticado lectores de ADN, este tipo de tecnología asociada para medidas de seguridad, pero que a final de cuentas se convertirán en datos que serán de utilidad para las organizaciones, como podrían ser elementos para la seguridad de una sociedad.

Transformación de datos

Ya que las organizaciones han capturado los datos (de todas las formas que se analizaron en el punto anterior),  tendrán demasiados, que tal vez como estén dispersos, no tengan mucha correlación con el resto. Por lo que ahora prosigue juntarlos en un mismo espacio y que tengan el mismo estilo.

En esta parte del proceso entraran los sistemas extraer, transformar y cargar (ETL)[3], que su finalidad será la de eliminar datos innecesarios, agrupar los que tengan importancia para poderles dar el mismo formato y cargarlos en una base de datos establecida por la organización.

Herramientas del Big Data

Hoy en día, podemos encontrar diversas herramientas que nos ayuden a desarrollar Big Data, de acuerdo con Instituto de ingeniería del conocimiento (2016) algunos ejemplos de las herramientas más utilizadas en la actualidad son las siguientes:

Hadoop. 

Hadoop es la herramienta para trabajar Big Data por excelencia, es de libre uso y se le considera el entorno de trabajo estándar para almacenar, aunque también analiza y procesa grandes sumas de datos, es usado por organizaciones mundiales tales como Facebook y Yahoo!.

Elasticsearch.

Es una herramienta de gran alcance para la búsqueda de una cantidad grande de datos complejos.

Nos la capacidad de analizar en el momento que lo deseemos una gran cantidad de datos y consultarlos. Se puede usar para las búsquedas de texto completo, ya que los datos al estar ordenados de acuerdo a un criterio, los datos se obtienen de una forma muy rápida.

“Con Elasticsearch podemos hacer búsquedas de texto complicadas, visualizar el estado de nuestros nodos y escalar sin demasiadas necesidades, si se diera el caso de que necesitáramos más potencia.” (Instituto de ingenieria del conocimiento , 2016)

Apache Storm.

Esta herramienta está destinada a actuar al momento, situada a procesar datos de manera constante, un ejemplo seria los que vienen de las redes sociales, una cantidad inmensa de datos (se estima que se comparten alrededor de 700 mil piezas de contenida cada minuto en Facebook).

Análisis de datos

Existen diversas técnicas en las cuales las organizaciones se apoyan para poder analizar la inmensa cantidad de datos que poseen, las más reconocidas son las siguientes:

Asociación. 

Con esta tecnica se pueden hallar los datos que estén relaciones por sus diferentes variables. Se pretende encontrar un pronóstico para lo que ocurra con otras variables.

Un ejemplo se podría encontrar en poder venderle a un cliente productos similares a los que consume, por medio de la venta electrónica.

Minería de datos. 

Conjunto de técnicas que ajusta métodos estadísticos, con almacenamiento en las bases de datos. La minería de datos tiene relación con otras herramientas que buscan hallar patrones en cantidades importantes de datos.

Agrupación. 

Este tipo de herramienta lo que busca es que de las enormes cantidades de datos que se generan, dividir en secciones más chicas, para poder descubrir semejanzas entre estos datos y conocer las condiciones que los puntualizan.

Es sumamente importante para encontrar similitudes entre resultados y hacer una valoración preliminar de los datos que se analizaran.

Análisis de texto. 

Como la mayoria de los datos generados por los usuarios son textos, como pueden ser e- mails, búsquedas en internet, entre otros. Este proceso lo que busca es extirpar la información de esos datos, para poder modelar diversos temas o predecir futuras búsquedas de los usuarios.

Finalmente, ¿Cómo podemos visualizar los datos?

Ya que tenemos el resultado final, después de capturar, procesar y analizar esa inmensa cantidad de datos, debemos encontrar alguna forma en la cual pueda ser presentada para el usuario final.

Diversos estudios afirman que el usuario final prefiere una presentación con una buena estructura, con gráficos comparativos mostrando los resultados en lugar con una tabla con una gran cantidad de números y conclusiones simples.

Un ejemplo de cómo se puede representar esto es a través de la plataforma Mondrian, “es una plataforma que permite visualizar la información a través de los análisis llevados a cabo sobre los datos que disponemos. Con esta plataforma se intenta llegar a un público más concreto, y una utilidad más acotada como un cuadro de mando integral de una organización.” (Wikipedia , 2018 )

Así mismo las infografías[4] se han puesto de moda a la hora de presentar los resultados que se obtuvieron por el análisis de datos, ya que es un material visualmente interesante, animado y simple para la recepción masiva.

Un ejemplo de una herramienta de reciente creación por parte de Vodafone

En España, más concretamente en la ciudad de Barcelona, durante el evento del Mobile World Congress, Vodafone presento una herramienta para que las Pymes del país puedan aprovechar el Big Data para así puedan saber y utilizar los datos que generan los consumidores de Vodafone y esto les sirva para futuras decisiones sobre sus negocios.

Vodafone afirma que los datos serán totalmente anónimos y los datos serán sobre sus patrones de conducta, tales como: los lugares a los que han ido, cuanto tiempo pasan allí, duración de las llamadas, páginas de internet que frecuentan, que es lo que compran, aplicaciones móviles que instalan, entre muchas cosas más.

El 91% de la población española accede a internet a través de un celular.

Las Pymes que contraten su herramienta Big Data llamada “Vodafone Analytics” tendrán que pagar una suscripción mensual para poder acceder a todos estos datos.

Esta información privilegiada permitirá una toma de decisiones más sólida sobre cuanto stock necesitan tener para determinado producto, ver si es factible abrir nuevas sucursales y en qué lugares, campañas de publicidad enfocadas a determinados sectores, entre muchas cosas más.

Así mismo Vodafone señala, que no solo ira dirigida a las Pymes del país, sino que también podrán suscribirse Instituciones públicas con la finalidad de tomar decisiones sobre urbanismo, el uso del transporte público, entre diversos temas de importancia para la sociedad.

Tendrá dos variantes su comercialización, una que estará ligada directamente a lo que necesita la organización y otra que coloca la información por módulos y rondara un costo de 1000 o 1500 euros mensuales.

Importancia del Big Data

A lo largo de la lectura, se han podido leer o inferir diversas ventajas que significarían para las organizaciones tener en sus manos todo lo que ofrece Big Data, pero siendo un poco más específicos, de acuerdo a PowerData (2018) estas serían algunas ventajas para diversas situaciones que afrontan las organizaciones de todo tipo.

Turismo. 

Que un cliente sea feliz y disfrute su estancia es la clave del éxito para una organización que opere en este rubro, pero el grado de complacencia no siempre es fácil de cuantificar, en especial cuando lo desea la organización.

El uso de Big Data ofrece a estas organizaciones poder analizar los datos arrojados por sus clientes, analizarlos y emitir un juicio sobre alguna situación en particular, así tal vez evitar algún problema antes de que sea demasiado tarde.

Salud. 

En las organizaciones dirigidas hacia la salud de los clientes, Big Data tiene mucho que ofrecer. Registros médicos, planes de salud, seguros adquiridos, entre muchas otras actividades pueden ser difíciles de controlar, ya que están llenas de información de suma importancia para la organización.

Es donde entra Big Data, donde analizara de forma precisa y rápida toda la información almacenada y se podrán emitir juicios sobre algún diagnostico o tratamiento para un paciente de manera oportuna.

Administración. 

Hoy en día la administración está ante un gran reto: que la calidad y productividad se mantenga o inclusive mejore, pero con un presupuesto corto. Con la ayuda de Big Data aumenta las operaciones y la administración tendrá una visión expandida de todas las actividades q ue se lleven a cabo en la organización.

Retail.5

El como se comercian los productos ha avanzado en los últimos años, ya que ahora los consumidores esperan que los minoristas sepan que es lo que quieren y en qué momento lo desean.

Big data es un gran apoyo para las personas que emprenden este tipo de comercio, ya que ahora cuentan con una cantidad importante de información sobre qué es lo que en realidad quiere el cliente, cuáles son sus costumbres de compra, sabe a las marcas o productos a los cuales el cliente es fiel, entre otras cosas. así mismo pueden

                                                         

5 El concepto suele vincularse a la venta de grandes cantidades, pero a muchos compradores diferentes. (Porto,

2014)

pronosticar cuales productos serán tendencia entre los consumidores o recomendarles productos de diferente índole.

Publicidad. 

El aumento de celulares inteligentes o diferentes periféricos que poseen GPS[5], da la capacidad a las organizaciones de poder dirigir publicidad a los clientes cuando estén cerca de determinado establecimiento. Esto hace que aumenten las ganancias de las organizaciones que otorgan el servicio y da la posibilidad de atraer nuevos consumidores.

Propuesta de tesis.  

Implementación de Big Data en una Pyme de la Ciudad de Orizaba para mejorar su publicidad.

Objetivo.

Conocer que es lo que buscan los consumidores, para que la Pyme pueda realizar promociones, publicidad de sus productos, entre otras para aumentar su publicidad.

Agradecimientos. 

Agradezco a mi familia, por darme todo el apoyo y el impulso para seguir día con día, al Instituto Tecnológico de Orizaba por abrirme sus puertas y permitirme continuar mis estudios con la Maestría en Ingeniería Administrativa y al Doctor Fernando Aguirre y

Hernández por motivarme con su conocimiento en el seminario de Fundamentos de Ingeniería Administrativa para realizar cada uno de los artículos asignados.

Conclusión.  

Con la lectura de este artículo, nos hemos podido dar cuenta de que Big Data es una herramienta relativamente nueva, pero que por nada del mundo será pasajera, ya que con el gran flujo de datos que se tienen hoy en día, cada vez es más solicitada alguna metodología que nos permita el Big Data.

Big Data es una parte del engranaje del cambio de cómo se manejan las organizaciones e incluso las sociedades. Así que creo, esto establecerá los cimientos de lo que serán otro tipo de evoluciones para el ser humano.

Bibliografía.

Ciampagna, J. M. (4 de Marzo de 2015 ). El blog del profe José . Obtenido de https://elprofejose.com/2015/03/04/una-breve-historia-sobre-big-data-que-todo-elmundo-deberia-leer/

Definista . (23 de Agosto de 2011). ConceptoDefinición.De. Obtenido de http://conceptodefinicion.de/tecnologia/

Grupo IGN . (2 de Mayo de 2017). Grupo IGN Soluciones de gestión para Pymes. Obtenido de https://ignsl.es/historia-del-big-data/

Instituto de ingenieria del conocimiento . (13 de Octubre de 2016). IIC Instituto de ingenieria del conocimiento . Obtenido de «http://www.iic.uam.es/innovacion/herramientas-big-data-para-empresa/»

MARTÍNEZ, V. (27 de Febreo de 2018). Vodafone lanza una herramienta de ‘big data’ para que las pymes conozcan mejor a sus clientes. El Mundo .

PowerData. (2018). PowerData Especialistas en gestión de datos . Obtenido de https://www.powerdata.es/big-data

Wikipedia . (20 de Febrero de 2018 ). Wikipedia la enciclopedia libre . Obtenido de https://es.wikipedia.org/wiki/Dato

Wikipedia . (27 de Febrero de 2018). Wikipedia, la enciclopedia libre . Obtenido de https://es.wikipedia.org/wiki/Macrodatos

_________

[1] Un zettabyte es una unidad de almacenamiento de información cuyo símbolo es el ZB, equivale a 1021 bytes. (Wikipedia, 2018)

[2] Correo electrónico.

[3] Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos para analizarlos, o en otro sistema operacional para apoyar un proceso de negocio. (Wikipedia, 2018)

[4] Es una combinación de imágenes sintéticas, explicativas y fáciles de entender y textos con el fin de comunicar información de manera visual para facilitar su transmisión. (Ofifacil, 2018)

[5] Sistema de Posicionamiento Global.

Cita esta página

Baranda Pacheco Martín. (2018, marzo 19). Big Data. Análisis de grandes volúmenes de información. Recuperado de https://www.gestiopolis.com/big-data-analisis-grandes-volumenes-de-informacion/
Baranda Pacheco Martín. "Big Data. Análisis de grandes volúmenes de información". gestiopolis. 19 marzo 2018. Web. <https://www.gestiopolis.com/big-data-analisis-grandes-volumenes-de-informacion/>.
Baranda Pacheco Martín. "Big Data. Análisis de grandes volúmenes de información". gestiopolis. marzo 19, 2018. Consultado el . https://www.gestiopolis.com/big-data-analisis-grandes-volumenes-de-informacion/.
Baranda Pacheco Martín. Big Data. Análisis de grandes volúmenes de información [en línea]. <https://www.gestiopolis.com/big-data-analisis-grandes-volumenes-de-informacion/> [Citado el ].
Copiar

Escrito por:

Imagen del encabezado cortesía de christiaancolen en Flickr