En el evento Big Data Spain…

Hola a todos, hace tiempo que no escribíamos en el blog. La verdad es que Sidelab ha sufrido cambios importantes últimamente… en breve os contaremos en detalle la nueva situación, pero ahora os voy a hablar de BigData.

Evento "Big Data Spain"

Hoy he estado en la conferencia BigData Spain. Se ha celebrado en la ETSIT de la UPM y ha sido organizada por Paradigma Tecnológico. La verdad es que ha estado muy bien. En este post contaré las cuestiones más relevantes del evento.

Por la mañana hemos tenido las charlas más generales sobre Big Data. La conclusion a la que he llegado es que Big Data en realidad es “processing” de big data. Hemos tenido varias charlas de gente clave en el mundo de BigData. Se han hablado de cuestiones como: Cassandra, otra de Cloud y BigData (de la mano de gente de gigaspaces), de BigQuery de Google y de Apache Pig.

Con lo que me quedo del mini-congreso es que hay muchos enfoques diferentes para trabajar en BigData. Como la eficiencia y la optimización es muy importante, hay muchos enfoques, cada uno de ellos para una tarea específica. Es decir, tradicionalmente lo más normal es que los datos de tu aplicación estén alojados en una base de datos relacional y todos los servicios (almacenamiento, análisis en tiempo real, consultas, informes…) se bases en dicha base de datos. Lo que aprendemos de BigData es que los modelos tradicionales no escalan y hay que utilizar otras tecnologías si queremos escalabilidad. Pero lo más importante es que no hay “una única nueva tecnología”… ahora hay muchas tecnologías diferentes que solventan problemas diferentes. Es más, lo habitual es que esas tecnologías se utilicen “a la vez” en tu sistema. Y eso me recuerda el término de persistencia-políglota de Martin Fowler. Todas estas nuevas formas de persistencia se engloban dentro del movimiento NoSQL, que ahora se empieza a entender como “Not only SQL” (en vez de No SQL).

La conclusión a la que llego es que en movimiento de BigData ya está lo suficientemente maduro como para que se empiece a pensar en la integración de todas estas tecnologías dentro de un mismo paraguas. Y no sólo desde el punto de vista conceptual, de modeloado de datos y de procesado de los mismos, también desde el punto de su ejecución. Hay que tener en cuenta que la escalabilidad es muy importante (junto con la tolerancia a fallos), por tanto el cloud computing (y la facilidad que proporciona el Paas) están muy relacionados con el BigData.

En definitiva… hay que estar al tanto de este movimiento para que no te pille desprevenido. Yo ya me he puesto a tope con MongoDB, una base de datos NoSQL.

¿Cuándo usar BigData? Según el ingeniero de Google: cuando el coste de determinar qué cosas no almacenar es mayor que el coste de almacenarlo todo 🙂

 

Anuncios

One thought on “En el evento Big Data Spain…

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s