{"id":29640,"date":"2016-12-07T10:16:40","date_gmt":"2016-12-07T10:16:40","guid":{"rendered":"http:\/\/ddigital.webs.ull.es\/?p=29640"},"modified":"2016-12-07T10:16:40","modified_gmt":"2016-12-07T10:16:40","slug":"un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer","status":"publish","type":"post","link":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/","title":{"rendered":"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \u00abBig Data Management\u00bb de Springer"},"content":{"rendered":"<p>Parte del Trabajo de Fin de Grado de V\u00edctor Plaza Mart\u00edn, hasta ahora alumno de Ingenier\u00eda Inform\u00e1tica de la Universidad de La Laguna, ha sido publicado recientemente por la editorial Springer como cap\u00edtulo titulado \u00abAnalyzing Network Log Files Using Big Data Techniques\u00bb en el libro \u00abBig Data Management\u00bb, editado por F.P. Garc\u00eda-M\u00e1rquez y B. Lev.<\/p>\n<p>El trabajo ha sido desarrollado en la Escuela Superior de Ingenier\u00eda y Tecnolog\u00eda del centro universitario, por el mencionado V\u00edctor Plaza Mart\u00edn, junto a Carlos J. P\u00e9rez Gonz\u00e1lez y Teno Gonz\u00e1lez-Santos, y en colaboraci\u00f3n con Jos\u00e9 C. Gonz\u00e1lez (Servicio TIC), bajo la direcci\u00f3n de Marcos Colebrook y Jos\u00e9 L. Roda Garc\u00eda.<\/p>\n<p>Este trabajo aborda el dise\u00f1o y desarrollo de una aplicaci\u00f3n que usa t\u00e9cnicas de Big Data para analizar los ficheros log de la WiFi de la Universidad de La Laguna, con el objetivo de rastrear informaci\u00f3n sobre los distintos dispositivos conectados, as\u00ed como el n\u00famero y tipo de accesos a cada edificio. Esta aplicaci\u00f3n ayudar\u00e1 en un futuro al Servicio TIC a analizar estos registros en tiempo real. La publicaci\u00f3n estar\u00e1 accesible gratuitamente desde la ULL (a partir de 2017) en <a href=\"http:\/\/doi.org\/10.1007\/978-3-319-45498-6\" target=\"_blank\" rel=\"noopener\">http:\/\/doi.org\/10.1007\/978-3-319-45498-6<\/a><\/p>\n<p>El proyecto corresponde al curso acad\u00e9mico 2014\/15 y en ese momento uno de los campos tecnol\u00f3gicos de mayor relevancia era y sigue siendo la BigData como se pod\u00eda observar en los rankings Gartner sobre tecnolog\u00eda.\u00a0 \u201cB\u00e1sicamente podemos entender BigData como el procesamiento y an\u00e1lisis de grandes cantidades de datos atendiendo a tres factores claves, la velocidad con lo que lo procesamos, la variedad de los datos que confiere mayor dificultad de c\u00f3mputo, y por \u00faltimo el volumen de los datos ya que a mayor volumen el tiempo final de computaci\u00f3n aumenta\u201d, explica el autor del trabajo.<\/p>\n<p>\u201cEstas tres variables, velocidad, variedad y volumen vienen a representar las tres V de la BigData y todas hacen referencia a los datos\u201d, prosigue, por lo que el primer paso del proyecto consisti\u00f3 en conseguir datos de calidad cuyo an\u00e1lisis tuviese inter\u00e9s y fuese relevante, para no realizar un proyecto eminentemente te\u00f3rico sino m\u00e1s bien pr\u00e1ctico.<\/p>\n<p>En este contexto surgi\u00f3 la posibilidad de colaborar con el Servicio TIC, ya que por ley una entidad como la universidad debe almacenar un registro de la actividad de sus servicios como m\u00ednimo un a\u00f1o. El Servicio TIC gestiona m\u00e1s de un centenar de servicios telem\u00e1ticos, a los que se acceden desde los 26 edificios que componen la instituci\u00f3n. Esta potente red de comunicaciones con tecnolog\u00eda de 10Gb est\u00e1 formada por m\u00e1s de mil dispositivos de red entre WiFi y cableados que interconectan a los usuarios con los servicios, generando alrededor de 10 Gb de registros por hora. Dicho registro detalla el conjunto de peticiones que se realizan de manera transparente para el usuario pero que monitorizan su actividad, por lo que viene a configurar un mapa de la actividad de los usuarios en este caso de la red WiFi de la universidad.<\/p>\n<p>En este contexto se plante\u00f3 el problema en colaboraci\u00f3n con el Servicio TIC de forma que de manera peri\u00f3dica tanto el volumen como la variedad de los datos iba aumentando. \u201cEsto se hizo con el fin de garantizar la exactitud de los datos, usando los procesos anteriores para validar los resultados obtenidos, ya que cuando se habla de cientos de millones de registros un fallo en su procesamiento puede pasar desapercibido y \u00e9ste era un aspecto clave para todas las partes interesadas\u201d.<\/p>\n<p>Se opt\u00f3 por el uso de la herramienta l\u00edder en su momento para el an\u00e1lisis de datos masivos llamada Hadoop, la cual permit\u00eda afrontar el problema desde otra perspectiva, y realizar un an\u00e1lisis computacional basado en una t\u00e9cnica llamada clustering. \u201cB\u00e1sicamente consiste en dividir el conjunto de datos en bloques m\u00e1s peque\u00f1os y manejables, con el fin de realizar el an\u00e1lisis de manera distribuida en muchos ordenadores para posteriormente agregar los resultados. De esta manera conseguimos aplicar paralelizaci\u00f3n a nuestro proceso de an\u00e1lisis reduciendo notablemente el tiempo de procesamiento\u201d, explica el ingeniero inform\u00e1tico de la Universidad de La Laguna.<\/p>\n<p>Para tener una referencia, el resultado final permit\u00eda llevar a cabo un an\u00e1lisis de cuatro servidores y cuatro d\u00edas en poco m\u00e1s de 15 minutos de media, contin\u00faa, haciendo uso de un cluster distribuido compuesto por cuatro ordenadores. Uno de las mejores cualidades de la soluci\u00f3n generada era su escalabilidad, es decir, el f\u00e1cil dimensionamiento de la soluci\u00f3n, de manera de que a\u00f1adir un mayor n\u00famero de ordenadores al cl\u00faster fuese casi transparente al usuario con el fin de agilizar el an\u00e1lisis.<\/p>\n<p>Esta primera parte del an\u00e1lisis, conocida como ETL y que consiste en la adquisici\u00f3n, transformaci\u00f3n y carga de los datos fue sobre la que m\u00e1s tiempo se invirti\u00f3 y la que a la postre acab\u00f3 centrando el cap\u00edtulo publicado en el libro (referencia 3) debido a la escasez de documentaci\u00f3n pr\u00e1ctica en \u00e9ste sentido.<\/p>\n<p>Gr\u00e1fica Gartner 2013: <a href=\"http:\/\/www.gartner.com\/newsroom\/id\/2575515\" target=\"_blank\" rel=\"noopener\">http:\/\/www.gartner.com\/newsroom\/id\/2575515<\/a><\/p>\n<ol>\n<li>Gr\u00e1fica Gartner 2014: <a href=\"http:\/\/www.gartner.com\/newsroom\/id\/2819918\" target=\"_blank\" rel=\"noopener\">http:\/\/www.gartner.com\/newsroom\/id\/2819918<\/a><\/li>\n<li>Link al libro con las referencias necesarias al mismo: <a href=\"http:\/\/link.springer.com\/book\/10.1007%2F978-3-319-45498-6\" target=\"_blank\" rel=\"noopener\">http:\/\/link.springer.com\/book\/10.1007%2F978-3-319-45498-6<\/a><\/li>\n<li>Link al libro con las referencias necesarias al mismo: <a href=\"http:\/\/link.springer.com\/book\/10.1007%2F978-3-319-45498-6\" target=\"_blank\" rel=\"noopener\">http:\/\/link.springer.com\/book\/10.1007%2F978-3-319-45498-6<\/a><\/li>\n<\/ol>\n","protected":false},"excerpt":{"rendered":"<p>Parte del Trabajo de Fin de Grado de V\u00edctor Plaza Mart\u00edn, hasta ahora alumno de Ingenier\u00eda Inform\u00e1tica de la Universidad&#8230;<\/p>\n","protected":false},"author":23,"featured_media":29641,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"gallery","meta":{"inline_featured_image":false,"footnotes":""},"categories":[345,349,1],"tags":[643,1353,2392,2621],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.3 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro &quot;Big Data Management&quot; de Springer - ULL - Noticias<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro &quot;Big Data Management&quot; de Springer - ULL - Noticias\" \/>\n<meta property=\"og:description\" content=\"Parte del Trabajo de Fin de Grado de V\u00edctor Plaza Mart\u00edn, hasta ahora alumno de Ingenier\u00eda Inform\u00e1tica de la Universidad...\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/\" \/>\n<meta property=\"og:site_name\" content=\"ULL - Noticias\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/universidaddelalaguna\/\" \/>\n<meta property=\"article:published_time\" content=\"2016-12-07T10:16:40+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.ull.es\/portal\/noticias\/wp-content\/uploads\/sites\/13\/2016\/12\/big-data1.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1034\" \/>\n\t<meta property=\"og:image:height\" content=\"708\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"gaprsa\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@CanalULL\" \/>\n<meta name=\"twitter:site\" content=\"@CanalULL\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"gaprsa\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/\",\"url\":\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/\",\"name\":\"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \\\"Big Data Management\\\" de Springer - ULL - Noticias\",\"isPartOf\":{\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/#website\"},\"datePublished\":\"2016-12-07T10:16:40+00:00\",\"dateModified\":\"2016-12-07T10:16:40+00:00\",\"author\":{\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/#\/schema\/person\/b2b1a89d43ffa609e591f7df8ef3e817\"},\"breadcrumb\":{\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"https:\/\/www.ull.es\/portal\/noticias\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \u00abBig Data Management\u00bb de Springer\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/#website\",\"url\":\"https:\/\/www.ull.es\/portal\/noticias\/\",\"name\":\"ULL - Noticias\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.ull.es\/portal\/noticias\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/#\/schema\/person\/b2b1a89d43ffa609e591f7df8ef3e817\",\"name\":\"gaprsa\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/www.ull.es\/portal\/noticias\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/443820550921091458b4823867723b3d?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/443820550921091458b4823867723b3d?s=96&d=mm&r=g\",\"caption\":\"gaprsa\"},\"url\":\"https:\/\/www.ull.es\/portal\/noticias\/author\/gaprsa\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \"Big Data Management\" de Springer - ULL - Noticias","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/","og_locale":"es_ES","og_type":"article","og_title":"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \"Big Data Management\" de Springer - ULL - Noticias","og_description":"Parte del Trabajo de Fin de Grado de V\u00edctor Plaza Mart\u00edn, hasta ahora alumno de Ingenier\u00eda Inform\u00e1tica de la Universidad...","og_url":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/","og_site_name":"ULL - Noticias","article_publisher":"https:\/\/www.facebook.com\/universidaddelalaguna\/","article_published_time":"2016-12-07T10:16:40+00:00","og_image":[{"width":1034,"height":708,"url":"https:\/\/www.ull.es\/portal\/noticias\/wp-content\/uploads\/sites\/13\/2016\/12\/big-data1.jpg","type":"image\/jpeg"}],"author":"gaprsa","twitter_card":"summary_large_image","twitter_creator":"@CanalULL","twitter_site":"@CanalULL","twitter_misc":{"Escrito por":"gaprsa","Tiempo de lectura":"5 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/","url":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/","name":"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \"Big Data Management\" de Springer - ULL - Noticias","isPartOf":{"@id":"https:\/\/www.ull.es\/portal\/noticias\/#website"},"datePublished":"2016-12-07T10:16:40+00:00","dateModified":"2016-12-07T10:16:40+00:00","author":{"@id":"https:\/\/www.ull.es\/portal\/noticias\/#\/schema\/person\/b2b1a89d43ffa609e591f7df8ef3e817"},"breadcrumb":{"@id":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.ull.es\/portal\/noticias\/2016\/un-alumno-de-ingenieria-informatica-de-la-ull-publica-en-el-libro-big-data-management-de-springer\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"https:\/\/www.ull.es\/portal\/noticias\/"},{"@type":"ListItem","position":2,"name":"Un alumno de Ingenier\u00eda Inform\u00e1tica de la ULL publica en el libro \u00abBig Data Management\u00bb de Springer"}]},{"@type":"WebSite","@id":"https:\/\/www.ull.es\/portal\/noticias\/#website","url":"https:\/\/www.ull.es\/portal\/noticias\/","name":"ULL - Noticias","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.ull.es\/portal\/noticias\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/www.ull.es\/portal\/noticias\/#\/schema\/person\/b2b1a89d43ffa609e591f7df8ef3e817","name":"gaprsa","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/www.ull.es\/portal\/noticias\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/443820550921091458b4823867723b3d?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/443820550921091458b4823867723b3d?s=96&d=mm&r=g","caption":"gaprsa"},"url":"https:\/\/www.ull.es\/portal\/noticias\/author\/gaprsa\/"}]}},"primary_category":null,"featured_image_thumbnail_url":"https:\/\/www.ull.es\/portal\/noticias\/wp-content\/uploads\/sites\/13\/2016\/12\/big-data1-300x205.jpg","_links":{"self":[{"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/posts\/29640"}],"collection":[{"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/users\/23"}],"replies":[{"embeddable":true,"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/comments?post=29640"}],"version-history":[{"count":0,"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/posts\/29640\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/media\/29641"}],"wp:attachment":[{"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/media?parent=29640"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/categories?post=29640"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.ull.es\/portal\/noticias\/wp-json\/wp\/v2\/tags?post=29640"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}