Borrar
Cristina leal
Derribando mitos del big data

Derribando mitos del big data

«A mayor cantidad de datos no siempre mejores resultados», dicen los expertos

Jueves, 11 de noviembre 2021

Necesitas ser registrado para acceder a esta funcionalidad.

Compartir

Su análisis puede ayudarnos a predecir goles, pandemias, nevadas, tendencias… o puede que no. Depende de la calidad de la información de la que disponemos y de la forma en que la procesamos. «Las tecnologías de big data permiten capturar y almacenar todo tipo de contenido (imágenes, sonido, texto...). Sin embargo, necesitan combinarse con otras herramientas dedicadas al análisis de datos y con el conocimiento humano para resultar eficientes», advierte Josep Curto, director del Máster en Inteligencia de Negocio y Big Data, de la Universitat Oberta de Catalunya (UOC).

Si lo hacemos así, dice el experto, sus capacidades son casi ilimitadas y ahorran mucho tiempo. «Lo que antes necesitaba meses de procesamiento, ahora se consigue en unas horas o tan solo unos minutos. Un ejemplo son las recomendaciones que aparecen cada día en Instagram, Netflix o Airbnb cuando abrimos las aplicaciones». Y no solo eso, las averiguaciones extraídas de la mayor filtración de datos sobre evasores en paraísos fiscales de la historia, conocida como los 'Papeles de Panamá, también fueron posibles gracias a esta tecnología.

Aun así, su enorme versatilidad sigue generando confusión a nivel social. ¿Qué puede y qué no puede conseguir el big data? Derribamos cinco grandes mitos.

  1. Mito 1

    Muchos datos es big data

Eso dependerá de la calidad de los datos recopilados. «Para poder hacer predicciones, como hace el big data, es imprescindible que la información que recojamos sea representativa del problema que queremos resolver», declara Javier García Algarra, director académico del área de Ingeniería y Ciencias en el Centro Universitario U-tad. «Por ejemplo, si tenemos acceso a millones de historias clínicas en España, esos datos no nos permitirán hacer predicciones correctas sobre las probabilidades de un paciente de desarrollar diabetes o melanoma en Filipinas o Guatemala, aunque el sistema sea muy preciso para la población española. Tampoco podemos deducir los gustos musicales de los mayores de 50 años estudiando las listas de reproducción de los estudiantes de bachillerato».

Además, agrega Curto, «es imprescindible tener en cuenta que la naturaleza de los datos es temporal, que caduca. Es decir, puede ocurrir que, pasado un tiempo, algunos datos dejen de tener vigencia y ya no sean útiles. Por lo que, para cada caso de uso, es necesario recopilar solo la información esencial».

  1. Mito 2

    Con big data podemos predecir cualquier fenómeno

Para que esto sea cierto es imprescindible que lo que estemos estudiando no sea completamente aleatorio. «No podemos predecir qué número resultará premiado en el sorteo de la lotería de Navidad, aunque sepamos los resultados de los 100 años previos, porque está relacionado con el puro azar. Por el contrario, sí podemos estimar que el equipo de fútbol A ganará al equipo B siete de cada diez veces que se enfrenten por el análisis de resultados recientes, porque el deporte no es completamente aleatorio», afirma Algarra.

Y añade: «También se creía que el big data permitiría prever el comportamiento electoral, pero la realidad es que es extremadamente difícil de modelar, y las redes sociales no son una representación fidedigna de la sociedad, solo de su parte más bulliciosa».

  1. Mito 3

    Sin científicos de datos no podemos analizar big data

No todos los proyectos requieren los mismos perfiles. Existe un espectro de profesionales que se dedican a capturar, procesar, almacenar, analizar y visualizar datos. Los científicos de datos son solo uno de ellos, cuya función es traducir los grandes volúmenes de datos y convertirlos en información útil para la empresa; pero hay otros, como los ingenieros, los analistas, los gestores, los administradores o los artistas de datos.

  1. Mito 4

    El big data puede solucionar 'todos' los problemas

No exactamente. Sin la experiencia previa, hacer predicciones resulta aventurado. Por ejemplo, la inteligencia de datos parecía que iba a impedir la propagación de la Covid-19 a principios de la pandemia, pero no fue así. «En las primeras semanas vimos muchos modelos predictivos que estimaban la evolución del número de contagiados o fallecidos y casi todos fallaron estrepitosamente. El motivo es que esta pandemia no tiene precedentes. En cambio, todos los años las autoridades sanitarias prevén con gran acierto cuántos contagios va a haber de gripe y en qué semana va a registrarse el pico. La clave está en que la gripe es recurrente y tenemos una serie histórica de datos representativa sobre la que basarnos», aclara Algarra.

  1. Mito 5

    Mis datos no importan a nadie

Al contrario, hay gente que está dispuesta a pagar mucho dinero por ellos. «Todo dato que generamos al usar internet queda en la red para siempre y no sabemos quién lo usará ni cómo se comercializará, ni ahora ni dentro de 20 años. Por eso, es muy importante que eduquemos a los más jóvenes en cuidar la información que difunden», destaca el profesor de la U-tad.

Y no solo lo que se comparte a conciencia, sino lo que se acepta inconscientemente, como las 'cookies' que utilizan las páginas web. Al no rechazarlas damos permiso para utilizar nuestros datos con distintas finalidades, desde enviarnos publicidad personalizada hasta controlar nuestros hábitos y rutinas.

La máquina tabuladora inventada por Herman Hollerith. IBM

¿Sabías qué...?

Hoy en día está en boca de todos, pero pocos conocen la historia del big data, y no es tan reciente como puede parecer. Desde el origen de la escritura en las antiguas civilizaciones de Mesopotamia y Egipto, la información ha ido quedando registrada en jeroglíficos, tablillas, papiros, papeles y, más recientemente, en discos duros y en la nube.

Pero fue en el siglo XX, con la era de la información, cuando el big data despegó. El primer recuerdo de los datos modernos se remonta a 1887, cuando el estadounidense Herman Hollerith inventó una máquina de computación que podía leer los agujeros perforados en tarjetas de papel para organizar los datos de un censo.

Sin embargo, esta tecnología no fue bautizada hasta 2005, cuando Roger Mougalas de O'Reilly acuñó el término 'big data' por primera vez.

Reporta un error en esta noticia

* Campos obligatorios