¿Qué es el Small Data y en qué se diferencia del Big Data?

Picture of Marta Espuny

En este post abrimos un debate sobre el uso del Small Data bajo criterios metodológicos y, especialmente, éticos. Hacemos esta reflexión para promover un uso consciente de los datos, arrojando luz sobre las implicaciones sociales y personales del uso sistematizado del Big Data

Diferencias entre el Small Data y el Big Data

En un mundo ‘dataficado’, donde los datos personales se convierten en una moneda de cambio para el uso de herramientas de comunicación y socialización digitales, existe una tendencia creciente a agregar y utilizar grandes volúmenes de datos de forma automática y sistemática. 

  • Estos datos son procesados y modelados a través de softwares, plataformas y otras herramientas mediadas por máquinas. Y han contribuido a la popularización de una falaz creencia en torno a las bondades del Big Data: cuantos más datos, mejor será el análisis. 
  • En contraposición a esta idea existen numerosas figuras, tanto en academia como en entidades privadas, que defienden el uso del Small Data, primando así calidad sobre cantidad. Cuando hablamos de análisis de datos, tan importante resulta el volumen de los datos, como la inteligencia que incorporemos al análisis. 

¿Qué significa el Small Data?

El Small Data es una práctica teórica y metodológica de investigación cuya información presenta un formato y volumen que es accesible, accionable e informativamente gestionable por una persona. 

Como veremos a continuación, definir un análisis de datos como basado en Small Data no siempre va a depender de la cantidad de datos usados, sino de la forma en que estos datos son procesados.

Para situar nuestra reflexión crítica es necesario entender las implicaciones del uso comercial de datos personales. El concepto de dataficación engloba muchos de los fenómenos de moda en torno al uso de datos en nuestros días.

Sin embargo, está menos extendido que otros conceptos que, siendo solo parte de este, resultan más familiares; conceptos como Inteligencia Artificial, Machine Learning, o algoritmos de predicción. La economía de datos pivota sobre tres cuestiones clave para su funcionamiento, en las que vamos a basar nuestra crítica: 

Almacenamiento automatizado de datos

Las plataformas miden, manipulan y monetizan datos constantemente. Esto puede darse gracias a las propias lógicas de su diseño, que producen flujos de datos estandarizados para permitir su agregación y distribución. 

Tendencia a usar Big Data

Está demostrado que, gracias al grabado de las plataformas, están proliferando nuevas formas de explotación sistematizada de datos mediante mecanismos autónomos y automatizados. 

Esta producción de conocimiento, y su subsecuente toma de decisiones, mediada principalmente por algoritmos y datos modelados, es lo que ha convertido la información personal -de comportamiento, gustos, ideologías, consumo- en una moneda de cambio. 

Uso ilegítimo de datos personales y daños a la privacidad

No es necesario adentrarnos en las teorías sobre política económica del Big Data para deducir que las infraestructuras tecnológicas están dando lugar a nuevas concentraciones de poder, que tienen lugar en torno a las multinacionales que poseen estos datos. 

Movidos por fines meramente comerciales, estos nuevos organismos supranacionales están creando diferentes profesiones en torno al análisis masivo de datos, desde campos como la ingeniería, la informática o las matemáticas. 

¿Cómo se aplica el Small Data?

Sin invalidar el análisis basado en el Big Data, existe un debate desde la teoría crítica de la comunicación en torno al uso ético de los datos. Una ética claramente cuestionable desde esta perspectiva, debido entre otras cosas, a la falta de consentimiento en torno al uso comercial de la información personal. 

Es aquí donde surge el Small Data como una teoría y práctica que no depende tanto de la cantidad de datos analizados, sino de la sensibilidad con la que se exploten los mismos.

Conocimiento obtenido respetando la información personal

Bajo esta lógica, en comma defendemos el uso del Small Data como técnica para alcanzar conocimiento estratégico acerca de la opinión pública y la cobertura mediática respetando al máximo posible la información personal. 

En otras palabras, a través del Small Data buscamos llegar a unas conclusiones clave usando el mínimo de datos posible. Esto implica una limitación clara en torno a los datos explotados, pero creemos que es la única forma de hacer análisis ético. 

Ventajas del Small Data

small dataRespeto a la privacidad

La defensa del Small Data como técnica de investigación se basa en el respeto a la privacidad. Creemos que es fundamental teorizar acerca de metodologías de análisis social digital que no impacten negativamente en los sujetos estudiados y, más generalmente, en la sociedad. 

Fomento de la responsabilidad en la recogida de datos

Un uso crítico de los datos en investigación conlleva una revisión constante de los métodos de descarga y procesamiento de información. Igual que se puede usar Big Data de forma consciente y responsable, el uso del Small Data no implica que se trate de una investigación crítica. 

La responsabilidad de este trabajo corresponde, en primera instancia, a las empresas que comercializan con ellos y, en última instancia a las personas que nos dedicamos a analizarlos y explotarlos. 

Crecimiento sostenible de la ciencia de los datos

Por suerte, conforme la investigación social digital progresa, también lo hacen las teorías sobre el impacto social de este tipo de investigación. 

Poner atención a las vulneraciones de privacidad, así como a las consecuencias en los cambios de comportamiento potencialmente producidos gracias a modelos predictivos que accionan modelos de consumo definidos por las plataformas como las redes sociales, es fundamental para que la ciencia de datos crezca de modo sostenible y se use para el bien común. 

Hacer este esfuerzo analítico con el Small Data es la clave para un uso e investigación consciente de los datos.

Últimos posts

Categorías

Etiquetas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

comunicacion