Hocelot, ¿cómo combatir el dirty data?
Los datos se han convertido en una herramienta de enorme potencial para la optimización de resultados, pero, ¿cómo distinguimos la información veraz de la fraudulenta? Las plataformas de big data no tienen en cuenta el dirty data, es decir, bases de datos con información incorrecta, incompleta, inexacta, desactualizada o con datos duplicados. Hocelot, una startup 100% de capital español especializada en la verificación de información de personas físicas en tiempo real, ayuda a las empresas a verificar esa información a través del Data Standarization & Enhacement gracias al cual podemos corregir, normalizar, organizar y descartar aquellos datos falsos que los usuarios introducen en las bases de datos de las empresas.
“Las empresas se enfrentan a un serio problema cuando se lanzan al big data, ya que no toda la información que recopilan es veraz. Según nuestros propios estudios más de la mitad de los usuarios aportan al menos un dato falso entre la información que facilitan a las empresas. Además, se calcula que el 25% de la información que poseen las empresas podrían ser datos falsos”, asegura Antonio Camacho, fundador de Hocelot. “El dirty data es, por tanto, un nuevo reto que las empresas deben afrontar si quieren reducir los riesgos por pérdidas relacionadas con el fraude de identidad”.
El big data, que consiste en la gestión y análisis de millones de datos, tiene como pilares fundamentales los conceptos de volumen, velocidad y variedad. Estas plataformas focalizaron su atención en analizar y gestionar un mayor volumen y variedad de datos a una velocidad cada vez más alta. Sin embargo, el dirty data añade dos nuevas variables: veracidad y valor.
La veracidad de los datos se ha convertido en una cuestión de confianza para las propias empresas, que deben conocer los motivos que llevan a los usuarios a falsear sus datos. Conscientes de este hecho, Hocelot ha desarrollado su servicio de Data Standarization & Enhacement que permite analizar infinidad de datos, centrándose en tres grandes campos: aspectos personales (edad, nivel educativo, búsquedas de trabajo, etc.), económicos (sueldo, capacidad de ahorro, etc.) y lo relativo al hogar (renta de alquiler, precio estimado del inmueble, etc.).
“Gracias a nuestro servicio de Standarization & Enhacement, somos capaces de realizar un análisis más exhaustivo de cada usuario, ya que analizamos infinidad de datos personales y profesionales. Entre ellos, la fecha de nacimiento, un factor importante si tenemos en cuenta que un 23% de los usuarios asegura que lo falsea de forma ocasional”, explica Camacho.