¿Qué patrones se pueden descubrir a partir de los macrodatos de Google? ¿A qué conclusión se llega?
Mark Twain dijo una vez: Hay tres tipos de mentiras en el mundo: mentiras, mentiras malas y estadísticas. ?Las conclusiones extraídas por los métodos de investigación tradicionales son sólo las conclusiones que los investigadores esperan obtener, no las conclusiones reales. Cuando toma el bolígrafo y comienza a marcar el cuestionario, ya ha ingresado al marco elaborado para usted por el diseñador de la encuesta. Siga las ideas establecidas en el informe de investigación, describa opciones limitadas y evite instintivamente las opciones que no sean buenas para usted.
Ya sean bien intencionados o maliciosos, cuando las personas se enfrentan a los demás, siempre muestran su lado positivo y ocultan su lado oscuro. Sin embargo, cuando las personas se enfrentan a una pantalla, a menudo bajan la guardia, dicen lo que piensan e incluso exageran sus demonios internos. Por eso hay tantos guerreros del teclado.
El analista de datos de Google, Seth Stephens-Davidowitz, saca muchas conclusiones inesperadas a partir del big data detrás de la pantalla.
1. Veamos primero un ejemplo. ¿Adivina qué datos de la red están altamente correlacionados con la tasa de desempleo? ¿Está buscando trabajo, redactando un currículum, entrevistas, educación y formación continua? Ninguna de las respuestas anteriores es correcta. El dato más relevante no fue una búsqueda de empleo, sino un sitio porno, seguido del Solitario Spider. ¿Sonreiste con complicidad después de saber la respuesta? Los datos dicen la verdad: hay mucha gente desempleada que se aburre y dedica su tiempo a hacer lo que los datos dicen.
2. Netflix pide a los usuarios que enumeren las películas que más quieren ver. En los primeros lugares de la lista se encuentran las películas culturales altamente valoradas, las películas clásicas en blanco y negro y los documentales de la Segunda Guerra Mundial. Netflix proporcionó a los usuarios fuentes de películas basadas en las listas que enumeraron, pero descubrió que había muy pocos clics. Las películas más vistas por los usuarios son las comedias sencillas y las películas románticas. Entonces Netflix dejó de investigar las preferencias de los usuarios y proporcionó fuentes de películas basadas directamente en los clics. En palabras de Netflix, “No creas en las palabras de los usuarios, mira sus acciones”.
3. Además del comportamiento humano, ¿qué otros patrones útiles han sido descubiertos por el big data?
Dame un ejemplo contrario a la intuición. La mayoría de la gente supone que muchas estrellas de la NBA nacieron en la pobreza. Pero los grandes datos dicen que un niño negro nacido en una zona rica tiene el doble de probabilidades de ingresar a la NBA que un niño negro nacido en una zona pobre. Es un 60% más alto para los niños blancos. Hay dos razones por las que los niños de clase media tienen más probabilidades de ingresar a la NBA. Tienen buenas condiciones de vida cuando eran niños, son altos y tienen una buena condición física. La altura promedio es de 2 metros y el hombre estadounidense promedio mide 1,75 metros. El segundo es la inteligencia emocional estable, la confianza, la autodisciplina, la perseverancia, la concentración y la organización cultivadas desde la infancia. Después de que Michael Jordan fuera expulsado de la escuela por pelear a la edad de 12 años, su madre lo llevaba a trabajar todos los días y lo restringía a leer en el auto en el estacionamiento. Después de que Jordan jugara para los Chicago Bulls, sus padres y primos lo visitaban con frecuencia para evitar las tentaciones de la fama y el dinero. Doug Wrenn, un jugador talentoso con talentos similares a Jordan, nació en una familia monoparental en una comunidad pobre de Seattle. En el equipo de la Universidad de Connecticut, provocó a sus compañeros y se burló del entrenador por robar zapatos de la tienda y fue expulsado. . La Universidad de Washington le dio una segunda oportunidad, pero aún así no pudo encajar en el equipo y fue expulsado de la NBA. A diferencia de los niños de abajo que intuitivamente nos dicen que tienen una fuerza sin precedentes cuando luchan entre el cielo y el infierno, estos talentosos y apasionados jugadores semilla de la NBA carecen del carácter para convertirse en superestrellas. ?
Frente al teclado, las personas están dispuestas a confesar sus comportamientos y pensamientos extraños y buscar ayuda de personas experimentadas. La red anónima no necesita soportar las consecuencias de que el mismo incidente sea expuesto en la vida real. El poder de los datos de Google reside en que los usuarios le cuentan a Google secretos que no quieren contarle a nadie más.
Seth Stephens-Davidowitz escribió un libro que resume las conclusiones del big data de Google llamado "Everyone Lies". Hay muchos ejemplos interesantes en el libro. El autor saca varias conclusiones a través del análisis de datos: cuántas personas son homosexuales en los Estados Unidos, si la publicidad influye, si los medios están sesgados, dónde evaden impuestos las personas y si son verificados por famosos. escuelas, cuánta influencia tiene la gente, si se puede ganar al mercado de valores y qué lugar es mejor para criar a los niños.
Para sorprender a los lectores, algunos ejemplos del libro son demasiado extremos. Sin embargo, los artículos sin una posición son aburridos. Vale la pena leer este libro. Puede ver muchas respuestas de big data que son diferentes de lo que esperaba.