La matemática no sirve para nada

Cada vez que mis alumnos y alumnas me dicen que la matemática no sirve para nada les cuento la historia del éxito profesional y empresarial de dos estudiantes de la Universidad de Stanford: Larry Page y Sergey Brin. Como toda historia de éxito estadounidense comenzó en un garaje ( nunca he entendido por qué los estadounidenses deciden emprender desde garajes; aunque no tengas dinero para independizarte siempre puedes montar el ordenador en una habitación de casa de tus padres con más luz ).





Larry y Sergey crearon en 1996 un buscador de páginas de internet al que llamaron BackRub. Un año más tarde lo rebautizaron y le pusieron Google. Ahora ya sabéis de que proyecto empresarial os voy a hablar. Era tanta la información que aspiraban a manejar con su buscador que Google proviene de “gúgol”, el término matemático que se refiere al número 10 elevado a la 100.


No fue hasta 1999 cuando estrenaron su buscador en Internet. Contaban con 80 procesadores y 2 routers HP en un ordenador de casa. En breve su buscador desbancó al resto de buscadores. Y a partir de ahí todo fue ir creciendo. En seguida llegó Google Noticias, Blogger, Google Libros, Google Maps, Google Académico, Android, Drive, Youtube…Para 2007 se convirtió en la empresa con mayor capitalización bursátil del planeta. ¿ Pero por qué tuvo tanto éxito ?



La seña de identidad de Google es su motor de búsqueda. Este se basa en un algoritmo denominado PageRank en honor a uno de los fundadores de la empresa. El buscador de páginas tiene como función ordenar un conjunto de páginas de internet en función de su importancia. ¿ Como lo hará ?


Antes de nada veamos como funcionan las páginas en internet. En la red hay millones de páginas. Y lo más importante es que están interconectadas ( por eso le llamamos “ la red “ ). Esto es, unas páginas nos dirigen a otras, estas últimas nos pueden dirigir a otras, etc….Imaginemos que sólo existieran 4 páginas y que están conectadas de la siguiente forma:

-   La 1ª tiene un enlace a la 2ª.

  • La 2ª tiene un enlace a la 3ª.
  • La 3ª tiene un enlace a la 1ª y a la 4ª.
  • La 4ª no lleva a ninguna de las otras páginas.


¿ Os parece bien que lo representemos así ?



Esta imagen es lo que en matemática denominamos un grafo de esta red.


Ya estamos en disposición de presentar la filosofía del algoritmo PageRank para ordenar páginas por nivel de importancia: una página será tanto o más prioritaria cuantas más páginas enlacen con ella. Por hacer un símil: imaginad que somos un grupo de amigos y queremos saber cual es el más “ popular “. El “criterio de PageRank “ sería que el amigo más popular es aquel que reciba más llamadas. Pero claro, no es lo mismo que la llamada que reciba uno sea la del “amigo guay” o la de otro. Digamos que la llamada de gente popular pesa más. Con PageRank pasa lo mismo; tiene en cuenta tanto el número de enlaces a cada pagina como “el nivel de relevancia” de las páginas desde las que se enlaza a cada página.


¿ Y como hace todo esto el buscador de Google ? En primer lugar, ¿ como sabe el buscador el número de enlaces de cada página ? Y en segundo lugar, ¿ como hace para ordenar toda esa información en función de mayores enlaces ?


Digamos que Google se pone a pasear por las páginas aleatoriamente y va apuntando los enlaces de cada página según va siguiendo itinerarios. Por ejemplo:


Empieza por la página 1; se dirige a la página 2 ( no hay más opciones; a no ser que la opción sea no ir a la página enlazada ); de la 2 va a la 3; y de la 3 toma la opción de ir a la 4 ( también podía volver a la 1 ). Y toda esta información de caminos probables la apunta en una tabla de este estilo:

 



Llegados a este punto ( a una matriz ) empezamos a intuir que el áljebra va a tener algo que ver con la forma de saber cual es la página campeona de enlaces. Así es, pero esa explicación supera el alcance de este artículo. Simplemente quedémonos con la filosofía del algoritmo, con la idea de que la información la podemos codificar en matrices y con la idea de que el áljebra luego es capaz de ordenar las páginas de mayor a menor importancia.


Evidentemente os he explicado el fundamento más básico. Pero Google , además de aplicar todo esto a un universo de millones de páginas en vez de a una muestra de 4 páginas, complica y afina todo esto mucho más. Tiene en cuenta que los internautas podemos clicar todos los enlaces de una página, o no. Otorga probabilidades diferentes a diferentes enlaces en función de criterios propios. Modifica los algoritmos según la historia de navegación personal de cada usuario. E incluso si pagas es capaz de manipular el algoritmo para que posicione a tu página la primera en las búsquedas!

Comentarios

Entradas populares de este blog

0ºC , ni frío ni calor

La vieja conspiranoia de los antivacunas

El proyecto Half-Earth: dejar respirar libre de nuevo a medio planeta