miércoles, 10 de septiembre de 2008

Distribución de apellidos (internacional)

Hace unos días os hablaba de "Saberlo todo sobre los apellidos" de enfemenino.com
Bueno, pues hoy he conocido otra página, Public Profiler Worldnames, con un enfoque más internacional, puesto que abarca 26 países (sí, España es uno de ellos), con un total de más de 300 millones de individuos que extrapolan a 1 billón (supongo que americano, es decir que 1000 milloncetes de los de aquí). Los datos se basan en datos de guías telefónicas y censos electorales del periodo 2000-2005.

Yo he hecho una prueba con mi apellido, y considerando una población en España de 46 millones de personas (los datos en enfemenino son valores absolutos, y los de publicprofiler son en FPM=frecuencia por millón), resulta que no son muy congruentes entre sí: PublicProfiler prácticamente estima el doble de individuos que enfemenino...

Otros datos interesantes que aporta esta web son:
  • Nombres más frecuentes para el apellido buscado.
  • Países, Regiones o Ciudades en los que mayor FPM existe para el apellido buscado.
  • Están desarrollando una búsqueda por áreas, que mostrará cuáles son los apellidos más frecuentes en el área seleccionada.
  • Están desarrollando una búsqueda etnográfica, que no tengo muy claro qué hará.
Algunos hallazgos curiosos sobre mi propio apellido, que sinceramente no me esperaba;
  • es casi tan frecuente en Nuevo México (USA) como en España
  • las ciudades con mayor FPM son Aiken, Carolina del Sur (USA), seguida de varias localidades españolas en Castilla la Mancha y Andalucía.
Y ya puestos, a partir de esta web he encontrado otra, OnoMap, en la que precisamente se basa PublicProfiler para aportar los orígenes de los apellidos. Se trata de un proyecto académico que trata de analizar la etnografía basándose en los nombres y apellidos, utilizando un algoritmo que describen someramente en la propia página, pero para el que también hay disponible un whitepaper.
Yo he probado con mi nombre y el de mis familiares, y nos ha clasificado casi correctamente. Los errores fueron definir mi nombre propio como Portugués, no reconocer nombres propios en Euskera, aunque permite que se le corrija, con lo que supongo que realimentarán el algoritmo (previo filtrado antivandalismo) para mejorar la respuesta en el futuro.

Vía microsiervos.

1 comentario:

  1. Me encantan estas cosas de los apellidos... pero no se.... salen cosas un poco raro... mi apellido es uno de los mas comunes en España... y sin embargo, como 'top cities' con mi apellido me sale una en Francia y otra en Italia... mmm... me parece un poco raro....

    De todas formas, es buena idea de página... a ver si la van mejorando...

    ResponderEliminar