lunes, 5 de mayo de 2008

Acerca del Grid Computing del Acelerador de Partículas del CERN

Reportaje exclusivo a María Alandes Padrillo Científica Española del CERN

CERN

¿Por qué razón surge la necesidad del Grid Computing y en que consiste?

1) La necesidad del grid computing surge porque la investigación científica en algunos campos necesita recursos computacionales tan potentes que los supercomputadores actuales no son suficientes. También hay que entender el grid computing como una evolución natural de los sistemas distribuídos. Al tener los ordenadores conectados a internet, se hace posible la opción de compartir sus recursos físicos: disco duro y procesador. De esta forma se da también respuesta a la demanda de altas cantidades de almacenamiento y procesador en campos científicos como la física de partículas, en concreto el LHC. Si podemos compartir muchos ordenadores en todo el mundo, y además resulta que la investigación en genética, metereología o física necesita cada vez más analizar y almacenar un montón de datos, entonces hemos encontrado la solución adecuada a nuestros problemas.

¿Cómo va a impactar el Grid en el futuro de Internet?

2) Es difícil prever el impacto que el grid tendrá en el futuro de internet, lo mismo que en su día ocurrió con la invención de la www. Pero está claro que el hecho de poder compartir recursos va a abrir un montón de puertas a nuevas aplicaciones y usos de internet. Lo ideal es que el grid sea en su idea un gigantesco recurso computacional al que nos podamos "enchufar" lo mismo que hoy nos enchufamos a la red eléctrica, con lo que no importará si por ejemplo no tenemos en casa suficiente procesador para jugar a un determinado juego de ordenador o si no tenemos suficiente espacio para almacenar nuestras fotos, quizás esto nos lo pueda solucionar el grid. Pero aún hay mucho trabajo por delante antes de que este tipo de cosas se materializen, ya que el grid es una tecnología relativamente joven y aún debe madurar y pasar por un proceso de normalización para poder ser una solución global.

¿Qué cantidad de información por hora va a producir el Acelerador de Partículas?

3) Se estima que el acelerador generará unos 15PB de datos por año (PB es petabyte -> byte -> megabyte -> gigabyte -> terabyte -> petabyte) Si un DVD son 4.7 GB, eso serían más de 3 millones de DVD al año! Si apilásemos esos DVD uno encima de otro, llegaríamos a tener una torre de 20km de CDs!! Más de 4 veces la altura del Montblanc!

Los científicos, ¿cómo van a buscar información precisa dentro de todo el total de información generada?

4) Esta pregunta no sé la respuesta. Supongo que serán las aplicaciones concretas que los físicos desarrollan para buscar la información que necesitan. No está relacionado con el grid porque el grid es la infraestructura que está debajo de esas aplicaciones de los físicos. Hay que tener en cuenta que luego los físicos desarrollan sus propios programas para llevar a cabo su investigación y en parte supongo que también programan herramientas de búsqueda y otras utilidades que les haga el trabajo más sencillo. Pero voy a intentar averiguar con los compañeros.

No hay comentarios: