quinta-feira, 20 de novembro de 2014

CERN chefe de TI: O que fazemos não é realmente especial


Escolhendo uma nuvem de hospedagem parceiro com confiança


Quando o chefe dos serviços de infra-estrutura no CERN diz que ele chegou à conclusão de que não há nada de intrinsecamente "especial" sobre os sistemas do multi-bilhões de átomo-smasher, naturalmente você deseja verificar se você já ouviu falar corretamente.


Afinal, quando nos sentamos com Tim Bell na Cúpula OpenStack em Paris recentemente, era bastante barulhento como cerca de 5.000 engenheiros técnicos visivelmente animado trocaram histórias de guerra sobre a plataforma de computação em nuvem aberta enquanto os vendedores atiraram hospitalidade e ofertas de emprego para eles.







Poucos deles, no entanto, seria executar o tipo de sistemas para os quais Bell e sua equipe são responsáveis: um arquivo 100PB crescendo a 27PB de um ano, com 11 mil servidores de apoio 75.000 unidades de disco e 45 mil fitas. E que os dados estão sendo jogado fora pela máquina que recentemente encontrou o bóson de Higgs, a partícula de Deus tão-chamada. A maioria dos gestores de tecnologia diria que é até a extremidade superior de desafios de infra-estrutura de dados.


Inside the CMS experiment

Mas, como de Bell continuou, alguns de seus problemas certamente soava familiar. O Large Hadron Collider em si está no meio de uma atualização que irá duplicar a quantidade de energia produzida, e os sistemas de apoio no CERN tem que manter-se.


Quando seu sistema de TI tem de manter-se com o Grande Colisor de Hádrons


O LHC é devido ao fogo de novo em abril, e Bell e sua equipe têm sido reequipar a infra-estrutura de TI desde 2013. Desde o início deste mês, o CERN está funcionando atualmente quatro nuvens baseadas em OpenStack, o maior consistindo de 70.000 núcleos de execução através de 3.000 servidores, enquanto três outras instâncias relógio até mais 45 mil núcleos. O número total de núcleos deve bater 150 mil no primeiro trimestre do próximo ano. Apenas a tempo para o reinício do LHC.


Mas há dois anos, quando Bell e sua equipe começou o planejamento para a atualização, que era hora de fazer algumas reflexões duro - uma prática não é incomum no CERN você pode assumir. Mesmo o mundo da física de ponta tem de operar dentro das leis humanas, tais como a economia - em algum grau de qualquer maneira. E, de acordo com Bell, isso significa que não há mais funcionários, um orçamento de materiais decrescente, e as ferramentas antigas que são de "alta manutenção e frágil". E no caso de você estar se perguntando, os "usuários" esperar auto-serviço rápido.


"A grande coisa neste caso foi aplicar isso para o departamento de TI ... estávamos basicamente desafiar alguns pressupostos fundamentais que o CERN tem para criar as suas próprias soluções. Que eles são especiais. "


Ele continuou: "Quando você vai mais longe que você precisa para começar a desafiar essas suposições que levaram software a ser desenvolvido localmente no CERN, em vez de tomar open source e contribuir para isso."


Então, que olhar duas vezes novamente: CERN TI não é especial? Realmente?


Pensar de forma diferente


"Há claramente algumas peças especiais", diz Bell. "Mas há também muitas vezes as coisas que são de interesse para outras pessoas. A principal coisa a evitar é que vamos acabar fazendo algo que é semelhante ao que está sendo feito lá fora ".


E o que cristalizou essa percepção? "Nós tivemos um momento em que nós trabalhamos para fora o quanto recursos de computação que íamos ter que dar para os físicos no próximo ano."


"Foi um ponto em que estávamos diante de um problema que foi difícil, tivemos que dar um passo atrás. Não ia ser resolvido fazendo um pouco extra - tivemos que repensar fundamentalmente as coisas desde o início ... e acho que isso ajudou a estabelecer algumas idéias no lugar "Soa familiar.?


Não é como se a equipe de Bell foram completamente carente de recursos. A TI no local, no CERN foi complementado por um novo centro de dados na Hungria. Mesmo assim, a Bell continua: "O que precisávamos era de apreciar a medida em que a organização precisava mudar, assim como ele ser apenas uma questão de instalar mais alguns servidores."


Daí a decisão de levantar-se perto e pessoal com OpenStack em geral e , em particular, Rackspace . Pode ser interessante notar que, de volta quando escreveu isso, a equipe do extintor de incêndio de Bell foi beber foi bombear para fora um mero 25PB um ano.


"Depois de alguns meses de prototipagem depois tivemos a base para pôr em prática algo onde pudéssemos traçar o roteiro para se aposentar o legado eo ambiente legado. O desmantelamento das que começou no dia 1º de novembro ", diz Bell. "Então, em 18 meses, basicamente, produziu uma cadeia de ferramentas [que é] a substituição do ambiente legado que ia correr para os últimos 10 anos."


OK, de modo que ainda soa um pouco especial. Mas, como toda organização, Bell experimentou alguns solavancos como mãos experientes fui peru frio sobre a abordagem "não foi inventado aqui".


"Isso envolveu um monte de trabalho com as pessoas a quem os serviços e ajudá-los com alguma formação - formal ou informal -, a fim de usar as novas ferramentas. Mas até agora nós tivemos um monte de comentários positivos das novas ferramentas, de modo que está tudo ajudou a levar as pessoas a bordo. "


E o treinamento formal muitas vezes vêm de jovens reta fora da faculdade, que estão familiarizados com as novas ferramentas e novas maneiras de fazer as coisas. Enquanto esta é talvez uma inversão da forma tradicional de TI é executado, também é cada vez mais comum. Ou, pelo menos, comumente falado . E também é mais rápido, pelo menos em teoria, do que ter uma maré constante de recrutas que têm de se familiarizar com ferramentas de que só vai encontrar em uma organização.


"Muitas vezes as pessoas estão se juntando CERN com o conhecimento das ferramentas da universidade", diz Bell. "Então, isso significa que o tempo de treinamento é consideravelmente menos - você pode comprar um livro que vai falar sobre Puppet enquanto que no passado você teria que sentar com o guru de entender como o velho sistema funcionou".


Ninguém está sugerindo que as mãos mais velhos descontentes estão recebendo a corcunda e sair. Mas diz Bell CERN tem sido sempre estruturado "para assumir um volume de negócios regular" da equipe de estagiários de verão, a programas companheiros.


"Como parte da missão do CERN, que não é só a física. Há um objetivo claro para o CERN para atuar também como um objetivo para que as pessoas chegam passar um curto período de tempo no CERN - até cinco anos em contratos de curto prazo - e depois voltar para seus países de origem com essas habilidades adicionais. Isso poderia ser engenharia, [igualmente] poderia ser física e computação. "


"Agora, neste caso, o que é grande é que tomamos um especialista em Linux fora da universidade e nós produzimos alguém que é treinado em OpenStack e Puppet e eles se encontram em uma grande demanda no momento em que eles têm um contrato com acabamento CERN."







via Alimentação (Feed)

Nenhum comentário:

Postar um comentário