Otimizar trabalhos interactivos em ambiente de computação em grelha LSF

Recentemente, um parceiro de vendas da Coreia do Sul abordou-nos com um desafio intrigante. Embora o Open iT ComputeAnalyzer ofereça plug-ins e conectores para medir ambientes de computação em grade distribuídos, percebemos que havia um potencial inexplorado. 

O ComputeAnalyzer concentra-se principalmente no sistema de computação em grade e menos no tempo de execução de trabalhos individuais. Embora isto funcione bem para trabalhos em lote que são colocados em fila de espera para processos automatizados, os trabalhos interactivos no servidor IBM LSF são diferentes. Exigem feedback em tempo real e são propensos a supervisão e práticas ineficientes quando há intervenção humana. É exatamente isto que o cliente pretendia monitorizar. 

Embora a Open iT seja especializada no acompanhamento e otimização de licenças, neste cenário, a ênfase é colocada nas ranhuras de trabalho. Estes slots estão para além das licenças, se as aplicações que participam nos trabalhos os utilizarem. 

O desafio 

Os nossos engenheiros identificaram que o cliente utilizava outro estilo de trabalho - execução de tarefas interactivas. O seu pedido era simples: monitorizar o nível de atividade destes trabalhos interactivos no ambiente de computação em grelha do LSF e libertar um espaço de trabalho. O servidor LSF então realoca os slots de trabalho ociosos para outras tarefas. 

Para responder às necessidades do cliente, os engenheiros da Open iT tiveram de enfrentar um desafio de duas frentes: 

  1. Ausência de um coletor de dados nos lançamentos de aplicações LSF 

Em um ambiente Unix, o coletor de dados é projetado para operar como um daemon quando um usuário acessa uma máquina. Esta conceção torna-se problemática em configurações onde os Agendadores de Trabalhos LSF são utilizados para lançar aplicações. 

A razão é que os utilizadores não se ligam diretamente às máquinas que alojam as aplicações. Em vez disso, acedem ao servidor de computação em grelha LSF, escolhendo a aplicação pretendida. O servidor assume então o controlo, atribuindo recursos a partir de um conjunto de slots de trabalho disponíveis. As janelas da aplicação são então reencaminhadas para o ID de ecrã do utilizador que foi utilizado durante a seleção da aplicação. 

  1. Bloqueio de reatribuição do Daemon em configurações preliminares 

O LSF vem com uma função de início de trabalho na camada de comando. Se a utilizarmos para executar o coletor de dados, surge um problema. O binário permanece ativo mesmo depois de a aplicação ser fechada pelo utilizador. Esse comportamento faz com que os slots de trabalho pareçam ainda estar em uso, obstruindo a capacidade do LSF de realocar os recursos de hardware necessários. 

Soluções sugeridas para uma funcionalidade melhorada 

Ao aprofundar os desafios apresentados, a nossa equipa de engenharia propôs as seguintes soluções refinadas: 

  1. Integrar o Coletor de dados com LSF_JOB_STARTER 

Como discutido anteriormente, a variável LSF_JOB_STARTER oferece um caminho promissor para os clientes. Embora essa abordagem exija a experiência da Open iT para ajustar a configuração do LSF do cliente, ela promete uma operação mais eficiente. Ao adotar isso, o coletor de dados será iniciado sem problemas antes de cada trabalho, alinhando-se com o nível de usuário e a variável de exibição corretos. 

  1. Incorporação de um mecanismo de auto-encerramento 

Este recurso de auto-terminação envolve adicionar inteligência ao daemon, permitindo que ele saia graciosamente quando necessário. Assim, isto aborda diretamente o segundo desafio. 

Os engenheiros forneceram ao cliente três formas diferentes de configurar a capacidade de auto-terminação: 

  • Vincular: Esta funcionalidade monitoriza ativamente as aplicações que um utilizador normalmente inicia. Se detetar que nenhuma destas aplicações está atualmente em funcionamento, o coletor de dados desliga-se imediatamente, libertando assim a ranhura de trabalho ocupada para outras tarefas. 
  • Tail: Este recurso verifica ativamente as atividades relacionadas ao usuário. Utilizando uma lista configurável, pode ser definida para ignorar intencionalmente determinados processos, sendo que as predefinições excluem normalmente o Open iT e várias outras tarefas relacionadas com o sistema. 
  • Ecrã: Desencadeia a auto-encerramento se o coletor de dados não conseguir estabelecer ligação ao ecrã do utilizador designado. 

Sucesso com o mecanismo de ligação 

Após o feedback do nosso parceiro de vendas, observando a prevalência da utilização deste tipo de trabalho na Coreia do Sul, a Open iT deu prioridade ao desenvolvimento para suportar este ambiente de computação em grelha. Após avaliações rigorosas de vários cenários e soluções potenciais, tornou-se claro que a tarefa de ligação era a solução ideal.  

Esta abordagem permitiu ao cliente recolher dados de forma eficiente no âmbito da sua estrutura de computação em grelha LSF. O nosso parceiro de vendas confirmou prontamente que a Open iT está agora totalmente equipada para otimizar os trabalhos interactivos LSF. 

Soluções personalizadas para uma gestão optimizada de activos de software 

Na Open iT, o nosso compromisso vai além da simples otimização de activos de software. Orgulhamo-nos de criar capacidades e soluções personalizadas que se alinham com as necessidades distintas dos nossos clientes. 

Os nossos engenheiros experientes trabalham em conjunto com os departamentos de TI dos nossos clientes, assegurando que co-criamos e implementamos estratégias que lhes permitem atingir os seus objectivos comerciais e ampliar o retorno das suas licenças de software. 

Entre em contacto agora com um representante da Open iT e descubra como podemos trazer benefícios semelhantes para a sua organização. 

Vamos conversar

Mostrar-lhe-emos como a sua empresa pode beneficiar das soluções Open iT.
Nota:
Ao submeter este formulário, está a concordar em receber comunicações adicionais da Open iT. As suas informações serão processadas de acordo com a nossa Política de Privacidade.