Kürzlich trat ein Vertriebspartner aus Südkorea mit einer faszinierenden Herausforderung an uns heran. Obwohl der Open iT ComputeAnalyzer Plug-ins und Konnektoren für die Messung verteilter Grid-Computing-Umgebungen bietet, erkannten wir, dass es ein ungenutztes Potenzial gab.
ComputeAnalyzer konzentriert sich in erster Linie auf das Grid-Computing-System und weniger auf die Laufzeit der einzelnen Jobs. Während dies bei Batch-Jobs, die für automatisierte Prozesse in eine Warteschlange gestellt werden, gut funktioniert, ist dies bei interaktiven Jobs auf dem IBM LSF-Server anders. Sie erfordern Echtzeit-Feedback und sind anfällig für Versäumnisse und ineffiziente Praktiken, wenn der Mensch eingreift. Genau das wollte der Client überwachen.
Während Open iT auf die Verfolgung und Optimierung von Lizenzen spezialisiert ist, liegt der Schwerpunkt in diesem Szenario auf Job-Slots. Diese Slots gehen über die Lizenzen hinaus, wenn die an den Jobs beteiligten Anwendungen sie nutzen.
Die Herausforderung
Unsere Ingenieure stellten fest, dass der Kunde eine andere Art von Jobs verwendete, nämlich die interaktive Ausführung von Aufgaben. Ihre Anforderung war einfach: Überwachung des Aktivitätsniveaus dieser interaktiven Jobs in der LSF-Grid-Computing-Umgebung und Freigabe eines Job-Slots. Der LSF-Server weist dann die ungenutzten Job-Slots anderen Aufgaben zu.
Die Erfüllung der Kundenanforderungen bedeutete für die Ingenieure der Open iT eine doppelte Herausforderung:
- Fehlen eines Datensammlers bei LSF-Anwendungsstarts
In einer Unix-Umgebung ist der Datensammler so konzipiert, dass er als Daemon arbeitet, wenn ein Benutzer auf einen Rechner zugreift. Dieses Design wird in Konfigurationen problematisch, in denen LSF Job Scheduler zum Starten von Anwendungen verwendet werden.
Der Grund dafür ist, dass sich die Benutzer nicht direkt bei den Rechnern anmelden, auf denen die Anwendungen laufen. Stattdessen greifen sie auf den LSF-Grid-Computing-Server zu und wählen ihre gewünschte Anwendung aus. Der Server übernimmt dann die Zuteilung von Ressourcen aus einem Pool verfügbarer Job-Slots. Die Anwendungsfenster werden dann auf die Anzeige-ID des Benutzers umgeleitet, die bei der Auswahl der Anwendung verwendet wurde.
- Blockierung der Neuzuteilung durch den Daemon in vorläufigen Aufstellungen
LSF verfügt über eine Job-Starter-Funktion auf der Befehlsebene. Wenn wir diese zur Ausführung des Datensammlers verwenden, tritt ein Problem auf. Die Binärdatei bleibt auch dann noch aktiv, wenn die Anwendung vom Benutzer geschlossen wird. Dieses Verhalten führt dazu, dass die Job-Slots so aussehen, als wären sie noch in Gebrauch, was LSF daran hindert, die notwendigen Hardware-Ressourcen neu zuzuweisen.
Vorgeschlagene Lösungen für erweiterte Funktionalität
Nachdem wir uns mit den Herausforderungen befasst hatten, schlug unser Ingenieurteam die folgenden raffinierten Lösungen vor:
- Integration des Datensammlers mit LSF_JOB_STARTER
Wie bereits erwähnt, bietet die LSF_JOB_STARTER-Variable einen vielversprechenden Weg für Kunden. Obwohl dieser Ansatz das Fachwissen der Open iT erfordert, um die LSF-Einrichtung des Kunden zu optimieren, verspricht er einen effizienteren Betrieb. So wird der Datensammler nahtlos vor jedem Job gestartet und mit der richtigen Benutzerebene und Anzeigevariable abgeglichen.
- Einbeziehung eines Mechanismus zur Selbstbeendigung
Bei dieser Selbstbeendigungsfunktion wird dem Daemon Intelligenz hinzugefügt, die ihn in die Lage versetzt, sich bei Bedarf ordnungsgemäß zu beenden. Damit wird die zweite Herausforderung direkt angegangen.
Die Ingenieure boten dem Kunden drei verschiedene Möglichkeiten, die Selbstterminierungsfunktion zu konfigurieren:
- Binden: Diese Funktion überwacht aktiv die Anwendungen, die ein Benutzer normalerweise startet. Wenn sie feststellt, dass keine dieser Anwendungen gerade in Betrieb ist, wird der Datensammler sofort heruntergefahren und gibt den belegten Job-Slot für andere Aufgaben frei.
- Tail: Diese Funktion scannt aktiv nach benutzerbezogenen Aktivitäten. Mithilfe einer konfigurierbaren Liste kann sie so eingestellt werden, dass bestimmte Prozesse absichtlich umgangen werden, wobei die Standardeinstellungen in der Regel Open iT und verschiedene andere systembezogene Aufgaben ausschließen.
- Anzeige: Löst die Selbstbeendigung aus, wenn der Datensammler keine Verbindung mit dem vorgesehenen Benutzerdisplay herstellen kann.
Erfolg mit dem Bindemechanismus
Aufgrund der Rückmeldung unseres Vertriebspartners, dass derartige Aufgaben in Südkorea weit verbreitet sind, hat Open iT der Entwicklung zur Unterstützung dieser Grid-Computing-Umgebung Priorität eingeräumt. Nach eingehender Prüfung verschiedener Szenarien und potenzieller Lösungen wurde klar, dass die Bindungsaufgabe die ideale Lösung ist.
Dieser Ansatz ermöglichte dem Kunden eine effiziente Datenerfassung im Rahmen seines LSF-Grid-Computings. Unser Vertriebspartner bestätigte prompt, dass die Open iT nun voll ausgestattet ist, um interaktive LSF-Jobs zu optimieren.
Maßgeschneiderte Lösungen für optimales Software Asset Management
Bei Open iT geht unser Engagement über die reine Optimierung von Software-Assets hinaus. Wir sind stolz darauf, maßgeschneiderte Fähigkeiten und Lösungen zu entwickeln, die auf die individuellen Bedürfnisse unserer Kunden abgestimmt sind.
Unsere erfahrenen Ingenieure arbeiten mit den IT-Abteilungen unserer Kunden zusammen und stellen sicher, dass wir gemeinsam Strategien entwickeln und implementieren, die sie in die Lage versetzen, ihre Geschäftsziele zu erreichen und die Rendite ihrer Softwarelizenzen zu steigern.
Wenden Sie sich jetzt an einen Mitarbeiter der Open iT und erfahren Sie, wie wir Ihrem Unternehmen ähnliche Vorteile bieten können.