Prof. Hans P. Reiser
Johannes Köstler
Vernetzte IT-Systemehaben heute sehr häufig hohe Anforderungen an Zuverlässigkeit, Verfügbarkeit und Sicherheit. Replikation von Diensten ist ein grundlegender Mechanismus, diese Anforderungen zu erfüllen. Um gleichzeitig Skalierbarkeit zu erzielen, gibt es vor allem im Bereich von Speicherdiensten viele Ansätze, die mit abgeschwächten Konsistenzanforderungen für die replizierten Daten wie etwa benötigen jedoch stärkere Konsistenzgarantien. Dies trifft beispielsweise auf Koordinierungsdienste wie ZooKeeper, den Namenode von HDFS oder Diensten zum Identity Management zu. Wenn Byzantinische Fehlermodelle zugrunde gelegt werden, sind schwache Konsistenzmodelle ebenfalls ungeeignet, da aus Konsistenzgründen divergente Werte nicht von fehlerhaften unterscheidbar sind. Dieses Vorhaben konzentriert sich daher auf Replikationsverfahren, die für Dienste mit starken Konsistenzanforderungen und für Byzantinische Fehlermodelle geeignet sind. State-Machine-Replication (SMR) ist ein etabliertes Verfahren zur Replikation. In diesem Ansatz werden eine verteilte Einigung oder ein total geordneten Multicast sowie eine deterministische Ausführung aller Aktivitäten eingesetzt. Diese Mechanismen sind sehr komplex und eröffnen einen großen Raum konfigurierbarer Parameter angefangen von der Auswahl unterschiedlicher Protokolle bis zur Festlegung von Timeout-Werten. Die deterministische Ausführung wird heute in der Regel durch sequentielle Abarbeitung der Anfragen erreicht, was mit der zunehmenden Verbreitung von Mehrkernsystemen inakzeptabel ist.
In der Praxis hängt das Verhalten eines Systems unter Anderem von den Kommunikationslatenzen, dem möglichen Netzdurchsatz, der Fehlerhäufigkeit, der Anzahl parallel arbeitender CPUs und von der internen Nebenläufigkeit der Anwendung ab. Das übergeordnete Ziel dieses Forschungsvorhabens ist es, dynamisch anpassbare Algorithmen für die Gruppenkommunikation und das deterministische Multithreading sowie Strategien zur Selbstkonfiguration und Selbstoptimierung für beide Teilaspekte zu erforschen. Als Ergebnisse erwarten wir elementares Wissen über die Zusammenhänge zwischen Umgebungsbedingungen, Anwendungsverhalten und Konfigurationsparametern bzw. den verschiedenen einsetzbaren Algorithmen.
Eine Prototypimplementierung für ein rekonfigurierbares und selbstadaptierendes Gruppenkommunikationssystem sowie für einen selbstoptimierenden deterministischen Scheduler soll entworfen und in ein Framework für replizierte Dienste integriert werden, mit dem schließlich praxisnahe Evaluationen möglich werden. Wir erwarten, dass sich selbstadaptierende Systeme entsprechend besser verhalten als starr konfigurierte oder nicht konfigurierbare Systeme. Das Vorhaben ist damit ein Grundlagenbeitrag um letztendlich SMR-basierte Systeme näher an die Praxis heranzuführen.
Deutsche Forschungsgemeinschaft
J. Köstler, S. Gebauer and H. P. Reiser, "Network Federation for Inter-Cloud Operations" in Proc. of the 21th IFIP International Conference on Distributed A pplications and Interoperable Systems (DAIS 2021) , 2021.
H. P. Reiser, G. Habiger and F. J. Hauck, "SmartStream: Towards Byzantine Resilient Data Streaming" in Proc. of the 36th ACM/SIGAPP Symposium on Applied Computing (SAC '21) , 2021.
J. Köstler, H. P. Reiser, G. Habiger and F. J. Hauck, "SmartStream: Towards Efficient Byzantine Resilient Data Streaming through Speculation and Sharding" , SIGAPP Appl. Comput. Rev. , vol. 21, no. 3, pp. 19-32, 2021. Association for Computing Machinery.
C. Berger, H. P. Reiser, J. Sousa and A. Bessani, "AWARE: Adaptive Wide-Area Replication for Fast and Resilient Byzantine Consensus" , IEEE Transactions on Dependable and Secure Computing , 2020.
G. Habiger, F. J. Hauck, H. P. Reiser and J. Köstler, "Self-optimising Application-agnostic Multithreading for Replicated State Machines" in Proc. of the 39st IEEE Symposium on Reliable Distributed Systems (SRDS 2020) , 2020.
C. Berger, H. P. Reiser, J. Sousa and A. Bessani, "Resilient Wide-Area Byzantine Consensus Using Adaptive Weighted Replication" in Proc. of the 38th IEEE Symposium on Reliable Distributed Systems (SRDS'19) , 2019.
G. Habiger, F. J. Hauck, J. Köstler and H. P. Reiser, "Resource-Efficient State-Machine Replication with Multithreading and Vertical Scaling" in Proc. of the 14th European Dependable Computing Conference (EDCC) , 2018.
N. Rakotondravony and H. P. Reiser, "Visualizing BFT SMR distributed systems -- example of BFT-SMaRt" in DSN Workshop on Byzantine Consensus and Resilient Blockchains , 2018.
C. Berger and H. P. Reiser, "WebBFT: Byzantine fault tolerance for resilient interactive web applications" in Proc. of the 18th IFIP International Conference on Distributed Applications and Interoperable Systems (DAIS 2018) , 2018.
J. Köstler, J. Seidemann and H. P. Reiser, "Emusphere: Evaluating Planetary-Scale Distributed Systems in Automated Emulation Environments" in The 35th International Symposium on Reliable Distributed Systems Workshops (SRDSW 2016) , 2016.
Johannes Köstler, Hans P. Reiser
OptSCORE: Self-Optimized Communication and Scheduling of Replicated Services
Work-in-progress presentation, Winter School on Operating Systems, Graz, Feb. 2016
Johannes Köstler, Hans P. Reiser
PEDSEWAN: Platform for the Evaluation of Distributed Systems in Emulated Wide-Area Networks
Presentation, Frühjahrstreffen der GI-Fachgruppe Betriebssysteme, Graz, Feb. 2016