Logo of the university Bild aus dem Unileben Bild aus dem Unileben Bild aus dem Unileben Bild aus dem Unileben Bild aus dem Unileben  
FIM Faculty Chairs Chair of Distributed Information Systems Teaching Semesters before 2007

Hauptseminar Data Grid

Hintergrund

Der Begriff Grid stellt eine Analogie zum Power Grid (Steckdose) her - Computing Power aus dem Internet soll so einfach wie unser Stromnetz genutzt werden und wurde von Prof. Ian Foster 1999 geprägt. Es geht hier um die gemeinsame Nutzung der vernetzten (und oft ungenutzten) Ressourcen mit Garantie der Verfügbarkeit, Sicherheit und Leistung. Von vielen als das Internet der Zukunft bezeichnet, wollen wir in diesem Seminar uns mit dem in den letzten Jahren proklamierten Data Grid wissenschaftlich auseinandersetzten.

Hintergrund des Seminars ist die Tatsache, dass immer mehr Grid-Anwendungen datenintensiv sind, d.h. sie erfordern den Zugriff auf umfangreiche strukturierte und teilstrukturierte Datenbestände, die meist verteilt und autonom verwaltet werden und heterogen aufgebaut sind. Prominente Beispiele finden sich z.B. in den Bereichen High Energy Physics und Earth Observation Science. Grid Architekturen, welche für die Verwaltung (Speicherung, Suche, Lokalisierung, Transport, etc.) dieser umfangreichen Datenbestände konzipiert sind und auf Datenbankmanagement-Technologien zurückgreifen, werden allgemein als Data Grids bezeichnet. Diese Tendenz spiegelt sich auch in der DBMS-Landschaft wieder, man vergleiche Oracle mit 10g (grid) zu 9i (internet).

 

Inhalte

In diesem Seminar werden wir zuerst die Gridtechnologie und deren Entwicklung betrachten und dann auf datenintensive Applikationen im Grid näher eingehen, welche das Data Grid bilden. Fokus liegt hier auf Informationsspezifischen Aspekten der (sem.) Datenintegration und Datenanfragen (Semantic Data Grid) und Servicebeschreibungen (Grid Web Serives), sowie in Anwendungen und ongoing Projekten.

Im Seminar gehen wir speziell auf die von der OGSA geprägten Architekturen und Services ein, die auf einem standardisierten Vokabular aufbauen:

Open Grid Services Architecture: Glossary of Terms

Global Grid Forum, 2004

Öffnet einen externen Link in einem neuen Fensterhttps://forge.gridforum.org/projects/ogsa-wg/document/draft-ggf-ogsa-glossary.doc

 

Ausarbeitung

Die Seminararbeit sollte einen Umfang von 10 Seiten im LNCS Format, Springer Verlag haben.
Benutzen Sie bitte dazu die Vorlagen, welche vom Springer Verlag unter www.springer.de und dann zur Rubik LNCS, zur Verfügung gestellt werden.
Die Vorlage enthät notwendige *.cls, *.sty fr latex Benutzer und Formatvorlagen für Wordbenutzer.

Inhalt:
Die Seminararbeit gibt die wesentlichsten Konzepte der Artikel wieder und arbeitet nützliche Hintergrundinformationen ein. Bitte arbeiten Sie auch Kritik und Anregungen zu Ihrem Vortrag in die Arbeit ein. Ich werde sehr stark auf die persönliche Ausarbeitung achten. Kopieren von Textteilen, sowei Übernahme von Teilen bereits existierender Seminararbeiten werden nicht toleriert.

Die Arbeit sollte einen Titel, Zusammenfassung, Schlagworte, Einleitung, Hauptteil (Beschreibung des wiss. Vorgehens und der Ergebnisse), eine kritische Bewertung ihrerseits, Zusammenfassung und Literaturangaben haben. Bitte betrachten Sie nicht nur den Artikel selber, erforschen Sie bitte auch sein Umfeld und beantworten Sie dazu die folgenden Fragen: gibt es weitere Artikel, die dieser Autor geschrieben hat? Was sind konkurrierende Ansätze? Was für Vorgänger, -Nachfolgearbeiten gibt es? Zur Literatursuche empfehle ich die folgende Seite zu konsultieren: www.im.uni-passau.de/anleitungen/research_de.html.

 

Vortrag

Ihr Vortrag sollte nicht läger als 45 Minuten sein. Überlänge von mehr als 10 Minuten werden nicht toleriert. Bitte bereiten Sie ihr Präsentationsmaterial rechtzeitig vor. Ich nehme meinen Notebook mit ins Seminar, von dem Sie gerne ihren Vortrag präsentieren können. Folien sind natrlich nicht verboten, und haben auch ihren Reiz, ebenso, wie eine schöne Tafeldarstellung.Danach diskutieren wir noch 10-15 Minuten ber die Inhalte des Vortrags.

 

Benotung

50% auf Vortrag - Inhalt, Vortragsstil, in der Zeit?, didaktischer Anspruch, Folienaufbau (verwenden Sie mind. 20pt)
50 % auf Seminarbeit - Genauigkeit, wiss. Anspruch, Sprache und Ausdruck, strukturelle Vollständigkeit, Lesbarkeit, Klarheit des Textes und der Bilder (kopieren sie die Bilder nicht aus dem pdf, sondern machen Sie ihre eigenen bitte).

Zum erfolgreichen Abschluss des Seminars benötigen sie sowohl einen erfolgreichen Vortrag, als auch eine erfolgreiche Seminararbeit.

Themenvergabe

Thema 1 und 3 am 10.5. Vorträge: Prof. Kosch und Dr. Coquil

Startet den Datei-DownloadFolien (Prof. Kosch)

Startet den Datei-DownloadFolien (Dr. Coquil)

Thema 2 am 24.5. Vortrag: Lu Xin

Startet den Datei-DownloadFolien

Thema 5 am 31.5 Vortrag: Andreas Scherbauer

Startet den Datei-DownloadFolien

dazwischen u.U. Koordinationstreffen
Thema 6 am 5.7 Vortrag: Stefan Löwe

Startet den Datei-DownloadFolien

Öffnet einen externen Link in einem neuen FensterVideo

Thema 4 am 19.7 Vortrag: Dipl.-Ing. Tilmann Rabl

Startet den Datei-DownloadFolien

 

Themenüberblick

1. Grid: Einleitung und Überblick

Der Begriff Grid wurde durch Ian Foster in der ersten Version seines Buchs: The Grid: Blueprint for a New Computing Infrastructure geprägt. Ian Fosters Vision des Grids ist stark mit der Standardisierung in der Open Grid Services Architecture (OGSA) - siehe auch weiter unten- und der Globus Alliance und dem Globus Toolkit (http://www.globus.org/) verbunden. Am Anfang des Seminars wollen wir das Thema generell beleuchten.

Referenzen:


www-1.ibm.com/grid/pdf/Clabby_Grid_Report_2004_Edition.pdf 
(This report describes what grid architecture is; how it works; the role expected Web services to play in grid evolution; how grids are being used (in scientific/research environments) and how grids are making their way into commercial environments).
Grid Cafe des CERN ("The place where everybody can learn about the Grid").
www.gridcomputing.com
www-128.ibm.com/developerworks/library/gr-heritage/ 
oder auch : Jim Gray: research.microsoft.com/~Gray/papers/Microsoft_and_Grid_Computing.doc 

2. Open Grid Services Architecture (OGSA)

Die Open Grid Services Architecture (OGSA) OGSA basiert auf dem Globus Toolkit (GT2) und bildet einen standardisierten Rahmen für ein daten- und serviceorientiertes Grid Computing, welches dann in den Teilen GT3 und GT4 verwirklicht wurde.

Referenzen:

De Roure et al.; IBM Redbook Introduction to Grid Computing with Globus
www.globus.org/ogsa/ (OGSA Homepage)
"The Physiology of the Grid", a research paper that proposed OGSA and laid out initial principles for its development
"The Open Grid Services Architecture, Version 1.0", a GGF informational document
"OGSA Tier 1 Use Case Draft Document", another related GGF document that describes a number of use cases that have informed the development of OGSA
A two-part introduction on ogsa and developing grid computing applications using the Globus Toolkit can be found on the IBM developerworks website: part i and part ii.

3. Data Grids: Überblick und Applikationen

Data grids ― grids that provide computing resources to allow for indepth analysis of and access to shared large-scale databases. 

Zuerst einmal definieren wir die Grundkonzepte des Data Grid, Management System und DB-Anbindung. Später gehen wir auf Performanz, Applikationen und ein konkretes EU-Projekt ein.  

a) Einführung

Referenzen:

Reagan Moore, Arun swaran Jagatheesan, Arcot Rajasekar, Micheal Wan und Wayne Schroeder: Data Grid Management Systems. In Proceedings of the 21stI EEE/NASA Conference on Mass Storage Systems and Technologies (MSST), April 13-16, 2004, College Park, Maryland, USA.
www.ivdgl.org/documents/document_server/uploaded_documents/doc--1214--msst2004-0111.pdf
A. Rajasekar, M. Wan, R. Moore und T. Guptill, Data Grids, Collections and Grid Bricks, Twentieth IEEE/Eleventh NASA Goddard Conference on Mass Storage Systems & Technologies, April 7-10, 2003, San Diego, USA.
www.sdsc.edu/dice/Pubs/bricksMS2003.pdf

b) Applikationen und Performanz:

Überblick über ausgewählte Applikationsfelder des Data Grids. Performanz in Data Grid Applikationen.

Erwin Laure, Heinz Stockinger und Kurt Stockinger: "Performance Engineering in Data Grids", Concurrency and Computation: Practice and Experience, Wiley Press, 17(2-4):171-191, 2005, see hst.home.cern.ch/hst/publications.html.

Speziell soll dann auf den Multimedia-Bereich eingegangen werden (medizinische Anwendung):

H. K. Huang, Aifeng Zhang, Brent Liu, Zheng Zhou, Marina del Rey, Jorge Documet und Marina del Rey: Data grid for large-scale medical image archive and analysis. In Proceedings of the 13th annual ACM international conference on Multimedia, pp. 1005-1013. 2005. 
delivery.acm.org/10.1145/1110000/1101357/p1005-huang.pdf

c) Ongoing Projekte:

Europäische Dimension:
eu-datagrid.web.cern.ch/eu-datagrid/ 
www.coregrid.net/ 

Deutsche Dimension
www.d-grid.de - und die verschiedenen Unterprojekte

Vgl. bei allen Aspekten auch die Anforderungen und Konzepten von Verteilten DBMS:

Unterschiede zu Verteilten DBMS und Anforderungen aus:
M.T. Özsu and P. Valduriez, Principles of Distributed Database Systems, 2nd edition, Prentice-Hall, Inc., 1999; ISBN 0-13-659707-6. 

4. Web Services und das Web Services Resource Framework (schwieriger):

Die Open Grid Services Architecture (OGSA) definiert in seinem Web Services Resource Framework (WSRF) Konventionen, um den Zustand von Ressourcen im Grid zu beschreiben. 

Referenz:

Dokumente auf www.globus.org/wsrf/ 

5. The OGSA-DAI und DQP Projekte:

Das OGSA-DAI Projekt entwickelt eine Middleware zur verteilten Datenintegration im Grid. 

Referenz:

www.ogsadai.org.uk/index.php 
Das OGSA-DAI Projekt definiert die Kompenenten der OGSA-DAI Middlware, insbesondere eine Query Processing (DQP) Komponente für die verteilte und parallele Verarbeitung. 

6. Semantic Grid

The semantic grid is an extension of the current grid in which information and services are given well-defined meaning, better enabling computers and people to work in cooperation.

www.semanticgrid.org/ 

Referenzen:

D. De Roure, N.R. Jennings, N.R. Shadbolt: The Semantic Grid: A future e-Science infrastructure. In: F. Berman, G. Fox, A.J.G. Hey. Grid Computing Making the Global Infrastructure Reality. John Wiley and Sons Ltd., 2003.
www.semanticgrid.org/documents/semgrid-journal/semgrid-journal.pdf 
D. De Roure, N.R. Jennings, N.R. Shadbolt: The Semantic Grid: Past, Present and Future. PROCEEDINGS OF THE IEEE, VOL. 93, NO. 3, MARCH 2005
www.semanticgrid.org/documents/semgrid2004/semgrid2004.pdf 
C. Goble, D. De Roure: The Semantic Grid: Myth Busting and Bridge Building. In Proceedings of the 16th European Conference on Artificial Intelligence (ECAI-2004), Valencia, Spain, 2004.
www.semanticgrid.org/docs/ECAISemanticGrid/ECAISemanticGridFinal.pdf 

7. Oracle 10g: DBMS and Grid

www.oracle.com/technologies/grid/

Zitiert aus der Oracle HP: For 40 years the mainframe has been the leader in computer performance and reliability. But now there's the Oracle Grid. A group of low-cost servers connected by Oracle software. The Oracle Grid runs applications faster than the fastest mainframe. And if a server fails, the mainframe stops while the Oracle Grid just keeps running.

Vor allem hier: Vergleich mit dem im Thema 3. Data Grids angesetzten Konzepten. Unterschiede zu Verteilten DBMS und Anforderungen aus:

M.T. Özsu and P. Valduriez, Principles of Distributed Database Systems, 2nd edition, Prentice-Hall, Inc., 1999; ISBN 0-13-659707-6.

 News at Department
 News at university
 Events at university
Home
Glossary
Imprint
Privacy policy
Home Sitemap Recommend page Print version
Hauptseminar Data Grid Deutsch
 Last changed: 17.07.08