Ziel des Vorhabens ist der Aufbau einer nachhaltig nutzbaren und datenschutzkonformen Plattform für die Integration heterogener Datenbestände in der klinischen und translationalen Forschung. Die Zusammenführung und standardisierte Aufbereitung erlaubt eine langfristige Nutzung der erhobenen Forschungsdaten. Hierzu sollen bewährte vorhandene Architekturen an die Bedürfnisse der vernetzten medizinischen Forschung in Deutschland angepasst und zu einem nahtlosen Prozess integriert werden.In medizinischen Forschungsverbünden und an den deutschen Universitätskliniken wurden in den letzten Jahren eine Vielzahl von Forschungsdatenbanken aufgebaut. Diese Datenbestände besitzen über ihren ursprünglichen Forschungszweck hinaus ein großes Nachnutzungspotenzial für aktuelle und zukünftige Forschungshypothesen.
Im Projekt IDRT soll, basierend auf frei verfügbaren IT-Komponenten, die in den letzten Jahren u.a. in TMF- bzw. BMBF-Projekten entstanden sind, eine generische Methodik und eine nachhaltig nutzbare und datenschutzkonforme Plattform für die Zusammenführung und Abfrage heterogener Datenbestände in einem Data Warehouse geschaffen werden. Als Kernkomponente zur generischen Datenhaltung und Datenabfrage wird das Open Source System i2b2 in das zu entwickelnde "Integrated Data Repository Toolkit (IDRT)" eingebettet. Für den ETL-Prozess selbst soll das Open Source Produkt Talend Open Studio verwendet werden. Zur Verwendung standardisierter Datenitems wird auf die Ergebnisse des BMBF-Projekts Metadata Repository zurückgegriffen. Zur Wahrung der Patientenrechte und des Datenschutzes wird der TMF PID-Generator in den ETL-Prozess integriert.
Durch die konsequente Nutzung von Open Source Komponenten und projektbegleitende Maßnahmen der Dissemination wird die Voraussetzung für eine dauerhafte Community-Nutzung über die Verbünde aus der TMF hinaus geschaffen.