digital future Story

Der Blick in die DNA

Das Team vom Tübinger Start-up Computomics entschlüsselt Gene mit bestimmten Eigenschaften. Die Kunden kommen aus der Landwirtschaft. (Foto: Piepenbrock)

Statistische Verfahren werden in der landwirtschaftlichen Pflanzen- und Tierzucht bereits angewandt. Mit ihnen lassen sich Zuchtlinien ausschließen, die eine erwünschte Eigenschaft nicht weitertragen würden. Das Start-up Computomics hat dieses Verfahren nun mit „machine learning“ weiter verfeinert.

f3 - farm. food. future: Saatguthersteller oder Tiergesundheitskonzerne bestellen bei euch modernste Bioinformatik-Analysen. Was genau sollt ihr für sie an der DNA ablesen und was haben die Konzerne davon?

Sebastian Schultheiss (links) und Tobias Dezulian haben Computomics gegründet. (Foto: MBG Baden-Württemberg) 

Dr. Sebastian Schultheiss: Wir arbeiten vor allem mit Pflanzen- und Tierzüchtern zusammen, die neue Sorten oder Rassen verbessern und dabei mehrere Jahre Zeit sparen möchten. Wir können ihnen nämlich mit unseren Analysemöglichkeiten Hinweise geben darauf, welche Pflanzen aus ihrem Genpool sie kreuzen müssen, um eine bestimmte Wirkung zu erzielen. Ohne also tatsächlich vorher einen langwierigen Pflanzversuch gemacht zu haben, können wir nur aufgrund der Datenanalysen voraussagen, wie diese Pflanze etwa auf Schädlinge reagieren oder wieviel Ertrag sie erzielen würde. Das Besondere sind nicht die statistischen Verfahren - die gibt es schon länger, z.B. um Zuchtwerte von Kühen zu ermitteln. Wir kombinieren diese Verfahren jedoch mit Machine-Learning-Algorithmen, mit deren Hilfe wir viel genauere Auskünfte geben können. Das ist neu und macht uns einzigartig.

Jetzt f3 Mitglied werden und direkt weiterlesen

Als f3-Mitglied erhälst du täglich Meldungen, Beiträge und Reportagen zu Innovationen und Start-ups aus den "grünen" Bereichen und wirst Teil des neuen Gründer-Netzwerks.

mehr Informationen bekommst du hier

Statistische Verfahren werden in der landwirtschaftlichen Pflanzen- und Tierzucht bereits angewandt. Mit ihnen lassen sich Zuchtlinien ausschließen, die eine erwünschte Eigenschaft nicht weitertragen würden. Das Start-up Computomics hat dieses Verfahren nun mit „machine learning“ weiter verfeinert.

f3 – farm. food. future: Saatguthersteller oder Tiergesundheitskonzerne bestellen bei euch modernste Bioinformatik-Analysen. Was genau sollt ihr für sie an der DNA ablesen und was haben die Konzerne davon?

Sebastian Schultheiss (links) und Tobias Dezulian haben Computomics gegründet. (Foto: MBG Baden-Württemberg) 

Dr. Sebastian Schultheiss: Wir arbeiten vor allem mit Pflanzen- und Tierzüchtern zusammen, die neue Sorten oder Rassen verbessern und dabei mehrere Jahre Zeit sparen möchten. Wir können ihnen nämlich mit unseren Analysemöglichkeiten Hinweise geben darauf, welche Pflanzen aus ihrem Genpool sie kreuzen müssen, um eine bestimmte Wirkung zu erzielen. Ohne also tatsächlich vorher einen langwierigen Pflanzversuch gemacht zu haben, können wir nur aufgrund der Datenanalysen voraussagen, wie diese Pflanze etwa auf Schädlinge reagieren oder wieviel Ertrag sie erzielen würde. Das Besondere sind nicht die statistischen Verfahren – die gibt es schon länger, z.B. um Zuchtwerte von Kühen zu ermitteln. Wir kombinieren diese Verfahren jedoch mit Machine-Learning-Algorithmen, mit deren Hilfe wir viel genauere Auskünfte geben können. Das ist neu und macht uns einzigartig.

f3 – farm. food. future: Das klingt mehr nach IT, als nach Biologie. Wie funktioniert eine solche Analyse?

Dr. Sebastian Schultheiss: Wir haben tatsächlich kein Labor, wir haben nur Computer. Wir brauchen aber auch keines, weil wir die DNA-Sequenzierung einer Pflanzenprobe nicht selbst durchführen. Wir kriegen die bereits aufgetrennten Basen einer DNA von sogenannten Sequenzierungsdienstleistern angeliefert. Diese Daten ergänzen wir noch um Trainingsdaten der Pflanzenzüchter, die wiederum aus Feldversuchen stammen, und schon kann gerechnet werden.

Statistische Verfahren finden die Nadel im Heuhaufen nicht.

Sebastian Schultheiss

Dr. Sebastian Schultheiss: Ohne zu sehr ins Detail zu gehen, kann ich es vielleicht so erklären: Ein Gen ist ein paar tausend Basen groß. Das ganze nimmt man mal 2, weil es je zwei Kopien von Vater und Mutter beinhaltet. Aus all diesen Informationen ergibt sich dann eine zu entschlüsselnde Datenmenge im Millionen-Gigabyte-Bereich! Statistische Verfahren tun sich schwer, in einem solchen Datenwust eine bestimmte DNA-Seqzenz mit einer bestimmten Eigenschaft zu entdecken. Sie finden quasi die Nadel im Heuhaufen nicht. Unsere Verfahren finden die Zusammenhänge höherer Ordnung und sind deswegen genauer.

In einem offenen, ganz in weiß gehaltenen Büro mit hohen Decken arbeiten zwölf Mitarbeiter. (Foto: Piepenbrock)

Machine learning vs. Statistik

f3 – farm. food. future: Euer Verfahren bedient sich maschineller Lernverfahren?

Dr. Sebastian Schultheiss: Genau. Maschinelle Lernverfahren gelten gemeinhin als „Blackbox“. Sie sind nur schwer zu lesen, weil man dafür im Grunde doch wieder selbst einen Blick in die Datenmengen werfen müsste. Wir haben jedoch einen technologischen Vorsprung, der uns ermöglicht, in unseren Algorithmus hinein zu schauen. Wir können dort genau sehen, was die einzelnen Gene voneinander unterscheidet. Dementsprechend können wir einzelne Gene ausfindig machen, die mit einer bestimmten Eigenschaft ausgestattet sind.

Wir haben das Gen gefunden, das nur für geringes Hornwachstum einer Kuh verantwortlich ist. 

Sebastian Schultheiss

Dr. Sebastian Schultheiss: Vor einiger Zeit hat uns zum Beispiel ein Unternehmen beauftragt, das Gen zu finden, das für nur ein geringes Hornwachstum einer Kuh verantwortlich ist. Damit sollen Kühe ohne Hörner gezüchtet werden. Wir haben auch mal das Gen gefunden, dass eine Resistenz gegen Kaffeerost bei Kaffee ausbildet oder welche Algenvariante jetzt genau die erwünschte Fettsäure produzieren kann.

Die auf maschinellem Lernen basierenden Algorithmen von Computomics liefern nach Unternehmensangaben genaueste Genmodelle wie diese. (Grafik: computomics)

Erster Kunde war Bayer Crop Science

f3 – farm. food. future: Du spricht von einem technologischen Vorsprung. Woher kommt der?

Dr. Sebastian Schultheiss: Wir sind eine Ausgründung der Uni Tübingen und des Max-Planck-Instituts für Entwicklungsbiologie. Meine Mitgründer sind die vier Wissenschaftler Prof. Dr. Weigel, Prof. Dr. Huson, Prof. Dr. Rätsch und Prof. Dr. Borgwardt. Ihnen haben wir es zu verdanken, dass wir unsere Algorithmen überhaupt so gut interpretieren können. Und sie forschen noch weiter.

f3 – farm. food. future: Wie kam es, dass ihr euch ausgerechnet auf die Landwirtschaft spezialisiert habt? Du selbst und alle Professoren sind Geo- oder Bioinformatiker, Statistiker oder IT-Fachleute – keine Agrarier.

Dr. Sebastian Schultheiss: Tatsächlich könnten wir die unterschiedlichsten Analysen in allen möglichen Branchen durchführen. Allerdings bekam gerade Prof. Detlef Weigl häufig konkrete Anfragen von Pflanzenzuchtunternehmen. Unser erster Kunde war Bayer Crop Science. Da gab es dann am Bedarf keinen Zweifel mehr. Das gefiel wiederum unserem Beirat und Coach Reinhard Hamburger, dem wichtig war, dass wir uns auf einen Markt fokussieren. Mittlerweile arbeiten wir mit vier der größten zehn Saatgutunternehmen zusammen.

Trends in der Pflanzen- und Tierzucht

f3 – farm. food. future: Deine Mitgründer sind vier Professoren, die neben Know-how und Forschungsarbeit auch Kapital beigesteuert haben. Wer hat noch investiert?

Dr. Sebastian Schultheiss: Als wir uns 2012 gründeten, investierten zuerst die vier Professoren, mein Mitgründer Tobias Dezulian und ich. Dann ist die Kreissparkasse Tübingen eingestiegen. Sie hat zusammen mit dem Hightechgründerfonds und dem Seedfonds Baden-Württemberg noch einmal rund 1,1 Mio. € in das Unternehmen investiert. Heute haben wir zwölf Mitarbeiter.

Wie ernähren wir 9 Mrd. Menschen? free

f3 – farm. food. future:  Wohin geht die Reise? Was werdet ihr in Bezug auf die Landwirtschaft künftig voraussagen können? Welche Trends beobachtet ihr?

Dr. Sebastian Schultheiss: Wir merken schon, dass die Pflanzenzüchter, die ohnehin schon acht bis zehn Jahre in die Zukunft denken, sich für Dürrephasen und Wetterextreme wappnen. Die Sorteneigenschaften verschieben sich entsprechend von Süden nach Norden.

Dr. Sebastian Schultheiss: Wir als Computomics möchten unsere Sortenempfehlungen noch weiter spezifizieren und irgendwann genau auf das Umfeld und die Umweltbedingungen, in denen eine Pflanze wächst, anpassen. Wenn wir wissen, welche Bakterien in welcher Pflanze auf welchem Standort gedeihen, wissen wir ziemlich individuell, wie eine Pflanze ausgestattet sein muss, die dort hohe Erträge erzielen soll. Unsere Bezahlung würden wir in solchen Fällen dann vom Sortenerfolg abhängig machen.