Seqera Labs s’empare de 5,5 millions de dollars pour aider à séquencer les variantes de Covid-19 et d’autres problèmes de données complexes – TechCrunch


Mettre de l’ordre et de la compréhension aux informations non structurées situées dans des silos disparates a été l’une des percées les plus importantes de l’ère du big data, et aujourd’hui une startup européenne qui a construit une plate-forme pour relever ce défi spécifiquement dans le domaine des sciences de la vie – et a, notamment, a été utilisé par les laboratoires pour séquencer et jusqu’à présent identifier deux variantes majeures de Covid-19 – annonce un financement pour continuer à développer ses outils pour un ensemble plus large de cas d’utilisation et pour s’étendre en Amérique du Nord.

Laboratoires Seqera, une plate-forme d’orchestration de données et de workflow basée à Barcelone conçue pour aider les scientifiques et les ingénieurs à commander et à obtenir des informations à partir de trésors de données génomiques basés sur le cloud, ainsi que pour s’attaquer à d’autres applications des sciences de la vie qui impliquent l’exploitation de données complexes à partir de plusieurs emplacements, a levé 5,5 millions de dollars dans le financement d’amorçage.

Un tel capital et Speedinvest co-dirigé ce tour, avec la participation également du précédent bailleur de fonds BoxOne Entreprises et une subvention du Initiative Chan Zuckerberg, Les efforts de Mark Zuckerberg et du Dr Priscilla Chan pour soutenir les projets de logiciels open source pour les applications scientifiques.

Seqera – un portemanteau de « séquence » et « ère », l’âge des données de séquençage, en gros – avait précédemment levé moins d’un million de dollars, et tranquillement, il génère déjà des revenus, avec cinq des plus grandes sociétés pharmaceutiques du monde faisant partie de son client base, aux côtés de clients biotechnologiques et autres sciences de la vie.

Seqera a été créée à partir du Center for Genomic Regulation, un centre de recherche biomédicale basé à Barcelone, où elle a été construite en tant qu’application commerciale de flux suivant, logiciel open source de workflow et d’orchestration de données créé à l’origine par les fondateurs de Seqera, Evan Floden et Paolo Di Tommaso, au CGR.

Floden, PDG de Seqera, a déclaré à TechCrunch que lui et Di Tommaso étaient motivés pour créer Seqera en 2018 après avoir vu Nextflow gagner beaucoup de terrain dans la communauté des sciences de la vie, et avoir par la suite reçu de nombreuses demandes répétées pour une personnalisation et des fonctionnalités supplémentaires. Nextflow et Seqera ont tous deux été très utilisés : le runtime Nextflow a été téléchargé plus de 2 millions de fois, a déclaré la société, tandis que l’offre cloud commerciale de Seqera a désormais traité plus de 5 milliards de tâches.

La pandémie de Covid-19 est un exemple classique du défi aigu que Seqera (et par association Nextflow) entend relever dans la communauté scientifique. Avec les épidémies de Covid-19 qui se produisent dans le monde, chaque fois qu’un test de Covid-19 est traité dans un laboratoire, des échantillons génétiques vivants du virus sont collectés. Ensemble, ces millions de tests représentent une mine d’informations sur le coronavirus et comment il mute, et quand et où il le fait. Pour un nouveau virus dont on comprend si peu et qui persiste toujours, ce sont des données inestimables.

Le problème n’est donc pas si les données existent pour une meilleure compréhension (c’est le cas) ; c’est qu’il est presque impossible d’utiliser plus d’outils hérités pour voir ces données comme un corps holistique. C’est dans trop d’endroits, et il y en a tout simplement trop, et cela augmente chaque jour (et change chaque jour), ce qui signifie que les approches traditionnelles de portage des données vers un emplacement centralisé pour exécuter des analyses dessus ne seraient tout simplement pas efficaces. , et coûterait une fortune à exécuter.

C’est là qu’intervient Segera. La technologie de l’entreprise traite chaque source de données sur différents clouds comme un pipeline saillant qui peut être fusionné et analysé en tant que corps unique, sans que ces données ne quittent jamais les limites de l’infrastructure où elles existent déjà. Personnalisés pour se concentrer sur les trésors génomiques, les scientifiques peuvent ensuite interroger ces informations pour obtenir plus d’informations. Seqera a joué un rôle central dans la découverte des variantes alpha et delta du virus, et les travaux sont toujours en cours alors que Covid-19 continue de marteler le monde.

Seqera est utilisé dans d’autres types d’applications médicales, comme dans le domaine de la « médecine de précision ». Cela apparaît comme une très grande opportunité dans des domaines complexes comme l’oncologie : le cancer mute et se comporte différemment en fonction de nombreux facteurs, y compris les différences génétiques des patients eux-mêmes, ce qui signifie que les traitements sont moins efficaces s’ils sont « taille unique ».

De plus en plus, nous voyons des approches qui tirent parti de l’apprentissage automatique et de l’analyse des mégadonnées pour mieux comprendre les cancers individuels et comment ils se développent pour différentes populations, afin de créer par la suite des traitements plus personnalisés, et Seqera entre en jeu pour séquencer ce type de données.

Cela met également en évidence un autre élément notable de la plateforme Seqera : elle est utilisée directement par les personnes qui analysent les données, c’est-à-dire les chercheurs et les scientifiques eux-mêmes, sans que les spécialistes des données aient nécessairement besoin de s’impliquer. C’était une priorité pratique pour l’entreprise, m’a dit Floden, mais néanmoins, c’est un détail intéressant de la façon dont la plate-forme fait par inadvertance partie de cette plus grande tendance des logiciels « sans code/low-code », conçus pour rendre utilisables des processus hautement techniques. par des personnes non techniques.

C’est à la fois l’opportunité existante et la manière dont Seqera pourrait être appliqué à l’avenir à d’autres types de données résidant dans le cloud, qui en font une entreprise intéressante, et cela semble également un investissement intéressant.

“Les progrès de l’apprentissage automatique et la prolifération des volumes et des types de données conduisent à de plus en plus d’applications de l’informatique dans les sciences de la vie et la biologie”, a déclaré Kirill Tasilov, directeur de Talis Capital, dans un communiqué. « Bien que cela soit incroyablement excitant du point de vue de l’humanité, cela fait également monter en flèche le coût des expériences, atteignant parfois des millions de dollars par projet, car elles deviennent lourdes en informatique et complexes à exécuter. Nextflow est déjà une solution omniprésente dans cet espace et Seqera pilote ces capacités au niveau de l’entreprise et, ce faisant, fait entrer l’ensemble du secteur des sciences de la vie dans l’ère moderne. Nous sommes ravis de faire partie du voyage de Seqera.

« Avec l’explosion des données biologiques provenant du séquençage d’ADN commercial bon marché, il est urgent d’analyser des quantités de données de plus en plus complexes et de plus en plus importantes », a ajouté Arnaud Bakker, directeur de Speedinvest. « Le cadre ouvert et axé sur le cloud de Seqera fournit un kit d’outils avancé permettant aux organisations d’adapter des déploiements complexes d’analyse de données et d’activer des solutions de sciences de la vie axées sur les données.

Bien que la médecine et les sciences de la vie soient peut-être les applications les plus évidentes et les plus opportunes de Seqera aujourd’hui, le cadre conçu à l’origine pour la génétique et la biologie peut être appliqué à un certain nombre d’autres domaines : la formation à l’IA, l’analyse d’images et l’astronomie sont les trois premiers cas d’utilisation, a déclaré Floden. L’astronomie est peut-être très appropriée, car il semble que le ciel soit la limite.

“Nous pensons que nous sommes dans le siècle de la biologie”, a déclaré Floden. « C’est le centre d’activité et il devient centré sur les données, et nous sommes ici pour créer des services autour de cela. »

Seqera ne divulgue pas sa valorisation avec ce tour.



Source link