banner

Blog

Dec 25, 2023

Genomsequenz und Silkomics des Hermelinfalters Yponomeuta cagnagella, der die frühe divergierende Abstammungslinie der ditrysischen Lepidoptera darstellt

Kommunikationsbiologie Band 5, Artikelnummer: 1281 (2022) Diesen Artikel zitieren

1294 Zugriffe

2 Zitate

9 Altmetrisch

Details zu den Metriken

Viele Schmetterlingsarten produzieren Seide, Kokons, Ernährungssonden oder Nester, um Raupen und Puppen vor Raubtieren und Parasiten zu schützen. Dennoch ist die Zahl der Schmetterlingsarten, deren Seidenzusammensetzung im Detail untersucht wurde, sehr gering, da die Gene, die die wichtigsten strukturellen Seidenproteine ​​codieren, dazu neigen, groß und repetitiv zu sein, was ihre Zusammensetzung und Sequenzanalyse schwierig macht. Hier haben wir die Seide von Yponomeuta cagnagella analysiert, die eine der frühen divergierenden Abstammungslinien der ditrysischen Lepidoptera darstellt und so die Abdeckung der Ordnung verbessert. Um eine umfassende Liste der Seidengene von Y. cagnagella zu erhalten, haben wir mithilfe der Technologien Oxford Nanopore und Illumina einen Genomentwurf sequenziert und zusammengesetzt. Wir verwendeten ein Seidendrüsentranskriptom und ein Seidenproteom, um die wichtigsten Seidenkomponenten zu identifizieren und die Gewebespezifität der Expression einzelner Gene zu überprüfen. Es wird eine detaillierte Annotation der wichtigsten Gene und ihrer mutmaßlichen Produkte bereitgestellt, einschließlich ihrer vollständigen Sequenzen und Exon-Intron-Strukturen. Die Morphologie der Seidendrüsen und Fasern wird ebenfalls gezeigt. Diese Studie füllt eine wichtige Lücke in unserem wachsenden Verständnis der Struktur, Evolution und Funktion von Seidengenen und stellt genomische Ressourcen für zukünftige Studien zur chemischen Ökologie von Yponomeuta-Arten bereit.

Seide ist ein funktioneller Begriff, der zur Beschreibung von Proteinfasern verwendet wird, die von einer Reihe von Arthropodenlinien gesponnen werden, und umfasst ein breites Spektrum unterschiedlicher Materialien1. Die zunehmende Anwendung von Omics-Technologien zur Charakterisierung der für Seidenkomponenten spezifischen Nukleotid- und Proteinsequenzen zeigt eine bemerkenswerte Variabilität der Seideneigenschaften zwischen Arthropoden-Taxa2,3,4,5. Es wurde die Hypothese aufgestellt, dass Seiden mit unterschiedlichen dominanten Proteinstrukturen unterschiedliche evolutionäre Ursprünge haben. Eine wachsende Zahl von Studien an Spinnen6, Motten2,7, Köcherfliegen8,9 und Honigbienen10,11 legen nahe, dass sich die Seidenproduktion in verschiedenen Gruppen unabhängig voneinander entwickelt hat. Insekten nutzen verschiedene Arten von Drüsen für die Seidensekretion und produzieren eine Reihe von Proteinsekreten. Tatsächlich könnte sich Insektenseide in 23 Abstammungslinien1 unabhängig voneinander entwickelt haben. Allerdings produzieren die Larven von Lepidoptera und Trichoptera (Schwestergruppen, die die Oberordnung der Amphiesmenoptera bilden) in ihren Labialdrüsen Seidenfasern, die L- und H-Fibroine enthalten, und ihre wichtigsten Seidenproteine ​​haben einen gemeinsamen Ursprung12. Es wird vermutet, dass die Produktion dieser Seidenart seit über 300 Millionen Jahren besteht13.

Die von Schmetterlingsraupen produzierte Seide wird von einem Paar spezialisierter Labialdrüsen (Speicheldrüsen), den sogenannten Seidendrüsen (SG), abgesondert. Eine Mischung aus Seidenproteinen wird in einem Lumen der Seidendrüse als dicke Lösung gespeichert, die nach dem Spinnen fest wird. Während die Gesamtstruktur der Seide ähnlich ist, können die einzelnen Proteine ​​bei Schmetterlingen stark variieren. Je nach Löslichkeit werden Seidenproteine ​​traditionell in zwei Gruppen eingeteilt: unlösliche Fibroinproteine, die zwei Kernfilamente bilden, und in heißem Wasser lösliche Sericinproteine, die eine hydrophile Beschichtung bilden und die Filamente zu einer Faser versiegeln14,15. Die Fibroine werden im hinteren Teil der Seidendrüsen (PSG) produziert, während die Hüllproteine ​​nach und nach der gespeicherten Seide in den mittleren Seidendrüsen (MSG) hinzugefügt werden. Der vordere Teil der Seidendrüsen (ASG) produziert offenbar keine Seidenkomponente und dient als Drüsenausgang14. Die Hüllproteine ​​weisen eine große Heterogenität zwischen den Arten auf, sowohl in der Anzahl der enthaltenen Proteine ​​als auch in den Sequenzen der einzelnen Komponenten16.

Eine detaillierte Analyse der Seidenbestandteile wurde bei mehreren Vertretern der Mottenfamilien Bombycidae17, Saturniidae18, Pyralidae19, Nolidae5, Tineidae7 und Psychidae20 durchgeführt, wobei die meisten Arten zur höheren Ditrysia gehören, die mehr als 98 % der vorhandenen Schmetterlingsdiversität ausmacht12. Der Nachweis von Seidenproteinen in neu untersuchten Arten wird jedoch durch die Wiederholung ihrer Sequenzen und die geringe Sequenzähnlichkeit selbst zwischen Arten derselben Familie erschwert. Genverluste und -duplikationen in Kombination mit schnellen Sequenzänderungen machen die Identifizierung einzelner Gene, die Hüllproteine ​​kodieren, aufgrund von Ähnlichkeiten ziemlich schwierig16. Folglich fehlen häufig Sequenzen in voller Länge und die Exon-Intron-Architektur der Seidengene.

Die Überfamilie Yponomeutoidea gehört zu einer der frühen ditrysischen Abstammungslinien21. Mitglieder der Familie Yponomeutidae sind aus der Unterkreide bekannt22,23, was sie zu einer der ersten Gruppen macht, die von der inneren zur äußeren Ernährung übergingen24 und Kräuter, Sträucher und Bäume in großem Umfang besiedelte25. Europäische Hermelinmotten der Gattung Yponomeuta werden seit langem im Hinblick auf die chemische Ökologie von Insekten-Pflanzen-Assoziationen und die ökologische Artbildung durch Wirtswechsel untersucht26,27,28,29.

Die Gattung Yponomeuta umfasst 76 beschriebene Arten, die auf der ganzen Welt verbreitet sind (außer Südamerika und den arktischen Regionen)30. Kleine Hermelinmotten sind vor allem für ihr ausgedehntes Schutznetz bekannt, das von den Larven einiger Arten produziert wird. Bei gelegentlichen Ausbrüchen können die Larven innerhalb weniger Tage ganze Bäume oder Büsche entlauben und sie mit Seide bedecken. Diese Netze bestehen aus ineinander verwobenen Seidenfäden, die um die Zweige von Nahrungspflanzen gesponnen sind. Die Larven verpuppen sich in den schützenden Nestern in Kokons, die leicht transparent sind und aus einer einzigen Seidenschicht bestehen (Abb. S1)31,32. In einer früheren Studie am Vogelkirsch-Hermelinspinner Yponomeuta evonymella wurden zahlreiche Seidendrüsen-spezifische cDNAs untersucht und Transkripte für die leichte Kette von Fibroin (L-Fib), Fibrohexamerin (Fhx oder P25) und eine Teilsequenz für die schwere Kette entdeckt Fibroinkette (H-Fib), was darauf hindeutet, dass die Zusammensetzung des Seidenfadenkerns erhalten bleibt33. Andere Seidenbestandteile wurden jedoch nicht identifiziert.

In der vorliegenden Studie zeigen wir eine detaillierte Analyse der Seidengene und ihrer Produkte in einer eng verwandten Hermelinmotte, Yponomeuta cagnagella, und erweitern die frühere Analyse von Y. evonymella. Um alle Gene zu identifizieren und zu charakterisieren, die für die wichtigsten Seidenkomponenten kodieren, haben wir das Genom von Y. cagnagella sequenziert und zusammengesetzt und die Ergebnisse mit transkriptomischen und proteomischen Analysen sowie einer Homologiesuche unter Verwendung von in Y. evonymella nachgewiesenen Proteinen kombiniert.

Die Genomgröße von Y. cagnagella wurde mittels Durchflusszytometrie bestimmt. Vier Köpfe erwachsener Männchen wurden mit Ephestia kuehniella-Standards in unabhängigen Replikaten verwendet. Die resultierende Genomgröße betrug 709,54 ± 6,52 Mbp (Mittelwert ± Standardfehler, N = 4). Ein Beispiel einer Durchflusszytometrieanalyse ist in Abb. S2 dargestellt. Darüber hinaus wurde die Genomgröße anhand von k-mer-Spektren geschätzt und erreichte in diesem Fall 508,47 Mbp (Abb. S3). Wenn wir uns weiter unten auf die Genomgröße beziehen, verwenden wir das Ergebnis der Durchflusszytometrie, da wir es für genauer halten.

Insgesamt ergab die DNA-Sequenzierung 26 Gbp Oxford Nanopore (ONT) Long Reads (N50 = 19,1 kb) und 43,8 Gb Illumina Short Reads, was einer etwa 37-fachen bzw. 62-fachen Genomabdeckung entspricht. Nach der Vorverarbeitung der Rohdaten bestand der endgültige Datensatz aus 25,5 GB korrigierten langen Lesevorgängen mit N50 = 19,5 kb, was einer etwa 36-fachen Genomabdeckung entspricht.

Die mit Flye erzeugte primäre Genomassemblierung ergab 30.252 Fragmente mit 978,3 MB und einem N50 von 67,3 kb. Die Vollständigkeit der Zusammenstellung wurde von BUSCO anhand der Insecta Core Orthologue Database bewertet und ergab einen hohen Anteil duplizierter Gene (44,4 %). Zusammen mit der Länge der Anordnung, die die Genomgröße übersteigt, und den Ergebnissen der k-mer-Analyse, die eine hohe Heterozygotie (1,29 %; Abb. S3) zeigten, deutete dies auf ein signifikantes Vorhandensein haplotypischer Duplikationen hin.

Nach der Deduplizierung mit der Purge-Dups-Pipeline und dem weiteren Polieren mit Illumina-Daten bestand die endgültige Anordnung des Y. cagnagella-Genoms aus 11.790 Contigs mit 626,3 MB und Contig N50 = 96,5 kb. Das längste Fragment war 931,2 kb lang. In der Endmontage waren 96,9 % der BUSCO-Orthologen vollständig, 1,6 % waren fragmentiert und nur 1,5 % fehlten. Die Anzahl der duplizierten Gene sank auf 10,5 %, was darauf hindeutet, dass die durch hohe Heterozygotie verursachten duplizierten Haplotigs signifikant reduziert wurden. Die Kraken 2-Suche nach Kontaminanten anhand der Standardbibliothek identifizierte 9 Contigs, die Menschen zugeordnet wurden, und 23, die Bakterien zugeordnet wurden (Tabelle S2). Eine detaillierte manuelle Inspektion bestätigte jedoch keine Kontamination, da die meisten k-mere dieser Contigs nicht klassifiziert wurden, was darauf hindeutet, dass diese Sequenzen von Wiederholungen abgeleitet sein könnten. Darüber hinaus ergab die Blastn-Suche der Sequenzen in der NT-Datenbank, dass Schmetterlingssequenzen in allen Fällen die engsten Übereinstimmungen darstellten.

Die Kommentierung der endgültigen Y. cagnagella-Assemblierung ergab, dass 46,75 % der Sequenz als repetitive Elemente maskiert waren, mit einem Genom-GC-Gehalt von 39,21 %. Die am häufigsten vorkommende Wiederholungsklasse waren lang eingestreute Kernelemente (LINEs; 10,69 % des Genoms), gefolgt von kurz eingestreuten Kernelementen (SINEs; 5,06 %) und DNA-Elementen (3,33 %). Nur 0,57 % der Gesamtheit wurden als Satelliten-DNA klassifiziert (Tabelle S3 und S4). Die weichmaskierte Baugruppe wurde im Dryad-Repository abgelegt (https://doi.org/10.5061/dryad.4j0zpc8d3). Insgesamt wurden von der BRAKER-Pipeline 30.003 proteinkodierende Genmodelle mit einer durchschnittlichen Genlänge von 8.331 bp und durchschnittlich 5,9 Exons pro Genmodell vorhergesagt. Die BUSCO-Bewertung der Vollständigkeit ergab, dass 93,5 % der Insecta-Orthologen im Gensatz vorhanden waren.

Schließlich verglichen wir die Hermelinmotten-Anordnung mit anderen Schmetterlingsgenomen (Tabelle 1). Y. cagnagella stellt eines der größten und heterozygotsten Genome aus der Liste dar. Der Unterschied in der Genomgröße und Assemblierungslänge bei Y. cagnagella liegt nahe bei S. exigua (88,3 % bzw. 88,2 %), und die N50-Statistik ähnelt denen, die für Genomassemblierungen anderer Nicht-Modell-Schmetterlinge, nämlich D. arcuata, erhalten wurden , E. variegata und M. jurtina, sequenziert durch eine kostengünstige Sequenzierungsstrategie mit geringer Abdeckung ohne weitere Gerüsttechniken wie HiC. Da nur 1,5 % der Insekten-BUSCO-Orthologen fehlten, stellt die Genomassemblierung von Y. cangnagella eine wertvolle Ressource für weitere Studien dar.

Die Seidendrüsen von Y. cagnagella zeigen eine charakteristische Morphologie mit unterschiedlichen Teilen des ASG, MSG und PSG. Abbildung 1a zeigt drei Kompartimente von Seidendrüsen mit einem dünnen vorderen Teil, dem dicksten mittleren Teil mit einem breiten Lumen und einem etwas dünneren hinteren Teil, der aus großen sekretorischen Zellen besteht, die das dünne Lumen umgeben. Um die Morphologie von SG in Bezug auf seine Position im Körper zu untersuchen, haben wir eine Reihe von Querschnitten durch die Larven im letzten Stadium angefertigt. Die Querschnitte zeigten weitere morphologische Unterschiede in den verschiedenen Teilen der Drüsen sowie in der Struktur des Lumens mit einer zentralen Lokalisierung der Fibroinkomponenten, die von Hüllschichten bedeckt waren, die hauptsächlich aus Sericinen bestanden (Abb. 1b – d). Das Verhältnis zwischen der Dicke der Fibroin- und Sericinschicht variiert entlang der Länge des SG. Die Sericinschicht ist im PSG nicht vorhanden (Abb. 1d, e). Die Seide im Lumen der Drüse zeigt Farbunterschiede zwischen den verschiedenen Drüsenkompartimenten, wenn sie mit Masson-Trichrom-Färbung gefärbt wird. Die Farbe spiegelt Veränderungen in der Struktur oder dem pH-Wert der Seidenbestandteile wider.

eine Übersicht über die gesamte montierte SG. Blaue Pfeilspitzen zeigen die Grenzen der SG-Kompartimente, wobei ASG – vorderer SG, MSG – mittlerer SG und PSG – hinterer Seidendrüsenteil. Schwarze Linien, die mit kleinen kursiven Buchstaben b–e markiert sind, beziehen sich auf die Ganzkörperabschnitte und zeigen die ungefähre Position, an der die Drüsen in den jeweiligen transversalen Paraplastabschnitten geschnitten wurden. b–e Paraplast-Querschnitte durch den Körper des 5. Larvenstadiums, gefärbt mit Masson-Trichrom-Färbung (Sigma-Aldrich). Eingefügte Bilder zeigen eine stärkere Vergrößerung des SG-Abschnitts, auf den die Pfeile und Pfeilspitzen zeigen. b, c Schnitt durch den Körper und die vordere Seidendrüse. d Mittlere Seidendrüse. e Hintere Seidendrüse. Die Pfeilspitzen zeigen den Abschnitt der hinteren Seidendrüse, die Pfeile in b und c zeigen ASG und die Pfeile in d zeigen den Abschnitt des hinteren Teils der mittleren Seidendrüse. Rote und blaue Bereiche unterscheiden sich in der Struktur. Maßstabsbalken: (a) 1000 μm; (b–e) 200 μm; Einschubbilder, 20 μm.

Mittels Rasterelektronenmikroskopie wurde die äußere und innere Struktur des Kokons untersucht. Die Seidenfilamente sind relativ dünn (2,6–2,8 µm) und bilden als Produkt paariger Drüsen Dubletts. Im Gegensatz zu B. mori oder G. mellonella, bei denen die Seidenfilamente ein dichtes Netzwerk mit einer großen Menge an Leimmaterial bilden, das die Innenfläche des Kokons bedeckt, hat die Seide von Y. cagnagella einen eher gitterartigen Charakter, der gelegentlich durch Verbindungen verbunden ist ein Klebebüschel (Abb. 2a–d). Der relativ geringe Klebstoffgehalt ist auch in mit Toluidinblau gefärbten und lichtmikroskopisch untersuchten Querschnitten erkennbar (Abb. 2e, f). Anhand der unterschiedlichen Färbungsintensität kann man zwischen dem dunklen Fibroinkern und der hellen Sericinhülle unterscheiden. Zum Vergleich zeigt Abb. 2f auch einen Schnitt durch einen Kokon der Wachsmotte (G. mellonella), der einen hohen Anteil an Sericinen enthält. Außerdem sind die Seidenfasern von Y. cagnagella im Vergleich zu G. mellonella deutlich dünner, obwohl die Larven eine ziemlich ähnliche Größe haben (Abb. 2e, f).

a, b Rasterelektronenmikroskopie unterschiedlicher Vergrößerung der Außenseite des Y. cagnagella-Kokons. c, d Bilder der Innenseite des Y. cagnagella-Kokons. e, f Vergleich der Seiden von Y. cagnagella und G. mellonella. Halbdünne Kokonschnitte von Y. cagnagella (e) und G. mellonella (f), gefärbt mit Toluidinblau. Beachten Sie die unterschiedliche Faserdicke und den Anteil an leimartigem Material (hellviolett). Maßstabsbalken: 10 μm.

Spuren: SG YC – Seidendrüsen von Y. cagnagella, die sich im letzten Larvenstadium spinnt; CA YC – Kadaver (abgetragenes SG) von Y. cagnagella, PU YC – Puppe von Y. cagnagella, SG YE – Seidendrüsen von Y. evonymella, die sich im letzten Larvenstadium spinnt; CA YE-Y. Evonymella-Kadaver ohne SG. Die Gesamt-RNA (5 μg) wurde auf einem Agarosegel mittels Elektrophorese aufgetrennt, auf eine Nylonmembran geblottet und mit [32P]-markierten cDNA-Fragmenten der angegebenen Y. cagnagella-Gene sondiert. Die Größe der erkannten Transkripte wird angezeigt. Die Gennamen sind in Tabelle 2 aufgeführt.

Um Kandidatengene zu identifizieren, die für Seidenproteine ​​kodieren, haben wir ein Seidendrüsen-spezifisches Transkriptom erstellt. Insgesamt wurden 7,85 Millionen Paired-End-Reads erhalten und nach der Reinigung zum Zusammensetzen des Transkriptoms verwendet. Die Transkriptomassemblierung wurde im Dryad-Repository abgelegt (https://doi.org/10.5061/dryad.4j0zpc8d3). Insgesamt wurden 1155 (84,4 %) der 1367 BUSCOs in der Versammlung identifiziert. 1045 (76,4 %) davon lagen als Einzelexemplare vor, während 110 (8,0 %) als Mehrfachexemplare in der Gesamtheit existierten. 66 BUSCOs (4,8 %) wurden in fragmentierter Form gefunden, während 146 BUSCOs fehlten (10,8 %). Wir kamen zu dem Schluss, dass die 146 fehlenden BUSCOs wahrscheinlich das Ergebnis einer hohen SG-Spezialisierung für die Seidenproduktion sind. In der Anordnung wurden 26.054 offene Leserahmen (ORFs) gefunden. Innerhalb dieser ORFs wurden 987 Signalpeptide identifiziert. Mehrere sehr häufig vorkommende Transkripte zeigten Homologie zu den bekannten Seidenproteinen von B. mori, einschließlich der schweren Fibroinkette H-Fib, L-Fib, Fhx und den Seroinen 1, 2 und 3.

Um den gesamten Satz an Seidenbestandteilen zu identifizieren, analysierten wir die Kokonproteine ​​mittels Massenspektrometrie (MS). Die Seidenproteine ​​wurden durch Kartierung tryptischer Peptide identifiziert. Wir haben mehr als 500 Peptide entdeckt, die 120 Proteinen zugeordnet wurden. Einigen der nachgewiesenen Proteine ​​fehlte das Signalpeptid und es handelte sich hauptsächlich um Enzyme und Haushaltsproteine. Insgesamt enthielten die 79 entdeckten Proteine ​​mutmaßliche Signalpeptide. Einige von ihnen hatten enge Homologe in anderen Arten, die nicht mit Seide assoziiert waren und von der weiteren Analyse ausgeschlossen wurden. Da wir davon ausgehen, dass die Strukturproteine ​​der Seide sehr häufig vorkommen, haben wir mehrere Kandidaten ausgeschlossen, die unterrepräsentiert waren. Die verbleibenden 30 Kandidatentranskripte wurden für die weitere Analyse verwendet.

Um die Seidenproteine ​​von Y. evonymella zu identifizieren, führten wir eine proteomische Analyse der Kokonseide durch, wie für Y. cagnagella beschrieben, und entdeckten 130 Proteine, von denen 39 Signalpeptide enthielten. Der Vergleich mit den Y. cagnagella-Daten ergab einen sehr ähnlichen Satz an Proteinen wie in der vorherigen Analyse sowie drei zusätzliche Proteine. Diese Proteine ​​wurden in der Proteomanalyse in Y. cagnagella nicht nachgewiesen. Allerdings waren homologe Sequenzen, die diese Proteine ​​codieren, in der transkriptomischen Datenbank des Hermelinspinners vorhanden und in Tabelle 2 aufgeführt.

Die mutmaßlichen sekretorischen Proteine, die in Kokonseide nachgewiesen wurden, könnten immer noch unspezifische Komponenten enthalten, die außerhalb von SG produziert werden (z. B. aus dem Verdauungstrakt abgelagertes Material) oder Proteine, die in verschiedenen anderen Geweben in höheren Konzentrationen produziert werden. Da die gewebespezifische Expression der homologen Proteine ​​H-Fib und Fhx (P25) bereits bei anderen Mottenarten eingehend untersucht wurde, haben wir uns auf andere Kandidaten konzentriert. Zunächst untersuchten wir 11 Kandidatengenprodukte mittels Northern Blot.

Um die Größe der homologen Transkripte zu vergleichen und die evolutionäre Konservierung der untersuchten Gene zu überprüfen, haben wir auch RNA aus dem verwandten Y. evonymella als Kontrolle einbezogen. Wir haben markierte Sonden von Y. cagnagella-cDNAs mithilfe von RT-PCR mit den in Tabelle S1 aufgeführten Primern hergestellt. Die Signale in Y. cagnagella waren fast so stark wie die von Y. evonymella, was auf eine hohe Ähnlichkeit der untersuchten Sequenzen zwischen den beiden Arten hinweist (Abb. 3). Die Größe von Ser1 und Ser2 ist bei beiden Arten ähnlich, wohingegen Muc1 und Ser4 bei Y. evonymella kleiner waren. Das Ser3-Signal war in Y. cagnagella schwächer, was auf eine geringere Expression hindeutet. Im Gegensatz dazu zeigte Fibrillin1-like (FB1L) eine geringere Intensität in Y. evonymella, was möglicherweise mit einem geringeren Expressionsniveau oder einer geringeren Sequenzdiversifizierung zwischen Y. cagnagella und Y. evonymella zusammenhängt.

Zusätzlich zu den Northern Blots verglichen wir die Expression von insgesamt 17 Kandidatengenen in SGs, Därmen, Fettkörpern und Integumenten mittels Echtzeit-PCR (Abb. 4). Northern-Analyse und qPCR-Ergebnisse bestätigten die SG-Spezifität von 21 Genen, darunter Fhx (P-25), das kleine SG-Peptid 1 und Gene, die für verschiedene Enzyme wie Proteinase, Sulfatase und Peroxidase kodieren. Im Gegensatz dazu waren Antichymotrypsin1 (ACHP1), Trypsin-ähnliches A (TRPLa), Fibrillin2-ähnliches (FB2L), Armreifen und Perlen (BNB) und Agrin-ähnliches (AGRL) nicht spezifisch für Seidendrüsen. Unsere endgültige Liste umfasst auch die bekannten Seidenbestandteile H-Fib und Seroine, sodass sich die endgültige Anzahl der Seidenbestandteile auf 25 beläuft (Tabelle 2).

(Seidendrüsen – blau, Darm – orange, Fettkörper – gelb und Hautdecke – grün) unter Verwendung von qPCR (n = 3, Mittelwert ± Standardabweichung). Die mRNA-Expressionsniveaus dieser Gene wurden mit einem externen Kontrollgen (Elongationsfaktor 1-α) normalisiert und mit einer relativen 2-ΔCt-Quantifizierung berechnet. Die vollständigen Gennamen sind in Tabelle 2 aufgeführt.

Schließlich haben wir die evolutionäre Divergenz und Ähnlichkeit zwischen DNA- und Aminosäuresequenzen abgeschätzt, indem wir die Homologen von acht Proteinen und ihren cDNAs verglichen, die in den Seiden von Y. cagnagella und Y. evonymella nachgewiesen wurden. Eine Zusammenfassung ist in Tabelle S5 enthalten und zeigt eine Identität von 96–99 % zwischen den Sequenzen der beiden Arten. Dies stützt die Idee, dass einzelne Seidenbestandteile anhand von Ähnlichkeiten leicht zwischen den beiden Arten derselben Gattung identifiziert werden können. Interessanterweise wiesen alle vier Sequenzen, die strukturelle Seidenkomponenten kodierten, tendenziell einen größeren genetischen Abstand zu ihren Gegenstücken aus Tineola bisselliella auf als vier als Kontrollen verwendete Stoffwechselgene (Tabelle S5).

Die resultierende Anzahl an Transkripten, die die wichtigsten Seidenkomponenten in Y. cagnagella kodieren, scheint der von G. mellonella oder T. bisselliella ähnlich zu sein7,16. Um mehr über die Struktur dieser Gene und ihre Beziehung zu den Seidengenen anderer Mottenarten zu erfahren, haben wir ihre Exon-Intron-Organisation und vollständige Sequenzen, einschließlich UTRs, bestimmt, indem wir das CDS auf der Genomsequenz platziert haben.

Wie in Tabelle 2 gezeigt, haben wir die vollständigen Sequenzen von 25 Genen identifiziert, die für die am häufigsten vorkommenden Seidenkomponenten von Y. cagnagella kodieren, einschließlich Fibroin-schwere Kette, Fibroin-leichte Kette, P25/Fhx, vier oder fünf mutmaßliche Sericine, drei Seroine, vier Zonadhesin-ähnliche Proteine, zwei Mucine und mehrere andere Proteine, einschließlich Sulfatase (SLP), Peroxidase (PXD), Serinprotease-ähnliches (SPL), Dentin-ähnliches Protein (DTL), Cytochrom-b5-ähnliches Protein (CB5L), Phosphatidylethanolamin- Bindungsproteinhomolog (PEBP) und Fibrillin1-ähnlich (FB1L). Ihre kommentierten Sequenzen wurden in der GenBank hinterlegt und schematische Zeichnungen der Strukturen jedes Gens sind in Abb. S4 dargestellt. Drei weitere seidenassoziierte Sequenzen von Y. cagnagella wurden basierend auf der Homologie zu Y. evonymella nachgewiesen, darunter Gift-Serin-Protease 34-like, Trypsin-like-Proteinase T2a, Antichymotrypsin-1-like b und Antichymotrypsin-2-like. Zwei davon sind möglicherweise nicht seidedrüsenspezifisch, da Antichymotrypsin 2-like (ACHP2) und Trypsin-like b (TRPLb) sehr enge Orthologe der Y. cagnagella-Gene sind, die oben durch PCR als nicht seidenspezifisch untersucht wurden.

H-Fib kodiert das größte Seidenprotein von 486 kDa, das durch einen hohen Glycin- und Alaningehalt (29,4 bzw. 26 %) gekennzeichnet ist. Das Gen besteht aus zwei Exons und einem Intron. Das erste Exon ist sehr kurz und kodiert 10 N-terminale Aminosäurereste des Signalpeptids. Das zweite Exon ist sehr groß und sein ORF kodiert 5753 Aminosäurereste. Das Intron ist 340 bp lang. Der zentrale Teil des H-Fib-Moleküls besteht aus einer unvollständigen repetitiven Sequenz, die 27–31 aa lange Wiederholungsmotive kodiert. Diese Motive enthalten eine SSAAA-Sequenz, die an die Fibroinwiederholungen von G. mellonella oder Antheraea yamamai erinnert, die die kristallinen Regionen bilden, die für die Faserfestigkeit verantwortlich sind (Abb. S5).

Es gibt mindestens vier Haupt-Sericin-Gene, die große hydrophile Proteine ​​kodieren, die auf der Oberfläche der Seidenfaser lokalisiert sind. Sie zeichnen sich durch einen hohen Gehalt an Serinresten und repetitiven Sequenzen aus. Sericin2 (Ser2) und Sericin3 (Ser3) enthalten den höchsten Anteil an Serinresten und haben eine gemeinsame Organisationsstruktur mit drei Exons und zwei Introns. Darüber hinaus befindet sich das Gen für Ser2 in der Nähe von Ser3, was darauf hindeutet, dass sie von einem einzelnen Vorläufergen abgeleitet sind. Darüber hinaus enthält Sericin 1 eine Sequenz, die ein charakteristisches CVCY-Motiv kodiert, das 17 Aminosäurereste vom C-Terminus entfernt liegt. Ein ähnliches Motiv findet sich auch in den Sericin-1-Homologen von B. mori, A. yamamai oder G. mellonella (Abb. S6)16,34.

Wir fanden auch mehrere andere mögliche strukturelle Seidenkomponenten, die unvollständige repetitive Motive enthalten, darunter zwei mutmaßliche Homologe von Mucinen, vier Zonadhesin-ähnliche Proteine, ein Fibrillin-1-ähnliches (FB1L) und ein Dentin-ähnliches Protein (DTL), siehe Tabelle 2. Mucin1 (Muc1) ist das zweitgrößte Seidenprotein und enthält 22 % Serinreste. Die für Muc1 und Mucin2 (Muc2) kodierenden Gene scheinen eine große Anzahl von Exons zu enthalten (32 bzw. 24; Abb. S4).

Wir fanden drei Seroin-Gene, die in einem engen Cluster in einem einzigen genomischen Contig (contig_36475) angeordnet waren. Wir haben auch B. mori-Homologe für Giftallergen-ähnliche (VAL) und mehrere Enzyme entdeckt, deren Rolle in Seide unklar ist. Schließlich bestätigten wir die Gewebespezifität der Expression des kurzen SG-Peptids 1 (SSP1) mit unbekannter Funktion, das eine Kette von Glutaminresten enthält (Tabelle 2).

Zum Zweck einer umfassenden Seidenanalyse haben wir den Entwurf des Genoms und Transkriptoms des Hermelinspinners Y. cagnagella, einem Vertreter der frühen divergierenden Familie der ditrysischen Schmetterlinge, sequenziert und zusammengestellt. Mithilfe eines kostengünstigen Ansatzes, der Oxford Nanopore- und Illumina-Reads mit geringer Abdeckung kombiniert, haben wir einen Entwurf einer Genomsequenz erhalten, der es uns ermöglichte, die Exon-Intron-Architektur in voller Länge von 25 Genen zu identifizieren, die für Seide dieser Art kodieren.

Die mittels Durchflusszytometrie gemessene Genomgröße (710 MB) unterschied sich von der k-mer-Umfrageschätzung (508 MB), letzterer Ansatz wurde jedoch möglicherweise durch die Datenqualität oder die Sequenzierungstiefe beeinflusst35. Daher gehen wir davon aus, dass die Ergebnisse der Durchflusszytometrie genauer sind. Beide Messungen deuten jedoch darauf hin, dass die Genomgröße von Y. cagnagella größer als der Durchschnitt (1C = 430 MB) oder die für Lepidoptera vorgeschlagene Vorfahrengröße (1C = 489 MB) ist36. Dieser hohe Wert kann durch die Erweiterung der Wiederholungen erklärt werden, da fast die Hälfte der Anordnung als repetitive Elemente annotiert wurde, und/oder durch die große Introngröße, wie von Chen et al.37 im Webwurm Hyphantria cunea vorgeschlagen. Die Länge der primären Genomassemblierung betrug 978,3 MB, was deutlich größer als die erwartete Genomgröße war und wahrscheinlich das Ergebnis der Beibehaltung des Haplotyps war, die durch hohe Heterozygotiegrade verursacht wurde, die in der Probe durch k-mer-Analyse festgestellt wurden. Nach der Deduplizierung betrug die endgültige Assemblierungslänge von 626,3 MB fast 90 % der erwarteten Genomgröße und enthielt 96,9 % BUSCO-Orthologe. Ungefähr 30.000 Protein-kodierende Genmodelle wurden in der Anordnung vorhergesagt, vergleichbar mit dem Bereich, der in anderen Schmetterlingsanordnungen gefunden wird. Die durchschnittliche Genlänge betrug 8,3 kB, wie für die Genomgröße von Y. cagnagella erwartet. Die durchschnittliche Anzahl von 5,9 Exons pro Genmodell war ähnlich wie 6,0 bzw. 6,1 Exons in Plutella xylostella39 und Bombyx mori40. Im endgültigen Gensatz waren 93,5 % BUSCO-Orthologe vorhanden. Insgesamt ist die Qualität des erhaltenen Genoms von Hermelinmotten vergleichbar mit anderen Nicht-Modell-Lepidoptera-Anordnungen ohne höheres Gerüst41,42 und stellt eine wertvolle Ressource für Genomanalysen dar, selbst für Studien großer Gene mit repetitiven Domänen wie Fibroinen, die oft eine große Bedeutung haben Herausforderung.

Wie oben erwähnt, enthält Seide zwei Kernfilamente, die von einer hydrophilen Beschichtung bedeckt sind, die die Filamente zu einer Faser versiegelt. In früheren Studien wurde gezeigt, dass der Seidenkern H-Fib, L-Fib und Fhx enthält, die in PSG43,44,45 hergestellt und zusammengesetzt sind. Der Dreikomponentenkomplex aus Seidenfibroinen ist bei den meisten Schmetterlingen erhalten46,47,48.

H-Fib ist das wichtigste Strukturmodul des Fibroinkerns. Es wird von einem großen Einzelkopie-Gen kodiert, das konservierte Sequenzen an beiden Enden und einen Bereich wiederholter Sequenzen im zentralen Teil des Moleküls enthält, die sehr artspezifisch sind und Strukturkomponenten kodieren, die als kristalline Blöcke bezeichnet werden und durch amorphe Regionen getrennt sind (Abb. S5). ). Diese Blöcke sind im Allgemeinen für die Zugfestigkeit von Seidenfasern verantwortlich und bestehen hauptsächlich aus den Aminosäureresten Glycin, Alanin und Serin49. Benachbarte Ketten von Kristalldomänen werden durch starke Wasserstoffbrückenbindungen in einer antiparallelen Anordnung zusammengehalten und bilden β-Faltblätter50. Verschiedene Lepidopterenseiden können anhand des Abstands zwischen den β-Faltblättern in drei Hauptkategorien eingeteilt werden, die von der Anordnung der drei Hauptaminosäurereste abhängen. Klasse-I-Wiederholungen bestehen aus alternierenden Aminosäuren Gly und Ala, Klasse-II-Wiederholungen bestehen aus ((Gly-Ala)x-Ala)n und Klasse-III-Wiederholungen bestehen überwiegend aus Ala- oder Ala- und/oder Ala-Ser-Ketten46,47,48 ,49,51 (Abb. S5). Die zentrale Region der H-Fib von Y. cagnagella enthält SSAAA-Sequenzmotive, die denen der H-Fib von A. yamamai oder G. mellonella ähneln, und die H-Fib aller drei Arten gehören zur Röntgenklasse III49 ,52 (Abb. S5).

Konservierte Sequenzen an beiden Enden von H-Fib (Abb. S7 und S8) sind wahrscheinlich an Wechselwirkungen mit L-Fib- und Fhx-Proteinen beteiligt53. Es wurde gezeigt, dass das B. mori-Ortholog von L-Fib über eine Disulfidbindung an den C-Terminus von H-Fib bindet und dieser Komplex für den Fibrointransport aus dem endoplasmatischen Retikulum erforderlich ist54. Sowohl L-Fib als auch Fhx enthalten keine repetitiven Sequenzen (Abb. S9 und S10). Es wurde berichtet, dass L-Fib in Seide fast aller Lepidoptera (mit Ausnahme von Motten der Familie Saturniidae, bei denen es verloren ging) sowie in Köcherfliegenarten vorkommt46,55. Y. cagnagella L-Fib wird von einem Einzelkopie-Gen kodiert und das Protein zeigt 47 % Identität mit L-Fib von T. bisselliella und 39 % Identität mit B. mori (Anordnung mehrerer L-Fib-Proteinsequenzen aus verschiedenen Schmetterlingsarten). und eine Köcherfliege ist in Abb. S9 dargestellt.

Y. cagnagella Fhx zeigt 62 % Identität mit Fhx von T. bisselliella und 39 % mit B. mori (die Ausrichtung mehrerer Fhx-Gene aus verschiedenen Schmetterlingsarten ist in Abb. S10 dargestellt). Es wurde bereits früher berichtet, dass das B. mori-Ortholog von Fhx nichtkovalent an den N-terminalen Teil von H-Fib bindet und an dessen Transport aus dem endoplasmatischen Retikulum sowie an der Aufrechterhaltung der Löslichkeit sekretorischer Fibroinkörnchen im Lumen von SG56 beteiligt ist . In Pseudoips prasinana gibt es 6 Paraloge des Fhx-Gens, während Fhx-Orthologe in P. californicus und bei Mitgliedern der Saturniidae-Familie zu fehlen scheinen33,46. Zusätzlich zu den echten Fhx-Proteinen besitzen die meisten Motten auch entfernt verwandte Fhx-ähnliche Proteine ​​mit unbekannter Funktion, die eine separate Unterfamilie bilden5, z. B. zwei davon in T. bisselliella, acht in P. prasinana und sechs in B. mori5. Interessanterweise haben wir in Y. cagnagella kein Homolog eines solchen Fhx-ähnlichen Gens gefunden.

Seidenhüllenproteine, die in MSG produziert werden, werden hauptsächlich durch Sericine und Mucine repräsentiert. Sie durchlaufen noch tiefgreifendere evolutionäre Veränderungen als die Fibroin-Untereinheiten, einschließlich häufiger Genduplikationen und -verluste. Die genomischen Strukturen der Mucine und Sericine von Y. cagnagella legen nahe, dass sie unterschiedliche Strategien zur Kodierung repetitiver Regionen verwenden. Abb. S6 zeigt ein Beispiel für die enorme Divergenz des mutmaßlichen Ser1-Proteins, das am CXCY-Motiv nahe seinem C-Terminus zu erkennen ist (Abb. S6). In ähnlicher Weise enthalten Mitglieder der Mucin-1-ähnlichen Familie das Drei-Cystein-Motiv CXCYCZ (Abb. S11). Während Sericin-Wiederholungen in großen Exons in Tandems angeordnet sind, neigt Mucin 1 interessanterweise dazu, ganze Exons zu duplizieren (Abb. S4). Die in Abb. S6 und S11 gezeigten Alignments von Sericin-1 und Mucin-1-ähnlichen Proteinen zeigen Konsenssequenzen, die den Nachweis von Orthologen in anderen ditrysischen Schmetterlingen ermöglichen könnten. Die genaue Ausrichtung anderer Sericin- und Mucin-Wiederholungen für Evolutionsstudien ist sehr schwierig und erfordert weitere Daten. Die artspezifische Verzweigung von Sericin-Proteinen (insbesondere solchen mit einem hohen Prozentsatz an Serinresten) in zuvor berichteten Kladogrammen9 legt nahe, dass es in der Evolution dieser Gene mehrere unabhängige Duplikationsereignisse gab. Solche Duplikationen wurden zuvor für Sericine in G. mellonella, A. yamamai oder Samia cynthia ricini vorgeschlagen16.

Mehrere Proteine, darunter Mucine und Zonadhesin-ähnliche Sequenzen, die im Seidenmantel von Y. cagnagella nachgewiesen wurden, weisen Homologe in den Seiden anderer Mottenarten auf und scheinen daher reguläre Bestandteile der Lepidoptera-Seide zu sein. Sowohl Mucine als auch Zonadhesin-ähnliche Proteine ​​könnten eine adhäsive Rolle spielen oder am antimikrobiellen Schutz beteiligt sein. Zonadhesin-ähnliche Proteine ​​sind durch Til- und EGF-Domänen und durch hochrepetitive Sequenzen gekennzeichnet, wobei Cystein der am häufigsten vorkommende Aminosäurerest ist und 12–14 % der gesamten Aminosäurereste ausmacht (Tabelle 2). Die Gene, die für Zonadhesin-ähnliche Proteine ​​kodieren, variieren in der Größe, sodass die größeren (Zon3) die duplizierten Produkte kürzerer Vorläuferformen (ähnlich Zon1) zu sein scheinen (Abb. S4). Mucine wurden auch in Labialdrüsen anderer Insekten gefunden und enthalten tandemartig wiederholte Sequenzen ProThrSer57.

Die Rolle weniger häufig vorkommender Proteine, die als Fibrillin-1-ähnliche, Dentin-ähnliche oder Giftallergen-ähnliche Proteine ​​bezeichnet werden, in der Seidenstruktur von Y. cagnagella ist unklar, und ihre mutmaßlichen Homologen in anderen Arten, einschließlich B. mori, waren bisher nicht bekannt mit Seide in Verbindung gebracht. Ihre Seidendrüsenspezifität, Hydrophilie und repetitiven Sequenzen verbinden sie mit anderen strukturellen Hüllproteinen. Die Funktion anderer Komponenten, darunter Cytochrom b5 (Cyt b5), Sulfatase (SLP) und Peroxidase (PXD), die Signalpeptide enthalten und in der Seide einiger anderer Motten vorkommen, muss noch geklärt werden. Wir benötigen Daten von weiteren Schmetterlingsarten, um festzustellen, ob sie ein primitives Merkmal, eine spezifische Anpassung der Überfamilie Yponomeutoidea oder reguläre Seidenbestandteile darstellen.

Nicht alle in Kokons nachgewiesenen Proteine ​​sind strukturelle Seidenbestandteile, die von SG produziert werden. Seide kann auch Proteine ​​aus dem Verdauungstrakt oder Haushaltsproteine ​​von SG-Zellen enthalten, die durch apokrine Sekretion in das Lumen gelangen, ähnlich wie die Speicheldrüsen von Drosophila melanogaster58. Eine weitere Analyse der Kandidatengenprodukte für die SG-spezifische Expression durch qPCR und/oder Northern Blot ist erforderlich. In dieser Studie haben wir 6 Kandidatenproteine ​​aus 31 sekretorischen Proteinen eliminiert, die durch Proteomik als unspezifisch für Seidendrüsen nachgewiesen wurden. Bei einem ähnlichen Ansatz erwies sich bei T. bisseliella, dass bis zu 50 % der im Kokon nachgewiesenen sekretorischen Proteine ​​unspezifisch waren7.

Weitere Informationen über Seiden, die von Vertretern wichtiger evolutionärer Lepidoptera-Kladen hergestellt wurden, werden es uns ermöglichen, unser Wissen über die Seidenstruktur, unsere Suche nach neuen Biomaterialien und genauere Genanmerkungen in zukünftigen Sequenzierungsprojekten zu verbessern. Insgesamt haben wir das Genom von Y. cagnagella sequenziert und zusammengesetzt und die Ergebnisse mit transkriptomischen und proteomischen Analysen kombiniert, um alle wichtigen Gene zu identifizieren, die für Seidenkomponenten kodieren. Zusätzlich zu den Omics-Analysen haben wir Informationen über die Seide einer verwandten Art, Y. evonymella, gleichzeitig analysiert, was es uns ermöglichte, die Ergebnisse durch Homologiesuchen zu ergänzen. Dies führte zur Identifizierung von drei weiteren Genen. Wir bieten eine detaillierte Annotation der 25 wichtigsten Seidenstrukturgene, einschließlich ihrer vollständigen Sequenzen und Exon-Intron-Strukturen. Omics-Methoden ermöglichen detaillierte Vergleiche der Seide verschiedener Motten, um nach den evolutionären Ursprüngen und funktionellen Anpassungen einzelner Seidenbestandteile zu suchen. Diese Studie füllt eine wichtige Lücke in unserem wachsenden Verständnis der Struktur, Evolution und Funktion von Seidengenen und legt den Grundstein für zukünftige detaillierte Vergleichsstudien.

Für die Durchflusszytometrie verwendeten wir Männchen der Gattung Yponomeuta cagnagella (Hübner, 1813) aus der Massenaufzucht im Labor, die mit in Levin (Tschechische Republik) gesammelten Larven begann. Für die Sequenzierung und proteomische Analyse wurden Y. cagnagella-Eierchargen in Watergraafsmeer (Amsterdam, Niederlande) gesammelt. Die geschlüpften Larven wurden bis zur Verpuppung auf Zweigen ihrer Nahrungspflanze Euonymus europaeus (Linnaeus, 1753) aufgezogen. Die Puppen wurden anhand ihrer Morphologie geschlechtlich untersucht, in flüssigem Stickstoff eingefroren und zur DNA-Extraktion bei –80 °C gelagert. Yponomeuta evonymella (Linnaeus, 1758) Larven wurden in Amsterdam (Niederlande) und Vrabce (Tschechische Republik) gesammelt. Erwachsene der mediterranen Mehlmotte Ephestia kuehniella (Zeller, 1879; Lepidoptera, Pyralidae) wurden aus dem Labor-Wildtyp-Stamm WT-C59 gewonnen. Larven der Wachsmotte Galleria mellonella (Linnaeus, 1758; Lepidoptera, Pyralidae) stammten aus einem Laborstamm, der ursprünglich aus in Ceske Budejovice (Tschechische Republik) gefundenen Exemplaren etabliert wurde.

Wholemount-Präparation des SG: Die SGs wurden zerlegt und auf einen Tropfen phosphatgepufferter Lösung auf einem Objektträger übertragen, mit einem Deckglas abgedeckt und unter dem Olympus BX63-Mikroskop (Olympus, Hamburg, Deutschland) abgebildet, das mit einer CCD-Kamera (Olympus DP74) ausgestattet war. . Das endgültige Foto wurde durch Zusammenfügen mehrerer Einzelbilder, die die Projektion mehrerer Z-Stapelbilder darstellen, mithilfe der CellSens-Software (Olympus) rekonstruiert.

Paraplast-Schnitt von Larven im 5. Larvenstadium: Die Kutikula wasseranästhesierter Larven wurde unter dem Fixiermittel auf Basis von gesättigter Pikrinsäure, 3,6 % Formaldehyd und 2,3 % Kupferacetat, ergänzt mit Quecksilberchlorid (Bouin-Hollande-Lösung), durchstochen60. Nach einer Stunde Fixierung wurden die Larven in drei Teile geschnitten und anschließend über Nacht bei 4 °C fixiert. Für die Gewebetrocknung, die Einbettung in Paraplast, das Schneiden bei 7–10 μm, die Entparaffinierung und die Rehydrierung wurden Standardtechniken verwendet. Die Schnitte wurden mit Lugol-Jod und anschließend mit einer 7,5 %igen Natriumthiosulfatlösung behandelt, um restliche Schwermetallionen zu entfernen, und dann in destilliertem Wasser gewaschen. Die Färbung wurde mit dem HT15 Trichrome Stain (Masson) Kit (Sigma-Aldrich, Burlington, USA) gemäß dem Protokoll des Herstellers durchgeführt. Die gefärbten Schnitte wurden dehydriert und in DPX-Eindeckmedium (Fluka, Buchs, Schweiz) eingehängt. Hochauflösende Bilder wurden durch Zusammenfügen mehrerer Bilder mit einem BX63-Mikroskop, einer DP74-CMOS-Kamera und der CellSens-Software (Olympus) aufgenommen.

Halbdünne Schnitte von Kokons: In Harz (Epon) eingebettete Teile von Kokons wurden mit einem Glasmesser geschnitten und mit Toluidinblau angefärbt. Die Proben wurden unter dem BX51-Mikroskop BX51 (Olympus, Hamburg, Deutschland) betrachtet und abgebildet, das mit der DP74 CMOS-Kamera (Olympus, Hamburg, Deutschland) ausgestattet war.

Seiden-Ultrastruktur: Kokonstücke wurden auf Aluminiumhalter geklebt, mit Gold sputterbeschichtet und mit einem Rasterelektronenmikroskop Jeol JSM-7401F (Jeol, Akishima, Japan) analysiert.

Die Größe des männlichen Genoms von Y. cagnagella wurde anhand von Gehirngewebe durch Durchflusszytometrie nach61 bestimmt, wobei E. kuehniella-Männchen als interner Standard verwendet wurden (1C = 440 Mbp;62). Kurz gesagt, ein frischer Kopf von Y. cagnagella männlich wurde zusammen mit einem Kopf von E. kuehniella Standard mit einer Rasierklinge in 500 μl Kernisolationspuffer (0,1 M Tris-HCl pH 7,5, 2 mM MgCl2, 1 % Triton X-) gehackt. 100;62. Die Suspension wurde filtriert und 500 µl Kernisolationspuffer hinzugefügt. Die Proben wurden 20 Minuten lang mit Propidiumiodid (50 µg/ml) gefärbt und mit einem Sysmex CyFlow Space-Durchflusszytometer (Sysmex Partec, Münster, Deutschland) analysiert. ausgestattet mit einem 100 mW 532 nm (grün) Festkörperlaser. Fluoreszenzintensität und seitliches Streulicht (SSC) von mindestens 8.000 Kernen wurden mit der FlowJo 10-Software (TreeStar, Inc., Ashland, OR, USA) aufgezeichnet und analysiert. Mittelwert, Variationskoeffizient und Anzahl der analysierten Kerne wurden für 2C-Peaks sowohl der Probe als auch des Standards aufgezeichnet und das Standard/Probe-Verhältnis der mittleren Fluoreszenz berechnet.

Genomische DNA für den Genomzusammenbau und die Illumina-Sequenzierung wurde durch CTAB-Extraktion aus einer einzelnen männlichen Puppe extrahiert63. DNA mit hohem Molekulargewicht für die Nanoporensequenzierung wurde aus drei männlichen Puppen mit dem MagAttract HMW DNA Kit (Qiagen, Hilden, Deutschland) gemäß den Anweisungen des Herstellers extrahiert.

Zur Analyse seidenbezogener Gene wurde Gesamt-RNA aus Seidendrüsen im letzten Larvenstadium unter Verwendung von TRIzol-Reagenz (Invitrogen, Carlsbad, CA) isoliert, gefolgt von der Isolierung von mRNA unter Verwendung des Dynabeads Oligo (dT)25 mRNA Purification Kit (Thermo Fisher Scientific, Waltham). , USA) und cDNA wurde mit dem NEXTflex Rapid RNA-Seq Kit (Bioo Scientific, Austin, USA) hergestellt. Um das Genom zu annotieren, wurde außerdem RNA aus Köpfen, Thorax und Gonaden von drei männlichen und weiblichen Imagos mit TRI-Reagenz (Sigma-Aldrich) gemäß dem bereitgestellten Protokoll extrahiert. Biologische Replikate wurden vor der Isolierung gepoolt, was zu drei gewebespezifischen Proben pro Geschlecht führte.

Um das Genom von Y. cagnagella zusammenzusetzen, wurden Oxford Nanopore Reads auf der Nanopore PromethION-Plattform von Novogene (HK) Co, Ltd. (Hongkong, China) sequenziert. Darüber hinaus wurde eine Illumina-Bibliothek mit einer Insertgröße von 700 bp von der Genomics Core Facility des European Molecular Biology Laboratory (Heidelberg, Deutschland) auf dem Illumina HiSeq 2500 mit 250 bp Paired-End-Reads erstellt und sequenziert. Die Rohdaten wurden im NCBI unter den SRA-Zugangsnummern SRR15714088 und SRR15714089 hinterlegt.

Zunächst wurden Adaptersequenzen und Basen geringer Qualität mit Trimmomatic (Version 0.36;64) mit den folgenden Parametern aus den Illumina-Daten herausgefiltert: „ILLUMINACLIP: /PATH/TruSeq3-PE-2.fa:2:30:10:1: true SLIDINGWINDOW:4:20 MINLEN:100“ und die Qualität der Lesevorgänge wurde mit FastQC (Version 0.11.5;65) überprüft. Genomgröße und Heterozygotie wurden anhand der gefilterten Daten mit GenomeScope (Version 1.0; 35) geschätzt. K-mere der Länge 31 wurden von Quallen gezählt (Version 2.3.0;66).

Nanopore-Reads, die kürzer als 500 bp sind und einen Qualitätsfaktor von weniger als 7 haben, wurden mit NanoFilt (Version 2.7.1;67) aus dem Datensatz entfernt und die Reads wurden mit NanoPlot (Version 1.33.1;59) visualisiert. Als nächstes wurde der FM-index Long Read Corrector (FMLRC Version 1.0.0;41) mit Standardeinstellungen verwendet, um die langen Lesevorgänge mithilfe der gefilterten Illumina-Sequenzen zu korrigieren. Wie empfohlen wurden Ropebwt268 und fmlrc-convert verwendet, um die für die FMLRC-Pipeline erforderliche BWT-Datenstruktur mit mehreren Zeichenfolgen zu erstellen. Die vorverarbeiteten langen Lesevorgänge wurden dann mit Flye (Version 2.8;69) zusammengestellt, wobei die Einstellungen an die korrigierte Eingabe, die Genomgröße von Y. cagnagella und drei Polieriterationen angepasst wurden („--nano-corr --genome-size 750 m --iterations 3“ ).

Um die haplotypischen Duplikationen aus der Primärbaugruppe zu entfernen, wurde die Pipeline „purge_dups“ (Version 1.0.1; 70) angewendet und anschließend mit POLCA (MaSuRCA Version 3.4.2; 42) poliert. Die Qualitätsbewertung des Entwurfsgenoms wurde mit QUAST (Version 4.6.371, BUSCO-Toolsuite (Version 5.2.2, der Datensatz für die Insecta-Linie;72) durchgeführt und das endgültige Genom wurde auf Kontamination mit Kraken 2 (Version 1.0;40) überprüft ).

Die Wiederholungszusammensetzung und der durchschnittliche GC-Gehalt wurden mit den Softwarepaketen RepeatModeler (Version 1.0 (Ref. 39, 2008–2015) und RepeatMasker (Version 4.039) analysiert. Um eine genauere Maskierung zu erreichen, wurden Hauptsatelliten (Tab S3) mit TAREAN (Version 0.3) identifiziert .8-451;73) aus Illumina-Daten, die auf eine 0,25-fache Genomabdeckung unterabgetastet wurden. Eine benutzerdefinierte Wiederholungsbibliothek, die aus der Genomsequenz mit RepeatModeler mit zusätzlichen Satellitendimeren erstellt wurde, wurde in der RepeatMasker-Pipeline verwendet, um die Landschaft sich wiederholender Elemente zu untersuchen und eine maskierte Version des Y zu generieren . Cagnagella-Montage.

Für die Annotation des Genoms wurden alle RNA-seq-Daten (SRA-Zugangsnummern SRX17830525-SRX17830530) in einem einzigen Datensatz verkettet, einschließlich der Seidendrüsen-RNA-seq (siehe unten). Die Qualität der Sequenzierung wurde mit FastQC (Version 0.11.5;65) überprüft. Die resultierenden 2,87 GB an Daten wurden mithilfe von STAR (Version 2.7.7a;74) mit der maskierten Genomassemblierung abgeglichen. Der Genomindex wurde mit dem folgenden Parameter generiert, der auf die Größe des Y. cagnagella-Genoms verkleinert wurde: „--genomeSAindexNbases 13“. Gene wurden mit BRAKER (Version 2.1.5; 75) vorhergesagt und mit BLASTp mit der NCBI RefSeq-Proteindatenbank für Wirbellose76 annotiert, alle implementiert in der GenSAS-Plattform (Version 6.0; 77). Die Vollständigkeit des Gensatzes wurde von BUSCO (Version 5.2.2;72) mit dem Datensatz „insekta_odb10“ bewertet und beschreibende Zusammenfassungen wurden mit dem Skript „gff3_stats.py“ aus der GenomeGC78-Suite berechnet.

Schließlich wurde die Qualität der Anordnung von Y. cagnagella mit zusammenfassenden Statistiken anderer Schmetterlingsanordnungen verglichen, die auf Daten von Oxford Nanopore basierten, nämlich der gewölbten Hakenspitze Drepana arcuata79, der Kakaomotte Ephestia elutella80, dem Sackwurm Eumeta variegata2, dem Tabakhornwurm Manduca sexta81, dem Wiesenbrauner Maniola jurtina82, der Mittelmeer-Maiszünsler Sesamia nonagrioides83 und der Rüben-Armewurm Spodoptera exigua84, sowie mit einem Referenzgenom von Bombyx mori85 und einem Genom des nahen Verwandten P. xylostella86 (Tabelle 1).

Die RNA-Isolierung, die Synthese von cDNA-Bibliotheken und die RNA-Sequenzierung erfolgten wie zuvor beschrieben7 (siehe Abschnitt „Transkriptionsspezifität von Seidenkandidatenproteinen und Ähnlichkeit zwischen Y. cagnagella- und Y. 200 evonymella-Seidenkandidatengenen“). Die cDNA-Bibliothek wurde auf der Illumina-Plattform 2×150 bp (Paired-End-Reads) mit MiSeq sequenziert. Das Entfernen und Trimmen der Adaptersequenzen wurde mit BBDUK (BBtools-Suite) mit den folgenden Einstellungen durchgeführt: ordered = t; ktrim = r; k = 23; Nerz = 11; hdist = 1; qtrim = rl; trimq = 20; Mindestlänge = 35; TPE; tbo. Ein weiterer rRNA-Kontaminationsschritt wurde unter Verwendung von BBDUK mit der zugehörigen ribokmers.fa-Datei87 durchgeführt, um die rRNA-Kontamination aus dem mRNA-Anreicherungsschritt der Bibliotheksvorbereitung zu eliminieren. Bereinigte Lesevorgänge wurden mithilfe des multi k-mer rnaSPades-Assemblers (Version 3.13.1; 88) zu einem Transkriptom zusammengesetzt. Für die De-novo-Assemblierung wurden K-mer-Größen von 25, 35, 45, 55, 65 und 75 gewählt, um die Wahrscheinlichkeit einer maximalen Transkriptwiederherstellung zu erhöhen89. Lachs (Version 1.0.0;90) wurde verwendet, um die Häufigkeit der Transkripte zu quantifizieren. Transkripte mit einem TPM-Wert von <1 wurden als Artefakte eingestuft und daher aus der Endmontage entfernt. BUSCO (Version 5.2.2;72,91) wurde verwendet, um die Vollständigkeit der Baugruppe unter Verwendung des Insecta odb10-Datensatzes (https://busco.ezlab.org/) zu bewerten. Die zum Generieren der Assembly verwendeten Rohlesevorgänge sind über NCBI verfügbar (SRA-Zugangsnummer: SRR15714087).

Für den Sequenzvergleich verwendeten wir RNA-Sequenzierungsdaten von Y. evonymella-Larven aus dem BioProject PRJNA788289. Die rohen Illumina-Messwerte wurden gemäß Yoshido et al.92 verarbeitet und zusammengestellt.

Das Transkriptom wurde mit dem DIAMOND Protein Aligner (Version 0.9.27.128;;93) mit den neuesten Versionen NCBI Non-Redundant (nr) und Uniprot-Swissprot (abgerufen am 26.11.19) annotiert. Die BlastX-Funktion wurde mit Standardeinstellungen und einem E-Wert von 1,0 × 10-5 verwendet. Die Explosionstreffer wurden dann nach Bitscore, E-Wert und prozentualer Identität sortiert. Für jedes Transkript wurde der beste Treffer beibehalten. ORFs wurden mithilfe des Transdecoders vorhergesagt. LongOrfs-Skript von Transdecoder (Version 5.5;94). Anschließend wurden ORFs mit SignalP5.0b im Eukaryotenmodus95 nach Signalpeptiden durchsucht.

Northern Blot wurde wie zuvor beschrieben durchgeführt16. Gewebe von Y. cagnagella: Seidendrüsen, Larvenkadaver mit abgetragenen Seidendrüsen und Puppen, Y. evonymella-Seidendrüsen und Larvenkadaver wurden homogenisiert und die Gesamt-RNA wurde unter Verwendung von RNA-Blau (Top-Bio, Vestec, Tschechische Republik) isoliert. 5 μg Gesamt-RNA wurden auf einem Agarosegel aufgetrennt und auf eine Nylonmembran geblottet. Sonden wurden durch PCR hergestellt, mit [α-32P]dATP markiert und die Membranen wurden dann wie beschrieben hybridisiert und autoradiographiert16. Die Liste der Primer ist in Tabelle S1 aufgeführt.

Vier Arten von Y. cagnagella-Geweben (Seidendrüsen, Darm, Fettkörper und Haut) in drei biologischen Replikaten wurden mittels qPCR analysiert. Primer (Tabelle S2) wurden mit der Software Lasergene PrimerSelect (DNASTAR, Madison, USA) entwickelt, um die optimale Funktion zu erreichen. Das PCR-Reaktionsvolumen betrug 20 µl und es enthielt 0,1 µg verdünnte cDNA, 250 nM Primer und 4 µl der Mischung HOT FIREPol EvaGreen qPCR Mix Plus (Solis BioDyne, Tartu, Estland). Nach dem anfänglichen Denaturierungs-/Pol-Aktivierungsschritt (95 °C für 15 Min.) wurden 45 Zyklen (95 °C für 15 Sek.; an das Primerpaar angepasste Annealing-Temperatur für 30 Sek.; 72 °C für 20 Sek.) mit dem durchgeführt Instrument Rotor-Gene Q MDx 2plex HRM (Qiagen, Hilden, Deutschland). Jede Probe wurde in drei technischen Replikaten analysiert. Die Daten wurden durch die 2ΔCt-Berechnung unter Verwendung des Dehnungsfaktors 1-α als Normalisierer verarbeitet. Die statistische Signifikanz wurde durch den Kruskal-Wallis-Rangsummentest und den Wilcoxon-Rangsummentest bestimmt.

Zur Berechnung der genetischen Unterschiede zwischen Y. cagnagella und Y. evonymella verwendeten wir cDNAs, die für acht in Seide nachgewiesene Proteine ​​kodieren. Der Abgleich und die Berechnung genetischer Unterschiede (p-Abstand) wurden mit der MEGA-X-Software96 durchgeführt. Für die Analyse wurden ausschließlich kodierende Regionen ohne Lücken und Stoppcodons verwendet.

Proteinproben wurden wie zuvor beschrieben für die Massenspektrometrie vorbereitet7. Seidenkokonproben (5 mg) wurden in 8 M Harnstoff gelöst, trypsiniert und mit Trifluoressigsäure angesäuert (auf 1 % Endkonzentration). Die Peptide wurden entsalzt und mittels nanoskaliger Flüssigkeitschromatographie gekoppelt mit Tandem-Massenspektrometrie (nLC-MS/MS) analysiert. Peptide wurden mit MaxQuant-Algorithmen (Version 1.5.3.8)97 analysiert und quantifiziert. Die Falscherkennungsrate (FDR) wurde sowohl für Proteine ​​als auch für Peptide auf 1 % festgelegt. Die in MaxQuant98 integrierte Andromeda-Suchmaschine wurde zur Identifizierung von Peptiden verwendet, indem MS/MS-Spektren anhand einer Datenbank durchsucht wurden, die aus dem oben beschriebenen Transkriptom abgeleitet war.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die experimentellen Daten, die die Ergebnisse dieser Studie stützen, sind in diesem Artikel oder in den ergänzenden Materialien verfügbar. Die Rohdaten wurden im NCBI unter den Bioprojekt-Zugangsnummern PRJNA760528 und PRJNA788289 hinterlegt. Das Transkriptom und die weichmaskierte Genomassemblierung wurden im Dryad-Repository abgelegt (https://doi.org/10.5061/dryad.4j0zpc8d3). Zur Annotation des Genoms wurden alle RNA-seq-Daten (SRA-Zugangsnummern SRX17830525-SRX17830530) verkettet. Die Liste der Seidengenkandidaten mit ihren GenBank-Zugangscodes ist in Tabelle 2 aufgeführt. Die den Diagrammen in Abb. 4 zugrunde liegenden Daten sind als Ergänzungsdaten verfügbar (Tabelle S6). Unbeschnittene und unbearbeitete Blot-/Gelbilder sind als ergänzende Abbildung S12 enthalten.

Sutherland, TD, Young, JH, Weisman, S., Hayashi, CY & Merritt, DJ Insektenseide: ein Name, viele Materialien. Annu. Rev. Entomol. 55, 171–188 (2010).

Artikel CAS PubMed Google Scholar

Kono, N. et al. Das Genom des Beutelwurms weist ein einzigartiges Fibroin-Gen auf, das für eine hohe Zugfestigkeit sorgt. Komm. Biol. 2, 148 (2019).

Artikel PubMed PubMed Central Google Scholar

Kono, N. et al. Darwins Rindenspinne teilt ein Spidroin-Repertoire mit Caerostris extrusa, erreicht aber durch Genexpression eine außergewöhnliche Seidenfestigkeit. Öffnen Sie Biol. 11, 210242 (2021).

Luo, SQ, Tang, M., Frandsen, PB, Stewart, RJ & Zhou, X. Das Genom eines Unterwasserarchitekten, der Köcherfliege Stenopsyche tienmushanensis Hwang (Insecta: Trichoptera). Gigascience 7, giy143 (2018).

Rindos, M. et al. Ein Vergleich der Seiden von Pseudoips prasinana und Bombyx mori zeigt eine molekulare Konvergenz bei den schweren Fibroinketten, aber große Unterschiede bei anderen Seidenkomponenten. Int. J. Mol. Wissenschaft. 22, 8246 (2021).

Kono, N. et al. Die Mehrkomponentennatur liegt den außergewöhnlichen mechanischen Eigenschaften der Spinnen-Schleppleinenseide zugrunde. Proz. Natl Acad. Wissenschaft. USA 118, e2107065118 (2021).

Rouhova, L. et al. Seide der gemeinen Kleidermotte Tineola bisselliella, einem kosmopolitischen Schädling, der zur basalen Linie der ditrysischen Motten gehört. Insektenbiochemie. Mol. Biol. 130, 103527 (2021).

Artikel CAS PubMed Google Scholar

Frandsen, PB et al. Erforschung der Unterwasser-Seidenarchitektur von Köcherfliegenwürmern: Vergleichende Seidenanalysen über zwei Unterordnungen von Köcherfliegen. Philos. Trans. R. Soc. B 374, 20190206 (2019).

Rouhová, L. et al. Verwendung des Multi-Omics-Ansatzes zur Aufdeckung der Seidenzusammensetzung bei Plectrocnemia conspersa. Vorderseite. Mol. Biowissenschaften. 9, https://doi.org/10.3389/fmolb.2022.945239 (2022).

Sutherland, TD et al. Biokompatibilität und Immunantwort auf rekombinantes Honigbienenseidenmaterial. J. Biomed. Mater. Res A 107, 1763–1770 (2019).

CAS PubMed Google Scholar

Sutherland, TD et al. Erhaltung wesentlicher Designmerkmale in gewickelter Seide. Mol. Biol. Evolution 24, 2424–2432 (2007).

Artikel CAS Google Scholar

Kristensen, NP, Scoble, MJ & Karsholt, O. Lepidoptera-Phylogenie und Systematik: der Stand der Inventarisierung der Motten- und Schmetterlingsvielfalt. Zootaxa 699–747 (2007).

Thomas, JA, Frandsen, PB, Prendini, E., Zhou, X. & Holzenthal, RW Eine Multigen-Phylogenie und Zeitleiste für Trichoptera (Insecta. Syst. Entomol. 45, 670–686 (2020). .

Sehnal, F. & Akai, H. Seidendrüsen von Insekten – ihre Arten, Entwicklung und Funktion sowie Auswirkungen von Umweltfaktoren und morphogenetischen Hormonen auf sie. Int. J. Insektenmorphol. 19, 79–132 (1990).

Artikel Google Scholar

Sehnal, F. & Zurovec, M. Konstruktion des Seidenfaserkerns bei Schmetterlingen. Biomacromolecules 5, 666–674 (2004).

Artikel CAS PubMed Google Scholar

Kludkiewicz, B. et al. Die Erweiterung von Genen, die lösliche Seidenkomponenten in der Wachsmotte Galleria mellonella kodieren. Insektenbiochemie. Mol. Biol. 106, 28–38 (2019).

Artikel CAS PubMed Google Scholar

Zhang, Y. et al. Vergleichende Proteomanalyse des mehrschichtigen Kokons der Seidenraupe Bombyx mori. PLoS ONE 10, e0123403 (2015).

Artikel PubMed PubMed Central Google Scholar

Tsubota, T., Yamamoto, K., Mita, K. & Sezutsu, H. Genexpressionsanalyse in der Larvenseidendrüse der Eri-Seidenraupe Samia ricini. Insektenwissenschaft. 23, 791–804 (2016).

Artikel CAS PubMed Google Scholar

Zurovec, M., Sehnal, F., Scheller, K. & Kumaran, AK Seidendrüsenspezifische Cdnas aus Galleria-Mellonella L. Insect Biochem. Mol. 22, 55 (1992).

Artikel CAS Google Scholar

Tsubota, T. et al. Die transkriptomische Analyse der Seidendrüse des Beutelwurms zeigt eine Reihe von Seidengenen, die in Schmetterlingen konserviert sind. Insektenwissenschaft. 28, 885–900 (2021).

Artikel CAS PubMed Google Scholar

Sohn, JC et al. Eine molekulare Phylogenie für Yponomeutoidea (Insecta, Lepidoptera, Ditrysia) und ihre Auswirkungen auf die Klassifizierung, Biogeographie und die Entwicklung der Wirtspflanzennutzung. PLoS ONE 8, e55066 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Gewöhnlich, IFB Moths of Australia (Melbourne University Press, 1990).

Kuznetsov, NY Eine Überarbeitung von Amber Lepidoptera. (Paläontologisches Institut, Akademie der Wissenschaften der UdSSR, 1941).

Powell, JA, Mitter, C. & Farrell, BD in Handbook of Zoology 4 Vol. Bd. 1: Evolution, Systematik und Biogeographie (Hrsg. Kristensen, NP) 403–422 (Walter de Gruyter, 1998).

Grimaldi, DA & Engel, MS Evolution of the Insects (Cambridge University Press, 2005).

Löfstedt, C., Herrebout, WM & Menken, SBJ Sexualpheromone und ihre mögliche Rolle bei der Entwicklung der reproduktiven Isolation bei kleinen Hermelinmotten (Yponomeutidae). Chemoecology 2, 20–28 (1991).

Artikel Google Scholar

Menken, SBJ, Herrebout, WM & Wiebes, JT Kleine Hermelinmotten (Yponomeuta): ihre Wirtsbeziehungen und Entwicklung. Annu. Rev. Entomol. 37, 41–66 (1992).

Artikel Google Scholar

Roessingh, P., Xu, S. & Menken, SB Riechrezeptoren auf den Oberkieferpalpen kleiner Hermelinmottenlarven: Evolutionsgeschichte der Benzaldehydempfindlichkeit. J. Comp. Physiol. A: Neuroethol. Sens. Neuronales Verhalten. Physiol. 193, 635–647 (2007).

Artikel CAS PubMed Google Scholar

Hora, KH Genetische Architektur der Wirtsspezialisierung in Yponomeuta. (2014).

Ulenberg, SA Phylogenie der Yponomeuta-Arten (Lepidoptera, Yponomeutidae) und die Geschichte ihrer Wirtspflanzenassoziationen. Tijdschr. für Entomologie 152, 187–207 (2009).

Artikel Google Scholar

Turner, H., Lieshout, N., Van Ginkel, WE & Menken, SB Molekulare Phylogenie der kleinen Hermelinmottengattung Yponomeuta (Lepidoptera, Yponomeutidae) in der Paläarktis. PLoS ONE 5, e9933 (2010).

Artikel PubMed PubMed Central Google Scholar

Gershenson, ZS, Pavlicek, T., Kravchenko, V. & Nevo, E. Yponomeutoide Motten (Lepidoptera: Yponomeutidae, Plutellidae, Argyresthiidae) aus Israel. Bd. 58 (Pensoft Publishers, 2006).

Yonemura, N. & Sehnal, F. Das Design der Seidenfaserzusammensetzung bei Motten ist seit mehr als 150 Millionen Jahren erhalten. J. Mol. Evolution 63, 42–53 (2006).

Artikel CAS Google Scholar

Zurovec, M. et al. Funktionelle Erhaltung und strukturelle Diversifizierung von Seidensericinen bei zwei Mottenarten. Biomakromoleküle 14, 1859–1866 (2013).

Artikel CAS PubMed Google Scholar

Vurture, GW et al. GenomeScope: schnelle referenzfreie Genomprofilierung aus kurzen Lesevorgängen. Bioinformatik 33, 2202–2204 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Liu, GC et al. Variation der Genomgröße bei Schmetterlingen (Insecta, Lepidotera, Papilionoidea): ein gründlicher phylogenetischer Vergleich. Syst. Entomol. 45, 571–582 (2020).

Artikel Google Scholar

Chen, Q. et al. Das Genom des Spinnennetzwurms Hyphantria cunea enthüllt genetische Anpassungen, die seine schnelle Invasion und Ausbreitung unterstützen. Bmc Genomics 21, 242 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Yandell, M. & Ence, D. Ein Leitfaden für Anfänger zur Annotation eukaryontischer Genomen. Nat. Rev. Genet. 13, 329–342 (2012).

Artikel CAS PubMed Google Scholar

Smit, AFA, Hubley, R. & Green, P. RepeatMasker Open-4.0. (2013–2015).

Wood, DE, Lu, J. & Langmead, B. Verbesserte metagenomische Analyse mit Kraken 2. Genome Biol. 20, 257 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, JR, Holt, J., McMillan, L. & Jones, CD FMLRC: Hybride Fehlerkorrektur bei langen Lesevorgängen mithilfe eines FM-Index. BMC Bioinform. 19, 50 (2018).

Artikel CAS Google Scholar

Zimin, AV & Salzberg, SL Das Genom-Poliertool POLCA führt schnelle und genaue Korrekturen in Genomassemblierungen durch. PLoS Comput. Biol. 16, e1007981 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Inoue, S. et al. Seidenfibroin von Bombyx mori wird abgesondert und bildet eine hochmolekulare Elementareinheit bestehend aus H-Kette, L-Kette und P25 im Molverhältnis 6:6:1. J. Biol. Chem. 275, 40517–40528 (2000).

Artikel CAS PubMed Google Scholar

Shimura, K. Chemische Zusammensetzung und Biosynthese von Seidenproteinen. Experientia 39, 455–461 (1983).

Artikel CAS Google Scholar

Yamaguchi, K. et al. Primärstruktur der leichten Kette von Seidenfibroin, bestimmt durch cDNA-Sequenzierung und Peptidanalyse. J. Mol. Biol. 210, 127–139 (1989).

Artikel CAS PubMed Google Scholar

Tanaka, K. & Mizuno, S. Homologe der Fibroin-L-Kette und P25 von Bombyx mori sind in Dendrolimus spectabilis und Papilio xuthus vorhanden, aber nicht in Antheraea yamamai nachweisbar. Insektenbiochemie. Mol. Biol. Rev. 31, 665–677 (2001).

Artikel CAS PubMed Google Scholar

Zurovec, M., Kodrik, D., Yang, C., Sehnal, F. & Scheller, K. Die P25-Komponente von Galleria-Seide. Mol. Gen. Genet. Rev. 257, 264–270 (1998).

Artikel CAS PubMed Google Scholar

Zurovec, M., Vaskova, M., Kodrik, D., Sehnal, F. & Kumaran, AK Leichtkettenfibroin von Galleria mellonella L. Mol. Gen. Genet. 247, 1–6 (1995).

Artikel CAS PubMed Google Scholar

Lucas, F. & Rudall, KM in Comprehensive Biochemistry Vol. 26 (Hrsg. Florkin, M. & Stotz, EH) 475–558 (Elsevier, 1968).

Zhou, CZ et al. Feine Organisation des Gens für die schwere Kette von Bombyx mori-Fibroin. Nukleinsäuren Res. 28, 2413–2419 (2000).

Artikel CAS PubMed PubMed Central Google Scholar

Warwicker, JO Vergleichende Studien zu Fibroinen. II. Die Kristallstrukturen verschiedener Fibroine. J. Mol. Biol. 2, 350–362 (1960).

Artikel CAS PubMed Google Scholar

Craig, CL Evolution der Arthropodenseide. Annu. Rev. Entomol. 42, 231–267 (1997).

Artikel CAS PubMed Google Scholar

Inoue, S. et al. Aufbau der Seidenfibroin-Elementareinheit im endoplasmatischen Retikulum und eine Rolle der L-Kette zum Schutz von Alpha1,2-Mannose-Resten in N-verknüpften Oligosaccharidketten von Fibrohexamerin/P25. EUR. J. Biochem. 271, 356–366 (2004).

Artikel CAS PubMed Google Scholar

Tanaka, K., Inoue, S. & Mizuno, S. Hydrophobe Wechselwirkung von P25, das Asn-verknüpfte Oligosaccharidketten enthält, mit dem HL-Komplex von Seidenfibroin, produziert von Bombyx mori. Insektenbiochemie. Mol. Biol. 29, 269–276 (1999).

Artikel CAS PubMed Google Scholar

Yonemura, N., Mita, K., Tamura, T. & Sehnal, F. Konservierung von Seidengenen in Trichoptera und Lepidoptera. J. Mol. Entwicklung 68, 641–653 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Zabelina, V. et al. Eine Mutation im Bombyx mori-Fibrohexamerin (P25)-Gen führt zu einer Reorganisation des rauen endoplasmatischen Retikulums in hinteren Seidendrüsenzellen und verändert die Morphologie der Fibroin-Sekretionskügelchen im Lumen der Seidendrüse. Insektenbiochemie. Mol. Biol. 135, 103607 (2021).

Artikel CAS PubMed Google Scholar

Syed, ZA, Hard, T., Uv, A. & van Dijk-Hard, IF Eine mögliche Rolle für Drosophila-Mucine in der Entwicklung und Physiologie. PLoS ONE 3, e3041 (2008).

Farkas, R. et al. Apokrine Sekretion in den Speicheldrüsen von Drosophila: subzellulärer Ursprung, Dynamik und Identifizierung sekretorischer Proteine. PLoS ONE 9, e94383 (2014).

Artikel PubMed PubMed Central Google Scholar

Marec, F. Genetische Bekämpfung des Schädlings Lepidoptera: Induktion einer geschlechtsgebundenen rezessiven Letalmutation in Ephestia kuehniella (Pyralidae). Acta Entomol. Bohemoslow. 87, 445–458 (1990).

Google Scholar

Levine, JD, Sauman, I., Imbalzano, M., Reppert, SM & Jackson, FR Periodenprotein aus dem Riesenseidenspinner Antheraea pernyi fungiert in Drosophila melanogaster als zirkadianes Uhrelement. Neuron 15, 147–157 (1995).

Artikel CAS PubMed Google Scholar

Hejnickova, M. et al. Fehlen des W-Chromosoms bei Psychidae-Motten und Auswirkungen auf die Theorie der Geschlechtschromosomenentwicklung bei Schmetterlingen. Genes (Basel) 10, https://doi.org/10.3390/genes10121016 (2019).

Buntrock, L., Marec, F., Krueger, S. & Traut, W. Organwachstum ohne Zellteilung: somatische Polyploidie bei einer Motte, Ephestia kuehniella. Genom 55, 755–763 (2012).

Artikel PubMed Google Scholar

Ferguson, KB et al. Jekyll oder Hyde? Das Genom (und mehr) von Nesidiocoris tenuis, einer zoophytophagen Raubwanze, die sowohl ein biologisches Bekämpfungsmittel als auch ein Schädling ist. Insektenmol. Biol. 30, 188–209 (2021).

Artikel CAS PubMed Google Scholar

Bolger, AM, Lohse, M. & Usadel, B. Trimmomatic: ein flexibler Trimmer für Illumina-Sequenzdaten. Bioinformatik 30, 2114–2120 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Andrews, S. FastQC: Ein Qualitätskontrolltool für Hochdurchsatz-Sequenzdaten [Online]. http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010).

Marcais, G. & Kingsford, C. Ein schneller, sperrenfreier Ansatz für die effiziente parallele Zählung des Vorkommens von k-meren. Bioinformatik 27, 764–770 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

De Coster, W., D'Hert, S., Schultz, DT, Cruts, M. & Van Broeckhoven, C. NanoPack: Visualisierung und Verarbeitung lang gelesener Sequenzierungsdaten. Bioinformatik 34, 2666–2669 (2018).

Artikel PubMed PubMed Central Google Scholar

Li, H. Schnelle Konstruktion des FM-Index für Lesevorgänge mit langen Sequenzen. Bioinformatik 30, 3274–3275 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Kolmogorov, M., Yuan, J., Lin, Y. & Pevzner, PA Zusammenstellung langer, fehleranfälliger Lesevorgänge mithilfe von Wiederholungsdiagrammen. Nat. Biotechnologie. 37, 540–546 (2019).

Artikel CAS PubMed Google Scholar

Guan, D. et al. Identifizierung und Entfernung haplotypischer Duplikationen in primären Genomanordnungen. Bioinformatik 36, 2896–2898 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Mikheenko, A., Valin, G., Prjibelski, A., Saveliev, V. & Gurevich, A. Icarus: Visualizer für die De-novo-Montagebewertung. Bioinformatik 32, 3321–3323 (2016).

Artikel CAS PubMed Google Scholar

Seppey, M., Manni, M. & Zdobnov, EM BUSCO: Bewertung der Genomassemblierung und der Vollständigkeit der Annotation. Methoden Mol. Biol. 1962, 227–245 (2019).

Artikel CAS PubMed Google Scholar

Novak, P. et al. TAREAN: ein Computertool zur Identifizierung und Charakterisierung von Satelliten-DNA aus nicht zusammengesetzten kurzen Lesevorgängen. Nukleinsäuren Res. 45, e111 (2017).

Dobin, A. et al. STAR: ultraschneller universeller RNA-seq-Aligner. Bioinformatik 29, 15–21 (2013).

Artikel CAS PubMed Google Scholar

Hoff, KJ, Lomsadze, A., Borodovsky, M. & Stanke, M. Whole-Genome Annotation with BRAKER. Genvorhersage: Methodenprotokoll. 1962, 65–95 (2019).

CAS Google Scholar

O'Leary, NA et al. Referenzsequenzdatenbank (RefSeq) am NCBI: aktueller Status, taxonomische Erweiterung und funktionale Annotation. Nukleinsäuren Res. 44, D733–D745 (2016).

Artikel PubMed Google Scholar

Humann, JL, Lee, T., Ficklin, S. & Main, D. Strukturelle und funktionelle Annotation eukaryontischer Genome mit GenSAS. Genvorhersage: Methodenprotokoll. 1962, 29–51 (2019).

CAS Google Scholar

Manchanda, N. et al. GenomeQC: ein Qualitätsbewertungstool für Genomassemblierungen und Genstrukturanmerkungen. Bmc Genomics 21, https://doi.org/10.1186/s12864-020-6568-2 (2020).

Yadav, C., Smith, M., Ogunremi, D. & Yack, J. Entwurf der Genomassemblierung und Annotation der maskierten Birkenraupe Drepana arcuata (Lepidoptera: Drepanoidea). Datenbrief 33, 106531 (2020).

Yan, B., Yu, X., Dai, R., Li, Z. & Yang, M. Genomassemblierung auf Chromosomenebene von Nephotettix cincticeps (Uhler, 1896) (Hemiptera: Cicadellidae: Deltocephalinae). Genombiol. Evol., https://doi.org/10.1093/gbe/evab236 (2021).

Gershman, A. et al. De-novo-Genomassemblierung des Tabakschwärmers (Manduca sexta). G3 (Bethesda) 11, https://doi.org/10.1093/g3journal/jkaa047 (2021).

Singh, KS et al. De-Novo-Genomassemblierung des Wiesenbraunen Schmetterlings, Maniola jurtina. G3 (Bethesda) 10, 1477–1484 (2020).

Artikel CAS PubMed Google Scholar

Müller, H. et al. Entwurf des Kerngenoms und vollständiges Mitogenom des mediterranen Maiszünslers Sesamia nonagrioides, einem großen Maisschädling. G3 (Bethesda), https://doi.org/10.1093/g3journal/jkab155 (2021).

Simon, S. et al. Genom- und Transkriptomanalyse des Rüben-Heerwurms Spodoptera exigua enthüllt Ziele für die Schädlingsbekämpfung. G3 (Bethesda), https://doi.org/10.1093/g3journal/jkab311 (2021).

Kawamoto, M. et al. Hochwertige Genomassemblierung der Seidenraupe Bombyx mori. Insektenbiochemie. Mol. Biol. 107, 53–62 (2019).

Artikel CAS PubMed Google Scholar

Ward, CM et al. Die Genomassemblierung einer haploiden Kohlmotte (Plutella xylostella L.) löst 31 Chromosomen auf und identifiziert eine Diamid-Resistenzmutation. Insektenbiochemie. Mol. Biol. 138, 103622 (2021).

Artikel CAS PubMed Google Scholar

Bushnell, B., Rood, J. & Singer, E. BBMerge – präzise gepaarte Shotgun-Read-Zusammenführung durch Überlappung. PLoS ONE 12, e0185056 (2017).

Artikel PubMed PubMed Central Google Scholar

Bushmanova, E., Antipov, D., Lapidus, A. & Prjibelski, AD rnaSPAdes: ein De-novo-Transkriptom-Assembler und seine Anwendung auf RNA-Seq-Daten. Gigascience 8, https://doi.org/10.1093/gigascience/giz100 (2019).

Hara, Y. et al. Optimierung und Benchmarking der De-novo-Transkriptomsequenzierung: von der Bibliotheksvorbereitung bis zur Assembly-Bewertung. Bmc Genomics 16, 977 (2015).

Artikel PubMed PubMed Central Google Scholar

Patro, R., Duggal, G., Love, MI, Irizarry, RA und Kingsford, C. Salmon bieten eine schnelle und voreingenommene Quantifizierung der Transkriptexpression. Nat. Methoden 14, 417–419 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Simao, FA, Waterhouse, RM, Ioannidis, P., Kriventseva, EV & Zdobnov, EM BUSCO: Bewertung der Genomassemblierung und Annotationsvollständigkeit mit Einzelkopie-Orthologen. Bioinformatik 31, 3210–3212 (2015).

Artikel CAS PubMed Google Scholar

Yoshido, A. et al. Entwicklung mehrerer Geschlechtschromosomen im Zusammenhang mit der dynamischen Neuordnung des Genoms bei holzweißen Leptidea-Schmetterlingen. Heredity (Edinb.) 125, 138–154 (2020).

Artikel CAS PubMed Google Scholar

Buchfink, B., Xie, C. & Huson, DH Schnelles und empfindliches Protein-Alignment mit DIAMOND. Nat. Methoden 12, 59–60 (2015).

Artikel CAS PubMed Google Scholar

Haas, B. & A., P. TransDecoder 5.5.0 [Online]. (abgerufen 2019).

Almagro Armenteros, JJ et al. SignalP 5.0 verbessert Signalpeptidvorhersagen mithilfe tiefer neuronaler Netze. Nat. Biotechnologie. 37, 420–423 (2019).

Artikel CAS PubMed Google Scholar

Kumar, S., Stecher, G., Li, M., Knyaz, C. & Tamura, K. MEGA X: Analyse der molekularen Evolutionsgenetik auf verschiedenen Computerplattformen. Mol. Biol. Entwicklung 35, 1547–1549 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Cox, J. et al. Genaue proteomweite, markierungsfreie Quantifizierung durch verzögerte Normalisierung und maximale Peptidverhältnisextraktion, genannt MaxLFQ. Mol. Zellproteom. 13, 2513–2526 (2014).

Artikel CAS Google Scholar

Cox, J. et al. Andromeda: eine in die MaxQuant-Umgebung integrierte Peptidsuchmaschine. J. Proteome Res. 10, 1794–1805 (2011).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Diese Forschung wurde durch das Programm der Europäischen Gemeinschaft Interreg Bayern Tschechische Republik Ziel ETZ 2021–2022 Nr. unterstützt. 331. Die Genomsequenzierung von Y. cagnagella wurde durch das an PN vergebene Stipendium 20-20650Y der Tschechischen Wissenschaftsstiftung finanziert. Diese Veröffentlichung wird auch durch das Projekt „BIOCEV – Biotechnologie- und Biomedizinzentrum der Akademie der Wissenschaften und der Karlsuniversität“ (CZ) unterstützt .1.05/1.1.00/02.0109), aus dem Europäischen Fonds für regionale Entwicklung. Wir danken auch der Kerneinrichtung Labor für Elektronenmikroskopie, Biologiezentrum CAS, unterstützt von MEYS CR (LM2018129 Czech-BioImaging) und EFRE (Nr. CZ.02.1.01/0.0/0.0/16_013/0001775). MH wurde durch die institutionelle Unterstützung der IMG (RVO–68378050) unterstützt. Wir danken Frau Jitka Pflegerová für ihre Hilfe bei der Probenvorbereitung.

Irena Provaznikova

Aktuelle Adresse: European Molecular Biology Laboratory, Heidelberg, Deutschland

Diese Autoren haben gleichermaßen beigetragen: Anna Volenikova, Petr Nguyen.

Biologiezentrum der Tschechischen Akademie der Wissenschaften, Institut für Entomologie, Ceske Budejovice, Tschechische Republik

Anna Volenikova, Petr Nguyen, Hana Sehadova, Barbara Kludkiewicz, Irena Provaznikova, Michal Sery, Martina Zurovcova, Lenka Rouhova und Michal Zurovec

Fakultät für Naturwissenschaften, Südböhmische Universität, Ceske Budejovice, Tschechische Republik

Anna Volenikova, Petr Nguyen, Hana Sehadova, Petr Koutecky, Irena Provaznikova, Lenka Rouhova und Michal Zurovec

School of Natural and Environmental Sciences, Newcastle University, Newcastle upon Tyne, Großbritannien

Peter Davey

NatureMetrics Ltd, Surrey Research Park, Guildford, GU2 7HJ, Großbritannien

Peter Davey

Abteilung für Ökologie und Evolutionsbiologie, University of Kansas, Lawrence, USA

James R. Walters

Institut für Biodiversität und Ökosystemdynamik, Universität Amsterdam, Amsterdam, Niederlande

Peter Rössingh

Institut für Molekulargenetik, Akademie der Wissenschaften der Tschechischen Republik, Prag, Tschechische Republik

Miluse Hradilova

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

AV, PN und Mi.Z. konzipierte die Arbeit, entwickelte die Methodik und entwarf Experimente. AV, PK, JW führten die Analyse des Genoms von Y. cagnagella durch, PR und IP sammelten Insektenmaterial, PD und Mi.Z. analysierte das Transkriptom, HS führte Histochemie und Elektronenmikroskopie durch. BK und LR führten eine Transkriptionsanalyse durch, MH konstruierte cDNA-Bibliotheken, MS und Ma.Z. Performante phylogenetische Analyse, PN und Mi.Z. schrieb das Manuskript unter Mitwirkung aller Autoren.

Korrespondenz mit Michal Zurovec.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt Lee Jung und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteure: Hannes Schuler und Luke R. Grinham. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Volenikova, A., Nguyen, P., Davey, P. et al. Genomsequenz und Silkomics des Hermelinfalters Yponomeuta cagnagella, der die frühe divergierende Abstammungslinie der ditrysischen Lepidoptera darstellt. Commun Biol 5, 1281 (2022). https://doi.org/10.1038/s42003-022-04240-9

Zitat herunterladen

Eingegangen: 01. Februar 2022

Angenommen: 09. November 2022

Veröffentlicht: 23. November 2022

DOI: https://doi.org/10.1038/s42003-022-04240-9

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE