banner
Heim / Blog / Dokumente und Patente werden mit der Zeit immer weniger störend
Blog

Dokumente und Patente werden mit der Zeit immer weniger störend

Jun 09, 2023Jun 09, 2023

Nature Band 613, Seiten 138–144 (2023)Diesen Artikel zitieren

290.000 Zugriffe

43 Zitate

4052 Altmetrisch

Details zu den Metriken

Theorien des wissenschaftlichen und technologischen Wandels betrachten Entdeckungen und Erfindungen als endogene Prozesse1,2, wobei zuvor gesammeltes Wissen künftigen Fortschritt ermöglicht, indem es Forschern ermöglicht, in Newtons Worten „auf den Schultern von Riesen zu stehen“3,4,5,6,7. In den letzten Jahrzehnten kam es zu einem exponentiellen Wachstum des Umfangs neuer wissenschaftlicher und technologischer Erkenntnisse, wodurch Bedingungen geschaffen wurden, die für große Fortschritte reif sein dürften8,9. Doch im Gegensatz zu dieser Ansicht deuten Studien darauf hin, dass sich der Fortschritt in mehreren wichtigen Bereichen verlangsamt10,11. Hier analysieren wir diese Behauptungen im großen Maßstab über sechs Jahrzehnte hinweg und verwenden dabei Daten zu 45 Millionen Veröffentlichungen und 3,9 Millionen Patenten aus sechs großen Datensätzen sowie eine neue quantitative Metrik – den CD-Index12 – der charakterisiert, wie Veröffentlichungen und Patente Zitationsnetzwerke verändern in Wissenschaft und Technik. Wir stellen fest, dass es bei Veröffentlichungen und Patenten immer weniger wahrscheinlich ist, dass sie mit der Vergangenheit auf eine Weise brechen, die Wissenschaft und Technologie in neue Richtungen treibt. Dieses Muster gilt allgemein für alle Fachgebiete und ist robust gegenüber mehreren verschiedenen zitations- und textbasierten Metriken1,13,14,15,16,17. Anschließend verknüpfen wir diesen Rückgang der Störwirkung mit einer Einschränkung der Nutzung von Vorwissen, was es uns ermöglicht, die von uns beobachteten Muster mit der Sichtweise „Schultern der Riesen“ in Einklang zu bringen. Wir stellen fest, dass die beobachteten Rückgänge wahrscheinlich nicht auf Veränderungen in der Qualität der veröffentlichten Wissenschaft, Zitierpraktiken oder fachspezifische Faktoren zurückzuführen sind. Insgesamt deuten unsere Ergebnisse darauf hin, dass die Verlangsamung der Störungsraten einen grundlegenden Wandel in der Natur von Wissenschaft und Technologie widerspiegeln könnte.

Obwohl das vergangene Jahrhundert eine beispiellose Erweiterung des wissenschaftlichen und technologischen Wissens erlebte, bestehen Bedenken, dass die Innovationstätigkeit nachlässt18,19,20. Studien belegen einen Rückgang der Forschungsproduktivität in der Halbleiter-, Pharma- und anderen Bereichen10,11. Papiere, Patente und sogar Förderanträge sind im Vergleich zu früheren Arbeiten weniger neuartig geworden und es ist weniger wahrscheinlich, dass sie unterschiedliche Wissensbereiche verbinden, was beides Vorläufer von Innovationen sind21,22. Auch die Kluft zwischen dem Jahr der Entdeckung und der Verleihung eines Nobelpreises hat zugenommen23,24, was darauf hindeutet, dass die heutigen Beiträge nicht mit der Vergangenheit mithalten können. Diese Trends haben zunehmende Aufmerksamkeit von politischen Entscheidungsträgern auf sich gezogen, da sie erhebliche Bedrohungen für das Wirtschaftswachstum, die menschliche Gesundheit und das Wohlbefinden sowie die nationale Sicherheit darstellen und gleichzeitig die globalen Bemühungen zur Bekämpfung großer Herausforderungen wie dem Klimawandel beeinträchtigen25,26.

Für diese Verlangsamung wurden zahlreiche Erklärungen vorgeschlagen. Einige verweisen auf einen Mangel an „niedrig hängenden Früchten“, da die leicht verfügbaren produktivitätssteigernden Innovationen bereits umgesetzt wurden19,27. Andere betonen die zunehmende Wissenslast; Wissenschaftler und Erfinder benötigen immer mehr Ausbildung, um die Grenzen ihres Fachgebiets zu erreichen, sodass ihnen immer weniger Zeit bleibt, diese Grenzen voranzutreiben18,28. Dennoch bleibt noch viel Unbekanntes, nicht nur über die Ursachen der Verlangsamung der Innovationstätigkeit, sondern auch über die Tiefe und Breite des Phänomens. Der Rückgang lässt sich nur schwer mit der jahrhundertelangen Beobachtung von Wissenschaftsphilosophen in Einklang bringen, die das Wissenswachstum als einen endogenen Prozess charakterisieren, bei dem früheres Wissen künftige Entdeckungen ermöglicht, eine Ansicht, die in Newtons Beobachtung berühmt zum Ausdruck kommt, dass, wenn er weiter gesehen hätte, dies geschehen wäre „auf den Schultern von Riesen stehen“3. Darüber hinaus basieren die Belege, die auf eine Verlangsamung hinweisen, bisher auf Studien in bestimmten Bereichen, die unterschiedliche und domänenspezifische Kennzahlen verwenden10,11, was es schwierig macht zu wissen, ob die Veränderungen in allen Bereichen der Wissenschaft und Technologie in ähnlichem Tempo stattfinden. Es ist auch wenig darüber bekannt, ob die in den aggregierten Indikatoren beobachteten Muster Unterschiede im Ausmaß der Grenzüberschreitung einzelner Werke verdecken.

Wir schließen diese Verständnislücken, indem wir 25 Millionen Artikel (1945–2010) im Web of Science (WoS) (Methods) und 3,9 Millionen Patente (1976–2010) in der Patents View-Datenbank des US-amerikanischen Patent- und Markenamts (USPTO) analysieren (Methoden). Die WoS-Daten umfassen 390 Millionen Zitate, 25 Millionen Papiertitel und 13 Millionen Abstracts. Die Daten der Patents View umfassen 35 Millionen Zitate, 3,9 Millionen Patenttitel und 3,9 Millionen Abstracts. Anschließend replizieren wir unsere Kernergebnisse anhand von vier weiteren Datensätzen – JSTOR, dem Korpus der American Physical Society, Microsoft Academic Graph und PubMed –, die 20 Millionen Artikel umfassen. Anhand dieser Daten verbinden wir eine neue zitationsbasierte Messung12 mit Textanalysen von Titeln und Abstracts, um zu verstehen, ob Papiere und Patente im Laufe der Zeit und in verschiedenen Fachgebieten neue Richtungen einschlagen.

Um die Natur der Innovation zu charakterisieren, stützen wir uns auf grundlegende Theorien des wissenschaftlichen und technologischen Wandels2,29,30, die zwischen zwei Arten von Durchbrüchen unterscheiden. Erstens verbessern einige Beiträge bestehende Wissensströme und festigen somit den Status quo. Kohn und Sham (1965)31, eine mit dem Nobelpreis ausgezeichnete Arbeit, nutzte etablierte Theoreme, um eine Methode zur Berechnung der Struktur von Elektronen zu entwickeln, die den Wert früherer Forschungen festigte. Zweitens stören einige Beiträge bestehendes Wissen, machen es obsolet und treiben Wissenschaft und Technologie in neue Richtungen. Watson und Crick (1953)32, ebenfalls Nobelpreisträger, stellten ein Modell der DNA-Struktur vor, das frühere Ansätze (zum Beispiel Paulings Dreifachhelix) ablöste. Kohn und Sham sowie Watson und Crick waren beide wichtig, aber ihre Auswirkungen auf den wissenschaftlichen und technologischen Wandel waren unterschiedlich.

Wir quantifizieren diese Unterscheidung anhand eines Maßes – des CD-Index12 –, der den konsolidierenden oder disruptiven Charakter von Wissenschaft und Technologie charakterisiert (Abb. 1). Die Intuition ist, dass, wenn ein Aufsatz oder ein Patent störend ist, die nachfolgende Arbeit, die es zitiert, weniger wahrscheinlich auch seine Vorgänger zitiert; Für zukünftige Forscher sind die Ideen, die in seine Herstellung eingeflossen sind, weniger relevant (zum Beispiel Paulings Tripelhelix). Wenn sich eine Arbeit oder ein Patent konsolidiert, ist es wahrscheinlicher, dass nachfolgende Arbeiten, in denen es zitiert wird, auch seine Vorgänger zitieren. Für zukünftige Forscher ist das Wissen, auf dem die Arbeit aufbaut, immer noch (und vielleicht sogar noch relevanter) relevant (zum Beispiel die von Kohn und Sham verwendeten Theoreme). Der CD-Index reicht von −1 (konsolidierend) bis 1 (disruptiv). Wir messen den CD-Index fünf Jahre nach dem Jahr der Veröffentlichung jedes Artikels (angezeigt durch CD5, siehe Extended Data Abb. 1 für die Verteilung von CD5 unter Artikeln und Patenten und Extended Data Abb. 2 für Analysen mit alternativen Fenstern)33. Beispielsweise erhielten Watson und Crick sowie Kohn und Sham innerhalb von fünf Jahren nach ihrer Veröffentlichung jeweils über hundert Zitate. Allerdings hat das Papier von Kohn und Sham einen CD5 von −0,22 (was auf eine Konsolidierung hinweist), während das Papier von Watson und Crick einen CD5 von 0,62 hat (was auf eine Störung hinweist). Der CD-Index wurde in früheren Untersuchungen umfassend validiert, unter anderem durch Korrelation mit Experteneinschätzungen12,34.

Diese Abbildung zeigt eine schematische Visualisierung des CD-Index. a, CD-Indexwert von drei mit dem Nobelpreis ausgezeichneten Arbeiten31,32,58 und drei bemerkenswerten Patenten59,60,61 in unserer Stichprobe, gemessen ab fünf Jahren nach der Veröffentlichung (angezeigt durch CD5). b, Verteilung von CD5 für Arbeiten aus WoS (n = 24.659.076) zwischen 1945 und 2010 und Patente aus Patents View (n = 3.912.353) zwischen 1976 und 2010, wobei ein einzelner Punkt eine Arbeit oder ein Patent darstellt. Die vertikale (oben-unten) Dimension jedes „Streifens“ entspricht den Werten des CD-Index (wobei die Achsenwerte links in Orange angezeigt werden). Die horizontale Abmessung (von links nach rechts) jedes Streifens trägt dazu bei, überlappende Punkte zu minimieren. Dunklere Bereiche auf jedem Streifendiagramm weisen auf dichtere Bereiche der Verteilung hin (d. h. häufiger beobachtete CD5-Werte). Weitere Details zur Verteilung des CD-Index sind in der erweiterten Datenabbildung 1 angegeben maximal konsolidierender Wert (CDt = −1). Das Gremium stellt außerdem die Gleichung für den CD-Index und eine anschauliche Berechnung bereit.

In allen Bereichen stellen wir fest, dass Wissenschaft und Technologie weniger disruptiv wirken. Abbildung 2 zeigt den durchschnittlichen CD5-Wert über die Zeit für Veröffentlichungen (Abb. 2a) und Patente (Abb. 2b). Bei den Arbeiten reicht der Rückgang zwischen 1945 und 2010 von 91,9 % (wobei der durchschnittliche CD5 von 0,52 im Jahr 1945 auf 0,04 im Jahr 2010 für „Sozialwissenschaften“ sank) bis 100 % (wo der durchschnittliche CD5 von 0,36 im Jahr 1945 auf 0 im Jahr 2010 sank). für „Physikwissenschaften“); Bei Patenten reicht der Rückgang zwischen 1980 und 2010 von 78,7 % (wo der durchschnittliche CD5 von 0,30 im Jahr 1980 auf 0,06 im Jahr 2010 für „Computer und Kommunikation“ sank) bis 91,5 % (wo der durchschnittliche CD5 von 0,38 im Jahr 1980 auf 0,03 Zoll sank). 2010 für „Drogen und Medizin“). Sowohl bei Papieren als auch bei Patenten sind die Rückgangsraten in den früheren Teilen der Zeitreihe am größten, und bei Patenten scheinen sie sich zwischen den Jahren 2000 und 2005 zu stabilisieren. Bei Papieren ist die Rückgangsrate seit etwa 1980 zu verzeichnen bescheidener in den „Biowissenschaften und Biomedizin“ und den Naturwissenschaften und am ausgeprägtesten und beständigsten in den Sozialwissenschaften und der „Technologie“. Insgesamt tragen neuere Veröffentlichungen und Patente im Vergleich zu früheren Epochen jedoch weniger dazu bei, Wissenschaft und Technologie in neue Richtungen zu lenken. Die allgemeine Ähnlichkeit der Trends, die wir in den verschiedenen Feldern beobachten, ist im Lichte der „Low-Hanging Fruit“-Theorie19,27 bemerkenswert, die wahrscheinlich eine größere Heterogenität beim Rückgang vorhersagen würde, da es unwahrscheinlich erscheint, dass Felder ihre Low-Hanging Fruit zu einem ähnlichen Zeitpunkt „verbrauchen“. Tarife oder Zeiten.

a,b, Rückgang von CD5 im Laufe der Zeit, getrennt für Aufsätze (a, n = 24.659.076) und Patente (b, n = 3.912.353). Bei Aufsätzen entsprechen die Zeilen den WoS-Forschungsbereichen; Von 1945 bis 2010 reichte das Ausmaß des Rückgangs von 91,9 % (Sozialwissenschaften) bis 100 % (Physikwissenschaften). Bei Patenten entsprechen die Zeilen den Technologiekategorien des National Bureau of Economic Research (NBER); Von 1980 bis 2010 reichte das Ausmaß des Rückgangs von 93,5 % (Computer und Kommunikation) bis 96,4 % (Medikamente und Medizin). Die schattierten Bänder entsprechen 95 %-Konfidenzintervallen. Wie wir in den Methoden näher erläutern, ist dieses Rückgangsmuster robust gegenüber Anpassungen für Störfaktoren, die sich aus Änderungen der Veröffentlichungs-, Zitier- und Autorenpraktiken im Laufe der Zeit ergeben.

Quelldaten

Der Rückgang disruptiver Wissenschaft und Technologie lässt sich auch anhand alternativer Indikatoren beobachten. Da sie zu Abweichungen vom Status quo führen, führen disruptive Papiere und Patente wahrscheinlich zur Einführung neuer Wörter (z. B. können sich Wörter, die zur Schaffung eines neuen Paradigmas verwendet werden, von denen unterscheiden, die zur Entwicklung eines bestehenden Paradigmas verwendet werden)35,36. Wenn die Störwirkung abnimmt, würden wir daher mit einem Rückgang der Vielfalt der in Wissenschaft und Technologie verwendeten Wörter rechnen. Um dies zu bewerten, dokumentiert Abb. 3a, d das Typ-Token-Verhältnis (dh eindeutige Wörter/Gesamtwörter) von Papier- und Patenttiteln im Zeitverlauf (Ergänzende Informationen, Abschnitt 1). Wir beobachten erhebliche Rückgänge, insbesondere in den früheren Zeiträumen, vor 1970 bei Papieren und 1990 bei Patenten. Bei den Papiertiteln (Abb. 3a) reicht der Rückgang (1945–2010) von 76,5 % (Sozialwissenschaften) bis 88 % (Technologie); Bei Patenttiteln (Abb. 3d) reicht der Rückgang (1980–2010) von 32,5 % (Chemie) bis 81 % (Computer und Kommunikation). Bei Paper Abstracts (Extended Data Abb. 3a) reicht der Rückgang (1992–2010) von 23,1 % (Biowissenschaften und Biomedizin) bis 38,9 % (Sozialwissenschaften); für Patentabstracts (Erweiterte Daten Abb. 3b) reicht der Rückgang (1980–2010) von 21,5 % (mechanisch) bis 73,2 % (Computer und Kommunikation). In Abb. 3b, e zeigen wir, dass dieser Rückgang der Wortvielfalt mit einem ähnlichen Rückgang der kombinatorischen Neuheit einhergeht. Im Laufe der Zeit ist es immer wahrscheinlicher, dass die einzelnen Wörter, die Wissenschaftler und Erfinder in den Titeln ihrer Arbeiten und Patente verwenden, auch in den Titeln früherer Arbeiten zusammen verwendet wurden. Im Einklang mit diesen Sprachtrends beobachten wir auch einen Rückgang der Neuheit in den Kombinationen früherer Arbeiten, die in Veröffentlichungen und Patenten zitiert werden, basierend auf einem zuvor festgelegten Maß für „atypische Kombinationen“14 (Erweiterte Daten, Abb. 4).

a,d, Zahlen, die einen Rückgang der Vielfalt der in Wissenschaft und Technik verwendeten Sprachen zeigen, basierend auf den eindeutigen/Gesamtwörtern von Papiertiteln von 1945 bis 2010 (a, n = 24.659.076) und von Patenttiteln von 1980 bis 2010 (d, n = 3.912.353). b,e, Zahlen, die einen Rückgang der Neuheit der in Wissenschaft und Technologie verwendeten Sprache zeigen, basierend auf der Anzahl neuer Wortpaare/Gesamtwortpaare, die jedes Jahr in WoS-Papiertiteln von 1945 bis 2010 (b) und in Patenttiteln der Patentansicht eingeführt wurden von 1980 bis 2010 (Ref. 1,17) (e). Für Arbeiten in a und b entsprechen die Linien den WoS-Forschungsgebieten (n = 264 WoS-Forschungsgebiet × Jahresbeobachtungen). Für Patente in d und e entsprechen die Linien NBER-Technologiekategorien (n = 229 NBER-Technologiekategorie × Jahresbeobachtungen). c,f, Zahlen, die die Häufigkeit der am häufigsten verwendeten Verben in Papiertiteln für das erste (rot) und letzte (blau) Jahrzehnt des Beobachtungszeitraums in Papier (c, n = 24.659.076) und Patent (f, n = 3.912.353) zeigen ) Titel.

Quelldaten

Der Rückgang der Störaktivitäten zeigt sich auch in der konkreten Wortwahl von Wissenschaftlern und Erfindern. Wenn die Störung abnimmt, sind wir zu dem Schluss gekommen, dass Verben, die auf die Schaffung, Entdeckung oder Wahrnehmung neuer Dinge anspielen, mit der Zeit seltener verwendet werden sollten, während Verben, die auf die Verbesserung, Anwendung oder Bewertung vorhandener Dinge anspielen, möglicherweise häufiger verwendet werden35,36. Abbildung 3 zeigt die häufigsten Verben in Papier- (Abb. 3c) und Patenttiteln (Abb. 3f) im ersten und letzten Jahrzehnt jeder Stichprobe (Ergänzende Informationen, Abschnitt 2). Obwohl es ohne Kontext schwierig ist, Wörter präzise und quantitativ als „konsolidierend“ oder „störend“ zu charakterisieren, verdeutlicht die Abbildung eine klare und qualitative Verschiebung in der Sprache. In den früheren Jahrzehnten evozierten Verben Schöpfung (z. B. „produzieren“, „formen“, „vorbereiten“ und „machen“), Entdeckung (z. B. „bestimmen“ und „melden“) und Wahrnehmung (z. B. „messen“) ') sind sowohl in Papier- als auch in Patenttiteln weit verbreitet. In den späteren Jahrzehnten wurden diese Verben jedoch fast vollständig durch solche ersetzt, die tendenziell eher eine Verbesserung (z. B. „verbessern“, „verbessern“ und „erhöhen“) oder eine Anwendung (z. B. „benutzen“ und „ „einbeziehen“) oder Bewertung (z. B. „assoziieren“, „vermitteln“ und „in Beziehung setzen“) vorhandener wissenschaftlicher und technologischer Erkenntnisse und Artefakte. Zusammengenommen deuten diese Muster auf einen wesentlichen Wandel in Wissenschaft und Technologie im Laufe der Zeit hin, wobei Entdeckungen und Erfindungen weniger disruptiv werden, was mit unseren Ergebnissen anhand des CD-Index übereinstimmt.

Hinter den aggregierten Trends, die wir dokumentieren, verbirgt sich eine erhebliche Heterogenität in der Störwirkung einzelner Veröffentlichungen und Patente sowie eine bemerkenswerte Stabilität in der absoluten Zahl hochstörender Werke (Methoden und Abb. 4). Insbesondere bleibt die Zahl der Arbeiten und Patente mit CD5-Werten ganz rechts in der Verteilung trotz starker Steigerungen der wissenschaftlichen Produktivität im Zeitverlauf nahezu konstant. Diese „Konservierung“ der absoluten Zahl höchst disruptiver Veröffentlichungen und Patente gilt trotz erheblicher Abwanderung in den zugrunde liegenden Bereichen, die für die Produktion dieser Werke verantwortlich sind (Extended Data Abb. 5, Einschub). Diese Ergebnisse legen nahe, dass das Fortbestehen großer Durchbrüche – beispielsweise bei der Messung von Schwerewellen und COVID-19-Impfstoffen – nicht im Widerspruch zu einer Verlangsamung der Innovationstätigkeit steht. Kurz gesagt, ein Rückgang der aggregierten Störwirkung schließt einzelne stark störende Arbeiten nicht aus.

Diese Abbildung zeigt die Anzahl der disruptiven Papiere (a, n = 5.030.179) und Patente (b, n = 1.476.004) über vier verschiedene CD5-Bereiche (Papiere und Patente mit CD5-Werten im Bereich [−1,0, 0) sind in nicht vertreten die Figur). Linien entsprechen unterschiedlichen Graden der Störung, gemessen durch CD5. Trotz eines erheblichen Anstiegs der Zahl der jährlich veröffentlichten Veröffentlichungen und Patente gibt es kaum Veränderungen bei der Anzahl äußerst disruptiver Veröffentlichungen und Patente, wie die relativ flachen roten, grünen und orangen Linien zeigen. Dieses Muster trägt dazu bei, die gleichzeitige Beobachtung sowohl aggregierter Hinweise auf eine Verlangsamung der Innovationstätigkeit als auch scheinbar großer Durchbrüche in vielen Bereichen der Wissenschaft und Technologie zu erklären. Die eingefügten Diagramme zeigen die Zusammensetzung der störendsten Veröffentlichungen und Patente (definiert als solche mit CD5-Werten > 0,25) nach Fachgebiet im Zeitverlauf. Die beobachtete Stabilität in der absoluten Zahl äußerst disruptiver Veröffentlichungen und Patente bleibt bestehen, obwohl es in den zugrunde liegenden Wissenschafts- und Technologiebereichen, die für die Entstehung dieser Werke verantwortlich sind, erhebliche Schwankungen gibt. „Life Sciences“ bezeichnet den Forschungsbereich Lebenswissenschaften und Biomedizin; „elektrisch“ bezeichnet die Kategorie Elektro- und Elektroniktechnik; „Arzneimittel“ bezeichnet die Kategorie Arzneimittel und Medizintechnik; und „Computer“ bezeichnet die Kategorie Computer und Kommunikationstechnologie.

Quelldaten

Was ist die Ursache für den Rückgang der Disruption? Zuvor haben wir darauf hingewiesen, dass unsere Ergebnisse nicht mit Erklärungen übereinstimmen, die eine Verlangsamung der Innovationsaktivität mit einem Rückgang der „Low-Hanging Fruits“ in Verbindung bringen. Erweiterte Daten Abb. 5 zeigt, dass der Rückgang der Störwirkung wahrscheinlich nicht auf andere feldspezifische Faktoren zurückzuführen ist, indem die Variation in CD5 zerlegt wird, die auf Feld-, Autoren- und Jahreseffekte zurückzuführen ist (Methoden).

Es ist unwahrscheinlich, dass rückläufige Störaktivitäten auf die abnehmende Qualität von Wissenschaft und Technologie zurückzuführen sind22,37. Wenn dies der Fall wäre, sollten die in Abb. 2 gezeigten Muster bei qualitativ hochwertigen Arbeiten weniger sichtbar sein. Wenn wir unsere Stichprobe jedoch auf Artikel beschränken, die in führenden Publikationsorten wie „Nature“, „Proceedings of the National Academy of Sciences and Science“ oder auf Entdeckungen mit Nobelpreisen veröffentlicht wurden38 (Abb. 5), bleibt der Abwärtstrend bestehen.

Diese Abbildung zeigt Veränderungen des CD5 im Laufe der Zeit für in Nature, Proceedings of the National Academy of Sciences (PNAS) and Science veröffentlichte Arbeiten (Einfügungsdiagramm, n = 223.745) und Nobelpreis-gekrönte Arbeiten (Hauptdiagramm, n = 635) mit mehrere bemerkenswerte Beispiele31,32,58,62,63,64,65,66 hervorgehoben. Die Farben kennzeichnen die drei verschiedenen Zeitschriften im Nebendiagramm. Farben kennzeichnen die drei verschiedenen Bereiche, in denen der Nobelpreis in der Haupthandlung verliehen wird. Die schattierten Bänder entsprechen 95 %-Konfidenzintervallen. Der historischen Vollständigkeit halber zeichnen wir die CD-Indexergebnisse für alle Nobelarbeiten bis 1900 (dem ersten Jahr, in dem der Preis verliehen wurde) zurück. Unsere Hauptanalysen beginnen jedoch in der Zeit nach 1945, als die WoS-Daten im Allgemeinen zuverlässiger sind. Die Zahl zeigt, dass Änderungen in der Qualität der veröffentlichten Wissenschaft im Laufe der Zeit wahrscheinlich nicht für den Rückgang der Störungen verantwortlich sind.

Quelldaten

Darüber hinaus wird der Trend nicht durch Merkmale der WoS- und UPSTO-Daten oder unserer speziellen Ableitung des CD-Index bestimmt; Wir beobachten einen ähnlichen Rückgang der Störwirkung, wenn wir CD5 anhand von Arbeiten in JSTOR, dem Korpus der American Physical Society, Microsoft Academic Graph und PubMed (Methods) berechnen, deren Ergebnisse in Abb. 6 der erweiterten Daten dargestellt sind kein Artefakt des CD-Index, da ähnliche Muster unter Verwendung alternativer Ableitungen gemeldet werden13,15 (Methoden und erweiterte Daten, Abb. 7).

Rückgänge in der Störwirkung sind auch nicht auf veränderte Publikations-, Zitier- oder Autorenpraktiken (Methoden) zurückzuführen. Zunächst haben wir unter Verwendung von Ansätzen aus der bibliometrischen Literatur39,40,41,42,43 mehrere normalisierte Versionen des CD-Index berechnet, die sich an die zunehmende Tendenz von Veröffentlichungen und Patenten anpassen, frühere Arbeiten zu zitieren44,45. Die Ergebnisse unter Verwendung dieser alternativen Indikatoren (Erweiterte Daten Abb. 8a, d) ähnelten denen, die wir in Abb. 2 berichteten. Zweitens schätzten wir mithilfe der Regression Modelle von CD5 als Funktion der Indikatorvariablen für jedes Veröffentlichungsjahr jedes Papiers oder Patents mit spezifischen Kontrollen für Fachgebiet × Jahresebene – Anzahl neuer Arbeiten/Patente, mittlere Anzahl zitierter Arbeiten/Patente, mittlere Anzahl Autoren oder Erfinder pro Arbeit – und Papier- oder Patentebene – Anzahl zitierter Arbeiten oder Patente – Faktoren. Vorhersagen aus diesen Modellen deuteten auf einen Rückgang der disruptiven Veröffentlichungen und Patente hin (Erweiterte Daten Abb. 8b, e und Ergänzungstabelle 1), was mit unseren Hauptergebnissen übereinstimmte. Schließlich haben wir mithilfe von Monte-Carlo-Simulationen die beobachteten Zitiernetzwerke nach dem Zufallsprinzip neu verkabelt und dabei wichtige Merkmale des Zitierverhaltens von Wissenschaftlern und Erfindern beibehalten, darunter die Anzahl der Zitate, die von einzelnen Veröffentlichungen und Patenten vorgenommen und erhalten wurden, sowie der Altersunterschied zwischen zitierenden und zitierten Werken. Wir stellen fest, dass die beobachteten CD5-Werte niedriger sind als die der simulierten Netzwerke (Extended Data Abb. 8c,f), und die Kluft wird größer: Im Laufe der Zeit sind Papiere und Patente immer weniger störend, als man zufällig erwarten würde. Zusammengenommen deuten diese zusätzlichen Analysen darauf hin, dass der Rückgang von CD5 wahrscheinlich nicht auf veränderte Veröffentlichungs-, Zitier- oder Autorenpraktiken zurückzuführen ist.

Wir haben auch darüber nachgedacht, wie eine abnehmende Disruptivität mit dem Wissenszuwachs zusammenhängt (Erweiterte Daten, Abb. 9). Einerseits sind Wissenschaftler und Erfinder mit einer zunehmenden Wissenslast konfrontiert, die Entdeckungen und Erfindungen behindern kann, die den Status quo stören. Andererseits behaupten Wissenschaftsphilosophen, wie bereits erwähnt, dass vorhandenes Wissen Entdeckungen und Erfindungen fördert3,6,7. Mithilfe von Regressionsmodellen haben wir die Beziehung zwischen dem Bestand an Papieren und Patenten (ein Indikator für Wissen) innerhalb der Fachgebiete und deren CD5 (Ergänzungsinformationen, Abschnitt 3 und Ergänzungstabelle 2) bewertet. Wir stellen fest, dass sich der Wissenszuwachs positiv auf die Störung von Arbeiten auswirkt, was mit früheren Arbeiten übereinstimmt20; Wir sehen jedoch einen negativen Effekt für Patente.

Angesichts dieser widersprüchlichen Ergebnisse haben wir die Möglichkeit in Betracht gezogen, dass die Verfügbarkeit von Wissen von seiner Nutzung abweichen könnte. Insbesondere die Zunahme von Veröffentlichungen und Patenten kann dazu führen, dass Wissenschaftler und Erfinder sich auf kleinere Bereiche früherer Arbeiten konzentrieren18,46 und dadurch den „effektiven“ Wissensbestand einschränken. Anhand von drei Proxys dokumentieren wir einen Rückgang der Nutzung von Vorwissen bei Wissenschaftlern und Erfindern (Abb. 6). Erstens sehen wir einen Rückgang der Vielfalt der zitierten Arbeiten (Abb. 6a, d), was darauf hindeutet, dass sich die zeitgenössische Wissenschaft und Technologie mit engeren Bereichen des vorhandenen Wissens auseinandersetzt. Darüber hinaus geht dieser Rückgang der Diversität mit einem Anstieg des Anteils der Zitate auf die 1 % der am häufigsten zitierten Arbeiten und Patente einher (Abb. 6a (i), d(i)), deren semantische Diversität ebenfalls abnimmt (Abb. 6a (ii),d (ii)). Im Laufe der Zeit zitieren Wissenschaftler und Erfinder zunehmend dieselben früheren Arbeiten, und diese früheren Arbeiten werden thematisch immer ähnlicher. Zweitens sehen wir eine Zunahme der Selbstzitierung (Abb. 6b, e), ein allgemeiner Indikator für die Fortsetzung des bereits bestehenden Forschungsstroms47,48,49, was damit übereinstimmt, dass Wissenschaftler und Erfinder sich mehr auf sehr vertrautes Wissen verlassen. Drittens steigt das durchschnittliche Arbeitsalter, ein gängiges Maß für die Nutzung veralteten Wissens50,51,52 (Abb. 6c,f), was darauf hindeutet, dass Wissenschaftler und Erfinder möglicherweise Schwierigkeiten haben, mit der Geschwindigkeit der Wissenserweiterung Schritt zu halten und sich stattdessen auf ältere, vertraute Arbeiten zu verlassen. Alle drei Indikatoren deuten auf eine konsistente Geschichte hin: Ein kleinerer Umfang des vorhandenen Wissens fließt in zeitgenössische Entdeckungen und Erfindungen ein.

a–f, Veränderungen im Grad der Diversität der vorhandenen wissenschaftlichen und technologischen Wissensnutzung bei Arbeiten (a, n = 264 WoS-Forschungsgebiet × Jahresbeobachtungen; b und c, n = 24.659.076 Arbeiten) und Patenten (d, 229 NBER-Technologiekategorie). × Jahr Beobachtungen; e und f, n = 3.912.353 Patente) basierend auf folgenden Maßen: Vielfalt der zitierten Arbeiten (a und d), mittlere Anzahl der Selbstzitierungen (b und e) und mittleres Alter der zitierten Arbeiten (c und f) . Die schattierten Bänder (b, c, e und f) entsprechen 95 %-Konfidenzintervallen. Die eingefügten Diagramme von a und d zeigen Veränderungen im Anteil der Zitate auf die 1 % der am häufigsten zitierten Arbeiten (a(i) und d(i)) und in der semantischen Vielfalt der 1 % der am häufigsten zitierten Arbeiten im Zeitverlauf (a). (ii) und d(ii)). Die Werte beider Messgrößen werden innerhalb des Feldes und des Jahres berechnet und anschließend zur grafischen Darstellung über die Felder hinweg gemittelt. Semantische Vielfalt basiert auf Papier- und Patenttiteln; Die Werte entsprechen dem Verhältnis der Standardabweichung zur mittleren paarweisen Kosinusähnlichkeit (d. h. dem Variationskoeffizienten) unter den Titeln der 1 % der am häufigsten zitierten Arbeiten und Patente nach Fachgebiet und Jahr. Um semantische Vergleiche zu ermöglichen, wurden Titel mithilfe vorab trainierter Worteinbettungen vektorisiert. Bei Arbeiten werden Zeilen für jeden WoS-Forschungsbereich angezeigt; Bei Patenten werden Linien für jede NBER-Technologiekategorie angezeigt. In anschließenden Regressionsanalysen unter Verwendung dieser Maßnahmen stellen wir fest, dass die Verwendung von weniger vielfältiger Arbeit, mehr eigener Arbeit und älterer Arbeit mit weniger störenden Papieren und Patenten verbunden ist (Tabelle 1 zu Methoden und erweiterten Daten).

Quelldaten

Ergebnisse einer nachfolgenden Reihe von Regressionsmodellen deuten darauf hin, dass die Nutzung von weniger vielfältiger Arbeit, mehr eigener Arbeit und älterer Arbeit allesamt negativ mit Störungen verbunden sind (Methoden, erweiterte Datentabelle 1 und ergänzende Tabelle 3), ein Muster, das auch nach Berücksichtigung der Bilanzierung anhält für das Durchschnittsalter und die Anzahl früherer Arbeiten der Teammitglieder. Wenn das Arbeitsspektrum von Wissenschaftlern und Erfindern kleiner wird, nimmt die disruptive Aktivität ab.

Zusammenfassend berichten wir von einem deutlichen Rückgang disruptiver Wissenschaft und Technologie im Laufe der Zeit. Unsere Analysen zeigen, dass dieser Trend wahrscheinlich nicht durch Änderungen in der Zitierpraxis oder der Qualität veröffentlichter Arbeiten getrieben wird. Vielmehr stellt der Rückgang einen wesentlichen Wandel in Wissenschaft und Technologie dar, der die Besorgnis über eine Verlangsamung der Innovationstätigkeit verstärkt. Wir führen diesen Trend zum Teil darauf zurück, dass sich Wissenschaftler und Erfinder auf einen engeren Bestand an vorhandenem Wissen verlassen. Auch wenn Wissenschaftsphilosophen Recht haben mögen, dass das Wachstum von Wissen ein endogener Prozess ist – bei dem angesammeltes Verständnis künftige Entdeckungen und Erfindungen fördert –, ist die Auseinandersetzung mit einem breiten Spektrum an vorhandenem Wissen notwendig, damit dieser Prozess ablaufen kann, eine Anforderung, die schwieriger zu sein scheint mit der Zeit. Sich auf engere Wissensbereiche zu verlassen, kommt der individuellen Karriere zugute53, nicht jedoch dem wissenschaftlichen Fortschritt im Allgemeinen.

Darüber hinaus stellen wir fest, dass die bloße Zahl stabil geblieben ist, auch wenn die Verbreitung störender Arbeiten zurückgegangen ist. Einerseits könnte dieses Ergebnis darauf hindeuten, dass es eine feste „Tragfähigkeit“ für hochgradig disruptive Wissenschaft und Technologie gibt. In diesem Fall könnten sich politische Interventionen zur Steigerung dieser Arbeit als schwierig erweisen. Andererseits legt unsere Beobachtung einer erheblichen Fluktuation in den zugrunde liegenden Bereichen, die für die Produktion disruptiver Wissenschaft und Technologie verantwortlich sind, die potenzielle Bedeutung von Faktoren wie den wechselnden Interessen von Geldgebern und Wissenschaftlern und der „Reife“ des wissenschaftlichen und technologischen Wissens für Durchbrüche nahe In diesem Fall kann die Produktion disruptiver Arbeit auf politische Hebel reagieren. In jedem Fall deutet die Stabilität, die wir bei der schieren Zahl bahnbrechender Veröffentlichungen und Patente beobachten, darauf hin, dass Wissenschaft und Technologie offenbar noch nicht das Ende der „endlosen Grenze“ erreicht haben. Es bleibt Raum für die regelmäßige Umleitung, dass disruptive Arbeiten zum wissenschaftlichen und technischen Fortschritt beitragen.

Unsere Studie ist nicht ohne Einschränkungen. Obwohl die bisherige Forschung die Gültigkeit des CD-Index12,34 bestätigt, handelt es sich insbesondere um einen relativ neuen Indikator für Innovationsaktivität und wird von künftigen Arbeiten zu seinem Verhalten und seinen Eigenschaften profitieren, insbesondere über Datenquellen und Kontexte hinweg. Besonders aufschlussreich wären Studien, die die Wirkung unterschiedlicher Zitierpraktiken54,55, die je nach Fachgebiet unterschiedlich sind, systematisch untersuchen.

Insgesamt vertiefen unsere Ergebnisse das Verständnis der Wissensentwicklung und können als Leitfaden für Karriereplanung und Wissenschaftspolitik dienen. Um bahnbrechende Wissenschaft und Technologie zu fördern, können Wissenschaftler dazu ermutigt werden, viel zu lesen, und ihnen Zeit gegeben werden, mit der schnell wachsenden Wissensgrenze Schritt zu halten. Universitäten könnten auf den Fokus auf Quantität verzichten und die Qualität der Forschung stärker belohnen56 und möglicherweise einjährige Sabbaticals stärker subventionieren. Bundesbehörden können in riskantere und längerfristige individuelle Auszeichnungen investieren, die Karrieren und nicht nur bestimmte Projekte unterstützen57 und Wissenschaftlern so die Zeit schenken, die sie brauchen, um aus dem Getümmel herauszutreten, sich von der Veröffentlichungs-oder-Untergangs-Kultur zu befreien und wirklich folgenreiche Arbeit zu leisten. Ein umfassenderes Verständnis des Niedergangs disruptiver Wissenschaft und Technologie ermöglicht ein dringend notwendiges Umdenken in den Strategien zur Organisation der Produktion von Wissenschaft und Technologie in der Zukunft.

Wir beschränken unseren Fokus auf Forschungsarbeiten, die zwischen 1945 und 2010 veröffentlicht wurden. Obwohl die WoS-Daten im Jahr 1900 beginnen, veränderten sich Umfang und soziale Organisation der Wissenschaft in der Nachkriegszeit deutlich, was Vergleiche mit der Gegenwart schwierig und möglicherweise irreführend machte67, 68,69. Wir beenden unsere Analysen der Papiere im Jahr 2010, da einige unserer Maßnahmen die Daten mehrerer Jahre nach der Veröffentlichung des Papiers erfordern. Das WoS-Datenarchiv umfasst 65 Millionen Dokumente, die zwischen 1900 und 2017 in 28.968 Zeitschriften veröffentlicht wurden, darunter 735 Millionen Zitate. Darüber hinaus umfassen die WoS-Daten die Titel und den vollständigen Text der Abstracts für 65 bzw. 29 Millionen Datensätze, die zwischen 1913 und 2017 veröffentlicht wurden. Nach Eliminierung nicht wissenschaftlicher Dokumente (z. B. Buchrezensionen und Kommentare) und Unterteilung der Daten in Im Zeitfenster 1945–2010 besteht die analytische Stichprobe aus n = 24.659.076 Arbeiten.

Wir beschränken unseren Fokus auf Patente, die ab 1976 erteilt wurden. Dies ist das früheste Jahr, für das maschinenlesbare Aufzeichnungen in den Daten der Patentansicht verfügbar sind. Wie bei den Papieren beenden wir unsere Analysen im Jahr 2010, da für die Berechnung einiger Maßnahmen Daten aus Folgejahren erforderlich sind. Die Patents View-Daten sind die umfassendste Quelle historischer Daten zu Erfindungen und enthalten Informationen zu 6,5 Millionen Patenten, die zwischen 1976 und 2017 erteilt wurden, und den entsprechenden 92 Millionen Zitaten. Die Daten der Patents View umfassen die Titel und Zusammenfassungen von 6,5 Millionen Patenten, die zwischen 1976 und 2017 erteilt wurden. Im Anschluss an frühere Arbeiten12 haben wir unsere Aufmerksamkeit auf Gebrauchspatente gerichtet, die die überwiegende Mehrheit (91 % in unseren Daten) der patentierten Erfindungen abdecken. Nach Eliminierung von Nicht-Gebrauchspatenten und Untergliederung der Daten in den Zeitraum 1976–2010 besteht die analytische Stichprobe aus n = 3.912.353 Patenten.

Beobachtungen (und Behauptungen) einer Verlangsamung des Fortschritts in Wissenschaft und Technologie werden immer häufiger, was nicht nur durch die von uns berichteten Beweise gestützt wird, sondern auch durch frühere Forschungen aus verschiedenen methodischen und disziplinären Perspektiven10,11,18,19,20,21,22,23 ,24. Doch wie im Haupttext angemerkt, besteht ein Spannungsverhältnis zwischen Beobachtungen eines langsameren Fortschritts bei aggregierten Daten einerseits und anhaltenden Berichten über scheinbar große Durchbrüche in vielen Bereichen der Wissenschaft und Technologie – von der Messung von Schwerewellen bis hin zur Messung von Gravitationswellen Sequenzierung des menschlichen Genoms – zum anderen. Um dieses Spannungsverhältnis auszugleichen, haben wir die Möglichkeit in Betracht gezogen, dass Entdeckungen und Erfindungen im Laufe der Zeit zwar insgesamt weniger störend sein könnten, die übergeordnete Sichtweise früherer Arbeiten jedoch eine erhebliche Heterogenität verschleiern könnte. Anders ausgedrückt: Die Gesamtheit der Belege für eine Verlangsamung des Fortschritts schließt die Möglichkeit nicht aus, dass eine Untergruppe von Entdeckungen und Erfindungen höchst disruptiv ist.

Um diese Möglichkeit zu bewerten, zeichnen wir die Anzahl der disruptiven Papiere (Abb. 4a) und Patente (Abb. 4b) im Zeitverlauf auf, wobei disruptive Papiere und Patente als solche mit CD5-Werten > 0 definiert werden. Innerhalb jedes Panels zeichnen wir vier Linien ein, die vier gleichmäßig verteilten Intervallen – (0, 0,25], (0,25, 0,5], (0,5, 0,75], (0,75, 1,00] – über den positiven Werten von CD5 entsprechen. Die ersten beiden Die Intervalle entsprechen daher Papieren und Patenten, die relativ schwach störend sind, während die beiden letztgenannten denjenigen entsprechen, die stärker störend sind (wo wir beispielsweise große Durchbrüche wie einige der oben genannten erwarten können). Trotz erheblicher Zuwächse in Während wir die Anzahl der jedes Jahr veröffentlichten Arbeiten und Patente erhöhen, sehen wir kaum Veränderungen bei der Anzahl äußerst störender Arbeiten und Patente, wie die relativ flachen roten, grünen und orangefarbenen Linien zeigen. Bemerkenswert ist, dass diese „Erhaltung“ der störenden Arbeit auch trotz Schwankungen Bestand hat im Laufe der Zeit in der Zusammensetzung der wissenschaftlichen und technologischen Bereiche, die für die Produktion der disruptivsten Arbeit verantwortlich sind (Abb. 4, Nebendiagramme). Insgesamt tragen diese Ergebnisse dazu bei, gleichzeitige Beobachtungen beider großer Durchbrüche in vielen Bereichen der Wissenschaft und Technologie und im Aggregat zu erklären Anzeichen für eine Verlangsamung des Fortschritts.

Unsere Ergebnisse zeigen einen stetigen Rückgang der disruptiven Wirkung von Wissenschaft und Technologie im Laufe der Zeit. Darüber hinaus sind die von uns beobachteten Muster in weiten Studienbereichen im Allgemeinen ähnlich, was darauf hindeutet, dass die Faktoren, die den Rückgang vorantreiben, nicht nur auf bestimmte Bereiche der Wissenschaft und Technologie beschränkt sind. Der Rückgang könnte durch andere Faktoren verursacht werden, beispielsweise durch die Bedingungen von Wissenschaft und Technologie zu einem bestimmten Zeitpunkt oder durch die einzelnen Personen, die Wissenschaft und Technologie hervorbringen. Beispielsweise können exogene Faktoren wie die Wirtschaftslage Forschungs- oder Erfindungspraktiken fördern, die weniger störend sind. Ebenso können Wissenschaftler und Erfinder verschiedener Generationen unterschiedliche Ansätze verfolgen, was zu mehr oder weniger starken Tendenzen zur Produktion disruptiver Arbeiten führen kann. Wir haben daher versucht, den relativen Beitrag der Faktoren Fachgebiet, Jahr und Autor (oder Erfinder) zum Niedergang disruptiver Wissenschaft und Technologie zu verstehen.

Zu diesem Zweck haben wir den relativen Beitrag von feld-, jahres- und autorenfesten Effekten zur Vorhersagekraft von Regressionsmodellen des CD-Index zerlegt. Die Beobachtungseinheit in diesen Regressionen ist Autor (oder Erfinder) × Jahr. Wir geben feste Feldeffekte mithilfe granularer Teilfeldindikatoren ein (d. h. 150 WoS-Themenbereiche für Aufsätze, 138 NBER-Unterkategorien für Patente). Der Einfachheit halber haben wir in unseren Modellen keine weiteren Kovariaten über die festen Effekte hinaus einbezogen. Feldfeste Effekte erfassen alle feldspezifischen Faktoren, die nicht je nach Autor oder Jahr variieren (z. B. das grundlegende Thema); Jahresfeste Effekte erfassen alle jahresspezifischen Faktoren, die nicht je nach Fachgebiet oder Autor variieren (z. B. der Stand der Kommunikationstechnologie); Die festen Effekte des Autors (oder Erfinders) erfassen alle autorenspezifischen Faktoren, die nicht je nach Fachgebiet oder Jahr variieren (z. B. das Jahr der Verleihung des Doktortitels). Nachdem wir unser Modell spezifiziert haben, bestimmen wir mithilfe der Shapley-Owen-Zerlegung den relativen Beitrag der festen Feld-, Jahres- und Autoreneffekte zum gesamten modellbereinigten R2. Konkret bewerten wir angesichts unserer n = 3 Gruppen fester Effekte (Feld, Jahr und Autor) den relativen Beitrag jedes Satzes fester Effekte, indem wir das angepasste R2 separat für die 2n Modelle unter Verwendung von Teilmengen der Prädiktoren schätzen. Der relative Beitrag jedes Satzes fester Effekte wird dann unter Verwendung des Shapley-Werts aus der Spieltheorie70 berechnet.

Die Ergebnisse dieser Analyse sind in der erweiterten Datenabbildung 5 dargestellt, sowohl für Veröffentlichungen (obere Leiste) als auch für Patente (untere Leiste). Die Gesamtbalkengröße entspricht dem Wert des angepassten R2 für das vollständig spezifizierte Modell (d. h. mit allen drei Gruppen fester Effekte). In Übereinstimmung mit unseren Beobachtungen aus Diagrammen des CD-Index im Zeitverlauf stellen wir fest, dass sowohl bei Veröffentlichungen als auch bei Patenten feldspezifische Faktoren den geringsten relativen Beitrag zum angepassten R2 leisten (0,02 bzw. 0,01 für Veröffentlichungen und Patente). Im Gegensatz dazu scheinen feste Autoreneffekte viel stärker zur Vorhersagekraft des Modells beizutragen, und zwar sowohl für Veröffentlichungen (0,20) als auch für Patente (0,17). Forscher und Erfinder, die in den letzten Jahren in dieses Fachgebiet eingestiegen sind, sehen sich möglicherweise mit einer höheren Wissenslast konfrontiert und greifen daher darauf zurück, auf engeren Bereichen der bestehenden Arbeit aufzubauen (z. B. aufgrund einer spezialisierteren Doktorandenausbildung), was im Allgemeinen zu weniger disruptiven wissenschaftlichen Erkenntnissen führen würde Technologie, die in späteren Jahren produziert wird, im Einklang mit unseren Erkenntnissen. Bei jährlichen Fixeffekten ist das Muster komplexer; Obwohl jahresspezifische Faktoren, die sich nicht je nach Fachgebiet oder Autor unterscheiden, sowohl für Aufsätze (0,02) als auch für Patente (0,16) eine größere Erklärungskraft als Fachgebiet haben, scheinen sie für letztere wesentlich wichtiger zu sein als für erstere. Zusammengenommen deuten diese Ergebnisse darauf hin, dass relativ stabile Faktoren, die zwischen einzelnen Wissenschaftlern und Erfindern variieren, besonders wichtig für das Verständnis von Veränderungen der Störwirkung im Laufe der Zeit sein könnten. Die Ergebnisse bestätigen auch, dass bereichsspezifische Faktoren in den Bereichen Wissenschaft und Technologie nur eine sehr geringe Rolle bei der Erklärung des Rückgangs der Störwirkung von Veröffentlichungen und Patenten spielen.

Wir haben auch darüber nachgedacht, ob die von uns dokumentierten Muster möglicherweise Artefakte unserer Wahl der Datenquellen sind. Obwohl wir sowohl in den WoS- als auch in den Patents View-Daten konsistente Trends beobachten und beide Datenbanken von der Science of Science-Community häufig genutzt werden, können unsere Ergebnisse möglicherweise durch Faktoren wie Änderungen in der Abdeckung beeinflusst werden (z. B. hinzugefügte oder aus WoS ausgeschlossene Zeitschriften). im Laufe der Zeit) oder sogar Datenfehler statt grundlegender Veränderungen in Wissenschaft und Technologie. Um diese Möglichkeit zu bewerten, haben wir daher CD5 für Arbeiten in vier weiteren Datenbanken berechnet – JSTOR, dem Korpus der American Physical Society, Microsoft Academic Graph und PubMed. Wir haben alle Aufzeichnungen von 1930 bis 2010 von PubMed (16.774.282 Artikel), JSTOR (1.703.353 Artikel) und der American Physical Society (478.373 Artikel) einbezogen. Die JSTOR-Daten wurden auf besondere Anfrage von ITHAKA, dem Datenverwalter (http://www.ithaka.org), erhalten, ebenso wie die Daten der American Physical Society (https://journals.aps.org/datasets). Wir haben die Microsoft Academic Graph-Daten von CADRE an der Indiana University (https://cadre.iu.edu/) heruntergeladen. Die PubMed-Daten wurden vom FTP-Server der National Library of Medicine (ftp://ftp.ncbi.nlm.nih.gov/pubmed/baseline) heruntergeladen. Aufgrund des außergewöhnlich großen Umfangs von Microsoft Academic Graph und des damit verbundenen Rechenaufwands haben wir zufällig 1 Million Artikel extrahiert. Wie in Abb. 6 der erweiterten Daten dargestellt, ist der Abwärtstrend bei der Störwirkung bei allen Stichproben erkennbar.

In mehreren neueren Veröffentlichungen wurden alternative Spezifikationen des CD-Index12 vorgestellt. Wir haben anhand zweier alternativer Varianten untersucht, ob die von uns beobachteten Rückgänge der Störwirkung bestätigt werden. Ein Kritikpunkt am CD-Index war, dass die Anzahl der Arbeiten, die nur die Referenzen des Schwerpunktpapiers zitieren, das Maß dominiert13. Bornmann et al.13 schlägt \({{\rm{DI}}}_{l}^{{\rm{nok}}}\) als Variante vor, die für dieses Problem weniger anfällig ist. Eine weitere potenzielle Schwäche des CD-Index besteht darin, dass er sehr empfindlich auf kleine Änderungen in den Vorwärtszitiermustern von Artikeln reagieren kann, die keine Rückwärtszitate vornehmen15. Leydesdorff et al.15 schlagen DI* als alternativen Indikator für Störungen vor, der dieses Problem angeht. Daher haben wir \({{\rm{DI}}}_{l}^{{\rm{nok}}}\) berechnet, wobei l = 5 und DI* für jeweils 100.000 zufällig ausgewählte Arbeiten und Patente aus unserer Analysestichprobe . Die Ergebnisse sind in den erweiterten Daten Abb. 7a (Papiere) und b (Patente) dargestellt. Die blauen Linien zeigen Störungen basierend auf Bornmann et al.13 und die orangefarbenen Linien zeigen Störungen basierend auf Leydesdorff et al.15 an. Im gesamten Wissenschafts- und Technologiebereich zeigen beide alternativen Messgrößen einen Rückgang der Störungen im Laufe der Zeit, ähnlich den beim CD-Index beobachteten Mustern. Zusammengenommen deuten diese Ergebnisse darauf hin, dass die von uns dokumentierten Rückgänge bei Störungen kein Artefakt unserer besonderen Operationalisierung sind.

Wir haben auch darüber nachgedacht, ob unsere Ergebnisse möglicherweise auf Änderungen in der Veröffentlichungs-, Zitier- oder Autorenpraxis zurückzuführen sind und nicht auf wesentliche Veränderungen bei Entdeckungen und Erfindungen. Am kritischsten ist vielleicht, wie im Haupttext erwähnt, dass es im Zeitraum unserer Studie zu einer deutlichen Ausweitung der Veröffentlichungs- und Patentierungstätigkeit kam. Diese Ausweitung hat natürlich dazu geführt, dass die Menge früherer Arbeiten, die für die aktuelle Wissenschaft und Technologie relevant sind und daher gefährdet sind, zitiert zu werden, zugenommen hat, ein Muster, das sich in der deutlichen Zunahme der durchschnittlichen Anzahl der Zitate von Aufsätzen und Patenten (d. h. Aufsätzen und Patenten) widerspiegelt Patente zitieren mehr frühere Arbeiten als in früheren Epochen)44,45. Denken Sie daran, dass der CD-Index den Grad quantifiziert, in dem zukünftige Arbeiten ein Schwerpunktwerk zusammen mit seinen Vorgängern zitieren (d. h. die Referenzen in der Bibliographie des Schwerpunktwerks). Die stärkere Zitierung eines Schwerpunktwerks unabhängig von seinen Vorgängern wird als Beleg für einen gesellschaftlichen Umbruchsprozess gewertet. Da in Veröffentlichungen und Patenten jedoch mehr frühere Arbeiten zitiert werden, kann die Wahrscheinlichkeit, dass ein Schwerpunktwerk unabhängig von seinen Vorgängern zitiert wird, automatisch sinken; Je häufiger ein Schwerpunktwerk zitiert wird, desto wahrscheinlicher ist es, dass zukünftige Arbeiten es zusammen mit einem seiner Vorgänger zitieren, auch wenn dies zufällig der Fall ist. Folglich kann ein Anstieg der Zahl der zum Zitieren verfügbaren Veröffentlichungen und Patente sowie der durchschnittlichen Zahl der von Wissenschaftlern und Erfindern vorgenommenen Zitate zu den sinkenden Werten des CD-Index beitragen. Kurz gesagt: Angesichts der deutlichen Veränderungen in Wissenschaft und Technologie während unseres langen Studienzeitraums ist der CD-Index der in früheren Zeiträumen veröffentlichten Arbeiten und Patente möglicherweise nicht direkt mit denen neuerer Jahrgänge vergleichbar, was wiederum unsere Schlussfolgerungen über den Rückgang beeinflussen könnte in disruptiver Wissenschaft und Technologie verdächtig. Wir haben diese Bedenken mit drei unterschiedlichen, aber sich ergänzenden Ansätzen angegangen: Normalisierung, Regressionsanpassung und Simulation.

Zunächst entwickelten wir gemäß der gängigen Praxis in der bibliometrischen Forschung39,40,41,42,43 zwei normalisierte Versionen des CD-Index mit dem Ziel, Vergleiche über einen längeren Zeitraum hinweg zu erleichtern. Unter den verschiedenen Komponenten des CD-Index haben wir unser Augenmerk auf die Anzahl der Arbeiten oder Patente gerichtet, die nur die Referenzen des Schwerpunktwerks zitieren (Nk), da dieser Begriff am ehesten mit der Zunahme von Veröffentlichungen und Patenten sowie in der Veröffentlichung zunehmen dürfte durchschnittliche Anzahl der Zitate von Aufsätzen und Patenten auf frühere Arbeiten13. Größere Werte von Nk führen zu kleineren Werten des CD-Index. Folglich können deutliche Anstiege von Nk im Laufe der Zeit, insbesondere im Vergleich zu anderen Komponenten der Messung, zu einer Abwärtstendenz führen und dadurch unsere Fähigkeit beeinträchtigen, disruptive Wissenschaft und Technologie in späteren Jahren genau mit früheren Zeiträumen zu vergleichen.

Unsere beiden normalisierten Versionen des CD-Index zielen darauf ab, dieser potenziellen Verzerrung entgegenzuwirken, indem sie den Effekt von Nk-Erhöhungen abschwächen. In der ersten Version, die wir „Papier normalisiert“ nennen, subtrahieren wir von Nk die Anzahl der Zitate, die in der Schwerpunktarbeit oder im Patent auf frühere Arbeiten vorgenommen wurden (Nb). Die Intuition hinter dieser Anpassung besteht darin, dass Nk wahrscheinlich größer ist, wenn in einer Schwerpunktarbeit oder einem Patent mehr frühere Arbeiten zitiert werden, da es für zukünftige Arbeiten mehr Möglichkeiten gibt, die Vorgänger der Schwerpunktarbeit oder des Patents zu zitieren. Dieser Anstieg von Nk würde zu niedrigeren Werten des CD-Index führen, allerdings nicht unbedingt aufgrund einer geringeren Störwirkung des Schwerpunktpapiers oder -patents. In der zweiten Version, die wir „Feld × Jahr normalisiert“ nennen, subtrahieren wir Nk von der durchschnittlichen Anzahl rückwärts zitierter Arbeiten oder Patente im WoS-Forschungsgebiet bzw. in der NBER-Technologiekategorie des Schwerpunktpapiers oder Patents im Jahr Veröffentlichung (wir beschriften diese Menge mit \({N}_{{\rm{b}}}^{{\rm{m}}{\rm{e}}{\rm{a}}{\rm{n} }}\)). Die Intuition hinter dieser Anpassung ist, dass in Bereichen und Zeiträumen, in denen Wissenschaftler und Erfinder eher dazu neigen, frühere Arbeiten zu zitieren, Nk wahrscheinlich auch größer ist, was zu niedrigeren Werten des CD-Index führt, wenn auch wiederum nicht unbedingt weil die Schwerpunktarbeit oder das Schwerpunktpatent weniger störend ist. In Fällen, in denen entweder Nb oder \({N}_{{\rm{b}}}^{{\rm{m}}{\rm{e}}{\rm{a}}{\rm{n }}}\) den Wert von Nk überschreiten, setzen wir Nk auf 0 (das heißt, Nk ist in den normalisierten Maßen niemals negativ). Beide Anpassungen des CD-Index basieren auf etablierten Ansätzen in der Literatur zur Szientometrie und können als eine Form der „Zitierungsseitennormalisierung“ verstanden werden (d. h. Normalisierung durch Korrektur der Auswirkungen von Unterschieden in der Länge von Referenzlisten)40.

In Extended Data Abb. 8 stellen wir die Durchschnittswerte beider normalisierter Versionen des CD-Index über die Zeit dar, getrennt für Aufsätze (Extended Data Abb. 8a) und Patente (Extended Data Abb. 8d). In Übereinstimmung mit unseren im Haupttext berichteten Erkenntnissen beobachten wir weiterhin einen Rückgang des CD-Index im Laufe der Zeit, was darauf hindeutet, dass die Muster, die wir in disruptiver Wissenschaft und Technologie beobachten, wahrscheinlich nicht auf Änderungen in der Zitierpraxis zurückzuführen sind.

Zweitens haben wir mögliche Störfaktoren mithilfe eines regressionsbasierten Ansatzes korrigiert. Dieser Ansatz ergänzt die soeben beschriebenen bibliometrischen Normalisierungen, indem er es uns ermöglicht, ein breiteres Spektrum an Änderungen in den Veröffentlichungs-, Zitier- und Autorenpraktiken im Allgemeinen zu berücksichtigen (wobei letztere weder im Normalisierungsansatz noch im unten beschriebenen Simulationsansatz direkt berücksichtigt werden). und erhöht insbesondere den Umfang der bisherigen Arbeiten, die für die aktuelle Wissenschaft und Technik relevant sind. In der Ergänzungstabelle 1 berichten wir über die Ergebnisse von Regressionsmodellen, die CD5 für Veröffentlichungen (Modelle 1–4) und Patente (Modelle 5–8) vorhersagen, wobei Indikatorvariablen für jedes Jahr unseres Studienfensters enthalten sind (die Referenzkategorien sind 1945 und 1980). für Aufsätze bzw. Patente). Die Modelle 1 und 4 sind die Basismodelle und beinhalten keine weiteren Anpassungen über die Jahresindikatoren hinaus. In den Modellen 2 und 5 fügen wir feste Unterfeldeffekte hinzu (WoS-Themenbereiche für Aufsätze und NBER-Technologie-Unterkategorien für Patente). Schließlich fügen wir in den Modellen 3–4 und 7–8 Kontrollvariablen für mehrere Fachgebiete x Jahre hinzu – Anzahl neuer Veröffentlichungen oder Patente, mittlere Anzahl zitierter Veröffentlichungen oder Patente, mittlere Anzahl von Autoren oder Erfindern pro Veröffentlichung – und Veröffentlichungs- oder Merkmale auf Patentebene (Anzahl der zitierten Arbeiten oder Patente) und ermöglichen so aussagekräftigere Vergleiche der Muster disruptiver Wissenschaft und Technologie über den langen Zeitraum unserer Studie. Für die Papiermodelle integrieren wir auch eine Kontrolle auf Papierebene für die Anzahl der nicht verlinkten Referenzen (d. h. die Anzahl der Zitate auf Werke, die nicht in WoS indexiert sind). Wir stellen fest, dass die Einbeziehung dieser Kontrollen die Modellanpassung verbessert, wie aus den statistisch signifikanten Wald-Tests hervorgeht, die unterhalb der relevanten Modelle dargestellt sind.

Bei allen acht in der Ergänzungstabelle 1 gezeigten Modellen stellen wir fest, dass die Koeffizienten der Jahresindikatoren statistisch signifikant und negativ sind und mit der Zeit an Größe zunehmen, was mit den Mustern übereinstimmt, die wir auf der Grundlage des unbereinigten CD5-Werteindex im Haupttext berichtet haben (Abb. 2). In Extended Data Abb. 8 visualisieren wir die Ergebnisse unseres regressionsbasierten Ansatzes, indem wir die vorhergesagten CD5-Werte für jeden der in den Modellen 4 (Papiere) und 8 (Patente) enthaltenen Jahresindikatoren separat grafisch darstellen. Um Vergleiche mit den im Haupttext gezeigten CD5-Rohwerten zu ermöglichen, stellen wir die einzelnen Vorhersagen für jedes Jahr als Liniendiagramm dar. Wie in der Abbildung dargestellt, beobachten wir weiterhin sinkende Werte des CD-Index bei allen Veröffentlichungen und Patenten, selbst wenn Änderungen in der Veröffentlichungs-, Zitier- und Autorenpraxis berücksichtigt werden.

Drittens haben wir im Anschluss an verwandte Arbeiten in Science of Science14,71,72,73 überlegt, ob unsere Ergebnisse ein Artefakt veränderter Muster in Veröffentlichungs- und Zitierpraktiken mithilfe eines Simulationsansatzes sein könnten. Im Wesentlichen misst der CD-Index Störungen, indem er das Netzwerk von Zitaten rund um eine Schwerpunktarbeit oder ein Patent charakterisiert. Viele komplexe Netzwerke, selbst solche, die aus zufälligen Prozessen resultieren, weisen jedoch Strukturen auf, die bei gängigen Netzwerkmaßen (z. B. Clustering) nicht triviale Werte liefern74,75,76. Während des von unserer Studie erfassten Zeitraums erfuhren die Zitationsnetzwerke von Wissenschaft und Technologie erhebliche Veränderungen, mit einem deutlichen Anstieg sowohl der Anzahl der Knoten (d. h. Papiere oder Patente) als auch der Kanten (d. h. der Zitate). Daher ist der beobachtete Rückgang der Störungen möglicherweise nicht auf einen sinnvollen sozialen Prozess zurückzuführen, sondern möglicherweise auf diese strukturellen Veränderungen in den zugrunde liegenden Zitiernetzwerken zurückzuführen.

Um diese Möglichkeit zu bewerten, folgten wir den Standardtechniken der Netzwerkwissenschaft75,77 und führten eine Analyse durch, bei der wir den CD-Index für zufällig neu verkabelte Zitationsnetzwerke neu berechneten. Wenn die Muster, die wir im CD-Index beobachten, das Ergebnis struktureller Veränderungen in den Zitationsnetzwerken von Wissenschaft und Technologie (z. B. Wachstum der Anzahl von Knoten oder Kanten) und nicht eines sinnvollen sozialen Prozesses sind, dann sollten diese Muster auch sichtbar sein in vergleichbaren Zufallsnetzwerken, die ähnliche strukturelle Veränderungen erfahren. Daher würde die Feststellung, dass sich die Muster, die wir im CD-Index sehen, für die beobachteten und zufälligen Zitationsnetzwerke unterscheiden, als Beweis dafür dienen, dass der Rückgang der Störungen kein Artefakt der Daten ist.

Wir begannen damit, Kopien des zugrunde liegenden Zitationsnetzwerks zu erstellen, auf dem die Werte des CD-Index basierten, der in allen im Haupttext berichteten Analysen verwendet wurde, getrennt für Veröffentlichungen und Patente. Für jedes Zitationsnetzwerk (eines für Aufsätze, eines für Patente) haben wir dann die Zitationen mithilfe eines graderhaltenden Randomisierungsalgorithmus neu verkabelt. In jeder Iteration des Algorithmus werden zwei Kanten (z. B. A–B und C–D) aus dem zugrunde liegenden Zitationsnetzwerk ausgewählt, woraufhin der Algorithmus versucht, die beiden Endpunkte der Kanten (z. B. A–B) zu vertauschen A–D und C–D wird zu C–B). Bleibt die Gradzentralität von A, B, C und D nach dem Tausch gleich, bleibt der Tausch erhalten; Andernfalls verwirft der Algorithmus den Austausch und fährt mit der nächsten Iteration fort. Bei der Bewertung der Gradzentralität berücksichtigen wir „In-Grade“ (d. h. Zitate aus anderen Arbeiten oder Patenten auf die Schwerpunktarbeit oder das Schwerpunktpatent) und „Out-Grade“ (d. h. Zitate aus der Schwerpunktarbeit oder dem Schwerpunktpatent auf andere Arbeiten oder Patente). Patente) separat. Darüber hinaus forderten wir auch, dass die Altersverteilung der zitierenden und zitierten Arbeiten oder Patente im ursprünglichen und neu verdrahteten Netzwerk identisch war. Konkret wurden Tauschvorgänge nur dann beibehalten, wenn das Erscheinungsjahr der Original- und Kandidatenzitate identisch war. Angesichts dieser Entwurfsentscheidungen sollte unser Neuverkabelungsalgorithmus als ziemlich konservativ angesehen werden, da er die wesentliche Struktur des ursprünglichen Netzwerks beibehält. Es besteht kein wissenschaftlicher Konsens darüber, wie viele Austausche erforderlich sind, um sicherzustellen, dass sich das ursprüngliche und das neu verkabelte Netzwerk ausreichend voneinander unterscheiden. Die Regel, die wir hier anwenden, ist 100 × m, wobei m die Anzahl der Kanten im Netzwerk ist, die neu verkabelt werden.

Im Anschluss an frühere Arbeiten14 haben wir zehn neu verkabelte Kopien der beobachteten Zitiernetzwerke sowohl für Veröffentlichungen als auch für Patente erstellt. Nachdem wir diese neu verkabelten Zitationsnetzwerke erstellt hatten, berechneten wir CD5 neu. Aufgrund des großen Umfangs der WoS-Daten basieren wir unsere Analysen auf einer zufälligen Teilstichprobe von zehn Millionen Artikeln; CD5 wurde für alle Patente im neu verkabelten Netzwerk berechnet. Für jede Arbeit und jedes Patent berechnen wir dann einen z-Score, der den beobachteten CD5-Wert mit denen der gleichen Arbeit oder des gleichen Patents in den zehn neu verkabelten Zitiernetzwerken vergleicht. Positive z-Werte weisen darauf hin, dass der beobachtete CD5-Wert größer (d. h. störender) ist, als man zufällig erwarten würde; Negative Z-Werte weisen darauf hin, dass die beobachteten Werte geringer sind (d. h. stärker konsolidieren).

Die Ergebnisse dieser Analysen sind in Extended Data Abb. 8 dargestellt, getrennt für Arbeiten (Extended Data Abb. 8c) und Patente (Extended Data Abb. 8f). Die Linien entsprechen dem durchschnittlichen Z-Score der im Fokusjahr veröffentlichten Arbeiten oder Patente. Die Diagramme offenbaren ein Änderungsmuster im CD-Index, das über das hinausgeht, was in der sich ändernden Struktur des Netzwerks verankert ist. Wir stellen fest, dass Papiere und Patente im Durchschnitt tendenziell weniger störend sind, als man zufällig erwarten würde, und darüber hinaus wird die Lücke zwischen den beobachteten CD-Indexwerten und denen aus den zufällig neu verkabelten Netzwerken mit der Zeit größer, was mit unseren Erkenntnissen übereinstimmt eines Rückgangs disruptiver Wissenschaft und Technologie.

Insgesamt deuten die Ergebnisse der vorangehenden Analysen darauf hin, dass es im Laufe unseres langen Studienfensters zwar deutliche Veränderungen in Wissenschaft und Technologie gegeben hat, insbesondere in Bezug auf Veröffentlichungs-, Zitier- und Autorenpraktiken, der Rückgang der disruptiven Wissenschaft und Technologie, die wir haben Es ist unwahrscheinlich, dass ein Dokument, das den CD-Index verwendet, ein Artefakt dieser Änderungen ist, sondern vielmehr eine wesentliche Veränderung in der Natur von Entdeckungen und Erfindungen darstellt.

Wir bewerten den Zusammenhang zwischen Störeffektivität und der Nutzung von Vorwissen mithilfe von Regressionsmodellen und prognostizieren CD5 für einzelne Arbeiten und Patente auf der Grundlage von drei Indikatoren für die Nutzung von Vorwissen – der Vielfalt der zitierten Arbeiten, der durchschnittlichen Anzahl von Selbstzitaten und dem Durchschnittsalter der Arbeit zitiert. Unser Maß für die Vielfalt der zitierten Arbeiten wird auf der Ebene Fachgebiet x Jahr gemessen; Alle anderen in die Regressionen einbezogenen Variablen werden auf der Ebene der Arbeit oder des Patents definiert. Um potenzielle Störfaktoren zu berücksichtigen, berücksichtigten unsere Modelle Jahres- und Feldfixeffekte. Jahresfeste Effekte berücksichtigen zeitvariante Faktoren, die alle Beobachtungen (Papiere oder Patente) gleichermaßen beeinflussen (z. B. globale Wirtschaftstrends). Feldfeste Effekte berücksichtigen feldspezifische Faktoren, die sich im Laufe der Zeit nicht ändern (z. B. können einige Bereiche disruptive Arbeit intrinsisch höher bewerten als konsolidierende). Im Gegensatz zu unseren deskriptiven Diagrammen berücksichtigen wir bei unseren Regressionsmodellen Feldeffekte mithilfe der detaillierteren 150 WoS-„erweiterten Themen“ (zum Beispiel „Biochemie und Molekularbiologie“, „Biophysik“, „Biotechnologie und angewandte Mikrobiologie“, „ Zellbiologie“, „Entwicklungsbiologie“, „Evolutionsbiologie“ und „Mikrobiologie“ sind erweiterte Fächer innerhalb des Forschungsbereichs Biowissenschaften und Biomedizin) und 38 Unterkategorien der NBER-Technologie (z. B. „Landwirtschaft“, „Lebensmittel“, „Textil“; „Beschichtung“, „Gas“, „organisch“ und „Harze“ sind Unterkategorien innerhalb der Kategorie „Chemietechnologie“.

Darüber hinaus berücksichtigen wir auch das „Durchschnittsalter der Teammitglieder“ (d. h. das „Karrierealter“, definiert als die Differenz zwischen dem Veröffentlichungsjahr der Schwerpunktarbeit oder des Patents und dem ersten Jahr, in dem jeder Autor oder Erfinder veröffentlichte). eine Arbeit oder ein Patent) und die „durchschnittliche Anzahl früherer Arbeiten, die von Teammitgliedern erstellt wurden“. Obwohl ein Anstieg der Selbstzitierungsraten darauf hindeuten kann, dass sich Wissenschaftler und Erfinder immer stärker auf ihre eigene Arbeit konzentrieren, können diese Raten teilweise auch durch die Menge früherer Arbeiten bedingt sein, die für Selbstzitierungen zur Verfügung stehen. Auch wenn der Anstieg des in Veröffentlichungen und Patenten genannten Arbeitsalters ein Hinweis darauf sein könnte, dass Wissenschaftler und Erfinder Schwierigkeiten haben, mitzuhalten, kann er auch auf die rasch alternde Belegschaft in Wissenschaft und Technik zurückzuführen sein78,79. Beispielsweise sind ältere Wissenschaftler und Erfinder möglicherweise besser mit älteren Arbeiten vertraut, nehmen diese aufmerksamer wahr oder wehren sich möglicherweise aktiv gegen Veränderungen80. Diese Kontrollvariablen helfen, diese alternativen Erklärungen zu berücksichtigen.

Ergänzende Tabelle 3 zeigt zusammenfassende Statistiken für Variablen, die in den Regressionsmodellen der gewöhnlichen kleinsten Quadrate verwendet werden. Die Vielfalt der zitierten Arbeiten wird anhand der normalisierten Entropie gemessen, die zwischen 0 und 1 liegt. Höhere Werte für dieses Maß weisen auf eine gleichmäßigere Verteilung der Zitate auf ein breiteres Spektrum bestehender Arbeiten hin; Niedrigere Werte deuten auf eine konzentriertere Verteilung der Zitate auf einen kleineren Bereich bestehender Arbeiten hin. Die Tabellen zeigen, dass die normalisierte Entropie in einem bestimmten Bereich und Jahr sowohl für Wissenschaft als auch für Technologie eine nahezu maximale durchschnittliche Entropie von 0,98 aufweist. Etwa 16 % der in einer Arbeit zitierten Arbeiten stammen von einem Autor der Schwerpunktarbeit; der entsprechende Anteil bei Patenten liegt bei etwa 7 %. Papiere stützen sich tendenziell auf ältere Arbeiten und Arbeiten, deren Alter (gemessen an der Standardabweichung) stärker variiert als Patente. Darüber hinaus liegt der durchschnittliche CD5-Wert einer Arbeit bei 0,04, während der durchschnittliche CD5-Wert eines Patents bei 0,12 liegt, was bedeutet, dass die durchschnittliche Arbeit tendenziell weniger störend ist als das durchschnittliche Patent.

Wir stellen fest, dass der Einsatz vielfältigerer Arbeiten, weniger eigener Arbeiten und älterer Arbeiten tendenziell mit der Produktion disruptiverer Wissenschaft und Technologie verbunden ist, selbst wenn das Durchschnittsalter und die Anzahl früherer Arbeiten von Teammitgliedern berücksichtigt werden. Diese Ergebnisse basieren auf unseren Regressionsergebnissen, die in der erweiterten Datentabelle 1 dargestellt sind. Die Modelle 6 und 12 stellen die vollständigen Regressionsmodelle dar. Die Modelle zeigen ein konsistentes Muster sowohl für Wissenschaft als auch für Technologie, wobei die Koeffizienten für die Diversität der zitierten Arbeiten positiv und signifikant für Veröffentlichungen (0,159, P < 0,01) und Patente (0,069, P < 0,01) sind, was darauf hindeutet, dass dies in Bereichen der Fall ist Je mehr vielfältige Arbeit genutzt wird, desto größer ist die Störung. Unter Berücksichtigung aller anderen Variablen erhöht sich der prognostizierte CD5 von Arbeiten und Patenten um 303,5 % bzw. 1,3 %, wenn die Vielfalt der zitierten Arbeiten um 1 sd zunimmt. Der Koeffizient des Verhältnisses von Selbstzitaten zur gesamten zitierten Arbeit ist negativ und signifikant für Veröffentlichungen (−0,011, P < 0,01) und Patente (−0,060, P < 0,01), was zeigt, dass Entdeckungen und Erfindungen tendenziell weniger störend sind, wenn sich Forscher oder Erfinder mehr auf ihre eigene Arbeit verlassen. Wenn man wiederum alle anderen Variablen auf ihrem Mittelwert hält, sinkt der prognostizierte CD5 von Veröffentlichungen und Patenten um 622,9 % bzw. 18,5 %, mit einem Anstieg des Verhältnisses um 1 SD. Der Koeffizient der Interaktion zwischen dem Durchschnittsalter der zitierten Arbeit und der Streuung des Alters der zitierten Arbeit ist positiv und signifikant für Arbeiten (0,000, P < 0,01) und Patente (0,001, P < 0,01), was darauf hindeutet, dass – die Streuung des Alters beibehalten wird der zitierten Arbeiten sind konstant – Veröffentlichungen und Patente, die sich mit älteren Arbeiten befassen, wirken eher störend. Der prognostizierte CD5 von Arbeiten und Patenten steigt um beeindruckende 2.072,4 % bzw. 58,4 %, wenn das Durchschnittsalter der zitierten Arbeit um 1 SD ansteigt (etwa neun bzw. acht Jahre für Arbeiten und Patente), wobei alle anderen Variablen wiederum gleich bleiben ihre Mittel. Zusammenfassend deuten die Regressionsergebnisse darauf hin, dass Änderungen in der Nutzung von Vorwissen zur Produktion weniger disruptiver Wissenschaft und Technologie beitragen können.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die mit dieser Studie verbundenen Daten sind in einem öffentlichen Repository unter https://doi.org/10.5281/zenodo.7258379 frei verfügbar. Unsere Studie stützt sich auf Daten aus sechs Quellen: der American Physical Society, JSTOR, Microsoft Academic Graph, Patents View, PubMed und WoS. Daten von Microsoft Academic Graph, Patents View und PubMed sind öffentlich verfügbar, und unser Repository enthält vollständige Daten für Analysen aus diesen Quellen. Daten der American Physical Society, JSTOR und WoS sind nicht öffentlich verfügbar und wurden unter Lizenz der jeweiligen Herausgeber verwendet. Um die Replikation zu erleichtern, enthält unser Repository begrenzte Versionen der Daten aus diesen Quellen, die die Berechnung grundlegender deskriptiver Statistiken ermöglichen. Die Autoren stellen Vollversionen dieser Daten auf Anfrage und mit Genehmigung ihrer jeweiligen Herausgeber zur Verfügung. Quelldaten werden mit diesem Dokument bereitgestellt.

Open-Source-Code zu dieser Studie ist unter https://doi.org/10.5281/zenodo.7258379 und http://www.cdindex.info verfügbar. Wir haben Python v.3.10.6 (pandas v.1.4.3, numpy v.1.23.1, matplotlib v.3.5.2, seaborn v.0.11.2, spacy v.2.2, jupyterlab v.3.4.4) verwendet Daten verarbeiten, analysieren und visualisieren sowie statistische Analysen durchführen. Wir haben MariaDB v.10.6.4 verwendet, um Daten zu verarbeiten. Wir haben R v.4.2.1 (ggplot2 v.3.36, ggrepel v.0.9.0) verwendet, um Daten zu visualisieren. Wir haben StataMP v.17.0 (reghdfe v.5.7.3) verwendet, um statistische Analysen durchzuführen.

Fleming, L. Rekombinante Unsicherheit in der technologischen Suche. Verwalten. Wissenschaft. 47, 117–132 (2001).

Artikel Google Scholar

Schumpeter, J. Kapitalismus, Sozialismus und Demokratie (Perennial, 1942).

Koyré, A. Ein unveröffentlichter Brief von Robert Hooke an Isaac Newton. ISIS 43, 312–337 (1952).

Artikel MathSciNet MATH Google Scholar

Popper, K. Vermutungen und Widerlegungen: Das Wachstum wissenschaftlicher Erkenntnisse (Routledge, 2014).

Fleck, L. Entstehung und Entwicklung einer wissenschaftlichen Tatsache (Univ. Chicago Press, 2012).

Acemoglu, D., Akcigit, U. & Kerr, WR Innovationsnetzwerk. Proz. Natl Acad. Wissenschaft. USA 113, 11483–11488 (2016).

Artikel ADS CAS Google Scholar

Weitzman, ML Rekombinantes Wachstum. QJ Econ. 113, 331–360 (1998).

Artikel MathSciNet MATH Google Scholar

Tria, F., Loreto, V., Servedio, VDP & Strogatz, SH Die Dynamik korrelierter Neuheiten. Wissenschaft. Rep. 4, 1–8 (2014).

Artikel Google Scholar

Fink, TMA, Reeves, M., Palma, R. & Farr, RS Zufall und Strategie bei schneller Innovation. Nat. Komm. 8, 1–9 (2017).

Artikel CAS Google Scholar

Pammolli, F., Magazzini, L. & Riccaboni, M. Die Produktivitätskrise in der pharmazeutischen Forschung und Entwicklung. Nat. Rev. Drug Discov. 10, 428–438 (2011).

Artikel CAS Google Scholar

Bloom, N., Jones, CI, Van Reenen, J. & Webb, M. Werden Ideen immer schwieriger zu finden? Bin. Wirtschaft. Rev. 110, 1104–1144 (2020).

Artikel Google Scholar

Funk, RJ & Owen-Smith, J. Ein dynamisches Netzwerkmaß für technologischen Wandel. Verwalten. Wissenschaft. 63, 791–817 (2017).

Artikel Google Scholar

Bornmann, L., Devarakonda, S., Tekles, A. & Chacko, G. Sind Störungsindexindikatoren konvergent gültig? Der Vergleich mehrerer Indikatorvarianten mit Einschätzungen von Peers. Quant. Wissenschaft. Zucht. 1, 1242–1259 (2020).

Artikel Google Scholar

Uzzi, B., Mukherjee, S., Stringer, M. & Jones, B. Atypische Kombinationen und wissenschaftliche Auswirkungen. Wissenschaft 342, 468–472 (2013).

Artikel ADS CAS Google Scholar

Leydesdorff, L., Tekles, A. & Bornmann, L. Ein Vorschlag zur Überarbeitung des Störungsindex. Prof. Inf. 30, e300121 (2021).

Lu, C. et al. Analyse sprachlicher Komplexität und wissenschaftlicher Auswirkungen. J. Informetr. 13, 817–829 (2019).

Artikel Google Scholar

Hofstra, B. et al. Das Diversitäts-Innovations-Paradoxon in der Wissenschaft. Proz. Natl Acad. Wissenschaft. USA 117, 9284–9291 (2020).

Artikel ADS CAS Google Scholar

Jones, BF Die Last des Wissens und der „Tod des Renaissance-Mannes“: Wird Innovation immer schwieriger? Rev. Econ. Zucht. 76, 283–317 (2009).

Artikel MATH Google Scholar

Gordon, RJ Der Aufstieg und Fall des amerikanischen Wachstums (Princeton Univ. Press, 2016).

Chu, JSG & Evans, JA Verlangsamter kanonischer Fortschritt in großen Wissenschaftsbereichen. Proz. Natl Acad. Wissenschaft. USA 118, e2021636118 (2021).

Artikel CAS Google Scholar

Packalen, M. & Bhattacharya, J. NIH-Finanzierung und das Streben nach Spitzenwissenschaft. Proz. Natl Acad. Wissenschaft. USA 117, 12011–12016 (2020).

Artikel ADS CAS Google Scholar

Jaffe, AB & Lerner, J. Innovation und ihre Unzufriedenheit: Wie unser kaputtes Patentsystem Innovation und Fortschritt gefährdet und was man dagegen tun kann (Princeton Univ. Press, 2011).

Horgan, J. Das Ende der Wissenschaft: Angesichts der Grenzen des Wissens im Zwielicht des wissenschaftlichen Zeitalters (Basic Books, 2015).

Collison, P. & Nielsen, M. Die Wissenschaft bekommt weniger für ihr Geld (Atlantic, 2018).

Nolan, A. Künstliche Intelligenz und die Zukunft der Wissenschaft. oecd.ai, https://oecd.ai/en/wonk/ai-future-of-science (25. Oktober 2021).

Wirksame Richtlinien zur Förderung von Forschung mit hohem Risiko und hohem Ertrag. OECD-Politikpapiere zu Wissenschaft, Technologie und Industrie (OECD, 2021).

Cowen, T. Die große Stagnation: Wie Amerika alle niedrig hängenden Früchte der modernen Geschichte aß, krank wurde und sich (irgendwann) besser fühlen wird (Penguin, 2011).

Einstein, A. Die Welt, wie ich sie sehe (Citadel Press, 1949).

Arthur, WB Die Struktur der Erfindung. Res. Richtlinie 36, 274–287 (2007).

Artikel Google Scholar

Tushman, ML & Anderson, P. Technologische Diskontinuitäten und organisatorische Umgebungen. Adm. Sci. Q. 31, 439–465 (1986).

Artikel Google Scholar

Kohn, W. & Sham, LJ Selbstkonsistente Gleichungen einschließlich Austausch- und Korrelationseffekten. Physik. Rev. 140, A1133 (1965).

Artikel ADS MathSciNet Google Scholar

Watson, JD & Crick, FHC Molekulare Struktur von Nukleinsäuren: eine Struktur für Desoxyribose-Nukleinsäure. Natur 171, 737–738 (1953).

Artikel ADS CAS Google Scholar

Bornmann, L. & Tekles, A. Der Störungsindex hängt von der Länge des Zitierfensters ab. Prof. Inf. 28, e280207 (2019).

Wu, L., Wang, D. & Evans, JA Große Teams entwickeln sich und kleine Teams verändern Wissenschaft und Technologie. Natur 566, 378–382 (2019).

Artikel ADS CAS Google Scholar

Kuhn, TS The Structure of Scientific Revolutions (Univ. Chicago Press, 1962).

Brad Wray, K. Kuhn und die Entdeckung von Paradigmen. Philos. Soc. Wissenschaft. 41, 380–397 (2011).

Artikel Google Scholar

Ioannidis, JPA Warum die meisten veröffentlichten Forschungsergebnisse falsch sind. PLoS Med. 2, e124 (2005).

Artikel Google Scholar

Li, J., Yin, Y., Fortunato, S. & Wang, D. Ein Datensatz mit Veröffentlichungsdatensätzen für Nobelpreisträger. Wissenschaft. Daten 6, 1–10 (2019).

Artikel Google Scholar

Bornmann, L. & Marx, W. Methoden zur Generierung normalisierter Citation Impact Scores in der Bibliometrie: Welche Methode spiegelt die Urteile von Experten am besten wider? J. Informetr. 9, 408–418 (2015).

Artikel Google Scholar

Waltman, L. Eine Überprüfung der Literatur zu Zitierwirkungsindikatoren. J. Informetr. 10, 365–391 (2016).

Artikel Google Scholar

Waltman, L. & van Eck, NJ im Springer Handbook of Science and Technology Indicators (Hrsg. Glänzel, W. et al.) 281–300 (Springer, 2019).

Bornmann, L. Wie kann der Einfluss von Zitaten in der Bibliometrie normalisiert werden? Ein neuer Ansatz, der Zitierseitennormalisierung und Zitierperzentile kombiniert. Quant. Wissenschaft. Zucht. 1, 1553–1569 (2020).

Artikel Google Scholar

Petersen, AM, Pan, RK, Pammolli, F. & Fortunato, S. Methoden zur Berücksichtigung der Zitierinflation bei der Forschungsbewertung. Res. Richtlinie 48, 1855–1865 (2019).

Artikel Google Scholar

Bornmann, L. & Mutz, R. Wachstumsraten der modernen Wissenschaft: eine bibliometrische Analyse basierend auf der Anzahl der Veröffentlichungen und zitierten Referenzen. J. Assoc. Inf. Wissenschaft. Technol. 66, 2215–2222 (2015).

Artikel CAS Google Scholar

Bornmann, L., Haunschild, R. & Mutz, R. Wachstumsraten der modernen Wissenschaft: ein latenter stückweiser Wachstumskurvenansatz zur Modellierung von Publikationszahlen aus etablierten und neuen Literaturdatenbanken. Humanit. Soc. Wissenschaft. Komm. 8, 1–15 (2021).

Artikel Google Scholar

Jones, BF & Weinberg, BA Altersdynamik in der wissenschaftlichen Kreativität. Proz. Natl Acad. Wissenschaft. USA 108, 18910–18914 (2011).

Artikel ADS CAS Google Scholar

Bonzi, S. & Snyder, H. Motivationen für das Zitieren: ein Vergleich von Selbstzitaten und Zitieren mit anderen. Scientmetrics 21, 245–254 (1991).

Artikel Google Scholar

Fowler, J. & Aksnes, D. Lohnt sich Selbstzitierung? Szientometrie 72, 427–437 (2007).

Artikel Google Scholar

King, MM, Bergstrom, CT, Correll, SJ, Jacquet, J. & West, JD Männer legen ihre eigenen Zitate hoch: Geschlecht und Selbstzitierung in allen Bereichen und im Laufe der Zeit. Socius 3, 2378023117738903 (2017).

Artikel Google Scholar

Mukherjee, S., Romero, DM, Jones, B. & Uzzi, B. Die nahezu universelle Verbindung zwischen dem Zeitalter des vergangenen Wissens und den Durchbrüchen in Wissenschaft und Technologie von morgen: der Hotspot. Wissenschaft. Adv. 3, e1601315 (2017).

Artikel ADS Google Scholar

Merton, RK Singletons und Vielfache in der wissenschaftlichen Entdeckung: ein Kapitel in der Wissenschaftssoziologie. Proz. Bin. Philos. Soc. 105, 470–486 (1961).

Google Scholar

Wang, D., Song, C. & Barabási, A.-L. Quantifizierung langfristiger wissenschaftlicher Auswirkungen. Wissenschaft 342, 127–132 (2013).

Artikel ADS CAS Google Scholar

Leahey, E. Nicht nur durch Produktivität: Wie Sichtbarkeit und Spezialisierung zum akademischen Einkommen beitragen. Bin. Soziol. Rev. 72, 533–561 (2007).

Artikel Google Scholar

Tahamtan, I. & Bornmann, L. Kernelemente im Zitierprozess von Publikationen: konzeptioneller Überblick über die Literatur. J. Informetr. 12, 203–216 (2018).

Artikel Google Scholar

Tahamtan, I. & Bornmann, L. Was messen Zitationszählungen? Eine aktualisierte Übersicht über Studien zu Zitaten in wissenschaftlichen Dokumenten, die zwischen 2006 und 2018 veröffentlicht wurden. Scientmetrics 121, 1635–1684 (2019).

Artikel Google Scholar

Bhattacharya, J. & Packalen, M. Stagnation and Scientific Incentives (Working Paper 26752), https://www.nber.org/papers/w26752 (2020).

Azoulay, P., Graff Zivin, JS & Manso, G. Anreize und Kreativität: Beweise aus den akademischen Biowissenschaften. RAND J. Econ. 42, 527–554 (2011).

Artikel Google Scholar

Baltimore, D. Virale RNA-abhängige DNA-Polymerase: RNA-abhängige DNA-Polymerase in Virionen von RNA-Tumorviren. Natur 226, 1209–1211 (1970).

Artikel ADS CAS Google Scholar

Page, L. Methode zum Knotenranking in einer verknüpften Datenbank. US-Patent 6.285.999 (2001).

Axel, R., Wigler, MH & Silverstein, SJ Verfahren zum Einfügen von DNA in eukaryontische Zellen und zur Herstellung proteinhaltiger Materialien. US-Patent 4.634.665 (1983).

Hawbaker, MS Sojabohnensorte SE90346. US-Patent 6.958.436 (2005).

Katsuki, T. & Sharpless, KB Die erste praktische Methode zur asymmetrischen Epoxidierung. Marmelade. Chem. Soc. 102, 5974–5976 (1980).

Riess, AG, et al. Beobachtungsbeweise von Supernovae für ein sich beschleunigendes Universum und eine kosmologische Konstante. Astron. J. 116, 1009 (1998).

Dirac, PAM Die Quantentheorie des Elektrons. Proz. R. Soc. London. Eine Mathematik. Physik. Wissenschaft. 117, 610–624 (1928).

ANZEIGEN MATH Google Scholar

Sanger, F., Nicklen, S. & Coulson, AR DNA-Sequenzierung mit kettenterminierenden Inhibitoren. Proz. Natl Acad. Wissenschaft. USA 74, 5463–5467 (1977).

Artikel ADS CAS Google Scholar

Bednorz, JG & Müller, KA Mögliche Hoch-Tc-Supraleitung im Ba-La-Cu-O-System. Z. Phys. B Kondensatoren. Materie 64, 189–193 (1986).

Wuchty, S., Jones, BF & Uzzi, B. Die zunehmende Dominanz von Teams bei der Wissensproduktion. Wissenschaft 316, 1036–1039 (2007).

Artikel ADS CAS Google Scholar

Guimera, R., Uzzi, B., Spiro, J. & Amaral, LAN Teamzusammenstellungsmechanismen bestimmen die Netzwerkstruktur der Zusammenarbeit und die Teamleistung. Wissenschaft 308, 697–702 (2005).

Artikel ADS CAS Google Scholar

Jones, BF, Wuchty, S. & Uzzi, B. Multiuniversitäre Forschungsteams: sich verändernde Auswirkungen, Geographie und Schichtung in der Wissenschaft. Science 322, 1259–1262 (2008).

Artikel ADS CAS Google Scholar

Grömping, U. Schätzer von relativer Bedeutung in der linearen Regression basierend auf Varianzzerlegung. Bin. Stat. 61, 139–147 (2007).

Artikel MathSciNet Google Scholar

Mukherjee, S., Uzzi, B., Jones, B. & Stringer, M. Eine neue Methode zur Identifizierung von Neukombinationen vorhandenen Wissens im Zusammenhang mit wirkungsvollen Innovationen. J. Prod. Innov. Verwalten. 33, 224–236 (2016).

Artikel Google Scholar

Christianson, NH, Sizemore Blevins, A. & Bassett, DS Architektur und Entwicklung semantischer Netzwerke in Mathematiktexten. Proz. R. Soc. A 476, 20190741 (2020).

Artikel ADS MathSciNet MATH Google Scholar

Newman, MEJ Die Struktur wissenschaftlicher Kooperationsnetzwerke. Proz. Natl Acad. Wissenschaft. USA 98, 404–409 (2001).

Artikel ADS MathSciNet CAS MATH Google Scholar

Newman, MEJ Wissenschaftliche Kooperationsnetzwerke. I. Netzwerkaufbau und grundlegende Ergebnisse. Physik. Rev. E 64, 016131 (2001).

Artikel ADS CAS Google Scholar

Uzzi, B. & Spiro, J. Zusammenarbeit und Kreativität: das Problem der kleinen Welt. Bin. J. Sociol. 111, 447–504 (2005).

Artikel Google Scholar

Funk, RJ Machen Sie das Beste aus Ihrem Standort: Geografie, Netzwerke und Innovation in Organisationen. Acad. Verwalten. J. 57, 193–222 (2014).

Artikel Google Scholar

Barabási, A.-L. Netzwerkwissenschaft (Cambridge Univ. Press, 2016).

Blau, DM & Weinberg, BA Warum die Arbeitskräfte im Wissenschafts- und Ingenieurwesen in den USA schnell altern. Proz. Natl Acad. Wissenschaft. USA 114, 3879–3884 (2017).

Artikel ADS CAS Google Scholar

Cui, H., Wu, L. & Evans, JA Alternde Wissenschaftler und verlangsamter Fortschritt. Vorabdruck unter https://doi.org/10.48550/arXiv.2202.04044 (2022).

Azoulay, P., Fons-Rosen, C. & Graff Zivin, JS Bringt die Wissenschaft jeweils eine Beerdigung voran? Bin. Wirtschaft. Rev. 109, 2889–2920 (2019).

Artikel Google Scholar

Referenzen herunterladen

Diese Studie wurde von der National Science Foundation unterstützt (Zuschussnummern 1829168, 1932596 und 1829302).

Carlson School of Management, University of Minnesota, Minneapolis, MN, USA

Michael Park & ​​Russell J. Funk

Fakultät für Soziologie, University of Arizona, Tucson, AZ, USA

Erin Leahey

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

RJF und EL haben gemeinsam zur Konzeption und Gestaltung der Studie beigetragen. RJF und MP trugen gemeinsam zur Erfassung, Analyse und Interpretation der Daten bei. RJF hat die in der Studie verwendete Software erstellt. RJF, EL und MP haben das Manuskript gemeinsam entworfen und überarbeitet.

Korrespondenz mit Russell J. Funk.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature dankt Diana Hicks und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Diese Abbildung gibt einen Überblick über die Verteilung von CD5 für Aufsätze (n = 24.659.076) und Patente (n = 3.912.353). Die Felder a und c zeigen die Anzahl der Veröffentlichungen und Patente über diskrete CD5-Intervalle. Die Felder b und d zeigen die Verteilung von CD5 über die Zeit innerhalb von Intervallen von 10 (Papiere) und 5 (Patente) Jahren unter Verwendung von Buchstaben-Wert-Diagrammen. Diese Diagramme ähneln Boxplots, bieten jedoch im Allgemeinen zuverlässigere Zusammenfassungen für große Datensätze. Sie werden erstellt, indem der Median der zugrunde liegenden Verteilung identifiziert und dann von dort aus rekursiv Kästchen nach außen in beide Richtungen gezeichnet werden, die die Hälfte der verbleibenden Daten umfassen.

Quelldaten

Diese Zahl bewertet die Sensitivität unserer Ergebnisse gegenüber der Verwendung verschiedener Forward-Citation-Fenster bei der Berechnung des CD-Index für Aufsätze (n = 24.659.076) und Patente (n = 3.912.353). Im Haupttext wird der Index auf der Grundlage von Zitierungen auf Veröffentlichungen und Patente sowie deren Rückverweise ab einem Zeitraum von fünf Jahren nach dem Erscheinungsjahr berechnet. a und c zeichnen den CD-Index unter Verwendung eines längeren Zeitfensters von 10 Jahren für Veröffentlichungen bzw. Patente auf. b und d zeichnen den CD-Index unter Verwendung aller Vorwärtszitate auf Beispielpapiere und Patente aus dem Jahr 2017 auf. Die schattierten Bänder entsprechen 95 %-Konfidenzintervallen. Insgesamt spiegeln die Ergebnisse die im Haupttext berichteten Ergebnisse wider, wobei der Rückgang bei Verwendung längerer Vorwärtszitierfenster etwas stärker ausfällt, was darauf hindeutet, dass unsere primären Ergebnisse möglicherweise eine konservativere Schätzung darstellen.

Quelldaten

Diese Abbildung zeigt Veränderungen im Verhältnis von Einzelwörtern zu Gesamtwörtern (auch bekannt als Typ-Token-Verhältnis) im Laufe der Zeit, basierend auf Daten aus den Abstracts von Aufsätzen (a, n = 76 WoS-Forschungsgebiet × Beobachtungen pro Jahr) und Patenten (b, n = 229 NBER-Technologiekategorie × Jahresbeobachtungen). Bei Aufsätzen entsprechen die Zeilen den WoS-Forschungsbereichen; Bei Patenten entsprechen die Zeilen den NBER-Technologiekategorien. Für Aufsatzabstracts beginnen die Zeilen im Jahr 1992, da WoS Abstracts für Aufsätze, die vor den frühen 1990er Jahren veröffentlicht wurden, nicht zuverlässig erfasst. Das Verhältnis der eindeutigen Wörter zur Gesamtzahl der Wörter wird separat nach Feld berechnet (dh die Eindeutigkeit der Wörter und die Gesamtzahl der Wörter werden innerhalb der WoS-Forschungsbereiche und NBER-Technologiekategorien bestimmt). Wenn die Störung abnimmt, können wir durchaus mit einem Rückgang der Vielfalt der von Wissenschaftlern und Erfindern verwendeten Wörter rechnen, da Entdeckungen und Erfindungen weniger wahrscheinlich zu Abweichungen vom Status quo führen und daher weniger wahrscheinlich eingeführt werden müssen neue Terminologie. Sowohl bei Veröffentlichungen als auch bei Patenten beobachten wir im Laufe der Zeit eine abnehmende Diversität im Wortgebrauch, was mit dieser Erwartung übereinstimmt und unsere Ergebnisse anhand des CD-Index bestätigt.

Quelldaten

Diese Abbildung zeigt sich ändernde Muster in der kombinatorischen Neuheit/Konventionalität von Papieren (a, n = 24.659.076) und Patenten (b, n = 3.912.353) unter Verwendung eines zuvor vorgeschlagenen Maßes für „atypische Kombinationen“14. Das Maß quantifiziert den Grad, in dem die frühere Arbeit, die in einer Arbeit oder einem Patent zitiert wird, zufällig zu erwarten wäre. Bei Arbeiten orientieren wir uns an früheren Arbeiten14 und berücksichtigen Kombinationen zitierter Zeitschriften. Wenn ein Artikel drei Zitate auf frühere Arbeiten enthält und diese Arbeit in drei verschiedenen Zeitschriften veröffentlicht wurde – Nature, Cell und Science –, dann gibt es drei Kombinationen – Nature × Cell, Nature × Science und Science × Cell. Um zu bestimmen, inwieweit jede Kombination zufällig zu erwarten wäre, wird die Häufigkeit der beobachteten Paarungen mithilfe eines Z-Scores mit denen in 10 „neu verkabelten“ Kopien des gesamten Zitationsnetzwerks verglichen. Für Patente gibt es kein natürliches Analogon zu Zeitschriften, daher betrachten wir Paarungen der primären Codes des US-amerikanischen Patentklassifizierungssystems (USPC). Wir präsentieren die Ergebnisse dieser Analyse nach dem Ansatz früherer Arbeiten14, bei denen die kumulative Verteilungsfunktion des Maßes dargestellt wird. Im Allgemeinen gibt es im Zeitverlauf eine Verschiebung der kumulativen Verteilungen nach rechts, was darauf hindeutet, dass die Kombinationen sowohl bei Veröffentlichungen als auch bei Patenten konventioneller sind, als man zufällig erwarten würde, was im Einklang mit dem steht, was wir aufgrund unserer Ergebnisse unter Verwendung des CD-Index erwarten würden. Bei den Patenten gibt es auch eine kleinere Verschiebung in die entgegengesetzte Richtung auf der linken Seite der Verteilung, was darauf hindeutet, dass neuartige Patente der letzten Jahrzehnte etwas neuartiger sind als neuartige Patente früherer Jahrzehnte. Insgesamt bewegt sich der Großteil der Verteilung jedoch nach rechts, was auf eine größere Konventionalität hindeutet.

Diese Abbildung zeigt den relativen Beitrag der festen Feld-, Jahres- und Autoreneffekte zum angepassten R2 in Regressionsmodellen, die CD5 vorhersagen. Die obere Leiste zeigt die Ergebnisse für Artikel (n = 80.607.091 Artikel × Autorenbeobachtungen); Die untere Leiste zeigt die Ergebnisse für Patente (n = 8.319.826 Patent × Erfinderbeobachtungen). Die Ergebnisse deuten darauf hin, dass stabile Eigenschaften von Autoren sowohl bei Veröffentlichungen als auch bei Patenten erheblich zu Störmustern beitragen. Darüber hinaus ist ein relativ geringer Teil der Variation auf feldspezifische Faktoren zurückzuführen.

Quelldaten

Diese Abbildung zeigt Veränderungen von CD5 im Laufe der Zeit in vier weiteren Datenquellen (die Zeilen WoS [n = 24.659.076] und Patents View [n = 3.912.353] sind als Referenz enthalten): JSTOR (n = 1.703.353), das Korpus der American Physical Society (n = 478.373), Microsoft Academic Graph (n = 1.000.000) und PubMed (n = 16.774.282). Farben kennzeichnen die sechs verschiedenen Datenquellen. Die schattierten Bänder entsprechen 95 %-Konfidenzintervallen. Die Zahl zeigt, dass der Rückgang der Störungen wahrscheinlich nicht auf unsere Stichprobenauswahl an WoS-Papieren und Patents View-Patenten zurückzuführen ist.

Quelldaten

Diese Abbildung zeigt den Rückgang der Störung von Papieren (a, n = 100.000) und Patenten (b, n = 100.000) basierend auf zwei alternativen Störungsmaßen. Die blauen Linien berechnen Störungen mithilfe eines von Bornmann et al.13 vorgeschlagenen Maßes \({{DI}}_{l}^{{nok}}\) mit l = 5, was das Maß widerstandsfähiger gegenüber geringfügigen Änderungen macht die Anzahl der Arbeiten oder Patente, die nur die Referenzen der Schwerpunktarbeit zitieren. Die orangefarbenen Linien berechnen die Störung anhand eines von Leydesdorff et al.15 vorgeschlagenen Maßes, DI*, das das Maß weniger empfindlich gegenüber kleinen Änderungen in den Vorwärtszitiermustern von Artikeln oder Patenten macht, die keine Rückwärtszitate vorsehen. Die schattierten Bänder entsprechen 95 %-Konfidenzintervallen. Bei beiden alternativen Maßnahmen beobachten wir einen Rückgang der Störungen bei Papieren und Patenten, was darauf hindeutet, dass der Rückgang kein Artefakt unserer Operationalisierung der Störung ist.

Quelldaten

Mit dieser Zahl wird bewertet, ob der Rückgang der Störwirkung auf Änderungen der Veröffentlichungs-, Zitier- und Autorenpraktiken für Aufsätze (n = 24.659.076) und Patente (n = 3.912.353) zurückzuführen ist. Die Panels a und d passen sich mithilfe eines Normalisierungsansatzes an diese Änderungen an. Wir stellen zwei alternative Versionen des CD-Index vor, die beide der Tendenz von Veröffentlichungen und Patenten Rechnung tragen, im Laufe der Zeit mehr frühere Arbeiten zu zitieren. Blaue Linien zeigen eine Normalisierung auf Papierebene an (die die Anzahl der Zitate aus dem Schwerpunktpapier/Patent widerspiegelt). Orangefarbene Linien zeigen eine Normalisierung auf Fachgebiets- und Jahresebene an (die die durchschnittliche Anzahl der Zitierungen von Veröffentlichungen/Patenten im Schwerpunktgebiet und Jahr widerspiegelt). Die Panels b (Artikel) und e (Patente) passen sich mithilfe eines Regressionsansatzes an Änderungen in den Veröffentlichungs-, Zitier- und Autorenpraktiken an. Die Panels zeigen vorhergesagte CD5-Werte basierend auf Regressionen, die in den Modellen 4 (Papiere) und 8 (Patente) der Ergänzungstabelle 1 gemeldet wurden, die für Feld × Jahr angepasst sind – Anzahl neuer Papiere/Patente, mittlere Anzahl zitierter Papiere/Patente, Mittelwert Anzahl der Autoren/Erfinder pro Artikel/Patent – ​​und Artikel-/Patentebene – Anzahl der zitierten Artikel/Patente, Anzahl der nicht verknüpften Referenzen – Merkmale. Die Prognosen werden für jeden in den Modellen enthaltenen Jahresindikator separat erstellt; Anschließend verbinden wir diese einzelnen Vorhersagen mit Linien, um die Interpretation zu erleichtern. Schließlich passen sich die Panels c (Artikel) und f (Patente) mithilfe eines Simulationsansatzes an Änderungen in der Veröffentlichungs-, Zitier- und Autorenpraxis an. Die Panels zeichnen Z-Scores auf, die die CD5-Werte, die aus den beobachteten Zitiernetzwerken erhalten wurden, mit denen vergleichen, die aus zufällig neu verkabelten Kopien der beobachteten Netzwerke erhalten wurden. In allen sechs Panels entsprechen die schattierten Bänder 95 %-Konfidenzintervallen.

Quelldaten

Diese Zahl zeigt die Anzahl der veröffentlichten Arbeiten (n = 24.659.076) (a) und der erteilten Patente (n = 3.912.353) (b) im Zeitverlauf. Bei Aufsätzen entsprechen die Zeilen den WoS-Forschungsbereichen; Bei Patenten entsprechen die Zeilen den NBER-Technologiekategorien.

Quelldaten

Ergänzende Abschnitte 1–3, Tabellen 1–3 und Referenzen.

Springer Nature oder sein Lizenzgeber (z. B. eine Gesellschaft oder ein anderer Partner) besitzen die ausschließlichen Rechte an diesem Artikel im Rahmen einer Veröffentlichungsvereinbarung mit dem/den Autor(en) oder anderen Rechteinhaber(n); Die Selbstarchivierung der akzeptierten Manuskriptversion dieses Artikels durch den Autor unterliegt ausschließlich den Bedingungen dieser Veröffentlichungsvereinbarung und geltendem Recht.

Nachdrucke und Genehmigungen

Park, M., Leahey, E. & Funk, RJ Papiere und Patente werden mit der Zeit weniger störend. Natur 613, 138–144 (2023). https://doi.org/10.1038/s41586-022-05543-x

Zitat herunterladen

Eingegangen: 14. Februar 2022

Angenommen: 08. November 2022

Veröffentlicht: 04. Januar 2023

Ausgabedatum: 05. Januar 2023

DOI: https://doi.org/10.1038/s41586-022-05543-x

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Zeitschrift für Chemieinformatik (2023)

Natur menschliches Verhalten (2023)

Naturbiomedizinische Technik (2023)

Naturkommunikation (2023)

Natur (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.