Датасеты

Здесь мы собираем ссылки на открытые наборы данных, важных для наукометрии. Они пригодятся как академическим науковедам, так и прикладным специалистам. Будем рады советам по пополнению коллекции. Почти все данные снабжены идентификаторами, позволяющими связывать их с любыми другими. При использовании обращайте внимание на соответствующие лицензии, особенно это касается дата-майнинга и применения в коммерческих продуктах.

Для поиска любых - не только наукометрических - датасетов рекомендуем https://datasetsearch.research.google.com/

Датасеты сгруппированы по типам:

  1. Метаданные публикаций
  2. Авторы
  3. Организации
  4. Источники (журналы и не только)
  5. Тематические классификации
  6. Источники финансирования
  7. Полные тексты публикаций

На роль "глобального датасета" всевозможных - не только научных - метаданных претендует Wikidata, во многих датасетах представлены идентификаторы из этой системы. Подробнее об идеологии открытого связывания всего со всем - в нашем видео.

Публикации

Полные наборы метаданных из открытых баз:

  • CrossRef. Главные по сбору и открытому распространению метаданных о научных публикациях. Помимо свободного доступа через API раз в год выкладывают полный датасет (в 2022 - 130 миллионов публикаций, 160 gb). Датасет CrossRef - основа большинства открытых наукометрических баз.
пример данных по отдельной публикации
{
"status": "ok",
"message-type": "work",
"message-version": "1.0.0",
"message": {
    "indexed": {
    "date-parts": [
        [
        2023,
        1,
        24
        ]
    ],
    "date-time": "2023-01-24T14:14:21Z",
    "timestamp": 1674569661638
    },
    "reference-count": 52,
    "publisher": "PeerJ",
    "license": [
    {
        "start": {
        "date-parts": [
            [
            2018,
            2,
            13
            ]
        ],
        "date-time": "2018-02-13T00:00:00Z",
        "timestamp": 1518480000000
        },
        "content-version": "unspecified",
        "delay-in-days": 0,
        "URL": "http://creativecommons.org/licenses/by/4.0/"
    }
    ],
    "content-domain": {
    "domain": [],
    "crossmark-restriction": false
    },
    "short-container-title": [],
    "abstract": "<jats:p>Despite growing interest in Open Access (OA) to scholarly literature, there is an unmet need for large-scale, up-to-date, and reproducible studies assessing the prevalence and characteristics of OA. We address this need using oaDOI, an open online service that determines OA status for 67 million articles. We use three samples, each of 100,000 articles, to investigate OA in three populations: (1) all journal articles assigned a Crossref DOI, (2) recent journal articles indexed in Web of Science, and (3) articles viewed by users of Unpaywall, an open-source browser extension that lets users find OA articles using oaDOI. We estimate that at least 28% of the scholarly literature is OA (19M in total) and that this proportion is growing, driven particularly by growth in Gold and Hybrid. The most recent year analyzed (2015) also has the highest percentage of OA (45%). Because of this growth, and the fact that readers disproportionately access newer articles, we find that Unpaywall users encounter OA quite frequently: 47% of articles they view are OA. Notably, the most common mechanism for OA is not Gold, Green, or Hybrid OA, but rather an under-discussed category we dub Bronze: articles made free-to-read on the publisher website, without an explicit Open license. We also examine the citation impact of OA articles, corroborating the so-called open-access citation advantage: accounting for age and discipline, OA articles receive 18% more citations than average, an effect driven primarily by Green and Hybrid OA. We encourage further research using the free oaDOI service, as a way to inform OA policy and practice.</jats:p>",
    "DOI": "10.7717/peerj.4375",
    "type": "journal-article",
    "created": {
    "date-parts": [
        [
        2018,
        2,
        13
        ]
    ],
    "date-time": "2018-02-13T08:54:31Z",
    "timestamp": 1518512071000
    },
    "page": "e4375",
    "source": "Crossref",
    "is-referenced-by-count": 392,
    "title": [
    "The state of OA: a large-scale analysis of the prevalence and impact of Open Access articles"
    ],
    "prefix": "10.7717",
    "volume": "6",
    "author": [
    {
        "given": "Heather",
        "family": "Piwowar",
        "sequence": "first",
        "affiliation": [
        {
            "name": "Impactstory, Sanford, NC, USA"
        }
        ]
    },
    {
        "given": "Jason",
        "family": "Priem",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Impactstory, Sanford, NC, USA"
        }
        ]
    },
    {
        "given": "Vincent",
        "family": "Larivière",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "École de bibliothéconomie et des sciences de l’information, Université de Montréal, Montréal, QC, Canada"
        },
        {
            "name": "Observatoire des Sciences et des Technologies (OST), Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST), Université du Québec à Montréal, Montréal, QC, Canada"
        }
        ]
    },
    {
        "given": "Juan Pablo",
        "family": "Alperin",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Canadian Institute for Studies in Publishing, Simon Fraser University, Vancouver, BC, Canada"
        },
        {
            "name": "Public Knowledge Project, Canada"
        }
        ]
    },
    {
        "given": "Lisa",
        "family": "Matthias",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Scholarly Communications Lab, Simon Fraser University, Vancouver, Canada"
        }
        ]
    },
    {
        "given": "Bree",
        "family": "Norlander",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Information School, University of Washington, Seattle, USA"
        },
        {
            "name": "FlourishOA, USA"
        }
        ]
    },
    {
        "given": "Ashley",
        "family": "Farley",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Information School, University of Washington, Seattle, USA"
        },
        {
            "name": "FlourishOA, USA"
        }
        ]
    },
    {
        "given": "Jevin",
        "family": "West",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Information School, University of Washington, Seattle, USA"
        }
        ]
    },
    {
        "given": "Stefanie",
        "family": "Haustein",
        "sequence": "additional",
        "affiliation": [
        {
            "name": "Observatoire des Sciences et des Technologies (OST), Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST), Université du Québec à Montréal, Montréal, QC, Canada"
        },
        {
            "name": "School of Information Studies, University of Ottawa, Ottawa, ON, Canada"
        }
        ]
    }
    ],
    "member": "4443",
    "published-online": {
    "date-parts": [
        [
        2018,
        2,
        13
        ]
    ]
    },
    "reference": [
    {
        "key": "10.7717/peerj.4375/ref-1",
        "article-title": "When the wolf finally arrives: big deal cancelations in North American Libraries",
        "author": "Anderson",
        "year": "2017"
    },
    {
        "key": "10.7717/peerj.4375/ref-2",
        "article-title": "The forbidden forecast: thinking about open access and library subscriptions",
        "author": "Anderson",
        "year": "2017"
    },
    {
        "key": "10.7717/peerj.4375/ref-3",
        "article-title": "Leveraging the growth of open access in library collection decision making",
        "author": "Antelman",
        "year": "2017"
    },
    {
        "key": "10.7717/peerj.4375/ref-4",
        "author": "Archambault",
        "year": "2013",
        "journal-title": "Proportion of open access peer-reviewed papers at the European and world levels–2004–2011"
    },
    {
        "key": "10.7717/peerj.4375/ref-5",
        "author": "Archambault",
        "year": "2014",
        "journal-title": "Proportion of open access papers published in peer-reviewed journals at the European and world levels–1996–2013"
    },
    {
        "key": "10.7717/peerj.4375/ref-6",
        "article-title": "Research impact of paywalled versus open access papers",
        "author": "Archambault",
        "year": "2016"
    },
    {
        "key": "10.7717/peerj.4375/ref-7",
        "article-title": "Measuring the scientific output and impact of NIGMS grants",
        "author": "Berg",
        "year": "2010"
    },
    {
        "issue": "4",
        "key": "10.7717/peerj.4375/ref-8",
        "doi-asserted-by": "publisher",
        "first-page": "919",
        "DOI": "10.1016/j.joi.2016.08.002",
        "article-title": "Hybrid open access—a longitudinal study",
        "volume": "10",
        "author": "Björk",
        "year": "2016",
        "journal-title": "Journal of Informetrics"
    },
    {
        "issue": "2",
        "key": "10.7717/peerj.4375/ref-9",
        "doi-asserted-by": "publisher",
        "first-page": "131",
        "DOI": "10.1002/leap.1021",
        "article-title": "The open access movement at a crossroad: are the big publishers and academic social media taking over?",
        "volume": "29",
        "author": "Björk",
        "year": "2016",
        "journal-title": "Learned Publishing"
    },
    {
        "key": "10.7717/peerj.4375/ref-10",
        "doi-asserted-by": "publisher",
        "first-page": "173",
        "DOI": "10.1002/leap.1096",
        "article-title": "Gold, green, and black open access",
        "volume": "30",
        "author": "Björk",
        "year": "2017",
        "journal-title": "Learned Publishing"
    },
    {
        "issue": "2",
        "key": "10.7717/peerj.4375/ref-11",
        "doi-asserted-by": "crossref",
        "first-page": "237",
        "DOI": "10.1002/asi.22963",
        "article-title": "Anatomy of green open access",
        "volume": "65",
        "author": "Björk",
        "year": "2014",
        "journal-title": "Journal of the Association for Information Science and Technology"
    },
    {
        "issue": "6",
        "key": "10.7717/peerj.4375/ref-12",
        "doi-asserted-by": "publisher",
        "first-page": "e11273",
        "DOI": "10.1371/journal.pone.0011273",
        "article-title": "Open access to the scientific journal literature: situation 2009",
        "volume": "5",
        "author": "Björk",
        "year": "2010",
        "journal-title": "PLOS ONE"
    },
    {
        "issue": "6285",
        "key": "10.7717/peerj.4375/ref-13",
        "doi-asserted-by": "publisher",
        "first-page": "508",
        "DOI": "10.1126/science.352.6285.508",
        "article-title": "Who’s downloading pirated papers? Everyone",
        "volume": "352",
        "author": "Bohannon",
        "year": "2016",
        "journal-title": "Science"
    },
    {
        "issue": "3",
        "key": "10.7717/peerj.4375/ref-14",
        "doi-asserted-by": "publisher",
        "first-page": "1453",
        "DOI": "10.1007/s11192-016-2225-6",
        "article-title": "Availability of digital object identifiers in publications archived by PubMed",
        "volume": "110",
        "author": "Boudry",
        "year": "2017",
        "journal-title": "Scientometrics March"
    },
    {
        "key": "10.7717/peerj.4375/ref-15",
        "article-title": "Publishers take ResearchGate to court, alleging massive copyright infringement",
        "author": "Chawla",
        "year": "2017",
        "journal-title": "Science News"
    },
    {
        "issue": "3",
        "key": "10.7717/peerj.4375/ref-16",
        "doi-asserted-by": "publisher",
        "first-page": "243",
        "DOI": "10.1080/19322909.2013.795426",
        "article-title": "Journal article retrieval in an age of Open Access: how journal indexes indicate Open Access articles",
        "volume": "7",
        "author": "Chen",
        "year": "2013",
        "journal-title": "Journal of Web Librarianship"
    },
    {
        "issue": "2",
        "key": "10.7717/peerj.4375/ref-17",
        "doi-asserted-by": "publisher",
        "first-page": "108",
        "DOI": "10.1080/00987913.2016.1182672",
        "article-title": "Measuring the degrees of openness of scholarly journals with the open access spectrum (OAS) evaluation tool",
        "volume": "42",
        "author": "Chen",
        "year": "2016",
        "journal-title": "Serials Review"
    },
    {
        "issue": "3",
        "key": "10.7717/peerj.4375/ref-18",
        "doi-asserted-by": "publisher",
        "first-page": "239",
        "DOI": "10.1016/j.joi.2007.04.001",
        "article-title": "Do open access articles have greater citation impact?",
        "volume": "1",
        "author": "Craig",
        "year": "2007",
        "journal-title": "Journal of Informetrics"
    },
    {
        "key": "10.7717/peerj.4375/ref-19",
        "article-title": "Attribution 4.0 International (CC BY 4.0)",
        "author": "Creative Commons",
        "year": "2018"
    },
    {
        "key": "10.7717/peerj.4375/ref-20",
        "doi-asserted-by": "publisher",
        "first-page": "2129",
        "DOI": "10.1096/fj.11-183988",
        "article-title": "Open access, readership, citations: a randomized controlled trial of scientific journal publishing",
        "volume": "25",
        "author": "Davis",
        "year": "2011",
        "journal-title": "FASEB Journal"
    },
    {
        "key": "10.7717/peerj.4375/ref-21",
        "doi-asserted-by": "publisher",
        "first-page": "208",
        "DOI": "10.3163/1536-5050.99.3.008",
        "article-title": "The impact of free access to the scientific literature: a review of recent research",
        "volume": "99",
        "author": "Davis",
        "year": "2011",
        "journal-title": "Journal of the Medical Library Association"
    },
    {
        "key": "10.7717/peerj.4375/ref-22",
        "article-title": "A social networking site is not an open access repository",
        "author": "Fortney",
        "year": "2015",
        "journal-title": "Office of Scholarly Communication"
    },
    {
        "issue": "10",
        "key": "10.7717/peerj.4375/ref-23",
        "doi-asserted-by": "publisher",
        "first-page": "e13636",
        "DOI": "10.1371/journal.pone.0013636",
        "article-title": "Self-selected or mandated, open access increases citation impact for higher quality research",
        "volume": "5",
        "author": "Gargouri",
        "year": "2010",
        "journal-title": "PLOS ONE"
    },
    {
        "key": "10.7717/peerj.4375/ref-24",
        "article-title": "Green and gold open access percentages and growth, by discipline",
        "author": "Gargouri",
        "year": "2012"
    },
    {
        "issue": "1",
        "key": "10.7717/peerj.4375/ref-25",
        "doi-asserted-by": "publisher",
        "first-page": "98",
        "DOI": "10.1016/j.joi.2015.11.008",
        "article-title": "Availability of digital object identifiers (DOIs) in web of science and scopus",
        "volume": "10",
        "author": "Gorraiz",
        "year": "2016",
        "journal-title": "Journal of Informetrics"
    },
    {
        "key": "10.7717/peerj.4375/ref-26",
        "doi-asserted-by": "publisher",
        "DOI": "10.12688/f1000research.11366.1",
        "article-title": "Looking into Pandora’s Box: the content of Sci-Hub and its usage [version 1; referees: 2 approved, 2 approved with reservations]",
        "volume": "6",
        "author": "Greshake",
        "year": "2017",
        "journal-title": "F1000Research"
    },
    {
        "key": "10.7717/peerj.4375/ref-27",
        "article-title": "Ten-year cross-disciplinary comparison of the growth of open access and how it increases research citation impact",
        "author": "Hajjem",
        "year": "2006"
    },
    {
        "issue": "1",
        "key": "10.7717/peerj.4375/ref-28",
        "doi-asserted-by": "publisher",
        "first-page": "36",
        "DOI": "10.1080/00987913.2008.10765150",
        "article-title": "The access/impact problem and the green and gold roads to open access: an update",
        "volume": "34",
        "author": "Harnad",
        "year": "2008",
        "journal-title": "Serials Review"
    },
    {
        "key": "10.7717/peerj.4375/ref-29",
        "doi-asserted-by": "publisher",
        "article-title": "Sci-Hub provides access to nearly all scholarly literature (No. e3100v1)",
        "author": "Himmelstein",
        "year": "2017",
        "journal-title": "PeerJ Preprints",
        "DOI": "10.7287/peerj.preprints.3100v1"
    },
    {
        "issue": "1",
        "key": "10.7717/peerj.4375/ref-30",
        "doi-asserted-by": "publisher",
        "first-page": "241",
        "DOI": "10.1007/s11192-017-2291-4",
        "article-title": "Copyright compliance and infringement in ResearchGate full-text journal articles",
        "volume": "112",
        "author": "Jamali",
        "year": "2017",
        "journal-title": "Scientometrics"
    },
    {
        "key": "10.7717/peerj.4375/ref-31",
        "doi-asserted-by": "publisher",
        "DOI": "10.1186/1741-7015-10-124",
        "article-title": "Anatomy of open access publishing: a study of longitudinal development and internal structure",
        "volume": "10",
        "author": "Laakso",
        "year": "2012",
        "journal-title": "BMC Medicine"
    },
    {
        "issue": "7",
        "key": "10.7717/peerj.4375/ref-32",
        "doi-asserted-by": "publisher",
        "first-page": "1323",
        "DOI": "10.1002/asi.22856",
        "article-title": "Delayed open access: an overlooked high-impact category of openly available scientific literature",
        "volume": "64",
        "author": "Laakso",
        "year": "2013",
        "journal-title": "Journal of the American Society for Information Science and Technology"
    },
    {
        "issue": "6",
        "key": "10.7717/peerj.4375/ref-33",
        "doi-asserted-by": "publisher",
        "first-page": "e20961",
        "DOI": "10.1371/journal.pone.0020961",
        "article-title": "The development of open access journal publishing from 1993 to 2009",
        "volume": "6",
        "author": "Laakso",
        "year": "2011",
        "journal-title": "PLOS ONE"
    },
    {
        "issue": "1",
        "key": "10.7717/peerj.4375/ref-34",
        "doi-asserted-by": "crossref",
        "first-page": "4",
        "DOI": "10.3163/1536-5050.97.1.002",
        "article-title": "Status of open access in the biomedical field in 2005",
        "volume": "97",
        "author": "Matsubayashi",
        "year": "2009",
        "journal-title": "Journal of the Medical Library Association"
    },
    {
        "issue": "4",
        "key": "10.7717/peerj.4375/ref-35",
        "doi-asserted-by": "publisher",
        "first-page": "1284",
        "DOI": "10.1111/ecin.12064",
        "article-title": "Identifying the effect of open access on citations using a panel of science journals",
        "volume": "52",
        "author": "McCabe",
        "year": "2014",
        "journal-title": "Economic Inquiry"
    },
    {
        "key": "10.7717/peerj.4375/ref-36",
        "doi-asserted-by": "publisher",
        "first-page": "e16800",
        "DOI": "10.7554/eLife.16800",
        "article-title": "How open science helps researchers succeed",
        "volume": "5",
        "author": "McKiernan",
        "year": "2016",
        "journal-title": "eLife"
    },
    {
        "issue": "1",
        "key": "10.7717/peerj.4375/ref-37",
        "doi-asserted-by": "publisher",
        "first-page": "213",
        "DOI": "10.1007/s11192-015-1765-5",
        "article-title": "The journal coverage of Web of Science and Scopus: a comparative analysis",
        "volume": "106",
        "author": "Mongeon",
        "year": "2016",
        "journal-title": "Scientometrics"
    },
    {
        "issue": "8",
        "key": "10.7717/peerj.4375/ref-38",
        "doi-asserted-by": "publisher",
        "first-page": "e0159614",
        "DOI": "10.1371/journal.pone.0159614",
        "article-title": "The post-embargo open access citation advantage: it exists (probably), it’s modest (usually), and the rich get richer (of course)",
        "volume": "11",
        "author": "Ottaviani",
        "year": "2016",
        "journal-title": "PLOS ONE"
    },
    {
        "issue": "3",
        "key": "10.7717/peerj.4375/ref-39",
        "doi-asserted-by": "crossref",
        "first-page": "111",
        "DOI": "10.47678/cjhe.v39i3.479",
        "article-title": "The SciELO open access: a gold way from the south",
        "volume": "39",
        "author": "Packer",
        "year": "2010",
        "journal-title": "Canadian Journal of Higher Education"
    },
    {
        "key": "10.7717/peerj.4375/ref-40",
        "article-title": "Reviewer guidelines: criteria for publication",
        "author": "PLOS",
        "year": "2018"
    },
    {
        "issue": "7635",
        "key": "10.7717/peerj.4375/ref-41",
        "doi-asserted-by": "publisher",
        "first-page": "13",
        "DOI": "10.1038/nature.2016.21223",
        "article-title": "Scientists in Germany, Peru and Taiwan to lose access to Elsevier journals",
        "volume": "541",
        "author": "Schiermeier",
        "year": "2017",
        "journal-title": "Nature News"
    },
    {
        "key": "10.7717/peerj.4375/ref-42",
        "article-title": "Knowledge sharing in global health research; the impact, uptake and cost of open access to scholarly literature",
        "author": "Smith",
        "journal-title": "BMC Health Research Policy and System"
    },
    {
        "key": "10.7717/peerj.4375/ref-43",
        "article-title": "The open access citation advantage: list of studies until 2015",
        "author": "SPARC Europe",
        "year": "2015"
    },
    {
        "key": "10.7717/peerj.4375/ref-44",
        "article-title": "Gratis and libre open access",
        "author": "Suber",
        "year": "2008",
        "journal-title": "SPARC Open Access Newsletter, 124"
    },
    {
        "key": "10.7717/peerj.4375/ref-45",
        "doi-asserted-by": "crossref",
        "article-title": "The open access citation advantage",
        "author": "Tennant",
        "year": "2017",
        "DOI": "10.14293/S2199-1006.1.SOR-EDU.CLPDPZB.v1"
    },
    {
        "key": "10.7717/peerj.4375/ref-46",
        "doi-asserted-by": "publisher",
        "DOI": "10.12688/f1000research.8460.3",
        "article-title": "The academic, economic and societal impacts of Open Access: an evidence-based review (version 3; referees: 3 approved, 2 approved with reservations)",
        "volume": "5",
        "author": "Tennant",
        "year": "2016",
        "journal-title": "F1000 Research"
    },
    {
        "key": "10.7717/peerj.4375/ref-47",
        "article-title": "Teurer als die Wissenschaft erlaubt",
        "author": "Universitat Konstanz",
        "year": "2014"
    },
    {
        "key": "10.7717/peerj.4375/ref-48",
        "article-title": "UdeM Libraries cancel Big Deal subscription to 2231 periodical titles published by Taylor & Francis Group",
        "author": "Université de Montréal",
        "year": "2017"
    },
    {
        "key": "10.7717/peerj.4375/ref-49",
        "doi-asserted-by": "publisher",
        "first-page": "2",
        "DOI": "10.5062/F4Q81B0W",
        "article-title": "Open access citation advantage: an annotated bibliography",
        "volume": "60",
        "author": "Wagner",
        "year": "2010",
        "journal-title": "Issues in Science and Technology Librarianship"
    },
    {
        "issue": "9",
        "key": "10.7717/peerj.4375/ref-50",
        "doi-asserted-by": "publisher",
        "first-page": "678",
        "DOI": "10.1241/johokanri.41.678",
        "article-title": "Free internet access to traditional journals",
        "volume": "41",
        "author": "Walker",
        "year": "1998",
        "journal-title": "Journal of Information Processing and Management"
    },
    {
        "key": "10.7717/peerj.4375/ref-51",
        "first-page": "263",
        "article-title": "The nine flavours of open access scholarly publishing",
        "volume": "49",
        "author": "Willinsky",
        "year": "2003",
        "journal-title": "Journal of Postgraduate Medicine"
    },
    {
        "key": "10.7717/peerj.4375/ref-52",
        "volume-title": "The access principle: the case for open access to research and scholarship",
        "author": "Willinsky",
        "year": "2009",
        "edition": "1"
    }
    ],
    "container-title": [
    "PeerJ"
    ],
    "original-title": [],
    "language": "en",
    "link": [
    {
        "URL": "https://peerj.com/articles/4375.pdf",
        "content-type": "application/pdf",
        "content-version": "vor",
        "intended-application": "text-mining"
    },
    {
        "URL": "https://peerj.com/articles/4375.xml",
        "content-type": "application/xml",
        "content-version": "vor",
        "intended-application": "text-mining"
    },
    {
        "URL": "https://peerj.com/articles/4375.html",
        "content-type": "text/html",
        "content-version": "vor",
        "intended-application": "text-mining"
    },
    {
        "URL": "https://peerj.com/articles/4375.pdf",
        "content-type": "unspecified",
        "content-version": "vor",
        "intended-application": "similarity-checking"
    }
    ],
    "deposited": {
    "date-parts": [
        [
        2022,
        8,
        14
        ]
    ],
    "date-time": "2022-08-14T07:10:18Z",
    "timestamp": 1660461018000
    },
    "score": 1,
    "resource": {
    "primary": {
        "URL": "https://peerj.com/articles/4375"
    }
    },
    "subtitle": [],
    "short-title": [],
    "issued": {
    "date-parts": [
        [
        2018,
        2,
        13
        ]
    ]
    },
    "references-count": 52,
    "alternative-id": [
    "10.7717/peerj.4375"
    ],
    "URL": "http://dx.doi.org/10.7717/peerj.4375",
    "archive": [
    "CLOCKSS",
    "LOCKSS",
    "Portico"
    ],
    "relation": {},
    "ISSN": [
    "2167-8359"
    ],
    "issn-type": [
    {
        "value": "2167-8359",
        "type": "electronic"
    }
    ],
    "subject": [
    "General Agricultural and Biological Sciences",
    "General Biochemistry, Genetics and Molecular Biology",
    "General Medicine",
    "General Neuroscience"
    ],
    "published": {
    "date-parts": [
        [
        2018,
        2,
        13
        ]
    ]
    },
    "article-number": "e4375"
}
}
  • OpenAlex. Ежемесячный полный слепок базы-наследницы Microsoft Academic Graph, обогащающей и сводящей открытые метаданные публикаций, авторов, организаций, источников и тематик ("концептов") в единую связанную систему. Более 240 миллионов публикаций, порядка 300 гб.
пример данных по отдельной публикации
{
"id": "https://openalex.org/W2741809807",
"doi": "https://doi.org/10.7717/peerj.4375",
"title": "The state of OA: a large-scale analysis of the prevalence and impact of Open Access articles",
"display_name": "The state of OA: a large-scale analysis of the prevalence and impact of Open Access articles",
"publication_year": 2018,
"publication_date": "2018-02-13",
"ids": {
    "openalex": "https://openalex.org/W2741809807",
    "doi": "https://doi.org/10.7717/peerj.4375",
    "mag": "2741809807",
    "pmid": "https://pubmed.ncbi.nlm.nih.gov/29456894",
    "pmcid": "https://www.ncbi.nlm.nih.gov/pmc/articles/5815332"
},
"host_venue": {
    "id": "https://openalex.org/V1983995261",
    "issn_l": "2167-8359",
    "issn": [
    "2167-8359"
    ],
    "display_name": "PeerJ",
    "publisher": "PeerJ, Inc.",
    "type": "journal",
    "url": "https://doi.org/10.7717/peerj.4375",
    "is_oa": true,
    "version": "publishedVersion",
    "license": "cc-by"
},
"type": "journal-article",
"open_access": {
    "is_oa": true,
    "oa_status": "gold",
    "oa_url": "https://doi.org/10.7717/peerj.4375"
},
"authorships": [
    {
    "author_position": "first",
    "author": {
        "id": "https://openalex.org/A1969205032",
        "display_name": "Heather A. Piwowar",
        "orcid": "https://orcid.org/0000-0003-1613-5981"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I4200000001",
        "display_name": "Our Research",
        "ror": "https://ror.org/02nr0ka47",
        "country_code": "CA",
        "type": "nonprofit"
        }
    ],
    "raw_affiliation_string": "Impactstory, Sanford, NC, USA"
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A2208157607",
        "display_name": "Jason Priem",
        "orcid": "https://orcid.org/0000-0001-6187-6610"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I4200000001",
        "display_name": "Our Research",
        "ror": "https://ror.org/02nr0ka47",
        "country_code": "CA",
        "type": "nonprofit"
        }
    ],
    "raw_affiliation_string": "Impactstory, Sanford, NC, USA"
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A291762745",
        "display_name": "Vincent Larivière",
        "orcid": "https://orcid.org/0000-0002-2733-0689"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I70931966",
        "display_name": "University of Montreal",
        "ror": "https://ror.org/0161xgx34",
        "country_code": "CA",
        "type": "education"
        },
        {
        "id": null,
        "display_name": "Observatoire des Sciences et des Technologies (OST) Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST) Université du Québec à Montréal Montréal QC Canada",
        "ror": null,
        "country_code": null,
        "type": null
        }
    ],
    "raw_affiliation_string": "École de bibliothéconomie et des sciences de l'information, Université de Montréal, Montréal, QC, Canada.; Observatoire des Sciences et des Technologies (OST) Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST) Université du Québec à Montréal Montréal QC Canada"
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A2790141563",
        "display_name": "Juan Pablo Alperin",
        "orcid": "https://orcid.org/0000-0002-9344-7439"
    },
    "institutions": [
        {
        "id": null,
        "display_name": "Canadian Institute for Studies in Publishing, Simon Fraser University, Vancouver, BC, Canada.",
        "ror": null,
        "country_code": null,
        "type": null
        },
        {
        "id": "https://openalex.org/I209863525",
        "display_name": "Public Knowledge Project",
        "ror": null,
        "country_code": null,
        "type": null
        }
    ],
    "raw_affiliation_string": "Canadian Institute for Studies in Publishing, Simon Fraser University, Vancouver, BC, Canada.; Public Knowledge Project, Canada."
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A2738039797",
        "display_name": "Lisa Matthias",
        "orcid": "https://orcid.org/0000-0002-2612-2132"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I18014758",
        "display_name": "Simon Fraser University",
        "ror": "https://ror.org/0213rcc28",
        "country_code": "CA",
        "type": "education"
        }
    ],
    "raw_affiliation_string": "Scholarly Communications Lab, Simon Fraser University, Vancouver, Canada."
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A2741312048",
        "display_name": "Bree Norlander",
        "orcid": "https://orcid.org/0000-0002-0431-4221"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I201448701",
        "display_name": "University of Washington",
        "ror": "https://ror.org/00cvxb145",
        "country_code": "US",
        "type": "education"
        }
    ],
    "raw_affiliation_string": "Information School, University of Washington, Seattle, USA"
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A4276213257",
        "display_name": "Ashley Farley",
        "orcid": null
    },
    "institutions": [
        {
        "id": "https://openalex.org/I201448701",
        "display_name": "University of Washington",
        "ror": "https://ror.org/00cvxb145",
        "country_code": "US",
        "type": "education"
        }
    ],
    "raw_affiliation_string": "Information School, University of Washington, Seattle, USA"
    },
    {
    "author_position": "middle",
    "author": {
        "id": "https://openalex.org/A2787483045",
        "display_name": "Jevin D. West",
        "orcid": "https://orcid.org/0000-0002-4118-0322"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I201448701",
        "display_name": "University of Washington",
        "ror": "https://ror.org/00cvxb145",
        "country_code": "US",
        "type": "education"
        }
    ],
    "raw_affiliation_string": "[Information School, University of Washington, Seattle, USA]"
    },
    {
    "author_position": "last",
    "author": {
        "id": "https://openalex.org/A2027010983",
        "display_name": "Stefanie Haustein",
        "orcid": "https://orcid.org/0000-0003-0157-1430"
    },
    "institutions": [
        {
        "id": "https://openalex.org/I159129438",
        "display_name": "University of Quebec at Montreal",
        "ror": "https://ror.org/002rjbv21",
        "country_code": "CA",
        "type": "education"
        },
        {
        "id": "https://openalex.org/I153718931",
        "display_name": "University of Ottawa",
        "ror": "https://ror.org/03c4mmv16",
        "country_code": "CA",
        "type": "education"
        }
    ],
    "raw_affiliation_string": "Observatoire des Sciences et des Technologies (OST), Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST),, Université du Québec à Montréal, Montréal, QC, Canada; School of Information Studies, University of Ottawa, Ottawa, ON, Canada"
    }
],
"cited_by_count": 491,
"biblio": {
    "volume": "6",
    "issue": null,
    "first_page": "e4375",
    "last_page": "e4375"
},
"is_retracted": false,
"is_paratext": false,
"concepts": [
    {
    "id": "https://openalex.org/C2778805511",
    "wikidata": "https://www.wikidata.org/wiki/Q1713",
    "display_name": "Citation",
    "level": 2,
    "score": "0.685776"
    },
    {
    "id": "https://openalex.org/C2780560020",
    "wikidata": "https://www.wikidata.org/wiki/Q79719",
    "display_name": "License",
    "level": 2,
    "score": "0.58424175"
    },
    {
    "id": "https://openalex.org/C2777462167",
    "wikidata": "https://www.wikidata.org/wiki/Q7432048",
    "display_name": "Scholarly communication",
    "level": 3,
    "score": "0.5511477"
    },
    {
    "id": "https://openalex.org/C178315738",
    "wikidata": "https://www.wikidata.org/wiki/Q603441",
    "display_name": "Bibliometrics",
    "level": 2,
    "score": "0.50542545"
    },
    {
    "id": "https://openalex.org/C3020774429",
    "wikidata": "https://www.wikidata.org/wiki/Q1201886",
    "display_name": "Web of science",
    "level": 3,
    "score": "0.49757937"
    },
    {
    "id": "https://openalex.org/C2778149293",
    "wikidata": "https://www.wikidata.org/wiki/Q309823",
    "display_name": "Open science",
    "level": 2,
    "score": "0.47510326"
    },
    {
    "id": "https://openalex.org/C41008148",
    "wikidata": "https://www.wikidata.org/wiki/Q21198",
    "display_name": "Computer science",
    "level": 0,
    "score": "0.46310776"
    },
    {
    "id": "https://openalex.org/C105345328",
    "wikidata": "https://www.wikidata.org/wiki/Q206276",
    "display_name": "Citation analysis",
    "level": 3,
    "score": "0.4566289"
    },
    {
    "id": "https://openalex.org/C40993552",
    "wikidata": "https://www.wikidata.org/wiki/Q514654",
    "display_name": "Gold standard (test)",
    "level": 2,
    "score": "0.44181696"
    },
    {
    "id": "https://openalex.org/C136764020",
    "wikidata": "https://www.wikidata.org/wiki/Q466",
    "display_name": "World Wide Web",
    "level": 1,
    "score": "0.44129536"
    },
    {
    "id": "https://openalex.org/C71924100",
    "wikidata": "https://www.wikidata.org/wiki/Q11190",
    "display_name": "Medicine",
    "level": 0,
    "score": "0.3934979"
    },
    {
    "id": "https://openalex.org/C161191863",
    "wikidata": "https://www.wikidata.org/wiki/Q199655",
    "display_name": "Library science",
    "level": 1,
    "score": "0.36801437"
    },
    {
    "id": "https://openalex.org/C17744445",
    "wikidata": "https://www.wikidata.org/wiki/Q36442",
    "display_name": "Political science",
    "level": 0,
    "score": "0.22105563"
    },
    {
    "id": "https://openalex.org/C95190672",
    "wikidata": "https://www.wikidata.org/wiki/Q815382",
    "display_name": "Meta-analysis",
    "level": 2,
    "score": "0.16920927"
    },
    {
    "id": "https://openalex.org/C105795698",
    "wikidata": "https://www.wikidata.org/wiki/Q12483",
    "display_name": "Statistics",
    "level": 1,
    "score": "0.15263802"
    },
    {
    "id": "https://openalex.org/C126322002",
    "wikidata": "https://www.wikidata.org/wiki/Q11180",
    "display_name": "Internal medicine",
    "level": 1,
    "score": "0.14720586"
    },
    {
    "id": "https://openalex.org/C33923547",
    "wikidata": "https://www.wikidata.org/wiki/Q395",
    "display_name": "Mathematics",
    "level": 0,
    "score": "0.12145212"
    },
    {
    "id": "https://openalex.org/C151719136",
    "wikidata": "https://www.wikidata.org/wiki/Q3972943",
    "display_name": "Publishing",
    "level": 2,
    "score": "0.10302654"
    },
    {
    "id": "https://openalex.org/C199539241",
    "wikidata": "https://www.wikidata.org/wiki/Q7748",
    "display_name": "Law",
    "level": 1,
    "score": "0.0"
    },
    {
    "id": "https://openalex.org/C111919701",
    "wikidata": "https://www.wikidata.org/wiki/Q9135",
    "display_name": "Operating system",
    "level": 1,
    "score": "0.0"
    }
],
"mesh": [],
"alternate_host_venues": [
    {
    "id": "https://openalex.org/V1983995261",
    "display_name": "PeerJ",
    "type": "journal",
    "url": "https://doi.org/10.7717/peerj.4375",
    "is_oa": true,
    "version": "publishedVersion",
    "license": "cc-by"
    },
    {
    "id": "https://openalex.org/V4306400806",
    "display_name": "PubMed Central - Europe PMC",
    "type": "repository",
    "url": "https://europepmc.org/articles/pmc5815332?pdf=render",
    "is_oa": true,
    "version": "publishedVersion",
    "license": "cc-by"
    },
    {
    "id": "https://openalex.org/V2764455111",
    "display_name": "PubMed Central",
    "type": "repository",
    "url": "https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5815332",
    "is_oa": true,
    "version": "publishedVersion",
    "license": null
    },
    {
    "id": null,
    "display_name": null,
    "type": "repository",
    "url": "https://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1143&context=scholcom",
    "is_oa": true,
    "version": "submittedVersion",
    "license": "cc-by"
    },
    {
    "id": "https://openalex.org/V4306402422",
    "display_name": "Université de Montréal - Papyrus : Institutional Repository",
    "type": "repository",
    "url": "https://papyrus.bib.umontreal.ca/xmlui/bitstream/1866/23242/1/peerj-06-4375.pdf",
    "is_oa": true,
    "version": "submittedVersion",
    "license": "cc-by"
    }
],
"referenced_works": [
    "https://openalex.org/W1560783210",
    "https://openalex.org/W1724212071",
    "https://openalex.org/W1767272795",
    "https://openalex.org/W1957687230",
    "https://openalex.org/W2003844967",
    "https://openalex.org/W2016860460",
    "https://openalex.org/W2020807482",
    "https://openalex.org/W2029057325",
    "https://openalex.org/W2031754690",
    "https://openalex.org/W2048185449",
    "https://openalex.org/W2078310052",
    "https://openalex.org/W2089123513",
    "https://openalex.org/W2115339903",
    "https://openalex.org/W2140880926",
    "https://openalex.org/W2160597895",
    "https://openalex.org/W2231201268",
    "https://openalex.org/W2306268324",
    "https://openalex.org/W2322381034",
    "https://openalex.org/W2343014812",
    "https://openalex.org/W2345375849",
    "https://openalex.org/W2463568293",
    "https://openalex.org/W2511661767",
    "https://openalex.org/W2520991028",
    "https://openalex.org/W2563251083",
    "https://openalex.org/W2566143661",
    "https://openalex.org/W2587705861",
    "https://openalex.org/W2588027260",
    "https://openalex.org/W2737712680",
    "https://openalex.org/W2753353163",
    "https://openalex.org/W2785823074",
    "https://openalex.org/W2953072907",
    "https://openalex.org/W2997143876",
    "https://openalex.org/W3121567788",
    "https://openalex.org/W4254015553",
    "https://openalex.org/W4298108315"
],
"related_works": [
    "https://openalex.org/W2055275276",
    "https://openalex.org/W2078188943",
    "https://openalex.org/W2586021869",
    "https://openalex.org/W2741809807",
    "https://openalex.org/W3003267280",
    "https://openalex.org/W3115560629",
    "https://openalex.org/W3131211795",
    "https://openalex.org/W3136123362",
    "https://openalex.org/W4235038322",
    "https://openalex.org/W4245410681"
],
"ngrams_url": "https://api.openalex.org/works/W2741809807/ngrams",
"abstract_inverted_index": {
    "67": [
    43
    ],
    "Despite": [
    0
    ],
    "growing": [
    1
    ],
    "interest": [
    2
    ],
    "in": [
    3,
    57,
    73,
    110,
    122
    ],
    "Open": [
    4,
    201
    ],
    "Access": [
    5
    ],
    "(OA)": [
    6
    ],
    "to": [
    7,
    54,
    252
    ],
    "scholarly": [
    8,
    105
    ],
    "literature,": [
    9
    ],
    "there": [
    10
    ],
    "is": [
    11,
    107,
    116,
    176
    ],
    "an": [
    12,
    34,
    85,
    185,
    199,
    231
    ],
    "unmet": [
    13
    ],
    "need": [
    14,
    31
    ],
    "for": [
    15,
    42,
    174,
    219
    ],
    "large-scale,": [
    16
    ],
    "up-to-date,": [
    17
    ],
    "and": [
    18,
    24,
    77,
    112,
    124,
    144,
    221,
    237,
    256
    ],
    "reproducible": [
    19
    ],
    "studies": [
    20
    ],
    "assessing": [
    21
    ],
    "the": [
    22,
    104,
    134,
    145,
    170,
    195,
    206,
    213,
    245
    ],
    "prevalence": [
    23
    ],
    "characteristics": [
    25
    ],
    "of": [
    26,
    51,
    75,
    83,
    103,
    137,
    141,
    163,
    209
    ],
    "OA.": [
    27,
    168,
    239
    ],
    "We": [
    28,
    46,
    97,
    203,
    240
    ],
    "address": [
    29
    ],
    "this": [
    30,
    114,
    142
    ],
    "using": [
    32,
    95,
    244
    ],
    "oaDOI,": [
    33
    ],
    "open": [
    35
    ],
    "online": [
    36
    ],
    "service": [
    37
    ],
    "that": [
    38,
    89,
    99,
    113,
    147,
    155
    ],
    "determines": [
    39
    ],
    "OA": [
    40,
    56,
    93,
    108,
    138,
    159,
    175,
    210,
    223,
    254
    ],
    "status": [
    41
    ],
    "million": [
    44
    ],
    "articles.": [
    45
    ],
    "use": [
    47
    ],
    "three": [
    48,
    58
    ],
    "samples,": [
    49
    ],
    "each": [
    50
    ],
    "100,000": [
    52
    ],
    "articles,": [
    53,
    152,
    211
    ],
    "investigate": [
    55
    ],
    "populations:": [
    59
    ],
    "(1)": [
    60
    ],
    "all": [
    61
    ],
    "journal": [
    62,
    70
    ],
    "articles": [
    63,
    71,
    79,
    94,
    164,
    191,
    224
    ],
    "assigned": [
    64
    ],
    "a": [
    65,
    250
    ],
    "Crossref": [
    66
    ],
    "DOI,": [
    67
    ],
    "(2)": [
    68
    ],
    "recent": [
    69,
    128
    ],
    "indexed": [
    72
    ],
    "Web": [
    74
    ],
    "Science,": [
    76
    ],
    "(3)": [
    78
    ],
    "viewed": [
    80
    ],
    "by": [
    81,
    120,
    235
    ],
    "users": [
    82,
    91,
    157
    ],
    "Unpaywall,": [
    84
    ],
    "open-source": [
    86
    ],
    "browser": [
    87
    ],
    "extension": [
    88
    ],
    "lets": [
    90
    ],
    "find": [
    92,
    154
    ],
    "oaDOI.": [
    96
    ],
    "estimate": [
    98
    ],
    "at": [
    100
    ],
    "least": [
    101
    ],
    "28%": [
    102
    ],
    "literature": [
    106
    ],
    "(19M": [
    109
    ],
    "total)": [
    111
    ],
    "proportion": [
    115
    ],
    "growing,": [
    117
    ],
    "driven": [
    118,
    233
    ],
    "particularly": [
    119
    ],
    "growth": [
    121
    ],
    "Gold": [
    123
    ],
    "Hybrid.": [
    125
    ],
    "The": [
    126
    ],
    "most": [
    127,
    171
    ],
    "year": [
    129
    ],
    "analyzed": [
    130
    ],
    "(2015)": [
    131
    ],
    "also": [
    132,
    204
    ],
    "has": [
    133
    ],
    "highest": [
    135
    ],
    "percentage": [
    136
    ],
    "(45%).": [
    139
    ],
    "Because": [
    140
    ],
    "growth,": [
    143
    ],
    "fact": [
    146
    ],
    "readers": [
    148
    ],
    "disproportionately": [
    149
    ],
    "access": [
    150
    ],
    "newer": [
    151
    ],
    "we": [
    153,
    188
    ],
    "Unpaywall": [
    156
    ],
    "encounter": [
    158
    ],
    "quite": [
    160
    ],
    "frequently:": [
    161
    ],
    "47%": [
    162
    ],
    "they": [
    165
    ],
    "view": [
    166
    ],
    "are": [
    167
    ],
    "Notably,": [
    169
    ],
    "common": [
    172
    ],
    "mechanism": [
    173
    ],
    "not": [
    177
    ],
    "Gold,": [
    178
    ],
    "Green,": [
    179
    ],
    "or": [
    180
    ],
    "Hybrid": [
    181,
    238
    ],
    "OA,": [
    182
    ],
    "but": [
    183
    ],
    "rather": [
    184
    ],
    "under-discussed": [
    186
    ],
    "category": [
    187
    ],
    "dub": [
    189
    ],
    "Bronze:": [
    190
    ],
    "made": [
    192
    ],
    "free-to-read": [
    193
    ],
    "on": [
    194
    ],
    "publisher": [
    196
    ],
    "website,": [
    197
    ],
    "without": [
    198
    ],
    "explicit": [
    200
    ],
    "license.": [
    202
    ],
    "examine": [
    205
    ],
    "citation": [
    207,
    216
    ],
    "impact": [
    208
    ],
    "corroborating": [
    212
    ],
    "so-called": [
    214
    ],
    "open-access": [
    215
    ],
    "advantage:": [
    217
    ],
    "accounting": [
    218
    ],
    "age": [
    220
    ],
    "discipline,": [
    222
    ],
    "receive": [
    225
    ],
    "18%": [
    226
    ],
    "more": [
    227
    ],
    "citations": [
    228
    ],
    "than": [
    229
    ],
    "average,": [
    230
    ],
    "effect": [
    232
    ],
    "primarily": [
    234
    ],
    "Green": [
    236
    ],
    "encourage": [
    241
    ],
    "further": [
    242
    ],
    "research": [
    243
    ],
    "free": [
    246
    ],
    "oaDOI": [
    247
    ],
    "service,": [
    248
    ],
    "as": [
    249
    ],
    "way": [
    251
    ],
    "inform": [
    253
    ],
    "policy": [
    255
    ],
    "practice.": [
    257
    ]
},
"cited_by_api_url": "https://api.openalex.org/works?filter=cites:W2741809807",
"counts_by_year": [
    {
    "year": 2023,
    "cited_by_count": 6
    },
    {
    "year": 2022,
    "cited_by_count": 108
    },
    {
    "year": 2021,
    "cited_by_count": 100
    },
    {
    "year": 2020,
    "cited_by_count": 133
    },
    {
    "year": 2019,
    "cited_by_count": 98
    },
    {
    "year": 2018,
    "cited_by_count": 43
    },
    {
    "year": 2017,
    "cited_by_count": 3
    }
],
"updated_date": "2023-01-20T02:26:25.443366",
"created_date": "2017-08-08"
}
  • Pubmed\MEDLINE. Важнейшая, наиболее полная и авторитетная база по медицине и биологии, подробнее - в разделе про отраслевые базы. Не так много метаданных, зато почти всем статьям надежно присвоены тематики биомедицинского тезауруса MESH. Слепок базы обновляется ежегодно.
пример данных по отдельной публикации
<PubmedArticle>
    <MedlineCitation Status="MEDLINE" Owner="NLM">
    <PMID Version="1">1133314</PMID>
    <DateCompleted>
        <Year>1975</Year>
        <Month>08</Month>
        <Day>20</Day>
    </DateCompleted>
    <DateRevised>
        <Year>2019</Year>
        <Month>09</Month>
        <Day>18</Day>
    </DateRevised>
    <Article PubModel="Print">
        <Journal>
        <ISSN IssnType="Print">0002-7138</ISSN>
        <JournalIssue CitedMedium="Print">
            <Volume>14</Volume>
            <Issue>2</Issue>
            <PubDate>
            <Year>1975</Year>
            <Season>Spring</Season>
            </PubDate>
        </JournalIssue>
        <Title>Journal of the American Academy of Child Psychiatry</Title>
        <ISOAbbreviation>J Am Acad Child Psychiatry</ISOAbbreviation>
        </Journal>
        <ArticleTitle>The training of child psychiatrists. Is quantitative and qualitative improvement possible?</ArticleTitle>
        <Pagination>
        <MedlinePgn>193-5</MedlinePgn>
        </Pagination>
        <AuthorList CompleteYN="Y">
        <Author ValidYN="Y">
            <LastName>Simmons</LastName>
            <ForeName>J E</ForeName>
            <Initials>JE</Initials>
        </Author>
        </AuthorList>
        <Language>eng</Language>
        <PublicationTypeList>
        <PublicationType UI="D016428">Journal Article</PublicationType>
        </PublicationTypeList>
    </Article>
    <MedlineJournalInfo>
        <Country>United States</Country>
        <MedlineTA>J Am Acad Child Psychiatry</MedlineTA>
        <NlmUniqueID>7505568</NlmUniqueID>
        <ISSNLinking>0002-7138</ISSNLinking>
    </MedlineJournalInfo>
    <CitationSubset>IM</CitationSubset>
    <MeshHeadingList>
        <MeshHeading>
        <DescriptorName UI="D002568" MajorTopicYN="Y">Certification</DescriptorName>
        </MeshHeading>
        <MeshHeading>
        <DescriptorName UI="D002665" MajorTopicYN="N">Child Psychiatry</DescriptorName>
        <QualifierName UI="Q000193" MajorTopicYN="Y">education</QualifierName>
        </MeshHeading>
        <MeshHeading>
        <DescriptorName UI="D004521" MajorTopicYN="N">Educational Measurement</DescriptorName>
        </MeshHeading>
        <MeshHeading>
        <DescriptorName UI="D006801" MajorTopicYN="N">Humans</DescriptorName>
        </MeshHeading>
        <MeshHeading>
        <DescriptorName UI="D011570" MajorTopicYN="N">Psychiatry</DescriptorName>
        </MeshHeading>
        <MeshHeading>
        <DescriptorName UI="D012955" MajorTopicYN="N">Societies, Medical</DescriptorName>
        </MeshHeading>
    </MeshHeadingList>
    </MedlineCitation>
    <PubmedData>
    <History>
        <PubMedPubDate PubStatus="pubmed">
        <Year>1975</Year>
        <Month>1</Month>
        <Day>1</Day>
        </PubMedPubDate>
        <PubMedPubDate PubStatus="medline">
        <Year>1975</Year>
        <Month>1</Month>
        <Day>1</Day>
        <Hour>0</Hour>
        <Minute>1</Minute>
        </PubMedPubDate>
        <PubMedPubDate PubStatus="entrez">
        <Year>1975</Year>
        <Month>1</Month>
        <Day>1</Day>
        <Hour>0</Hour>
        <Minute>0</Minute>
        </PubMedPubDate>
    </History>
    <PublicationStatus>ppublish</PublicationStatus>
    <ArticleIdList>
        <ArticleId IdType="pubmed">1133314</ArticleId>
        <ArticleId IdType="doi">10.1016/s0002-7138(09)61421-7</ArticleId>
    </ArticleIdList>
    </PubmedData>
</PubmedArticle>
  • DBLP - ведущая библиографическая база в Computer Science - публикует всё свое содержимое (публикации, конференцим, журналы и авторы) открыто в едином XML-файле, который постоянно обновляется.
  • FATCAT - открытая база метаданных научных работ от команды Internet Archive, которую могут редактировать все желающие, и которая делает упор на фиксацию различных версий публикаций и digital preservation. Все области науки. Доступен слепок в виде дампа PostgreSQL с инструментами конвертации в JSON.
  • Semantic Sсholar - вторая по популярности после Google Sсholar база поиска литературы, в отличие от GS открыта, содержит не только метаданные, но и сделанные искусственным интеллектом краткие выжимки из статей, а также embeddings для машинного обучения. Более 200 млн. публикаций. Скачивание после бесплатной регистрации.
  • BIP! DB - открытый датасет различных метрик на основе цитирований для более 100 миллионов научных публикаций, собранный в 2021 г. Общее число цитирований, PageRank и т.д. Методика описана в научной работе.
  • ЕГИСУ НИОКТР - пока еще открытая база научных проектов, поддержанных российским госфинансированием, и соответствующих публикаций. Крайне разные качество и полнота информации, но часто есть DOI и другие идентификаторы. Много данных для майнинга (аннотации, ключевые слова). Для скачивания надо кликнуть на "открытые данные", кнопка снизу в центре на официальном сайте. Тип лицензии не указан, правила пользования данными - тоже.
пример данных по отдельному проекту с несколькими публикациями
{
            "registration_number": "222012100022-2",
            "created_date": "2022-01-21",
            "name": "Геология и генезис месторождений, минералогия и технология шунгитовых пород Онежской структуры",
            "approve_date": "2021-12-20",
            "applications_count": 1,
            "books_count": 1,
            "pages_count": 33,
            "tables_count": 6,
            "pictures_count": 13,
            "bibliography": "21",
            "publication_count": 8,
            "keyword_list": [
                "Онежская структура",
                "Палеопротерозой",
                "шунгитовые породы",
                "минералогия",
                "электронная микроскопия",
                "рамановская спектроскопия",
                "сорбционная активность",
                "эффективность экранирования"
            ],
            "abstract": "Работы по теме направлены на получение фундаментальных и прикладных знаний по геологии и генезису месторождений, минералогии и технологии шунгитовых пород с целью их более эффективного использования в традиционных и принципиально новых инновационных технологиях. Изучен изотопный состав карбонатных пород Онежской структуры по ОПС (Онежская параметрическая скважина), и бассейна Франсвиль (Габон). Показано, что изменения δ13Cкарб не являются глобальными, а напрямую связаны с фациальными изменениями. В керне буровых скважин из двух осадочных палеопротерозойских бассейнов Франсвиль и Онежского (Карелия) обнаружены интервалы с каолинитом, который поглощает фосфор в кислой среде пресноводных водоёмов, но высвобождает в морской воде, где он становится доступным для фитопланктона. Фосфорный горизонт предполагается использовать как региональный репер для заонежской свиты Онежской структуры. В результате геофизических исследований на участке Никонова гора выявлена новая залежь шунгитовых пород. Исследованы шунгитовые породы восьми залежей одного стратиграфического уровня заонежской свиты. Определены структурно-текстурные особенности и состав высокоуглеродистых шунгитовых пород Максовского месторождения в зоне верхнего экзоконтакта с силлом габбродолеритов.\nВ ходе технологических работ установлено, что способ подготовки шунгитовых пород для водоочистки влияет на их сорбционную активность. Изучены условия совместного использования шунгитовых пород и применяемых в водоочистке эффективных микроорганизмов (актиномицетов, молочнокислых и фототрофных бактерий, дрожжей). Разработана инновационная двухступенчатая технология фильтрации на основе шунгитовой породы и эффективных микроорганизмов, которая была апробирована  для очистки ливневых стоков в ходе полевых испытаний в Санкт-Петербурге и в Лаппеенранте в рамках проекта KS1460 «Инновационные природные технологии для очистки воды на основе системы Шунгит - Эффективные Микроорганизмы» по приграничному сотрудничеству Россия – Юго-Восточная Финляндия. Для выявления способов создания новых материалов, получены углеродные пленки при термическом распылении в вакууме шунгитов (С~98%) из выходов Шуньга, Максово и Чеболакша, и, для сравнения, спектрального графита. Кривые комбинационного рассеяния всех пленок имеют необычную форму без отчетливых пиков D и G и подобны спектрам пленок, нанесенных методом импульсного лазерного осаждения (PLD) стекловидного углерода в вакууме. Проведены измерения зависимости электропроводности углеродных пленок от температуры в диапазоне 77-300 К. Для пленок из графита и шунгита месторождения Шуньга происходит монотонное увеличение электропроводности с повышением температуры, что характерно для полупроводников. Для пленок, полученных из шунгитов месторождений Чеболакша и Максово, зависимость имеет V-образный вид с минимумом при температурах 180-200 К, что определяется изменением механизма проводимости  от металлического к полупроводниковому. Выявленные закономерности могут быть использованы для получения новых материалов, а также в качестве критерия для разделения шунгитов на различные промышленные типы.",
            "work_supervisor": {
                "name": "Владимир",
                "surname": "Ковалевский",
                "patronymic": "Викторович",
                "position": "главный научный сотрудник",
                "degree": "Доктор геолого-минералогических наук",
                "rank": "Старший научный сотрудник",
                "wos_research_id": "B-2343-2012",
                "scopus_author_id": "57191848660",
                "rinc_id": null,
                "url": null,
                "orcid": "0000-0001-8715-8115",
                "territory": "РОССИЯ"
            },
            "organization_supervisor": {
                "name": "Ольга",
                "surname": "Бахмет",
                "patronymic": "Николаевна",
                "position": "Генеральный директор КарНЦ РАН",
                "degree": null,
                "rank": null,
                "wos_research_id": null,
                "scopus_author_id": null,
                "rinc_id": null,
                "url": null,
                "orcid": null,
                "territory": "РОССИЯ"
            },
            "rubrics": [
                "Разведочная геофизика",
                "Состав и свойства твердых горючих полезных ископаемых",
                "Физико-химические методы исследования минералов, горных пород и руд",
                "Образование месторождений неметаллических полезных ископаемых"
            ],
            "oecds": [
                "GEOCHEMISTRY & GEOPHYSICS",
                "GEOLOGY"
            ],
            "authors": [
                {
                    "name": "Владимир",
                    "surname": "Ковалевский",
                    "patronymic": "Викторович",
                    "description": "Введение, разделы 2, 3, заключение",
                    "position": "г.н.с.",
                    "degree": "Доктор геолого-минералогических наук",
                    "rank": "Старший научный сотрудник",
                    "wos_research_id": "B-2343-2012",
                    "scopus_author_id": "57191848660",
                    "rinc_id": "44916",
                    "url": null,
                    "orcid": "0000-0001-8715-8115",
                    "territory": "РОССИЯ"
                },
                {
                    "name": "Аэлита",
                    "surname": "Первунина",
                    "patronymic": "Валериевна",
                    "description": "Раздел 1",
                    "position": "с.н.с.",
                    "degree": "Кандидат геолого-минералогических наук",
                    "rank": "Отсутствует",
                    "wos_research_id": "N-6277-2016",
                    "scopus_author_id": "57208597407",
                    "rinc_id": null,
                    "url": null,
                    "orcid": "0000-0002-7514-226",
                    "territory": "РОССИЯ"
                },
                {
                    "name": "Юлия",
                    "surname": "Дейнес",
                    "patronymic": "Евгеньевна",
                    "description": "Введение, раздел 1, заключение",
                    "position": "н.с.",
                    "degree": "Отсутствует",
                    "rank": "Отсутствует",
                    "wos_research_id": "AAC-7895-2020",
                    "scopus_author_id": "26422887800",
                    "rinc_id": null,
                    "url": null,
                    "orcid": "0000-0002-9574-1893",
                    "territory": "РОССИЯ"
                },
                {
                    "name": "Игорь",
                    "surname": "Мошников",
                    "patronymic": "Анатольевич",
                    "description": "Раздел 3",
                    "position": "н.с.",
                    "degree": "Отсутствует",
                    "rank": "Отсутствует",
                    "wos_research_id": "-",
                    "scopus_author_id": "57208100691",
                    "rinc_id": null,
                    "url": null,
                    "orcid": "0000-0002-7833-7979",
                    "territory": "РОССИЯ"
                },
                {
                    "name": "Виктория",
                    "surname": "Рожкова",
                    "patronymic": "Сергеевна",
                    "description": "Раздел 2",
                    "position": "вед.химик",
                    "degree": "Отсутствует",
                    "rank": "Отсутствует",
                    "wos_research_id": "-",
                    "scopus_author_id": "-",
                    "rinc_id": null,
                    "url": null,
                    "orcid": "0000-0002-7522-8312",
                    "territory": "РОССИЯ"
                },
                {
                    "name": "Татьяна",
                    "surname": "Товпенец",
                    "patronymic": "Юрьевна",
                    "description": "Раздел 2",
                    "position": "м.н.с.",
                    "degree": "Отсутствует",
                    "rank": "Отсутствует",
                    "wos_research_id": "-",
                    "scopus_author_id": "-",
                    "rinc_id": null,
                    "url": null,
                    "orcid": "0000-0001-9242-9426",
                    "territory": "РОССИЯ"
                }
            ],
            "expected_results": "В ходе геолого-геофизических работ на участке Никонова гора выявлены аномалии естественного электрического поля, предположительно связанные с шестым шунгитоносным горизонтом, который является продуктивным для развития залежи шунгитовых пород. Выявлены литохимические признаки шунгитовых пород восьми залежей одного стратиграфического уровня заонежской свиты палеопротерозоя Карелии. Проведены исследования изотопного состава карбонатных пород туломозерской и нижней подсвиты заонежской свиты Онежской структуры по ОПС (Онежская параметрическая скважина), участкам Райгуба и Шуньга, а также бассейна Франсвиль (Габон). Показано, что изменения δ13Cкарб не являются глобальными, а напрямую связаны с фациальными изменениями. Также в керне буровых скважин из двух осадочных палеопротерозойских бассейнов Франсвиль в Габоне и Онежского в Карелии обнаружены интервалы разреза с сохранившимся каолинитом. Новыми экспериментальными результатами показано, что каолинит легко поглощает фосфор в кислой среде пресноводных водоёмов, но в больших количествах высвобождает фосфор в условиях морской воды, где он становится доступным для фитопланктона. Фосфорный горизонт является региональным репером для заонежской свиты Онежской структуры.\nУстановлено, что способ подготовки шунгитового материала влияет на его сорбционную активность, более высокие значения которой достигаются при измельчении, исключая истирание. Шунгитовая порода характеризуется равномерным распределением углерода и минералов, морфология и элементный состав которых существенно не меняются при длительном воздействии воды, что благоприятствует использованию шунгитового материала при очистке воды. Микрофлора шунгитовых пород содержит специфические штаммы бактерий рода Bacillus, способные прилипать к поверхности породы и обладающие антибактериальными свойствами. Посев эффективных микроорганизмов (актиномицетов, молочнокислых бактерий, фототрофных бактерий и дрожжей) на шунгитовую породу показал подавление их жизнедеятельности и функционирования в режимах очистки воды. Совместное использование шунгитовых пород и эффективных микроорганизмов возможно при двухступенчатой технологии фильтрации, когда шунгитовая порода в качестве сорбента находится на первой стадии, а эффективные микроорганизмы с керамическим носителем - на второй стадии.\nПолучены нанокристаллические углеродные пленки, путем термического распыления в вакууме шунгитовых пород I типа (С~98%) из месторождений Шуньга, Максово и Чеболакша, и для сравнения, спектральных графитовых стержней. Спектры комбинационного рассеяния для образцов углеродных пленок, полученных из графита и шунгита, имеют необычную форму без отчетливых пиков D и G и похожи на спектры тонких пленок стекловидного углерода, нанесенных методом импульсного лазерного осаждения (PLD) в вакууме углеродных мишеней. Проведены измерения зависимостей электропроводности от температуры нанокристаллических углеродных пленок в диапазоне 77-273К. Для пленок графита и пленок шунгита месторождения Шуньга происходит монотонное увеличение электропроводности с повышением температуры, что характерно для полупроводников. Для пленок, полученных из образцов шунгитов месторождений Чеболакша и Максово, зависимость имеет вид V-образной кривой с минимумом при температурах в области 180-200 К, что характерно для изменения механизма переноса электронов  от типичного металлического к типичному полупроводниковому при температурах 180-200К. Выявленные различия свидетельствуют о сохранении структурной памяти в пленках об исходных шунгитах даже при высокоэнергетических воздействиях и могут быть использованы для получения новых материалов. При этом шунгиты по выявленным особенностям могут быть отнесены к различным промышленным типам.",
            "report_type": "Промежуточный",
            "stage_start_date": "2021-01-01",
            "stage_end_date": "2021-12-31",
            "stage_number": 2,
            "budgets": [
                {
                    "funds": "12100.000",
                    "kbk": "07501104730290059611",
                    "budget_type": "Средства федерального бюджета"
                }
            ],
            "publications": [
                {
                    "authors": [
                        {
                            "name": "Александр",
                            "surname": "Ромашкин",
                            "patronymic": "Евгеньевич",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-03-15",
                    "publication_name": "Iron Isotopes Reveal a Benthic Iron Shuttle in the Palaeoproterozoic Zaonega Formation: Basinal Restriction, Euxinia, and the Effect on Global Palaeoredox Proxies",
                    "edition_name": "Minerals",
                    "bibliographic_link": "Kaarel Mänd, Stefan V. Lalonde, Kärt Paiste, Marie Thoby, Kaarel Lumiste, Leslie J. Robbins, Timmu Kreitsmann, Alexander E. Romashkin, Kalle Kirsimäe, Aivo Lepland and Kurt O. Konhauser. Iron Isotopes Reveal a Benthic Iron Shuttle in the Palaeoproterozoic Zaonega Formation: Basinal Restriction, Euxinia, and the Effect on Global Palaeoredox Proxies // Minerals 2021, 11(4), 368",
                    "edition_type": "статья",
                    "identificators": [
                        {
                            "identificator_type": "DOI",
                            "identificator": "10.3390/min11040368"
                        },
                        {
                            "identificator_type": "РИНЦ",
                            "identificator": "46764888"
                        },
                        {
                            "identificator_type": "Web of science",
                            "identificator": "WOS:000643328800001"
                        },
                        {
                            "identificator_type": "Scopus",
                            "identificator": "2-s2.0-85103313569"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Александр",
                            "surname": "Ромашкин",
                            "patronymic": "Евгеньевич",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-05-15",
                    "publication_name": " Konhauser The kaolinite shuttle links the Great Oxidation and Lomagundi events",
                    "edition_name": "Nature Communications",
                    "bibliographic_link": "Weiduo Hao,  Kaarel Mänd,  Yuhao Li,  Daniel S. Alessi,  Peeter Somelar,  Mathieu Moussavou,  Alexander E. Romashkin,  Aivo Lepland,  Kalle Kirsimäe,  Noah J. Planavsky &  Kurt O. Konhauser The kaolinite shuttle links the Great Oxidation and Lomagundi events. // Nature Communications, 12, 2944 (2021)",
                    "edition_type": "статья",
                    "identificators": [
                        {
                            "identificator_type": "DOI",
                            "identificator": "10.1038/s41467-021-23304-8"
                        },
                        {
                            "identificator_type": "Web of science",
                            "identificator": "WOS:000658740300007"
                        },
                        {
                            "identificator_type": "Scopus",
                            "identificator": "2-s2.0-85106239027"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Павел",
                            "surname": "Медведев",
                            "patronymic": "Владимирович",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Дмитрий",
                            "surname": "Рычанчик",
                            "patronymic": "Владимирович",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Александр",
                            "surname": "Ромашкин",
                            "patronymic": "Евгеньевич",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Юлия",
                            "surname": "Дейнес",
                            "patronymic": "Евгеньевна",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-06-15",
                    "publication_name": "The grandest of all: the Lomagundi-Jatuli Event and Earth's Oxygenation",
                    "edition_name": "Journal of the Geological Society",
                    "bibliographic_link": "Prave A.R., K. Kirsimäe, A. Lepland, A.E. Fallick, T. Kreitsmann, Yu.E. Deines, A.E. Romashkin, D.V. Rychanchik, P.V. Medvedev, M. Moussavou, K. Bakakas and M.S.W. Hodgskiss. The grandest of all: the Lomagundi-Jatuli Event and Earth's Oxygenation // Journal of the Geological Society (2021)",
                    "edition_type": "статья",
                    "identificators": [
                        {
                            "identificator_type": "DOI",
                            "identificator": "10.1144/jgs2021-036"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Юлия",
                            "surname": "Дейнес",
                            "patronymic": "Евгеньевна",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-06-15",
                    "publication_name": "Геолого-геофизические исследования шунгитовых породОнежского синклинория в XXI веке",
                    "edition_name": "Материалы конференции с международным участием \"Шунгитовые породы Карелии: геология, строение, инновационные материалы и технологии \"Шунгит-2020–2021\"",
                    "bibliographic_link": "Дейнес Ю. Е. Геолого-геофизические исследования шунгитовых породОнежского синклинория в XXI веке // Материалы конференции с международным участием \"Шунгитовые породы Карелии: геология, строение, инновационные материалы и технологии \"Шунгит-2020–2021\"    – Петрозаводск: КарНЦ РАН, 2021. С. 9-13.",
                    "edition_type": "материалы конференции (съезда, симпозиума)",
                    "identificators": [
                        {
                            "identificator_type": "РИНЦ",
                            "identificator": "46487920"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Михаил",
                            "surname": "Филиппов",
                            "patronymic": "Михайлович",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Юлия",
                            "surname": "Дейнес",
                            "patronymic": "Евгеньевна",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-06-15",
                    "publication_name": " Перспективы открытия месторожденияшунгитов на участке Никонова гора",
                    "edition_name": "Материалы конференции с международным участием \"Шунгитовые породы Карелии: геология, строение, инновационные материалы и технологии \"Шунгит-2020–2021\"",
                    "bibliographic_link": "Филипов М. М., Дейнес Ю. Е. Перспективы открытия месторожденияшунгитов на участке Никонова гора // Материалы конференции с международным участием \"Шунгитовые породы Карелии: геология, строение, инновационные материалы и технологии \"Шунгит-2020–2021\"    – Петрозаводск: КарНЦ РАН, 2021. С. 13-16.",
                    "edition_type": "материалы конференции (съезда, симпозиума)",
                    "identificators": [
                        {
                            "identificator_type": "РИНЦ",
                            "identificator": "46487902"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Дмитрий",
                            "surname": "Рычанчик",
                            "patronymic": "Владимирович",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Александр",
                            "surname": "Ромашкин",
                            "patronymic": "Евгеньевич",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Аэлита",
                            "surname": "Первунина",
                            "patronymic": "Валерьевна",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Владимир",
                            "surname": "Ковалевский",
                            "patronymic": "Викторович",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Юлия",
                            "surname": "Дейнес",
                            "patronymic": "Евгеньевна",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-07-15",
                    "publication_name": " Шунгитовые породы Карелии: от геологических исследований к перспективам использования в инновационных технологиях",
                    "edition_name": "Труды КарНЦ РАН",
                    "bibliographic_link": "Дейнес Ю.Е., Ковалевский В.В., Первунина А.В., Ромашкин А.Е., Рычанчик Д.В., Иешко Е.П. Шунгитовые породы Карелии: от геологических исследований к перспективам использования в инновационных технологиях // Труды КарНЦ РАН. No 7. Комплексные научные исследования КарНЦ РАН. 2021. C. 72-88",
                    "edition_type": "статья",
                    "identificators": [
                        {
                            "identificator_type": "DOI",
                            "identificator": "10.17076/them1426"
                        },
                        {
                            "identificator_type": "РИНЦ",
                            "identificator": "46385362"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Игорь",
                            "surname": "Мошников",
                            "patronymic": "Анатольевич",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Юрий",
                            "surname": "Марковский",
                            "patronymic": "Анатольевич",
                            "affiliation": "ИГ КарНЦ РАН"
                        },
                        {
                            "name": "Владимир",
                            "surname": "Ковалевский",
                            "patronymic": "Викторович",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-11-15",
                    "publication_name": "Electrical conductivity of carbon films obtained by thermal sputtering of type I shungite rocks of various deposits",
                    "edition_name": "FULLERENES, NANOTUBES AND CARBON NANOSTRUCTURES",
                    "bibliographic_link": "Moshnikov Igor A. , Vladimir V. Kovalevski, and Yuriy A. Markovskii. Electrical conductivity of carbon films obtained by thermal sputtering of type I shungite rocks of various deposits // FULLERENES, NANOTUBES AND CARBON NANOSTRUCTURES. 2021.",
                    "edition_type": "сборник (научных трудов)",
                    "identificators": [
                        {
                            "identificator_type": "DOI",
                            "identificator": "10.1080/1536383X.2021.1998004"
                        },
                        {
                            "identificator_type": "РИНЦ",
                            "identificator": "47520978"
                        },
                        {
                            "identificator_type": "Web of science",
                            "identificator": "WOS:000713496000001"
                        },
                        {
                            "identificator_type": "Scopus",
                            "identificator": "2-s2.0-85118447375"
                        }
                    ],
                    "megascience_object_name": null
                },
                {
                    "authors": [
                        {
                            "name": "Юлия",
                            "surname": "Дейнес",
                            "patronymic": "Евгеньевна",
                            "affiliation": "ИГ КарНЦ РАН"
                        }
                    ],
                    "publication_date": "2021-07-15",
                    "publication_name": "Protracted oxygenation in the Paleoproterozoic did not result in proliferation of mitochondrial organisms",
                    "edition_name": "Goldschmidt 2021",
                    "bibliographic_link": "Mänd K., Planavsky N.J., Porter S., Robbins L.J., Wang Ch., Kreistmann T., Paiste K., Paiste P., Deines Yu., Kirsimäe K., Lepland A., Konhauser K. Protracted oxygenation in the Paleoproterozoic did not result in proliferation of mitochondrial organisms // Goldschmidt 2021 Abstract. ",
                    "edition_type": "материалы конференции (съезда, симпозиума)",
                    "identificators": [
                        {
                            "identificator_type": "DOI",
                            "identificator": "10.7185/gold2021.6732"
                        }
                    ],
                    "megascience_object_name": null
                }
            ],
            "preprints": [],
            "thematic_reports": [],
            "workers_total": "12.000",
            "workers_researches": "6.000",
            "workers_teachings": "0.000",
            "workers_others": "6.000",
            "workers_technitians": "0.000",
            "workers_accessories": "0.000",
            "with_report": true,
            "experimental_developments": [],
            "ikrbsbooks": [
                {
                    "number": 1,
                    "pages_count": 33
                }
            ],
            "prepared_analytics_materials": [],
            "stages": [],
            "ran_conclusion_date": null,
            "transmission_to_third_party_users": false,
            "grnti_oecd_description": null,
            "transmission_to_external_antiplagiat": true,
            "license_expiration": null,
            "license_conditions": null,
            "access_to_neb": null,
            "access_to_cyber": null,
            "report_license_type": null,
            "has_commercial_secret": false,
            "customer": {
                "short_name": "МИНОБРНАУКИ РОССИИ",
                "name": "МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ",
                "original_name": null,
                "original_short_name": null,
                "ogrn": "1187746579690",
                "supervisor_name": null,
                "supervisor_surname": null,
                "supervisor_patronymic": null,
                "organization_type": "Организация",
                "territory": null,
                "okogu": "Министерство науки и высшего образования Российской Федерации",
                "okopf": "Федеральные государственные казенные учреждения"
            },
            "executor": {
                "short_name": "ИГ КарНЦ РАН",
                "name": "Институт геологии - обособленное подразделение Федерального государственного бюджетного учреждения науки Федерального исследовательского центра «Карельский научный центр Российской академии наук»",
                "original_name": null,
                "original_short_name": null,
                "ogrn": "1021000531133",
                "supervisor_name": null,
                "supervisor_surname": null,
                "supervisor_patronymic": null,
                "organization_type": "Организация",
                "territory": null,
                "okogu": "Министерство науки и высшего образования Российской Федерации",
                "okopf": "Обособленные подразделения юридических лиц"
            },
            "nioktr": "АААА-А18-118020690238-0"
        },
  • Directory of Open Access Books - Быстро растущий каталог книг открытого доступа, содержащий на март 2023 г. более 66к изданий от 650 издательств. Доступны и полные тексты, и метаданные, которые можно скачать в виде дампа или по API.

Авторы

Данные об авторах можно разделить на две части: собранные на основе публикаций и имеющие другое происхождение, прежде всего - ORCID, где ученые регистрируются лично или с помощью работодателей. И те, и другие используются для взаимного обогащения: извлеченные из публикаций авторы соотносятся с ORCID, а профили ORCID наделяются списками публикаций.

Профили на основе публикаций для всех проиндексированных авторов доступны в уже упомянутых дампах OpenAlex (обогащет авторов наиболее важными тематиками и фиксирует последнее место работы), FATCAT и Semantic Scholar (в последнем - даже с неистребимыми индексами Хирша), а также DBLP. Существует также большой датасет авторов на основе OpenAlex, созданный для развития Author Name Recognition, т.е. надежного автоматизированного соотнесения записей об авторах с самими авторами. Он подготовлен китайцами, для которых эта задача особенно актуальна.

Канонический каталог авторов - ORCID, включающий всю информацию, которую авторы там разместили в режиме public. Дампы выкладываются ежегодно в XML и разделены на сводки об авторах и полные записи их "активностей" (публикации, гранты и т.д.).

Из традиционных коммерческих баз доступно мало что, прежде всего - перечень метрик цитируемости для 200 тысяч наиболее цитируемых авторов Scopus, но он не содержит ни авторских идентификаторов, ни связок с публикациями.

По отдельным категориям авторов - например, нобелевским лауреатам - есть очень богатые датасеты со списками всевозможных публикаций.

Организации

  • Research Organization Registry (ROR) - канонический каталог и идентификатор, аналог ORCID для уровня организаций. На начало 2023 г. включает более 102 тысяч организаций. Описание и ссылки на дамп в JSON, обновляемый раз в две недели (обычную таблицу в CSV можно попросить по почте support@ror.org). Качество данных среднее, по РФ, и, вероятно, остальным странам встречаются ошибки.
пример данных по отдельной организации
{
"id":"https://ror.org/013cjyk83",
"name":"PSL Research University",
"email_address":null,
"ip_addresses":[

],
"established":2010,
"types":[
    "Education"
],
"relationships":[
    {
        "label":"ESPCI Paris",
        "type":"Child",
        "id":"https://ror.org/03zx86w41"
    },
    {
        "label":"Subcellular Structure and Cellular Dynamics",
        "type":"Child",
        "id":"https://ror.org/04w11tv37"
    },
    {
        "label":"École Pratique des Hautes Études",
        "type":"Child",
        "id":"https://ror.org/046b3cj80"
    }
],
"addresses":[
    {
        "lat":48.854692,
        "lng":2.33781,
        "state":null,
        "state_code":null,
        "city":"Paris",
        "geonames_city":{
            "id":2988507,
            "city":"Paris",
            "geonames_admin1":{
            "name":"Île-de-France",
            "id":3012874,
            "ascii_name":"Ile-de-France",
            "code":"FR.11"
            },
            "geonames_admin2":{
            "name":"Paris",
            "id":2968815,
            "ascii_name":"Paris",
            "code":"FR.11.75"
            },
            "license":{
            "attribution":"Data from geonames.org under a CC-BY 3.0 license",
            "license":"http://creativecommons.org/licenses/by/3.0/"
            },
            "nuts_level1":{
            "name":"ÎLE DE FRANCE",
            "code":"FR1"
            },
            "nuts_level2":{
            "name":"Île de France",
            "code":"FR10"
            },
            "nuts_level3":{
            "name":"Paris",
            "code":"FR101"
            }
        },
        "postcode":null,
        "primary":false,
        "line":null,
        "country_geonames_id":3017382
    }
],
"links":[
    "https://www.psl.eu/en/university"
],
"aliases":[
    "Université PSL"
],
"acronyms":[
    "PSL"
],
"status":"active",
"wikipedia_url":"https://en.wikipedia.org/wiki/PSL_Research_University",
"labels":[
    {
        "label":"Université de recherche Paris Sciences et Lettres",
        "iso639":"fr"
    }
],
"country":{
    "country_name":"France",
    "country_code":"FR"
},
"external_ids":{
    "ISNI":{
        "preferred":null,
        "all":[
            "0000 0004 1784 3645"
        ]
    },
    "OrgRef":{
        "preferred":null,
        "all":[
            "31274670"
        ]
    },
    "Wikidata":{
        "preferred":null,
        "all":[
            "Q1163431"
        ]
    },
    "GRID":{
        "preferred":"grid.440907.e",
        "all":"grid.440907.e"
    }
}
}
  • Russian Index of Research Organizations (RIRO) - сводный датасет сведений и идентификаторов российских научных и научно-образовательных организаций, объединяющий их профили в наукометрических базах, официальные id типа ОГРН, адреса и геолокации. Подробнее в разделе про идентификаторы организаций. Официальный сайт и сам датасет.

Также профили организаций c метриками есть в вышеупомянутом дампе OpenAlex, многое можно извлечь из дампов ЕГИСУ НИОКТР, но там часты ошибки, особенно в указании руководителей.

Источники (журналы и не только)

Наиболее важные традиционные наборы метаданных об источниках концентрируются на журналах и доступны только за деньги. Это набор метрик Journal Citation Reports в составе Web of Science, а также Ulrich's Periodicals Directory - де-факто стандарный библиотечный каталог, включающий порядка 300 тысяч журналов со всего мира. Также в платном режиме наиболее авторитетный "черный список" - Cabell's Predatory Reports.

Но на фоне развития открытого доступа ситуация с журнальными датасетами быстро меняется. Способствует и то, что сейчас под источниками понимают уже далеко не только научные журналы: растет роль препринтов и соответствующих площадок типа arXiv или RePEc, всё важнее ведущие конференции по компьютерным наукам, а монографии и сборники продолжают оставаться значимыми в социальных и гуманитарных дисциплинах. Наконец, на арену выходят датасеты и их хранилища типа Zenodo.

Новые базы данных это отражают. Так, в OpenAlex по запросу https://api.openalex.org/sources выдается более 200 тысяч разнообразнейших источников от центральных журналов до локальных репозиториев (правда, пока иногда с дубликатами). О том, как работать с этими данными в python, хорошо рассказывается здесь на примере с японскими источниками.

Аналогичные возможности есть и в других базах метаданных, платных и бесплатных. Среди специальных наборов данных именно об источниках отметим следующие:

  • Directory of open access journals (DOAJ) - Главный мировой каталог журналов открытого доступа. Содержит массу ценной информации по всем значимым OA-журналам в форматах веб-интерфейса, API и дампа. Набор полей и актуальность информации зависят от издания и в идеале внушительны, как видно на примере Scientific Reports:
пример данных по отдельному журналу
{
  "id": "a93400557c92470b8603e96796297aab",
  "created_date": "2011-11-04T11:48:02Z",
  "last_updated": "2023-01-19T10:42:10Z",
  "bibjson": {
    "boai": true,
    "eissn": "2045-2322",
    "publication_time_weeks": 20,
    "title": "Scientific Reports",
    "oa_start": 2011,
    "apc": {
      "has_apc": true,
      "url": "https://www.nature.com/srep/open-access",
      "max": [
        {
          "currency": "USD",
          "price": 2390
        },
        {
          "currency": "GBP",
          "price": 1890
        },
        {
          "currency": "EUR",
          "price": 2090
        }
      ]
    },
    "article": {
      "license_display_example_url": "https://www.nature.com/articles/s41598-022-17512-5",
      "orcid": true,
      "i4oc_open_citations": true,
      "license_display": [
        "Embed"
      ]
    },
    "copyright": {
      "author_retains": false,
      "url": "https://www.nature.com/nature-portfolio/editorial-policies/self-archiving-and-license-to-publish"
    },
    "deposit_policy": {
      "has_policy": true,
      "url": "https://v2.sherpa.ac.uk/id/publication/24229",
      "service": [
        "Sherpa/Romeo"
      ]
    },
    "editorial": {
      "review_url": "https://www.nature.com/srep/journal-policies/peer-review",
      "board_url": "https://www.nature.com/srep/about/editors",
      "review_process": [
        "Blind peer review"
      ]
    },
    "other_charges": {
      "has_other_charges": false
    },
    "pid_scheme": {
      "has_pid_scheme": true,
      "scheme": [
        "DOI"
      ]
    },
    "plagiarism": {
      "detection": true,
      "url": "https://www.nature.com/srep/journal-policies/editorial-policies#plagiarism"
    },
    "preservation": {
      "has_preservation": true,
      "url": "https://www.springernature.com/gp/librarians/licensing/a-z/digital-preservation",
      "national_library": [
        "National Digital Preservation Program, China"
      ],
      "service": [
        "CLOCKSS",
        "PMC",
        "Portico"
      ]
    },
    "publisher": {
      "name": "Nature Portfolio",
      "country": "GB"
    },
    "ref": {
      "oa_statement": "https://www.nature.com/srep/open-access",
      "journal": "https://www.nature.com/srep/",
      "aims_scope": "https://www.nature.com/srep/about/aims",
      "author_instructions": "https://www.nature.com/srep/publish/guidelines",
      "license_terms": "https://www.nature.com/srep/open-access"
    },
    "waiver": {
      "has_waiver": true,
      "url": "https://www.nature.com/srep/open-access"
    },
    "keywords": [
      "natural sciences",
      "biology",
      "chemistry",
      "earth sciences",
      "physics"
    ],
    "language": [
      "EN"
    ],
    "license": [
      {
        "type": "CC BY",
        "BY": true,
        "NC": false,
        "ND": false,
        "SA": false,
        "url": "https://creativecommons.org/licenses/by/4.0/"
      }
    ],
    "subject": [
      {
        "code": "R",
        "scheme": "LCC",
        "term": "Medicine"
      },
      {
        "code": "Q",
        "scheme": "LCC",
        "term": "Science"
      }
    ]
  },
  "admin": {
    "seal": false,
    "ticked": true
  }
}

Так как в мире идет переход к открытому доступу и через пять лет все основные журналы вероятно перейдут на OA-модель, значение и наполнение DOAJ будет быстро расти. Уже сейчас в нем порядка 20к журналов, в т.ч. 560 российских.

  • Базы, основанные на Scopus - Списки журналов и их метрик в Scopus изначально позиционировались как открытые в противовес платным импакт-факторам Web of Science. В онлайн-каталоге источников Scopus (доступен без подписки, в т.ч. в России) на март 2023 г. более 40 тысяч журналов, почти 2 тысячи книжных серий и 500 основных конференций. Там же можно скачать таблицу в excel, где указаны тематики, издатель и значение CiteScore. Популярные нормализованные метрики по этой базе для Elsevier рассчитывают внешние исполнители: значения SJR легко скачать в excel на ScimagoJR, а SNIP - на CWTS Journal Indicators.

  • "Белый список" журналов Российского центра научной информации - Один из списков изданий, которые планируется применять для формальной оценки российской науки вместо метрик WoS\Scopus. На официальном сайте в профилях журналов указана масса информации, включая метрики в динамике, но скачать ее сходу нельзя: в выгружаемом датасете в csv лишь название, ISSN и языки, тогда как самое интересное из имеющегося - актуальные сведения о том, в какие базы входит то или иное издание (почему-то RSCI, DOAJ и некоторые другие каталоги в профилях журналов не отражаются, зато есть WoS, Scopus и отраслевые базы типа DBLP и MEDLINE). Так как запрета на скрейпинг на сайте нет, эту информацию можно скачать простым скриптом (работает на март 2023 г., легко расширить для скачивания иной информации) и затем свести с основной таблицей по названию журнала:

cкрипт на python для скрейпинга статуса индексации в базах по данным РЦНИ
#pip install requests beautifulsoup4 lxml
import re
import requests
from bs4 import BeautifulSoup
preurl=r'https://journalrank.rcsi.science/ru/record-sources/details/'
path=r'c:\ivan\rcsi_list\all.csv' #output path
for x in range(1,30050): #adjust if the list eventually grows
    print ('doing page ',str(x))              
    r=requests.get(preurl+str(x))
    if len(r.text)>1000:
        soup = BeautifulSoup(r.text, 'lxml')
        nameout=re.sub('<[^<]+?>', '', str(soup.findAll('h3', {'class': 'mg-0'}))).strip("][")      
        indexedout=re.sub('<[^<]+?>', '', str(soup.findAll('span', {'class': 'badge badge-primary badge-outline badge-pill mg-right-5 cursor-tip tx-0-8-em'}))).strip("][")    
        with open(path, 'a', encoding='utf-8') as f:
            f.write(nameout+'\t'+indexedout+'\n')
  • Составленные экспертами списки "хороших" журналов и конференций, используемые в различных процедурах оценки - В мире широко распространены списки изданий, составленные экспертами с использованием наукометрии в виде подспорья для суждений профильных специалистов. На таких списках основаны, например, оценки университетов в Скандинавии или неформальные требования для желающих сделать академическую карьеру в экономике, компьютерных науках и ряде других дисциплин. Наиболее актуальные и доступные для скачивания:

  • Национальный список Норвегии (журналы, конференции и книжные издательства), доступен после свободной регистрации, десятки тысяч источников. Из необычного: по большинству указаны официальные сайты.

  • Аналогичный список Финляндии.
  • Journal Quality List от Анне-вил Харзинг, создательницы Publish or Perish. Метарейтинг, объединяющий 10 рейтингов журналов по экономике, менеджменту и смежным областям.
  • CORE Conference Portal - вероятно, наиболее авторитетный рейтинг конференций в Computer Science. Составляется объединением факультетов CS Австралии уже много лет, на весну 2023 г. включает почти тысячу конференций, разбитых на пять уровней, с указанием основных и второстепенных тематик. Есть связка с DBLP.

  • Репозитории данных и датасетов - Наиболее быстро растущий сегмент научной коммуникации. Один из ведущих каталогов хранилищ данных - FAIRsharing.org, там их уже больше тысячи, от общенаучных до специфических, имеется API. Еще один общедоступный каталог хранилищ - re3data. В биомедицине популярен каталог от National Institutes of Health. Также рекомендуем OpenDOAR от создателей Sherpa Romeo.

  • Препринты - Самый близкий к полному список серверов препринтов - видимо, Directory of Open Access Preprint Repositories. Функционал бедный, ждем новые инструменты.

Back to top