分类:数据集

来自Big Physics
Jinshanw讨论 | 贡献2017年6月30日 (五) 22:42的版本

数据集

科学计量学方面的数据集,除了大型综合型论文题录数据库Web of ScienceScopus之外,我们还经常使用这些:

数据名称 数据描述 来源
APS data(截止2013) 包含题目、作者、单位、发表时间、引用、PACS码 APS官方提供
APS author disambiguation(截至2010) Roberta Sinatra提供的APS处理重名后的数据 下载
APS单位识别数据(截至2013) MapAffil处理得到的单位数据,包含机构,城市,国家信息 Vetle Torvik提供
USPTO美国专利商标局专利数据(截至2016) 包含题目、专利分类号、申请者、单位、引用 下载
EPO专利局专利数据(截至2016) 包含题目、专利分类号、申请者、单位、引用 下载
SIPO中国国家知识产权局专利数据(不同频率更新,没有所有数据合集下载) 包含题目、专利分类号、申请者、单位、引用 下载
JPO日本特许厅专利数据(每月更新,没有所有数据合集下载) 包含题目、专利分类号、申请者、单位、引用 下载
Medline/PubMed题录数据(截至2016) 包含题目、作者、杂志、MeSH标注、部分包括引用信息 下载
Medline/PubMed全文数据(仅部分有全文,截至2016) PMC(PubMed核心库)全文 下载
PubChem数据 包含化学反应物、反应、论文 NIH PubChem网站 ftp下载
NIH基金数据 包含NIH各个基金项目的编号,类别,主申请人,关键词,受资助文章等信息 下载
SPIRES 已经匹配好的NIH论文和基金数据库,Scientific Publication Information Retrieval & Evaluation System SPIRES
历史学博士学位论文(截至2015) 包含题目、作者、导师、单位 爬取于国家图书馆学位论文库
历史学研究期刊论文 包含题目、作者、单位、摘要 知网
dblp数据 包含题目、作者、杂志、部分包括引用信息 下载
springer-nature数据 包含题目、作者、杂志、部分包括引用信息 springer-nature 提供
Aminer Citation Network Dataset 经过Aminer清洗好的文献引用数据,包含题目、作者、杂志、部分包括引用信息 aminer提供
城市列表 包含城市、国家名称,经纬度位置,人口数等 Geoname提供
机构列表 包含各类机构,及机构位置,机构关系,机构类型等 GRID提供
医学概念网络(Unified Medical Language System® (UMLS®),本体论形式的) 包含和MeSH相对应的概念和概念之间的关系,主要层次性关系 美国国家医学图书馆提供
数学论文题录数据 包含标题、作者、期刊和MSC标注 Mathematical Reviews® (MathSciNet®)提供
经济学论问题录数据 包含标题、作者、期刊和JEL标注 美国经济学学会EconLit提供
Wikidata 把Wikipedia页面结构化得来的Ontology(概念网络,各种概念已经进过识别和结构化,例如学校的地址和经纬度) Wikidata
YAGO 把Wikipedia页面结构化得来的计算机科学的Ontology(概念网络) YAGO
DBpedia 把Wikipedia页面结构化,并且和其他一些Ontology,例如Wordnet得来的Ontology(概念网络) DBpedia
WordNet 日常用语的Ontology(概念网络,主要上下级关系) WordNet
Influential references dataset 作者自己标注的引文列表中对工作有直接实际影响的引文 Influential references dataset
Astro Data Set 从Web of Science输出的天文学论文的数据,用来发展和比较文献主题识别算法 TOPIC EXTRACTION CHALLENGE

本分类目前不含有任何页面或媒体文件。