作者:探码科技, 原文链接: http://www.tanmer.com/blog/537
参考资料:
https://opendata.cityofnewyork.us/
提供230,256个数据集、14个数据目录
提供1700个数据集、9个数据目录
247个数据集、12个数据目录
共享大量数据集的分布式系统,提供445.96TB的研究数据
http://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html
提供国外开放数据网站相关信息,目前已集合35个查询途径
美国人口普查局
USGovXML.com是美国政府提供的公共Web服务和XML数据源的索引。USGovXML.com索引来自 美国政府所有3个分支机构以及董事会,委员会,公司和独立机构的数据来源。
快速搜索和分析政府、公司和组织发布的数十亿份公共记录。
发现和分享高质量数据集,与他人联系和分享知识。
https://registry.opendata.aws/
帮助人们发现和共享通过AWS资源提供的数据集。
开放数据网站导航
金融,经济和替代数据集的主要来源,为投资专业人士提供服务。Quandl的平台被超过40万人使用,其中包括来自世界顶级对冲基金,资产管理公司和投资银行的分析师。
研究论文上传网站,已有2600万+浏览量、750万+下载、800,000+上传、200万+文章
https://dev.maxmind.com/geoip/geoip2/geolite2/
IP地理定位数据库
https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public
公共开放数据集汇总
https://www.kaggle.com/datasets
数据文档,拥有20394个数据集
https://www.internationalgenome.org/data
国际基因组样本资源
https://www.google.com/publicdata/directory
谷歌公开数据搜索网站
世界银行开放数据搜索网站
http://chriswhong.github.io/nyctaxi/
纽约出租车数据开放平台
https://www.opendataphilly.org/
费城开放数据平台、16个数据目录、354个数据集
https://grouplens.org/datasets/
提供9个数据集,关于书籍、电源、wiki数据集
http://archive.ics.uci.edu/ml/index.php
加州大学欧文机器学习库,提供481个数据集
http://web.archive.org/web/20150320022752/https://bitly.com/bundles/hmason/1
公共数据集汇总
美国国家环境信息中心,监测,评估和提供国家气候和历史天气数据和信息
美国宇航局公布的美国气候数据
https://www.reddit.com/r/datasets/
开放数据集汇总网站
关于货币的数据集
健康指标和评估研究所 - 来自世界各地的健康和人口统计数据集目录,包括IHME结果
圣路易斯联邦储备银行数据开放网站,该网站提供丰富的经济数据和信息,以促进经济教育和加强经济研究。
新西兰经济研究所,可在该网站下载自1850年以来的相关经济数据。
http://www.nyu.edu/projects/politicsdatalab/datasupp_datasources.html
纽约大学政治数据中心
https://github.com/datasciencemasters/data
Github网站上的开放数据源总结
https://www.unicef.org/statistics/index_24287.html
联合国儿童基金会官网,开放世界各国家、地区的儿童状况报告
http://data.un.org/Default.aspx
联合国国际统计数据库,包含6,000多万个数据点,涵盖广泛的统计主题,包括农业,犯罪,通信,发展援助,教育,能源,环境,金融,性别,健康,劳动力市场,制造业,国民核算,人口与移民,科学技术,旅游,运输和贸易。
https://sedac.ciesin.columbia.edu/
社会经济数据和应用中心,是美国国家航空航天局地球观测系统数据和信息系统(EOSDIS)中的分布式主动档案中心(DAAC)之一。
https://www.gdeltproject.org/#intro
GDELT博客是世界上最大的人类社会开放研究平台的最新新闻,公告,信息和应用程序的官方一站式存储库。
瑞典统计局,提供瑞典国家统计数据,包含26个数据集。
https://www.datasciencecentral.com/profiles/blogs/great-github-list-of-public-data-sets
Github公共数据集
https://data.stackexchange.com/
一个开源工具,用于对来自StackExchange网络的公共数据进行任意查询。
旧金山政府开发数据网站
https://www.datasciencecentral.com/profiles/blogs/the-free-big-data-sources-everyone-should-know
数据科学中心
https://competitions.codalab.org/competitions/17094
https://github.com/src-d/datasets/tree/master/PublicGitArchive
Git Hub开放数据平台汇总
来自Microsoft Research的免费数据集,以推进自然语言处理,计算机视觉和特定领域科学等领域的最新研究。
印度开放政府数据(OGD)平台-data.gov.in-是一个用于支持印度政府开放数据倡议的平台。
https://toolbox.google.com/datasetsearch
谷歌数据集搜索门户
它是美国政府免费提供有关气候和犯罪等各种惊人信息的门户。
有来自英国所有中央部门以及许多其他公共部门和地方当局的数据集。它充当有关一切信息的门户,包括商业与经济,犯罪与正义,国防,教育,环境,政府,卫生,社会和交通运输。
该网站是有关政府掌握的有关美国公民生活的统计数据,包括人口,经济,教育,地理等。
https://www.cia.gov/library/publications/the-world-factbook/
世界上每个国家的事实;重点研究267个国家/地区的历史,政府,人口,经济,能源,地理,通讯,运输,军事和跨国问题。
http://open-data.europa.eu/en/data/
数据的增长包括欧盟内部的经济发展以及欧盟机构内部的透明度,包括地理,地缘政治和金融数据,统计数据,选举结果,法律法规以及犯罪,健康,环境,交通运输和科学研究的数据。
包含许多政府和地理空间数据集的试点项目。它可以帮助您探索加拿大政府如何通过开放数据,开放信息和开放对话来提高透明度,加强问责制,提高公民参与度并推动创新和经济机会。
https://opengovernmentdata.org/
它提供来自美国,欧盟,加拿大,CKAN等的开放政府数据。
国家教育统计中心(NCES)是收集和分析与美国和其他国家/地区的教育相关数据的主要联邦实体。
https://www.ukdataservice.ac.uk/
英国数据服务集合包括英国政府资助的主要调查,跨国调查,纵向研究,英国人口普查数据,国际总量,商业数据和定性数据。
最全的中国开放数据(Open Data)及政府数据开放平台汇总
《Open Data in a Big Data World》协议下载:【联系我们】或者关注【探码科技】微信公众号,回复关键词“国外开放数据”即可。