做数据分析或模型训练,可能最头疼的并不是代码,而是找到合适的数据集,这也是非常关键耗时的环节。
今天在 GitHub 上看到了一份精心整理了的全球高质量公开的数据合集:Awesome Public Datasets,已斩获 64000+ Star!
涵盖了农业、生物学、经济学、气候、教育、医疗等几十个领域的数据集,且每个数据集都标注了可用状态和元数据链接。
GitHub:https://github.com/awesomedata/awesome-public-datasets
除此之外,还包含数据格式、大小、更新频率等关键信息,提供多种数据类型,如 CSV、JSON、数据库等。
项目持续在维护更新,数据源权威可靠,有需要的朋友可以收藏备用。