教程
Data Science Tutorials & Resources for Beginners
¶
如果你想了解更多关于数据科学的知识,但不知道从哪里开始,这个列表适合你!
不需要先前的知识,但 Python 和统计基础知识肯定会派上用场. 这些资源已被我当地数据科学学生组的许多初学者成功使用 ML-KA.
What is Data Science?¶
- 'What is Data Science?' on Quora
- Explanation of important vocabulary - 大数据、机器学习、数据科学的差异化.
- Data Science for Business (Book) - 介绍数据科学及其作为商业资产的用途.
Common Algorithms and Procedures¶
- Supervised vs unsupervised learning - 两种最常见的机器学习算法.
- 9 important Data Science algorithms and their implementation
- Cross validation - 评估算法/模型的性能.
- Feature engineering - 修改数据以更好地模拟预测.
- Scientific introduction to 10 important Data Science algorithms
- Model ensemble: Explanation - 将多个模型合并为一个以获得更好的性能.
Data Science using Python¶
此列表仅涵盖 Python,因为许多人已经熟悉这门语言. Data Science tutorials using R.
General¶
- O'Reilly Data Science from Scratch (Book) - 带有示例代码的数据处理、实现和可视化.
- Coursera Applied Data Science - 使用 Python 的在线课程,涵盖大部分相关工具包.
Learning Python¶
numpy¶
numpy 是一个 Python 库,它提供大型多维数组和对它们的快速数学运算.
pandas¶
pandas 为 Python 提供高效的数据结构和分析工具. 它建立在 numpy 之上.
- Introduction to pandas
- DataCamp pandas foundations - 付费课程,但在创建帐户后有 30 天免费(足以完成课程).
- Pandas cheatsheet - 快速浏览最重要的功能.
scikit-learn¶
scikit-learn 是 Python 中最常用的机器学习和数据科学库.
- Introduction and first model application
- Rough guide for choosing estimators
- Scikit-learn complete user guide
- Model ensemble: Implementation in Python
Jupyter Notebook¶
Jupyter Notebook 是一个用于轻松数据可视化和代码演示的 Web 应用程序.
- Downloading and running first Jupyter notebook
- Example notebook for data exploration
- Seaborn data visualization tutorial - 适用于 Jupyter 的绘图库.
Various other helpful tools and resources¶
- Template folder structure for organizing Data Science projects
- Anaconda Python distribution - 包含大多数重要的数据科学 Python 包.
- Spacy - 用于处理基于文本的数据的开源工具包.
- LightGBM gradient boosting framework - 成功用于许多 Kaggle 挑战.
- Amazon AWS - 租用云服务器进行更耗时的计算(r4.xlarge 服务器是一个很好的起点).
Data Science Challenges for Beginners¶
按复杂性递增排序.
- Walkthrough: House prices challenge - 通过简单的房价挑战演练.
- Blood Donation Challenge - 预测捐赠者是否会再次捐赠.
- Titanic Challenge - 预测泰坦尼克号上的生存.
- Water Pump Challenge - 预测非洲水泵的运行状况.
More advanced resources and lists¶
Contribute¶
欢迎投稿! 阅读 contribution guidelines 第一的.
License¶
在法律允许的范围内,Simon Böhm 已放弃所有版权和 本作品的相关或邻接权利. 免责声明:一些链接是附属链接.