我是Duke University在读的研究生,专业是数据科学(Master in Interdisciplinary Data Science)。受启发于李笑来老师,萌生了想法写一个零基础的Data Science入门教程,定位是作为帮助对数据科学(Data Science)感兴趣的朋友们入门的第一个教程。
这个教程会介绍4个基础却重要的统计学模型,它们是数据科学和机器学习领域的基础。虽然简单但是实用,适合入门的初学者。
除此之外,我希望大家可以真正的学会使用这些数据科学的分析方法,理解这些知识的价值。所以在教程中引入了四个实战练习,解决实际问题包括:
- 二手车价格预测
- 糖尿病诊断
- 植物分类
要学习这个教程,你需要你具备以下的基本要求:
- 高中数学基础
- 理解Python的基本概念
Section1: 简单线性回归 Simple Linear Regression
Section2: 多元线性回归 Multiple Linear Regression
Section3: 逻辑回归 Logistic Regression
Section4: 逻辑回归 Logistic Regression
- 感谢李笑来老师对写作思路的指导。
- 感谢我在Duke的同学阿兰,大华哥帮我校对课程内容。
- 感谢我的好朋友郭小璇,吕一冰从读者的角度提出的建议。
我会持续的优化这个教程,所以期待大家提出问题和反馈建议。可以在Github中提出,或者通过email联系我:[email protected]
期待我们一起学习的旅程!