机器学习/数据科学公开课推荐

Posted by c cm on January 23, 2014

Coursera上Johns Hopkins University前两日发布了数据科学(Data Science)专业系列公开课,顺风推荐一些别的机器学习/数据科学相关MOOC或者其他来源的课程以供大家参考。

Coursera

  1. Stanford老牌经典机器学习公开课《机器学习Machine Learning》,口碑极好,极力推荐,用Matlab/Octave。最近又有新session开设,14年3月开课。另外,《概率图模型Probabilistic Graphical Models》由经典教材《Probabilistic Graphical Models》作者Daphne Koller教授。可以弥补其他机器学习课程概率图部分缺失的空白。
  2. University of Washington 《机器学习Machine Learning》;《高性能科学运算High Performance Scientific Computing》用Python;《数据科学简介Introduction to Data Science》用Python/R/SQL;《科学运算Scientific Computing》和《数据分析的计算方法Computational Methods for Data Analysis》用Matlab/Octave。看过后两个,视频为上课录像,清晰度不高。
  3. 台湾大学《機器學習基石 (Machine Learning Foundations)》,中文授课英文作业。台大代表队几次获得KDD Cup第一,相信机器学习公开课也不错。老师还很像某个我认识的人,所以看视频效果不错。
  4. Duke University 《数据分析与统计推断Data Analysis and Statistical Inference》 10周,用R语言,重点是inference,参考书是OpenIntro Statistics (Second Edition)
  5. Johns Hopkins University-《数据科学系列Data Science》:一共九门课,每课程4周,预计用时每周3-4小时。时间从14年4月到8月。包括:《数据科学家工具箱Data Scientist’s Toolbox》,《R语言编程 R Programming》,《获取与清洗数据 Getting and Cleaning Data》, 《探索性数据分析Exploratory Data Analysis》, 《可重复性研究Reproducible Research》,《统计推断 Statistical Inference》, 《回归模型Regression Models》,《机器学习应用Practical Machine Learning》,《数据产品开发 Developing Data Products》. 课程设置从零基础到高级应用都有,适合希望系统学习数据科学的同学。最后一个课Developing Data Products会教大家怎么用Shiny,很符合现在Data Scientist的InfoGraph和StoryTelling的潮流嘛。Shiny一些很酷炫的应用可以点这里
  6. Johns Hopkins University-《数据分析Data Analysis》 和 《数据分析计算Computing for Data Analysis》:数据科学系列推出之前的两门公开课,节奏较快,虽然也是4周,但是包括内容很多,每周官方预计3-5小时。其中Data Analysis介绍了整个数据分析的框架并介绍了一些统计包在R中的应用,Computing包括了R语言编程、debug、画图等。
  7. Coursera还有一些跟金融/生物/医学结合的数据分析课程,需要的同学自助

EDX-youtube

  1. MIT-The Analytics Edge,用数据解决现实问题(eg.Moneyball, eHarmony, the Framingham Heart Study, Twitter, IBM Watson, and Netflix)。R语言。8-10h * 11week。
  2. Caltech-《从数据学习Learning From Data》,同样是机器学习课程。
  3. EDX其他数据分析类的课程比较基础,需要的同学点此

Udacity-youtube

  1. 《数据科学简介Intro to Data Science》 /《探索性数据分析Exploratory Data Analysis
  2. 《Hadoop和MapReduce简介Intro to Hadoop and MapReduce》/《用MongoDB进行数据处理Data Wrangling with MongoDB 》。虽然Udacity不交钱不给certificate,但是还是有免费courseware可以看的,而且后两门公开课其他MOOC都没有,推荐给希望了解大数据的同学。当然,仅仅只能起到了解的作用。
  3. 《探索性数据分析Exploratory Data Analysis》用R和ggplot2,是facebook的data scientist讲的哦!有一些案例分析也是用的facebook的数据。

Others

  1. Stanford University 《统计学习Statistical Learning》。机器学习必读《统计学习精要The Elements of Statistical Learning》(下载)的作者之二——两个很萌的老头子一起讲的,参考书《统计学习及在R中的应用简介An Introduction to Statistical Learning with Applications in R》(下载)也很不错,比ESL更基础。用R语言,视频在youtube上。
  2. Harvard 《数据科学Data Science 》提供了上课视频,略卡,需要一点点编程基础,建议在cs50后上。
  3. Using R with Databases简介用R连接数据库,耗时约3小时