如何入门机器学习研究
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。作为越来越受到瞩目的学科,本篇简要介绍如何做相关研究的入门。
首先找一本机器学习相关书籍,简要过一遍基础概念。
如果对于遇到的数学概念不明白的,还需要补充高数、线性代数、概率论相关知识。
熟悉了基础概念之后,就可以到国际上的会议、期刊上寻找感兴趣的方向的论文了。
了解一个领域的最新研究,需要泛读大量文献。选择精读其中有借鉴意义的部分文章,然后找到作者主页(国际会议的文章作者一般都有个人主页),可以获取到代码,论文中往往也会提到数据集。获取到代码和数据集之后,就可以着手复现论文中的实验了。
在复现实验之中,你会加深了解到论文的优点和不足之处,也为以后自己的优化奠定了基础。
使用 Python 开始你的机器学习之旅
安装 Anaconda
下一步是安装 Anacona。有了 Anaconda ,你将可以开始使用 Python 来探索机器学习的世界了。Anaconda 的默认安装库包含了进行机器学习所需要的工具
基本的机器学习技能
有了一些基本的 Python 编程技能,你就可以开始学习一些基本的机器学习技能了。一个实用的学习方法是学到一定技能便开始进行练习。然而,如果你想深入学习这个领域,那么你需要准备投入更多的学习时间。
一个获取技能的有效方法是在线课程。吴恩达的 Coursera 机器学习课程 是一个不错的选择。其它有用的在线训练包括:
Python 机器学习: Scikit-Learn 教程
Python 实用机器学习教程
你也可以在 LiveEdu.tv 上观看机器学习视频,从而进一步了解这个领
学习更多的 Python 库
当你对 Python 和机器学习有一个好的感觉之后,可以开始学习一些开源的 Python 库。科学的 Python 库将会使完成一些简单的机器学习任务变得很简单。然而,选择什么库是完全主观的,并且在业界内许多人有很大的争论。
一些实用的 Python 库包括:
Scikit-learn :一个优雅的机器学习算法库,可用于数据挖掘和数据分析任务。
Tensorflow :一个易于使用的神经网络库。
Theano : 一个强大的机器学习库,可以帮助你轻松的评估数学表达式。
Pattern : 可以帮助你进行自然语言处理、数据挖掘以及更多的工作。
Nilearn :基于 Scikit-learn,它可以帮助你进行简单快速的统计学习。
探索机器学习
对基本的 Python、机器学习技能和 Python 库有了一定理解之后,就可以开始探索机器学习了。接下来,尝试探索一下 Scikit-learn 库。一个不错的教程是 Jake VanderPlas 写的 Scikit-learn 简介。
然后,进入中级主题,比如 K-均值聚类算法简介、线性回归、决策树和逻辑回归。
最后,深入高级机器学习主题,比如向量机和复杂数据转换。
就像学习任何新技能一样,练习得越多,就会学得越好。你可以通过练习不同的算法,使用不同的数据集来更好的理解机器学习,并提高解决问题的整体能力。
使用 Python 进行机器学习是对你的技能的一个很好的补充,并且有大量免费和低成本的在线资源可以帮助你。
途傲科技为中小企业提供网站制作、网站建设、微信H5、微信小程序,多商户平台,多级分销系统,APP开发,手机网站,HTML5多端自适应网站,营销型企业站建设,及对技术人才的培养等都积累与沉淀了丰富的心得和实战经验。
如果您有想法,可以将需求提交给我们【免费提交需求,获取解决方案】
免责声明:文章部分内容收集于互联网,不代表本站的观点和立场,如有侵权请联系删除。