哪一款数学软件或者编程软件最适合统计专业的学生?

杨君·中国防卫科技学院
2016-04-04
阅读数2890

有很多可以进行统计研究的软件,比如R、SAS、MATLAB等等,这其中哪些是最适合做统计方面的学术用途的呢?
中国石油大学(北京)· 2016-04-07
SAS在数据统计学处理上很强大。总之取决于你具体要做什么
评论 0 赞同 0
中国石油大学(北京)· 2016-04-07
处理数据用matlab,如果是文本字符用R或python吧
评论 0 赞同 0
2016-04-04
Matlab是matrixorientated,在做数值运算方面更强大,更适合于数值建模(模型假设以及数据大多数来自于模拟和对实验观测的抽象)。而现实世界中的数据,大多无法直接应用数学模型来解决。常见的数据总有各种不完美的地方,比如missingvalue,outliers,skewness,categoricalvaribles,字符串数据,等等。Matlab在处理这些数据上显然有些力不从心。(而且对许多实际问题来说,有用统计模型无非某个linearmodel和ensembletree)



统计软件的话应该首推R了。R是S语言的具体实现,而S语言是专门为了构建统计模型而设计的。R是dataoriented,所以处理数据上更得心应手。R的语言更接近于C/JAVA/Python,而且近年来Rcpp和rJava的成功也使R在对程序要求较高的人群中流行开来。相较之下,Minitab,SPSS和SAS便显得有些画地为牢。由于过于依赖程序自身的interface(当然还有SAS里奇葩的Macro),精通这些语言并不能提升使用者的编程水平。(PS,本人并不喜欢rJava,这大概源于本人对JAVA的厌恶。不过Rcpp绝对是masterpiece)



R的另一大好处来是开源。开源便意味着任何人都可以为R的发展做出贡献,而这些不求利润的自主的contributor的贡献往往使得免费软件的发展要先于付费软件许多。比如R中最著名的画图软件ggplot2,其实用性和美观度是许多付费软件所不能及的(D3或许可以和ggplot2较量一下)。近年来更多的package,比如dplyr,data.table等,使得R中的数据处理进一步简化,且更加有效。



Python是R的竞争者。Python中许多package也可以做为很好的数据处理及统计建模工具。比如numpy,pandas,sklearn等。pandas大概是python中最有名的数据处理工具了,但其本身也在很大程度上受到了R中data.frame数据结构的影响。相较于R,Python是一个更加严谨的编程语言。在处理大数据问题时,Python比R要更有效。此外,Python也很实用于收集网络数据,处理非表格数据(如xml等)等问题。Python同时还是Matlab的有力竞争者,其数学建模的能力并不输于matlab。(Matlab很令人恼火的地方是很多toolbox需要额外收费,这总能激起我对那逝去的充满盗版软件的童年的无限感怀)



目前为止我还没有找到一个令我喜欢上Matlab的地方(大概是因为我很少做PDE之类的建模),但我不能否认Matlab还是一个比较成功的工具。至于Minitab/SPSS/SAS,有点编程基础的人应该尽量避免。



我个人的经验是,如果有能力,R和Python都应该下点功夫学。两者相辅相成,对于解决实际问题都是很得心应手的工具。而且两者处理数据的思路很不一样,有助于思路的开阔。(野心再大一点的话,C++也是应该写一写,具体可以借鉴一下HadleyWickham的各种Rpackage)
著作权归作者所有,转载需联系作者以获得授权,引用需注明出处。
作者ID:韩咏祺
链接:https://www.applysquare.com/topic-cn/78T2hak9B/?from=singlemessage&isappinstalled=1
评论 0 赞同 1
别默默的看了,快来和大家聊聊吧,登录后回答问题~ 登录 立即注册
赛乐云AI 证书查询 赛氪APP全新升级

下载赛氪APP

参加有趣活动,获得赛程提醒

分享大学生活,获得前辈指点

意见反馈

产品建议、功能吐槽、使用问题…

欢迎提出关于赛氪网的问题和建议 :)

微信公众号
关注赛氪订阅号
微信服务号
关注赛氪服务号
温馨提示

非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。

温馨提示
温馨提示
帮助与反馈

热门问题