【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>
《时间序列分析及应用-R语言》,由美 Jonathan D. Cryer和Kung-Sik Chan编著,潘鸿宇等译,机械工业出版社出版,我这本是第二版。这是一本2008年就写好的书,2011年中文出版。算起来都7年了,不禁感概一下,中国在这方面确实落后一大截子了。
数据分析无非是分析样本数据,无论多少数据都只是一个样本而已。这个样本数据从时空分析的角度来看,主要有时间序列和空间序列,大部分数据同时会有时空属性,但目前对时空同时分析的比较少。统计学主要分析时间序列,而地理信息系统(GIS)更多地处理和分析空间序列即空间分布,二者结合起来就叫空间过程,分析和表达的难度都比较大。
时间序列分析最常用的是极值、平滑和回归等操作,从而发现一些长期性的趋势。对周期性过程需要采用模型识别方法,然后对参数和误差进行计算,以评估模型的精度。模型建好了就可以将新的样本数据代入进去,从而预测未来的可能值。
时间序列分析的基本处理使用R能够很容易完成,难的是对复杂过程的建模。常见的有季节变化、正余弦等模型,更复杂的谱分析模型。由于现实世界的复杂性,这些模型往往会叠加到一起,形成多个波,这个由于难度太大,这本书里没有涉及。
这本书通过对气温等数据作为例子,对使用R语言进行分析的方法进行了实战指导,而且附上了各种统计参数的计算公式,非常实用,但是对于公式恐惧症患者有点让人看起来头疼。
不过,要做数据分析,这些基本功还是必须要掌握的,否则只能去当个小说家,去写写哪些“啤酒+尿布”的“大数据分析”的故事了。
对于有心去做大数据分析的人,把这本书啃下来,随便下载点数据做一些图表,拿出来一秀,基本上就能雷倒一大片人了。还是比较值得的。
来源:oschina
链接:https://my.oschina.net/u/2306127/blog/470056