MATLAB感悟(1)--数据切割与插值拟合
目的描述 笔者拿到的C题其实质是一道大数据分析的题目,需要通过已经给出的数据推测出各种东西,但是给出的数据的参数种类很多,需要自行选择,其中个数的考究就留给大家自己去琢磨。 拿到选取出来的 label 之后就需要将这些 label 对应的数据从大量的数据中切割出来。 当时主办方当然不会让你这么容易就通过了,因为你选取的数据大部分是残缺不全的,而且缺的年份甚至有可能是不同的,这就比较蛋疼ing。 解决思路 MATLAB提供的从各种各样的材料导入数据的方法是非常强大的,所以并不用担心导入的问题。所以我们要解决的其实是以下几个问题。 怎样在大量的数据中准确的找到自己选取的 label 所对应的数据? 如果数据缺失怎样处理? 怎样选取出数据的办法因人而异,笔者将自己的代码贴出,希望给大家一点灵光。 至于数据缺失,要么就放弃这个 label ,选取数据完整的 label ,要么就想办法把缺失的数据补齐。 说到补齐很多人自然想到的是 插值与拟合或者回归 ,这几种方法中间的微妙差异是读者该去考虑的问题,笔者就不多赘述。但是把数据补齐这点要注意的是 NaN和0 的区别,同时需要注意的是补齐的数据要放到对应的年份,不然会影响到会面的分析。 代码展示 #param_cell是读者自己的lab,MSN是总的lab function OUTPUT=select_MSN_Index