发布网友 发布时间:2022-04-21 07:36
共3个回答
热心网友 时间:2023-11-02 00:27
在做研究的时候遇到Pearson分布系统这个概念。该类分布是由统计学鼻祖Karl Pearson在15年提出来的。 但是在教科书和文献中出现得很少。从定义上看,该分布分为8种(0型是正态分布,I型是四参数beta分布,III型是三参数gamma分布,IV有自己的pdf表达式且不属于任何标准的分布,VII就成了t分布),似乎是这些分布的一个大一统分布模型。在作用上,从Matlab统计工具箱给的功能来看,Pearson系统随机发生器(pearsrnd)主要用于给定一、二、三、四阶中心矩(均值、方差、偏度、峰度)的样本生成,并返回其类型。一些文献中,通过其一、二、三、四阶中心矩解析地给出了pdf的表达式,并应用在了VaR的估计中。除此之外,我对Pearson系统并没有更深层理解。尤其是不明白:1. 以上提到的8种分布之间到底是什么关系,为什么可以通过Pearson系统来统一归纳;2. Pearson分布为什么可以通过输入前四阶中心矩的方法来进行随机模拟(难道只是因为pdf长那个样子吗)。 其模拟的效果有多可靠? 信息有多完整?3. 除了通过前四阶中心矩随机模拟,Pearson分布是否还有其他方面的应用?
热心网友 时间:2023-11-02 00:28
对数变换是数据变换的一种常用方式,数据变换的目的在于使数据的呈现方式接近我们所希望的前提假设,从而更好的进行统计推断。但需要注意的是,数据是离散变量时进行对数变换要额外小心!(Why)为什么需要做数据变换?从直观上讲,是为了更便捷的发现数据之间的关系(可以理解为更好的数据可视化)。举个栗子,下图的左图是各国人均GDP和城市人口数量的关系,可以发现人均GDP是严重左偏的,并且可以预知在回归方程中存在明显的异方差性,但如果对GDP进行对数变换后,可以发现较明显的线性关系。为什么呢?因为我们度量相关性时使用的Pearson相关系数检验的是变量间的线性关系,只有两变量服从不相关的二元正态分布时,Pearson相关系数才会服从标准的t-分布,但如果变量间的关系是非线性的,则两个不的变量之间的Pearson相关系数也可以为0.所以,数据变换后可以更便捷的进行统计推断(t检验、ANOVA或者线性回归分析)。例如通常构造估计量的置信区间时是使用样本均值加减两倍标准差的方式,而这就要求样本均值的分布是渐近正态分布,如果数据呈现出明显的偏度,则此时使用上述统计推断方式就是不适用的;另外,最经典的例子就是回归分析中的异方差性,误差项的方差随着自变量的变化而变化,如果直接进行回归估计残差的方差会随着自变量的变化而变化,如果对变量进行适当变换,此时残差服从同一个正态分布。作者:五雷链接:/question/22012482/answer/21357107来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
热心网友 时间:2023-11-02 00:28
在作用上,从Matlab统计工具箱给的功能来看,Pearson系统随机发生器(pearsrnd)主要用于给定一、二、三、四阶中心矩(均值、方差、偏度、峰度)的样本生成,并返回其类型。