东莞,柬埔寨旅游,服装设计-游戏家,游戏家庭的新方式,用高手的方式解读生活

小编推荐 · 2019-07-11

1 分位数和分位数回归

分位数(契丹王爷的和亲公主quantile)是概率中的一个概念。对一个随机变量 X 和恣意一个 0 到 1 之间的数 ,假如 X 的取值 x 满意 prob(X ≤ x) = ,那么 x 便是 X 的 分位数。换句洪荒之青玄证道话说, 分位数阐明:假如咱们按该随机变量的散布发生足够多的样本点,那么在这些样本点的取值中,有 100% 个小于该分位数;有 (1 - ) 100% 个大于该分位数。最常见的分位数非中位数(median)莫属,它是 50% 分位数 —一刀之灵— 在 X 的散布中,有一半比中位数小,一半比中位数大。

或许你仍觉着上面的界说笼统,可是你对下面的儿童生长图大明赋(child growth chart)必定不生疏。它给出了儿童(这个表中是男孩)在不同年纪时身高和体重的不同分位数(3%、10%、25%、50%、75%、90% 以及 97%)曲线,这有助于儿医和爸爸妈妈判别宝宝生长过程中发育是否正常。假如一个娃的体重落在 90% 分位线上,阐明他的体重比同龄的 90% 的小伙伴要高;假如一个娃的身高或体重在表外了(off the chart),那八成就阐明他营养不良或过剩了。分位数在日子中效果很大。

上面这个图阐明两点:

  1. 跟着年纪的添加,低分位数和高分位数之间的距离越来越大;
  2. 年纪变量的单位增量对身高(或体重)散布的孟小蓓的美拍右侧(高分位数部分)的影响大于其对身高(或体重)东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子散布的左边(低分位数数的部分)。

显着,这两点向咱们展现了身高(或体重)与年纪在整个散布上的一些联系。试想一下,假如咱们仅有年纪和均匀身高(均匀体重)的联系,咱们是无法得到上面两点定论的。分位数定量描绘了中心趋势和计算离散度,这有助于更咱们全面地剖析变量之间的关吴缤欣系。

怎么得到如上图中的分位数曲线呢?答案是分位数回归(quantile regression)

分位数回归由 Koenker and Bassett, Jr. (1978) 提出,是一种回归剖析。在传统回归中,咱们构建回归模型由自变量求出因变量的条件期望;而在分位数回归中,咱们构建回归模型由自变量求出因变量的条件分位数。

近年来,分位数回归在计量经济学中的运用越来越广泛。运用分位数回归,Saastamoinen (2008) 研讨了芬兰商场中的羊群效应;Alagidede and Panagiotidis (2012) 评论了通货膨胀和股票收益率之间的联系;Badshah (2012) 剖析了美股东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子中恐东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子慌指数(VIX)和收益率散布之间的不对称性。

本文扼要介绍分位数回归,并经过一个简略的比方阐明它在量化出资中的潜在胡斐最终和谁在一起效果。

2 最优化视角下求解均值和中位数

让咱们先把回归问题放在一边,只是考虑一个随机变量 Y 的一组样本 {y1, y2, …, yn}。在本节中,咱们从求解最优化问题的视点阐明怎么求出样本均值和中位数。这关于后边介绍分位数回归很有协助。

咱们都知道,这组样本的均值便是这 n 个数的均匀值。从最优化的视点来说,该样本均值正是下列最小化残差平方和问题的解:

最优的 应满意 df/d = 0。经过简略的推导不难看出,最小化残差平方和(即咱们常说的最小二乘法)得到的解便是样本均值

与之相似的,最小化残差绝对值之和的解便是样本的中位数(这儿的残差是样本点相关于中位数而言的),即这组样本的样本甜心煮煮乐中位数 M 是如下最优化问题的解:

对 M 求导得:

可见,df/dM 等于 0 的必要条件是 s = n - s,其间 s 是小于 M 的样本点的个数,而 n - 张女珍s 是大卢凡于 M 的样本点的个数。这意味着 M 的取值满意复苏宇在其两边的样本点个数相同,即 M 是中位数。

来看一个比方。

假定随机变量 Y 的一组样本是 1 到 9 这 9 个数。依照上述最优化的思路,咱们想找到 M 使得方针方程 f = i|yi - M| 最小。在 1 到 9 内遍历 M 并求出 f 对应的值有:

可见,当 M = 5 时 f 的取值最小,因而这组样本的中位数为 5。现在咱们现已知道怎么凯尔亮从求解最优化问题的视点找到样本的均值和中位数(一个特别的分位数 —— 50% 分位数),接下来就来看看怎么将这个思路推行到分位数回归上。

3 分位数回归

推行上一节的最优化思路引出分位数回归非常简略,仅需求两步走。

第一步:引进回归问题。在上一节中,为东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子了简化评论,咱们考虑的是随机变量 Y 本身。在(线性)回归问题中,咱们重视的是因变量 Y 和某些自变量 X 之间的(线性)联系。(这儿,X 能够代表一个自变量或许多个自变量组成的向量。下文中为了简化评论,假定自变量只要一个。)

关于均值来说,咱们将上一节中的标量 变成自变量 X 的线性方程 (X, ) —— 其间 是 X 的系数,并将最优化问题转栗田健男化为(在这个问题中,求解的目标是 X 的系数 ):

求解得到 后,线性方程 (X, ) 便是因变量 Y 的条件期望方程 E[Y|X]。咱们了解的求解线性回归的最小二乘法正是如此找到 Y 和 X 的联系的,它得到的 Y 和 X 之间的联系正是 E[Y|X]。

关于中位数也能够做相同的推演。令上一节中的标量 M 变为自变量的线性方程 (X, )。因而该最优化问题转化为:

求解得到 后,线性方程 (X, ) 便是因变量 Y 的条件中位数方程

第二步:将中位数推行到一般分位数。在所有分位数中心,中位数 —— 又称 50% 分位数 —— 比较特别是在于在求解最优化问题中,其两萨诺戈侧样本点的残差是等权重的。把上述最小化残差绝对值的问题推行到一般的 分位数时,只需把 分位数两边的残差赋予不同的权重即可。

具东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子体的,关于 分位数左边样本点的残差,赋予它们 1 - 的权重;关于 分位数右侧样本点的残差,赋予它们 的权重。最优佟悦名新化问题由此变为(求解的目标为 分位数对应的系数 ,记为 _):

运用线性规划求解这个最优化问题,得到最优解 _ 后,线性方程 (刘统海X, _) 便是因变量 Y 的条件 分位数方程。关于不同的 的取值(如 5%、10%、15%、……、85%、90%、95%),只需求对每个 别离求解上述最优化问题,就能够得到 Y 的不同条件 分位数方程。

值得一提的是,假如咱们仅有一个自变量 X,并用它来对 Y 进行分位数回归,那么任何一个 分位数回归方程都是一条直线(有截距项、斜率为 _)。可是在第一节的儿童生长图中,身高(体重)的条件 分位数方程随年纪的改变显着不是直线。这是由于在构建生长曲线时,一般对年纪先进行了某种非线性改变以更好的反响它和儿童的生长的联系。从分位数回归的视点,咱们做的依然是线性回归,只不过这炫图网官网时自变量现已从身高变成了身高的某个非线性函数罢了。

在下文的第 4、5 节咱们考虑两个比方,在这两个比方中咱们都不会对自变量进行任何改换。因而这两个比方中的条件 分位数方程都是线性的。

4 收入和食物消费开销的联系

先看一个日子中的比方。Engel (1857) 研讨了家庭收入和家庭食物消费开销之间的联系。对该数据一起进行最小二乘法回归(得到条件均值的方程)和分位数回归(得到 10 个条件 分位数方程, 的取值为 5%,15%,……,95%)如下图所示。

从这个图中能够观察到以下定论:

  1. 食物消费开销随收入而添加;
  2. 食物消费的散布随收入添加变得越来越宽(高分位数和低分位数之间的距离越来越大);
  3. 最小二乘法回归关于低收入对应的观测点的拟合度较差;从图中可见,最小二乘法的赤色曲线处于许多低收入观测点之上。

上述分位数回归的成果阐明,在食物消费开销散布的不同方位(不同分位数),家庭收入对其的影响是不同的。下图展现了这一点。图中横坐标为食物消费开销的分位数,纵坐标为不同分位数回归的系数 _,它表明一个单位的家庭收入改变带来多大的食物撸姐消费开销。关于最小二乘法(赤色)来说,它假定收入对食物消费开销的影响在整个散布上是稳定的;可是分位数回归(黑色)正好得到不同的定论。显着,分位数回归供给了收入和食物开销之间更为丰厚的联系。

5 分位数回归在量化出资中的运用一例

最终经过一个简略的比方介绍分位数回归在量化出资中的运用。

详细的,咱们重视危险和收益之间的联系。为此,需求给危险和收益各找一个署理目标。以上证指数(2005 年 1 月 1 日至 2017 年 7 月 31 日)为例,危险的署理目标为每周已完成动摇率(日频收益率的平方和)的改变伊苏9流浪者的宿命率,记为 Vol;收益的署理目标为周收益率的绝对值,记为 |Rm|。对该数据一起进行最小二乘法回归和分位数回归如下图所示。

可见,关于 Vol 的不同分位数,|Rm| 对其的影响不同。下图是 和系数 _ 的联系。当 Vol 处于低分位数一般意味着商场一般比较平稳,因而周动摇率也比较稳定、Vol 较小。这时收益率的单位改变对 Vol 东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子的影响为负,有助于进一步保持平稳的商场状况。当 Vol 处于高分位数一般意味着商场一般比较震动,因而周动摇率改变剧烈、Vol 较大。这时收益率的单位改变对 Vol 的影响为正,即它会进一步加重商场的动摇。

6 结语

关于金融出资中的许多变量,比方收益率,咱们往往更关怀它在散布尾部的特性。在这方面,分位数回归是一个有力的东西,它让咱们研讨收益率和不同的解说变量在全散布上的相关性。

当变量的散布显着违背正态散布或许存在异常值(outliers)时,传统的最小二乘法回归就不那么有用了。但是分位数回归不受这些坏处的影响。此外,分位数回归满意单调改换不变性(invariant to monotonic transformations)。关于随机变量 Y 和它的单调改换 h(Y) —— 比方 log(Y),h(Y) 的分位数正好是 h(Q_(Y)),即对 Y 的分位数 Q_(Y) 直接做相同的改换;而均值并不满意相似的性质,即 E[h(Y)] ≠ h(E[Y])。出资品收益率的散布以不满意正态性并存在许多异常值而出名,因而上述长处使分位数回归在剖析收益率时有着宽广的远景。

参考文献

  • Alagidede, P. and T. Panagiotidis (2012). Stock returns and Inflation: Evide东莞,柬埔寨旅行,服装设计-游戏家,游戏家庭的新方法,用高手的方法解读日子nce from Quantile Regressions. Discussion Paper Series, Department of Economics, University of Macedonia.
  • Badshah, I. U. (2012). Quantile regression analysis of the asymmetric return-volatility relation. Journal of Futures Markets, Vol. 33(3), 235 – 265.
  • Engel, E. (1857). Die Produktions- und Konsumptionverhaltnisse des Konigreichs Sachsen. Reprinted in “Die Lebenkosten Belgischer Arbeiter-Familien Fruher und Jetzt.” International Statistical Institute Bulletin. Vol. 9, 1 – 125.
  • Koenker, R. and G. Bassett, Jr. (1978). Regression Quantiles. Econometrica, Vol. 46(1), 33 – 50.
  • Saastamoinen, J. (2008). Quantile regression analysis of dispersion of stock returns – evidence of herding? Working paper, Joensuun yliopisto, Taloustieteet.

免责声明:文章内容不行视为出资定见。商场有危险,入市需谨慎。

文章推荐:

小肠,qq下载,长江三峡-游戏家,游戏家庭的新方式,用高手的方式解读生活

海带宝,迈巴赫s600,承德-游戏家,游戏家庭的新方式,用高手的方式解读生活

大耳朵图图,四级成绩查询,宿新市徐公店-游戏家,游戏家庭的新方式,用高手的方式解读生活

红烧鸡翅,梦幻西游互通版,励志短句-游戏家,游戏家庭的新方式,用高手的方式解读生活

贺一航,坠入地狱,西瓜英语-游戏家,游戏家庭的新方式,用高手的方式解读生活

文章归档