#[Resources][Recursos]#
#[Le't start by recalling the definition of the regression line from Part A, and look at a formula for computing it directly (without having to use "trial and error" as we did in Part A).][Empecemos por recordar la definición de la recta de regresión de Parte A, y mirar una fórmula para calcularla directamente (sin tener que hacerlo por "ensayo y error" como hicimos en Parte A).]#
#[Regression line][Recta de regresión]#
#[The
regression line (least squares line, best-fit line) associated with the points $(x_1, y_1),\ (x_2, y_2), \dots, (x_n, y_n)$ is the line that gives the minimum sum of squares error (%SSE). The regression line has the form][La
recta de regresión (recta de mínimos cuadrados, recta de mejor ajuste) asociada a los puntos $(x_1, y_1),\ (x_2, y_2), \dots, (x_n, y_n)$ es la recta que da el mínimo error de la suma de cuadrados (%SSE). La recta de regresión tiene la forma]#
%where $m$ %and $b$ #[are computed as follows:][se calcula como sigue:]#
$m = \frac{n\left(\sum xy\right) - \left(\sum x\right)\left(\sum y\right)}{n\left(\sum x^2\right) - \left(\sum x\right)^2}$
$b = \frac{\left(\sum y\right) - m\left(\sum x\right)}{n}$
#[Here, $\sum $ stands for "the sum of." Thus, for example, ][Aquí, $\sum $ significa "la suma de." Así, por ejemplo,]#
$\sum x =$ #[Sum of the $x$-values][Suma de los valores-$x$]# $= (x_1 + x_2 + \dots + x_n)$
$\sum xy =$ #[Sum of the products $xy$][Suma de los productos $xy$]# $= (x_1y_1 + x_2y_2 + \dots + x_ny_n)$
$\sum x^2 =$ #[Sum of the squares of the $x$-values][Suma de los cuadrados de los valores-$x$]# $= (x_1^2 + x_2^2 + \dots + x_n^2)$
#[On the other hand,][Por otro lado,]#
$\left(\sum x\right)^2 =$ #[Square of $\sum x \quad = \quad $ Square of the sum of the $x$-values.][Cuadrado de $\sum x = $ Cuadrado de la suma de los valores-$x.$]#
#[Finally,][Finalmente,]#
$n =$ #[Number of data points.][Número de puntos de datos.]#
#[The easiest way to compute these values is by using a table, as we show in the following quiz, where we will compute the regression line for a set of data.][La manera más fácil calcular estos valores es a través de una tabla, como mostramos en el siguiente concurso, en lo que calcularemos una recta de regresión para un conjunto de datos.]#
#[Consider the following observed data:][Considera los siguientos datos observados:]#
#[Fill in the missing quantities:][Rellena las cantidades faltantes:]#
#[Now use the values in the table to find the slope and intercept regression line:][A continuación, usa los valores en la tabla para determinar la pendiente y intersección de la recta de regresión:]#
#[Coefficient of Correlation][Coeficiente de correlación]#
#[We would like a good measure of how well the regression line fits the given data. Although the sum-of-squares error %SSE is one such measure, its magnitude depends on the units of measurement of $x$ and $y,$ and so we cannot tell just by looking at its value how good a fit the line is. A related quantity that is independent of the units of measurement is the
coefficient of correlation $r.$ The value of $r$ is always between $-1$ and $1,$ and its sign is the same as that of the slope of the regression line. Values close to $1$ and $-1$ indicate a good fit (for a perfect fit, $r = ± 1$) while values close to $0$ indicate a poor fit.][Deseamos una buen medida de cuán cercano la recta de regresión se ajuste a los puntos de datos. Aunque la suma de cuadrados de error %SSE es una de tales medidas, su magnitud depende de las unidades de medida de $x$ e $y,$ y por lo tanto no podemos saber simplemente por mirar su valor cuán cercano se ajuste la recta. Una cantidad relacionada que es independiente de las unidades de medida es la
coeficiente de correlación $r.$ El valor de $r$ es siempre entre $-1$ y $1,$ y su signo es lo mismo que lo de la pendiente de la recta de regresión. Valores cercanos a $1$ y $-1$ indican un ajuste bueno (para un ajuste perfecto, $r = ± 1$) mientras que valores cercanos a $0$ indican un ajuste malo.]#
#[Here are some regression lines with different values of $r:$][Hay aquí algunas rectas de regresión con diferentes valores de $r:$]#
$r = 1$
|
$r = -1$
|
$r = %30$
|
$r = %31$
|
#[Correlation coefficient][Coeficiente de correlación]#
#[The
coefficient of correlation for the $n$ points $(x_1, y_1),\ (x_2, y_2), \dots, (x_n, y_n)$ is given by][La
coeficiente de correlación para los $n$ puntos $(x_1, y_1),\ (x_2, y_2), \dots, (x_n, y_n)$ se da por]#
$r = \frac{n\left(\sum xy\right) - \left(\sum x\right)\left(\sum y\right)}{\sqrt{n\left(\sum x^2\right) - \left(\sum x\right)^2} \cdot \sqrt{n\left(\sum y^2\right) - \left(\sum y\right)^2}}$
#[The quantity $r$ measures how closely the regression line fits the data points.][La cantidad $r$ mide cuán cercano la recta de regresión se ajuste a los puntos de datos.]#
#[Interpretation][Interpretación]#
- #[If $r > 0$ the regression line has positive slope; if $r < 0$ the regression line has negative slope.][Si $r > 0$ la recta de regresión tiene pendiente positiva, si $r &glt; 0$ la recta de regresión tiene pendiente negativa.]#
- #[If $r = ±1,$ then the data points lie eactly on the regression line; if $r$ is close to $±1,$ then the points are close to the regression line. as a general rule of thumb, value of $\|r\|$ of more than 0.8 indicates a good fit. ][Si $r = ±1,$ entonces los puntos de datos se asientan exactamente en la recta de regresión; si $r$ está cercano a $±1,$ entonces los puntos están cercanos a la recta de regresión. A ojo de buen cubero, caulquier valor de $\|r\|$ de más que 0.8 indica un buen ajuste.]#
- #[If $r$ is not close to $±1,$ then the points are not close to the regression line, meaning that the fit is a poor one.][Si $r$ no está cercano a $±1,$ entonces los puntos no están cercanos a la recta de regresión, y esto significa que el ajuste es malo.]#
#[We will now compute the value of $r$ for the regression line we calculated above for the data][Ahora calcularemos el valor de $r$ para la recta de regresión que determinamos arriba para los datos]#
#[One of the quantities that we need in the formula is $\sum y^2,$ the sum of the squares of the $y$-coordinates, which we calclate first:][Una de las cantidades que necesitamos en la fórmula es $\sum y^2,$ la suma de los cuadrados de los coordenadas-$y,$ que calculamos primero:]#
#[Now we can use the values we already calculated to obtain $r$ using the above formula:][A continuación podemos usar los valores ya determinamos para obtener $r$ a través de la formula arriba:]#
Now try the exercises in Section 1.4 of or , some the %8, or move ahead to the next tutorial by pressing on the sidebar.
Ahora prueba los ejercicios en la sección 1.4 del libro o , algunos de los %8, o seguir al siguiente tutorial por pulsar el vínculo ubicado a la izquierda.
Last Updated: Jaunuary, 2014
Copyright © 2013
Última actualización: enero 2014
Derechos de autor © 2014