Bootstrem, muestras pequeñas, aplicación en análisis de datos. Tipos de muestras

En el proceso de evaluación del grado de representatividad de estas observaciones selectivas, la cuestión del volumen del agregado de la muestra se vuelve importante. Estudiante de coeficiente de recálculo de muestreo

No solo la magnitud de los límites, que, con esta probabilidad, no excede el error de muestreo, sino también los métodos para determinar estos límites.

Con una gran cantidad de unidades de distribución agregada selectiva () de errores aleatorios del medio de muestra de acuerdo con teorema lyapunova Normalmente o se acerca a lo normal a medida que aumenta el número de observaciones.

La probabilidad de salida de error para ciertos límites se estima en base a tablas laplas integral . El cálculo de errores de muestra se basa en el tamaño de la dispersión general, ya que con un gran coeficiente, que se multiplica por varianza selectiva para obtener el general, el gran papel no juega.

En la práctica del examen estadístico, a menudo es necesario lidiar con las llamadas muestras pequeñas.

Bajo una muestra pequeña significa una observación tan selectiva, el número de unidades de las cuales no supera los 30.

El desarrollo de la teoría de la pequeña muestra fue iniciada por las estadísticas inglesas. V.S. Gosset (impreso bajo el seudónimo Estudiante ) En 1908, demostró que la evaluación de la discrepancia entre la muestra central y el promedio general tiene una ley de distribución especial.

Para determinar los posibles límites de error, use el llamado criterio estudiante, Definido por la fórmula

¿Dónde está la medida de las oscilaciones aleatorias de medio selectivo en

pequeña muestra.

El valor se calcula sobre la base de datos de observación selectivos:

Este valor se utiliza solo para la totalidad total, y no como una evaluación aproximada en la población general.

Con un pequeño número de distribución de muestreo. Estudiante Se diferencia de lo normal: los valores grandes del criterio tienen una mayor probabilidad aquí que con la distribución normal.

El error límite de una pequeña muestra dependiendo del error promedio se representa como

Pero en este caso, el valor está asociado de lo contrario con una estimación probable que con una muestra grande.

Según la distribución. Estudiante Esta evaluación probable depende tanto del tamaño como en el tamaño de la muestra si el error límite no excede el error promedio en muestras pequeñas.

Tabla 3.1. Distribución de probabilidad en muestras pequeñas dependiendo del coeficiente de confianza y muestreo


Como puede verse mesa. 3.1. Con un aumento en esta distribución, busca normal y ya es poco diferente.

Mostramos cómo usar la mesa de distribución del estudiante.

Supongamos que la encuesta de muestras de los trabajadores de la pequeña empresa ha demostrado que los trabajadores gastaron en la implementación de una de las operaciones de producción (mín.). Buscar costos promedio selectivos:

Dispersión selectiva

De ahí el error promedio de una pequeña muestra.

Por mesa. 3.1. Encontramos que para el coeficiente de confianza y el volumen de una muestra pequeña, la probabilidad es igual.

Por lo tanto, con una probabilidad, se puede argumentar que la discrepancia entre la muestra y el promedio general reside en el rango de, es decir, La diferencia no excederá el valor absoluto ().

En consecuencia, el tiempo promedio pasado en la totalidad de la totalidad será de hasta.

La probabilidad de que este supuesto sea realmente incorrecto y el error por razones aleatorias será mayor que, igual a :.

Tabla de probabilidades Estudiante a menudo se da en otros uniformes que en tab 32.1. . Se cree que, en algunos casos, una forma es más conveniente para el uso práctico ( mesa. 3.2 ).

De mesa. 3.2 De ello se deduce que para cada número de grados de libertad, se indica el valor límite, que con esta probabilidad no se excederá con las oscilaciones casuales de los resultados de la muestra.

Basado en especificado en mesa. 3.2 Los valores se determinan. intervalos de confianza : y.

Este es un área de esos valores del promedio general, la salida más allá de la cual tiene una probabilidad muy baja igual a:

Como una probabilidad de confianza, la prueba bilateral se usa como regla general, o que no excluye, sin embargo, la elección y otros no se dan en mesa. 3.2 .

Tabla 3.2. Algunos significados Estudiante de trantendencia

La probabilidad de una producción accidental del valor promedio estimado más allá de los límites del intervalo de confianza será igual y, es decir, Muy pequeña.

La elección entre las probabilidades es hasta cierto punto arbitrario. Esta elección está determinada en gran medida por el contenido de esas tareas para resolver una pequeña muestra.

En conclusión, observamos que el cálculo de errores en una muestra pequeña difiere poco de cálculos similares de una muestra grande. La diferencia es que con una pequeña muestra, la probabilidad de nuestra declaración es algo menor que con más muestra (en particular, en el ejemplo anterior y, en consecuencia).

Sin embargo, todo esto no significa que pueda usar una pequeña muestra cuando necesite una gran muestra. En muchos casos, las discrepancias entre las bases encontradas pueden alcanzar tamaños significativos, que apenas están satisfechos con los investigadores. Por lo tanto, se debe aplicar una pequeña muestra en un estudio estadístico de los fenómenos socioeconómicos con gran cuidado, con la justificación teórica y práctica apropiada.

Por lo tanto, los hallazgos basados \u200b\u200ben los resultados de las muestras pequeñas son prácticos solo bajo la condición de que la distribución del rasgo en la población general es normal o asintóticamente normal. También es necesario tener en cuenta la precisión de los resultados de muestreo de un pequeño volumen aún es menor que con una muestra grande.

En la práctica, a menudo es necesario lidiar con las muestras de un volumen muy pequeño, el número de lo cual es significativamente menor de veinte y media. Dichas muestras en estadísticas se llamaban pequeñas muestras. La necesidad de una consideración especial de pequeñas muestras es causada por el hecho de que los métodos desmontados por encima de los métodos de la evaluación de puntos e intervalo de las características de la muestra sugieren un número suficientemente grande de muestras.

El concepto de pequeñas muestras. Distribución de estudiantes

Promedio selectivo y, en consecuencia, su error se distribuye normalmente, y la corrección por la cantidad de dispersión de selección es muy cercana a una y no tiene un valor práctico. El error de muestreo bajo estas condiciones rara vez excede el valor. Otro tratamiento con un pequeño muestreo. Con pequeñas muestras, la dispersión selectiva se desplaza significativamente. Por lo tanto, sería incorrecto aplicar la función de la distribución normal para conclusiones probabilísticas sobre el posible valor del error. Con un pequeño muestreo, siempre es necesario utilizar una evaluación de dispersión sin complicaciones:

En consecuencia, para obtener una evaluación increíble de la dispersión de acuerdo con la muestra menor, la suma de los cuadrados de las desviaciones debe dividirse por la cantidad. Este valor se llama el número de grados de libertad de variación. En el futuro, para la brevedad, la cantidad de grados de libertad de variación se denotará por la letra griega (NU).

El problema de evaluar las características selectivas basadas en pequeñas muestras fue investigado por primera vez por el matemático británico de las estadísticas V. Gosset, quien publicó sus trabajos bajo el seudónimo de estudiantes (1908).

Sobre la base de la propuesta de la normalidad de la distribución del rasgo en la población general y considerando en lugar de desviaciones absolutas de su relación con la norma independiente, el estudiante encontró una distribución que depende solo del número de muestra. Más tarde (1925) R. Fisher dio una prueba más severa de esta distribución, que se denominó distribución de estudiantes.

El estudiante se expresa como la siguiente actitud:

El numerador de expresión aparece el valor variable que refleja los posibles valores de las desviaciones del medio de muestra del promedio general. El valor se distribuye normalmente con un centro igual a cero, y una dispersión igual a.

Debe enfatizarse especialmente que el denominador de expresión no puede considerarse como un error promedio de la variable. El valor se considera aquí como una variable distribuida independiente del numerador. Significa la desviación promedio cuadrática (estándar) de esta muestra y no es una estimación de la población general, ya que la distribución del styudente no depende del parámetro general de la población. Determinado por el muestreo como

Las distribuciones son independientes entre sí. Solo bajo esta condición y para muestras de agregados normales, la distribución del estudiante tiene lugar.

La principal ventaja de la distribución del estudiante es que no depende de los parámetros de la población general y se trata solo de los valores obtenidos directamente de la muestra.

DIFERENCIA DE DIFERENCIA DISTRIBUCIÓN DE ESTUDIANTES (Densidad de probabilidad) Tiene la forma:

donde el tamaño de la muestra;

el valor correspondiente a la ordenación máxima de la curva de distribución en T \u003d 0.

En consecuencia, se expresa la función de distribución del estudiante:

En otras palabras,

donde la diferencia estandarizada (normalizada) calculada por los resultados de una pequeña muestra.

Los valores de G () y G () son funciones gamma. Para un cierto número de gamma, la función se expresa por una integral incompatible:

En muestras pequeñas, siempre hay un número positivo completo (volumen de muestreo).

En este caso, Gamma: la función siempre tiene un valor finito y se expresa a través de factor.

por eso:

Al calcular las funciones gamma útiles para conocer las siguientes propiedades:

1) cuando hay;

  • 3) Por ejemplo,

Usando esta propiedad, es fácil calcular los valores de G () y G () en la expresión de la densidad de distribución;

4) La función alcanza un mínimo durante el valor fraccional.

Figura 3.1

El tipo general de función gamma se muestra en la FIG. 3.1.

Desde las propiedades de la distribución del estudiante, se considera generalmente en el curso de la teoría de la probabilidad, se presta atención a lo siguiente:

1) La distribución del estudiante es excelente porque depende solo de un parámetro: el volumen de muestreo y no depende del promedio y la dispersión de la población general (en contraste con la distribución normal dependiendo de estos dos parámetros).

  • 2) La distribución del estudiante es precisamente para cualquier tamaño de muestra, y para muestras pequeñas, lo que le permite hacer conclusiones probabilísticas para una pequeña cantidad de observaciones.
  • 3) Con un aumento en el tamaño de la muestra, el valor se acerca al valor y la distribución de enfoques estudientes normales. Cuando la distribución del alumno se vuelve normal. Casi por la aproximación normal se considera suficiente.

Figura 3.2.

En la Fig. 3.2 Muestra la relación entre la distribución del estudiante y la distribución normal.

Como se puede ver en la FIG. 3.2, en los extremos de la curva de distribución estable, por ejemplo, o, es una parte significativamente grande del área que bajo la curva de la distribución normal con los mismos valores. Esto significa que con un pequeño volumen de muestra, la probabilidad de hacer grandes errores aumenta significativamente. Puede verse a partir de la figura que a los valores de la desviación normalizada que excede el valor absoluto, el área debajo de la curva de distribución estable es mucho mayor que en la curva de distribución normal.

Sobre la magnitud de las discrepancias entre los valores de la función de distribución de los estudiantes, dependiendo del tamaño de la muestra, y los valores de la función de distribución normal, pueden ser juzgados de acuerdo con la tabla. 3.2, donde se dan los valores del área bajo la curva de distribución de diferentes números de muestra.

Tabla 3.1.

El valor de la función de distribución normal.

Tabla 3.2.

Valores de probabilidad con diferentes muestras.

Desviación normada

Significado con pequeñas muestras con números.

Valor en muestras grandes

De la tabla 3.2. Se puede ver que con un aumento en el tamaño de la muestra, una pequeña muestra se acerca rápidamente a la normalidad. Al mismo tiempo, con un número muy pequeño de discrepancias entre los valores a este valor, es muy significativo.

Los estudios encontraron que la distribución del estudiante es casi aplicable, no solo en el caso de una distribución normal del rasgo en la población general. Resultó que ocurre en conclusiones prácticamente aceptables y, cuando la distribución del rasgo en la población general no es normal, sino solo simétricamente e incluso unos pocos asimétricos, pero el tamaño de la muestra no es demasiado pequeño.

Los valores de la función de distribución de estudiantes se graban en diferentes valores, por lo que, al evaluar las características selectivas, use tablas listas:

Tabla 3.3.

Tabla de valores de función

Los valores de la función de distribución de estudiantes se pueden usar de varias maneras, dependiendo de la naturaleza de las tareas sólidas, al determinar la probabilidad de desviación de la muestra del general. Los más utilizados:

1) Determinar la probabilidad de que la diferencia entre medio selectivo y medio general sea menor que un cierto valor. En las desviaciones normalizadas, la tarea se reduce para determinar la probabilidad de que haya menos que el valor especificado por las condiciones del problema, es decir, Para encontrar significado

Figura 3.3.

Esta es la probabilidad de grandes desviaciones negativas, que se encuentra en la FIG. 3.3 corresponde al área sombreada.

2) Determinación de la probabilidad de que la diferencia entre medio selectivo y medio general sea al menos algún valor dado, en otras palabras, se debe encontrar

Figura 3.4.

Esta es la probabilidad de grandes desviaciones positivas, que se muestra en forma de un área sombreada en la FIG. 3.4. Esta probabilidad es fácil de encontrar usando tablas.

3) Determinar la probabilidad de que la desviación normalizada en el valor absoluto se exprese menos

Esta es la probabilidad del valor abolitivo de las desviaciones. Esta probabilidad se puede determinar utilizando tablas. Dado que en la práctica, con mayor frecuencia, tiene que determinar esta probabilidad redactada en una tabla de valor especial (Tabla 3.3).

La ilustración gráfica de la probabilidad de menor en el valor absoluto de las desviaciones se da en la FIG. 3.5

Figura 3.5

4) Determinación de la probabilidad de que el error de muestra en valor absoluto sea al menos un valor dado. En unidades normalizadas, la probabilidad de que, en valor absoluto, no será menos, expresará

Esta es la probabilidad de grandes desviaciones en el valor absoluto. Gráficamente se ilustra en la FIG. 3.6.

Figura 3.6.

Para encontrar la probabilidad de grandes en el valor absoluto de las desviaciones, hay tablas especiales (Apéndice 3). Esta probabilidad se puede calcular fácilmente, también utilizando tablas.

  • 6. Tipos de grupos estadísticos, su importancia informativa.
  • 7. Tablas de Estado: Tipos, Reglas de construcción, Lectura
  • 8. Valores absolutos: especies, importancia cognitiva. Las condiciones para el uso científico de indicadores absolutos y relativos.
  • 9. Valores medios: contenido, tipos, tipos, condiciones científicas.
  • 11. Dispersión de maquillaje. La regla de la adición (descomposición) de la dispersión y su uso en el análisis estadístico.
  • 12.Vids gráficos estadísticos en el contenido de tareas resueltas y métodos de construcción.
  • 13. Filas de altavoces: especies, indicadores de análisis.
  • 14. Métodos de identificación de tendencias en rangos dinámicos.
  • 15. Índices: definición, elementos básicos de índices, tareas resueltas usando índices, sistema de índice en estadísticas.
  • 16. Reglas para construir índices dinámicos y territoriales.
  • 17. Conceptos básicos de la teoría del método selectivo.
  • 18. La teoría de las muestras pequeñas.
  • 19. Métodos para seleccionar unidades en un conjunto selectivo.
  • 20. Conexiones VIDA, métodos estadísticos para analizar las relaciones, el concepto de correlación.
  • 21. Análisis de correlación de excursión, modelos de correlación.
  • 22. Ingresos (estanqueidad) de la correlación.
  • 23. El sistema de indicadores de estadísticas socioeconómicas.
  • 24. Agrupaciones básicas y clasificaciones en estadísticas socioeconómicas.
  • 25. Riqueza nacional: categoría y composición.
  • 26. Contenido de inventario de tierras. Indicadores de la composición de la tierra para la forma de propiedad, el propósito previsto y los tipos de tierras.
  • 27. Clasificación de activos fijos, métodos de evaluación y revaluación, indicadores de movimiento, estado y uso.
  • 28. Objetivos de las estadísticas laborales. El concepto y contenido de las principales categorías del mercado laboral.
  • 29. Estadísticas de uso de mano de obra y tiempo de trabajo.
  • 30. Indicadores de productividad laboral y métodos de análisis.
  • 31. Indicadores de producción de producción de cultivos y rendimientos S.-H. Culturas y tierra.
  • 32. Pathelors de producción de cría de animales y productividad de animales de granja.
  • 33.Statismo de los costos públicos y los costos de producción.
  • 34.Statismo de los costos laborales y laborales.
  • 35.Estabilidad de los productos y ingresos brutos.
  • 36. Movimientos de movimiento y venta de productos agrícolas.
  • 37. Suprimos de análisis estadístico de las empresas agrícolas.
  • 38.Statismo de precios y bienes de los sectores de la economía nacional: tareas y métodos de análisis.
  • 39.Estabilidad del mercado de bienes y servicios.
  • 40.Statismo de los indicadores de producción social.
  • 41. Análisis del estado de los precios del mercado del consumidor.
  • 42. La inflación del estatismo y los principales indicadores de su evaluación.
  • 43. Estadísticas rápidas de Finanzas de Empresas.
  • 44. Los principales indicadores de los resultados financieros de las empresas.
  • 45. Estadísticas rápidas del presupuesto estatal.
  • 46. \u200b\u200bEl sistema de indicadores de estadísticas presupuestarias estatales.
  • 47. El sistema de indicadores de estadísticas monetarias.
  • 48. Las estadísticas de la composición y estructura de la oferta monetaria en el país.
  • 49. Las principales tareas de billetes.
  • 50. Los principales indicadores de estadísticas bancarias.
  • 51.Cosas y clasificación del préstamo. Las tareas de su estudio estadístico.
  • 52. El sistema de indicadores de estadísticas de crédito.
  • 53. Los principales indicadores y métodos para analizar un negocio de ahorro.
  • 54. Posee de las estadísticas del mercado de valores y valores.
  • 56.Statismo de los intercambios de productos básicos: tareas y sistema de indicadores.
  • 57. Sistema de cuentas nacionales: conceptos, categorías principales y clasificación.
  • 58. Los principios principales de la construcción del SNA.
  • 59. Los principales indicadores macroeconómicos son el contenido, los métodos de determinación.
  • 60. Balance de los hombres: conceptos, tareas, especies de mob.
  • 62. Estación de ingresos y costos de población.
  • 18. La teoría de las muestras pequeñas.

    Con una gran cantidad de unidades de agregado selectivo (N\u003e 100), la distribución de errores aleatorios del medio de muestra de acuerdo con el teorema de AM Toripunov es normal o se acerca a lo normal a medida que aumenta el número de observaciones.

    Sin embargo, en la práctica de la investigación estadística en las condiciones de una economía de mercado, se enfrenta cada vez más con pequeñas muestras.

    Una pequeña muestra se llama tales observación selectiva, el número de unidades de las cuales no supera los 30.

    Al evaluar los resultados de una muestra pequeña, el valor de la población general no se utiliza. Para determinar los posibles límites de error, use el criterio del estudiante.

    El valor de σ se calcula sobre la base de datos de observación selectivos.

    Este valor se utiliza solo para la talidad en estudio, y no como una estimación aproximada σ en la población general.

    Una evaluación probabilística de los resultados de una muestra pequeña difiere de la estimación en una muestra grande en que con un pequeño número de observaciones, la distribución de probabilidad para el promedio depende del número de unidades seleccionadas.

    Sin embargo, para una pequeña muestra, el valor del coeficiente de confianza t está asociado de otra manera con una evaluación probabilística que con una muestra grande (ya que, la ley de distribución difiere de la normalidad).

    De acuerdo con la distribución, el error de distribución probable, el error de distribución probable depende tanto del valor del coeficiente de confianza T como en el volumen de muestreo V.

    El error promedio de muestra menor se calcula por la fórmula:

    donde - la dispersión de una pequeña muestra.

    En MV, el coeficiente N / (N-1) debe tenerse en cuenta y asegúrese de ajustar. Al determinar la dispersión S2, el número de grados de libertad es igual:

    .

    El error límite de muestreo pequeño está determinado por la fórmula.

    Al mismo tiempo, el valor del coeficiente de confianza T depende no solo de una probabilidad de confianza dada, sino también en el número de unidades de muestra N. Para los valores individuales T y N, la probabilidad de confianza de la muestra pequeña está determinada por tablas especiales de estudiantes, en las que se dan la distribución de desviaciones estandarizadas:

    La evaluación probabilística de los resultados de MV difiere de la evaluación en el BV en el hecho de que con un pequeño número de observaciones, la distribución de probabilidad para el promedio depende del número de unidades seleccionadas

    19. Métodos para seleccionar unidades en un conjunto selectivo.

    1. El conjunto selectivo debe ser lo suficientemente grande.

    2. La estructura del agregado selectivo debe reflejar mejor la estructura del agregado parcial

    3. El método de selección debe ser aleatorio.

    Dependiendo de si las unidades seleccionadas están involucradas en la muestra, el método se distingue: imágenes y repetidas.

    La captura se llama tal selección en la que la unidad que cayó en la muestra no regresa al agregado, de la cual se realiza una selección adicional.

    Cálculo del error promedio de la muestra aleatoria no accidental:

    Cálculo del error límite de la muestra aleatoria no accidental:

    Con una re-selección, la unidad que cayó en la muestra después de registrar las características observadas se devuelve al conjunto inicial (general) para la participación en el procedimiento de selección adicional.

    El cálculo del error promedio de la muestra aleatoria re-fácil es la siguiente:

    Cálculo del error de límite de muestreo re-aleatorio:

    La formación del agregado de muestra se divide en: individual, grupo y combinado.

    El método de selección, determina el mecanismo específico de muestreo de unidades de la población general y se divide en: en realidad, al azar; mecánico; típico; de serie; conjunto.

    En realidad - aleatorio El método más común de selección en una muestra aleatoria, también se denomina método de sorteo, con él para cada unidad del conjunto estadístico, un ticket con un número de secuencia está en blanco. Además, en orden aleatorio, se selecciona el número requerido de unidades agregadas estadísticas. En estas condiciones, cada una de ellas tiene la misma probabilidad de entrar en la muestra.

    Muestra mecánica. Se aplica en los casos en que se ordena el conjunto general de cualquier manera que sea e. Hay una cierta secuencia en la ubicación de las unidades.

    Para determinar el error promedio de la muestra mecánica, la fórmula de error central se usa en una no-elección no aleatoria aleatoria.

    Selección típica. Se utiliza cuando todas las unidades de la población general se pueden dividir en varios grupos típicos. La selección típica implica una muestra de unidades de cada grupo en sí mismo por aleatorio o mecánicamente.

    Para el muestreo típico, el valor del error estándar depende de la precisión de la definición de promedios de grupo. Entonces, en la fórmula del error final de la muestra típica, se tiene en cuenta el promedio de las dispersiones grupales, es decir,

    Selección serial. Se aplica en los casos en que las unidades del agregado se combinan en grupos pequeños o series. La esencia de la muestra de serie es en sí misma una selección aleatoria o mecánica de la serie, dentro del cual se realiza una encuesta continua de unidades.

    En una muestra de serie, el valor de error de muestra no depende de la cantidad de unidades en estudio, y en el número de series encuestadas y en el valor de dispersión de intergrupales:

    Selección combinada Puede pasar uno o más pasos. La muestra se llama una sola etapa, si las unidades de la totalidad se seleccionan una vez expuestas.

    La muestra se llama multistalSi la selección del agregado pasa por pasos, etapas en serie, y cada etapa, la etapa de selección tiene su propia unidad de selección.

    "

    En la práctica de la investigación estadística a menudo tienen que lidiar con muestras pequeñas que tienen un volumen de menos de 30 unidades. Grande generalmente incluyen muestras de más de 100 unidades.

    Por lo general, se aplican muestras pequeñas en los casos en que es imposible o inapropiado usar una muestra grande. Es necesario lidiar con tales muestras, por ejemplo, en encuestas de turistas y visitantes de hoteles.

    La magnitud del error de muestra menor se determina mediante fórmulas que difieren de las fórmulas para un tamaño de muestra relativamente grande ().

    Con un pequeño muestreo nORTE. La relación entre la dispersión selectiva y general debe tenerse en cuenta:

    Dado que con una muestra pequeña, la fracción es esencial, el cálculo de la dispersión se hace teniendo en cuenta los llamados el número de grados de libertad . Se entiende como el número de opciones que pueden tomar valores arbitrarios sin cambiar los valores del promedio.

    El error promedio de una muestra pequeña está determinada por la fórmula:

    El error límite de selección para medio y compartir es similar al caso de una muestra grande:

    donde T es el coeficiente de confianza, dependiendo del nivel de importancia especificado y el número de grados de libertad (Apéndice 5).

    Los valores del coeficiente dependen no solo de la probabilidad de confianza dada, sino también en el tamaño de la muestra nORTE.. Para los valores individuales T y N, la probabilidad de confianza está determinada por la distribución del estudiante, que contiene la distribución de desviaciones estandarizadas:

    Comentario.A medida que aumenta la muestra, la distribución del estudiante se está acercando a la distribución normal: cuando nORTE.\u003d 20 Ya no es diferente de la distribución normal. Al realizar pequeñas encuestas de muestra, se debe tener en cuenta que cuanto menor sea el tamaño de la muestra. NORTE.Cuanto mayor sea la diferencia entre la distribución del estudiante y la distribución normal. Por ejemplo, para p min. \u003d.4 Esta distinción es muy significativa, lo que indica la reducción de la precisión de los resultados de una muestra pequeña.

    La distribución de las características de la muestra sobre la población general, basada en la acción de la ley de grandes números, sugiere un muestreo suficientemente grande. Sin embargo, en la práctica de la investigación estadística, a menudo es necesario lidiar con la incapacidad por una razón u otra para aumentar el número de unidades de muestreo que tienen un pequeño volumen. Esto se aplica al estudio de las actividades de las empresas, las instituciones educativas, los bancos comerciales, etc., el número de los cuales en las regiones, como regla general, es ligeramente, y a veces es solo 5-10 unidades.

    En el caso, cuando el agregado selectivo consiste en un pequeño número de unidades, menos de 30, se llama la muestra pequeña. En este caso, para calcular el error de muestra, es imposible usar el teorema Lyapunov, ya que la magnitud de cada una de las unidades seleccionadas al azar y su distribución puede ser significativamente diferente de lo normal.

    En 1908, V.S. Gosset demostró que la evaluación de la discrepancia entre la muestra media selectiva y el promedio general tiene una ley de distribución especial (ver Capítulo 4). Tomando el problema de una evaluación probabilística del medio selectivo con un pequeño número de observaciones, mostró que, en este caso, es necesario considerar la distribución de los promedios no selectivos, y los valores de sus desviaciones de la fuente promedio colocar. En este caso, las conclusiones pueden ser bastante confiables.

    La apertura del alumno se llama. la teoría de las pequeñas muestras.

    Al evaluar los resultados de una muestra pequeña, no se utiliza la magnitud de la dispersión general en los cálculos. En muestras pequeñas, se utiliza una dispersión de muestra "corregida" para calcular el error de muestra promedio:

    esos. En contraste con las muestras grandes en el denominador en su lugar. pAG Vale la pena (y - 1). El cálculo del error de muestra promedio para una muestra pequeña se da en la tabla. 5.7.

    Tabla 5.7.

    Cálculo de un error promedio de una pequeña muestra.

    El error límite de una muestra pequeña es igual a: donde t. - Coeficiente de confianza.

    Valor t. De lo contrario, está asociado con una estimación probable que con una muestra grande. De acuerdo con la distribución del estudiante, la probabilidad de una evaluación depende del tamaño de t, Y en el tamaño de la muestra, en caso de que el error límite no exceda un error central M-múltiple en muestras pequeñas. Sin embargo, depende del número de unidades seleccionadas.

    V.S. Gosset ha redactado la tabla de distribución de probabilidad en muestras pequeñas, correspondiente a estos valores del coeficiente de confianza t. y una cantidad diferente de pequeñas muestras y, extracto de ella se da en la tabla. 5.8.

    Tabla 5.8.

    Fragmento de la tabla de probabilidad de estudiante (las probabilidades se multiplican por 1000)

    Tabla de datos. 5.8 Indique que con un aumento ilimitado en el tamaño de la muestra (I \u003d \u003d °°), la distribución del estudiante tiende a la ley de distribución normal, y cuando I \u003d 20 es diferente de ella.

    La tabla de distribución de estudiantes a menudo se administra en una forma diferente, más conveniente para la aplicación práctica (Tabla 5.9).

    Tabla 5.9.

    Algunos valores (distribuidor de estudiante

    El número de grados de libertad

    para intervalo de un solo lado

    para un intervalo bilateral.

    P \u003d. 0,99

    Considere cómo usar la tabla de distribución. Cada valor fijo pAG Calcular el número de grados de libertad k. dónde k \u003d p - 1. Por cada valor del grado de libertad, se indica el valor límite. t P (T 095 o t 0. 99), que con esta probabilidad R No se excederá mediante oscilaciones casuales de los resultados de la muestra. Basado en magnitud t P. Los límites de confianza se determinan.

    intervalo

    Como una probabilidad de confianza cuando la verificación bilateral, como regla general, use P \u003d. 0.95 o P \u003d. 0.99, que no excluye la elección y otros valores de probabilidad. El valor de probabilidad se selecciona en función de los requisitos específicos de las tareas, para resolver una pequeña muestra.

    La probabilidad de la liberación de los valores del promedio general más allá del límite del intervalo de confianza es igual q Dónde p. = 1 - r. Este valor es muy poco. En consecuencia para las probabilidades consideradas r Es 0.05 y 0.01.

    Las muestras pequeñas se distribuyen ampliamente en las ciencias técnicas de la biología, pero para aplicarlos en estudios estadísticos se necesita con gran cuidado, solo con el examen teórico y práctico apropiado. Es posible usar una pequeña muestra si la distribución del rasgo en la población general es normal o cercana a ella, y el valor promedio se calcula mediante datos selectivos obtenidos como resultado de observaciones independientes. Además, debe tenerse en cuenta que la precisión de los resultados de la muestra de un pequeño volumen es menor que con una muestra grande.

    Comparte con amigos o ahorra para ti mismo:

    Cargando...