Ejercicios de estadistica datos agrupados

Extrapolación:


Se refiere a la estimación de valores fuera del área de estudio.

Convolución:

Es la transformación de imágenes rasterizadas (documentos, fotos aéreas o imágenes de satélites) de una resolución espacial y orientación a otra.

MDT:

Es una estructura numérica de datos que representan la distribución espacial de una variable cuantitativa y continúa.

MDE:

Estructura numérica de datos que representa la distribución espacial de la altitud de la superficie del terreno.

Variable aleatoria regionalizada:

Son variables que pueden tomar cualquier valor dentro de un rango de terminado y tienen una posición en el espacio.

Estimación:

Es obtener valores desconocidos a partir, no sólo de los conocidos, sino también de su estructura de continuidad espacial.

Error medio:

Distancia dirigida que tiene el dato xi de la media aritmética muestral o poblacional (promedio). Es decir que tan cercano o lejano está el dato del promedio.

Estimación Kriging:

Consiste en la obtención de un valor estimado, de un valor real y desconocido, basándose en una combinación lineal de pesos asociados a cada localización donde fue muestreado un valor del fenómeno estudiado, teniendo en cuenta dos condiciones: que el  estimador sea insesgado y que la varianza sea mínima.

Modelo Vectorial:

Objetos geométricos definidos por las coordenadas de sus nodos y vértices, los atributos del terreno se representan en puntos, líneas y polígonos.

Modelo Raster:

Localizaciones espaciales a las cuales se les asigna un valor para la unidad de la superficie, los datos se interpretan como el valor medio de las unidades de la superficie.

Simulación:

Es una modelización de objetos que permite generar escenarios futuros o reconstruir escenarios.

Co-Kriging:

Método que nos permite generar datos, utilizando los valores que son dependientes para generar una proyección en base a los valores que son independientes. Hay variable que generan estimación a través de los datos que ya existen.

Variograma:

Se define como la media aritmética de todos los cuadrados de las diferencias entre pares de valores experimentales separados una distancia H.

Semivariograma:

depende del número de pares de la distancia h de los valores y de las localizaciones de donde son los valores.

1. Explique que es la Interpolación:

El procesos de Interpolación consiste en la estimación de valores que alcanza una variable Z en un conjunto de puntos definidos por un par de coordenadas X e Y, partiendo de los valores de Z medidos en una muestra de puntos situados en el mismo área de estudio.

2. Cuáles son las fuentes de datos más comunes para realizar Interpolación:

Fotos aéreas estereoscópicas. -Scanners instalados tanto en satélites como en aviones. -Muestras puntuales de un atributo usando diferentes tipos de patrones de adquisición de datos. -Mapas que han sido digitalizados.

3. Nombre los patrones de adquisición de datos más comunes en la Interpolación espacial:

Muestreo sistemático: Se toma en un orden predeterminado. – Muestreo aleatorio: Sin ningún tipo de orden en el mismo espacio. – Muestreo en transecta – Muestreo sistemático aleatorio – Muestreo en Clúster: Agrupamiento. – Muestreo curvas de nivel.

4. De acuerdo a la clasificación de métodos de interpolación, desarrolle en qué consisten los métodos globales:

Los métodos globales asumen una dependencia de la variable a interpolar como de otras variables de apoyo; se pueden dar dos situaciones en función del tipo de variable de apoyo que se utilice, siendo los métodos de clasificación la variable de apoyo cualitativa, mientras que el método de regresión una variable que indica el análisis de regresión previo donde se genera un modelo de interpolación de tipo polinomio.

5. En que se diferencian los métodos IDW, Spline y Kriging:

En los métodos de interpolación local se encuentra el IDW y Spline, usando información proveniente de los puntos vecinos para calcular el valor del atributo, definiendo de esta forma una región alrededor de la ubicación donde el valor del atributo debe ser calculado y así determinar cuántos puntos vecinos se encuentran al interior de esta región y encontrar una función matemática que represente la variación del conjunto de puntos y evaluar esta situación en una malla regular. •IDW:
Combina la idea de puntos vecinos con la de un cambio gradual de la superficie como una tendencia; suponiendo que el valor del atributo Z en una posición donde el valor del atributo no es conocido es un promedio de los valores de sus puntos vecinos pero donde los más cercanos tienen más peso, que los más alejados •Spline:
Estima valores usando una  función matemática que reduce al mínimo la curvatura de la superficie total, dando como resultado una superficie lisa que pasa sobre los puntos muestreados, siendo este método el mejor para variar superficies como elevación,  concentración de contaminación y alturas en superficies del agua. •El método Kriging describe la correlación tanto espacial como temporal que existe entre los valores de un atributo, utilizando en la estimación las características de variabilidad y correlación espacial del fenómeno estudiado por lo cual necesita un análisis previo de la información, con el objetivo de definir de esta información inicial un modelo que represente su continuidad espacial.

6. Explique diferencias fundamentales entre modelo TIN e INTERCON:

El modelo TIN  se genera desde información vectorial, en forma de líneas, puntos, o una combinación de ambos. Produce polígonos triangulares, donde cada uno de ellos resulta con atributos de área, perímetro, altitud y pendiente, el modelo INTERCON, en tanto, se genera desde información rasterizada a partir de isolíneas en formato vectorial. No admite puntos en combinación con las líneas ni opera con aquellos en forma independiente. Para el cálculo del error medio se obtienen mejores resultados con el modelo INTERCON que con el TIN.

7. Explique métodos directos e indirectos de captura de información, para crear modelos de elevación digital (MDE):

Los métodos directos se dividen en altímetros, GPS y estaciones topográficas. -Los altímetros se dividen en radar (Sensor pasivo que recibe la fracción de luz reflejada por el suelo) y laser (Sensor activo que lanza un pulso a la superficie y la energía reflejada de esto se captura con una antena.-El GPS  permite obtener valores de las tres coordenadas espaciales para un lugar concreto de la superficie terrestre mediante métodos de triangulación a través de satélites.-Las estaciones topográficas general y almacenan los resultados de sus medidas en formato digital, que pueden ser incorporados y tratados por algunos sig. Los métodos indirectos consisten en la restitución fotogramétrica, la interferometria radar, digitalización automática, y la manual. -La restitución fotogramétrica consiste en un estudio de imágenes de una zona, parcialmente solapadas y tomadas desde puntos de vista diferentes formando pares estereoscópicos. Examinando puntos homólogos entre los pares es posible deducir de su paralelaje las cotas de referencia necesaria para reconstruir la topografía. -La interferometria radar es una comparación entre dos imágenes del mismo lugar tomadas desde una misma posición pero en momentos diferentes, la diferencia de faces exhibe patrones de interferencia bastante claros. -La digitalización automática consiste en un análisis mediante escáner de un documento, en el cual el dispositivo traduce la superficie del mapa a un cierto número de niveles de gris. -La digitalización manual se realiza con un tablero digitalizador  sobre el que se coloca el mapa, las curvas de nivel se siguen manualmente con el cursor de forma que el ordenador recibe ciertos intervalos prefijados que definen la trayectoria de la línea.

8. Explique la importancia de la creación de los MDT, en el desarrollo de la investigación científica de índole geográfica en cuanto a visualización, modelamiento de variables y simulación de datos geográficos:

Los modelos digitales del terreno tienen una versión analógica en mapas que pueden representar las mismas características del terreno, pero codificándolas sobre un soporte físico mediante convenciones gráficas; los mapas que representan las mismas variables que los MDT constituyen, por tanto, modelos analógicos del terreno: MAT. Las ventajas que ofrece la codificación numérica son claras en algunos aspectos, pero los mapas impresos son imprescindibles actualmente para el manejo práctico de la información.

9. Explique la importancia de la tabla RMS (roots mean square) en la aplicación de un modelo digital:

La importancia de la tabla RMS es ayudar a definir de la misma manera conceptos utilizados por diferentes usuarios de forma que ambos escojan el valor propuesto en vez de definirlo ellos mismos. En el caso de la exactitud posicional, por ejemplo, se podrían definir medidas de error como el RMS, el RMS en X, el RMS en Y, etc.

10. Explique cómo se generan modelos de elevación digital, a partir de levantamientos directo de datos:

El levantamientos directo de información es a través de  Altímetros, GPS y Estaciones Topográficas; siendo los Altímetros de radar y  de laser con los que se hace, el registro directo de datos de altitud en formato digital. Los Altímetros de radar donde los señores óptimos reciben la fracción de la luz reflejada por el suelo ante la radiación electromagnética del sol; mientras que el Altímetro de láser, donde desde el satélite o avión se lanza un breve pulso hacia la superficie, una fracción de la energía es reflejada por la superficie y devuelta hacia una antena receptora, donde el tiempo transcurrido depende de la distancia de la antena y el suelo. El GPS utiliza un conjunto de satélites de referencia y mediante métodos de triangulación permiten obtener valores de las tres coordenadas espaciales para un lugar concreto de la superficie terrestre. Finalmente las estaciones topográficas pueden generar y almacenar los resultados de sus medidas en formato digital.

11. De acuerdo a la clasificación de métodos de interpolación, desarrolle en qué consisten los métodos locales:

Usan la información proveniente de los puntos vecinos para calcular el valor del atributo. Esto significa: -definir una región alrededor de la ubicación donde el valor del atributo debe ser calculado. -determinar cuántos puntos vecinos se encuentran al interior de esta región -encontrar una función matemática que representa la variación de este conjunto de puntos y -evaluar esta variación por puntos en una malla regular.Ejemplos de Interpolación Local los polígonos de Thiessen. Estos tipos de métodos de interpolación se encuentran disponibles en la mayoría de los programas S.I.G. Este procedimiento debe ser repetido hasta que todos los puntos en la malla regular hayan sido calculados.

*Desde la Estadística se proponen tres formas de describir los datos, como un paso básico para su transformación en información: Las representaciones gráficas:

Son esquemas visuales, que muestran ideas por medio de variables que son organizadas según reglas que permiten acceder a la información. Bertín “la construcción gráfica en que las correspondencias en un plano pueden establecerse entre todas las divisiones de una y otra componente que explican un fenómeno”.

La distribución de frecuencias:

Es un método que utiliza tablas denominadas de distribución de frecuencias, con las que se busca ordenar los datos y describir el número de veces que ocurre un resultado dentro de un conjunto de observaciones. Según Carrera “la distribución de frecuencias permite expresar con claridad el grado de regularidad o irregularidad con que se distribuyen los valores que toma una variable”. Por su parte Harnett y Murphy “indicación más precisa de la información disponible.

Las medidas de resumen:

Son técnicas cuantitativas que hacen una descripción general de los datos, a partir de la obtención de un sólo dato. De acuerdo a Harnett y Murphy, el propósito es reducir la información a una medida simple. Este tipo de medidas son útiles para el análisis espacial en tanto hacen posible describir la distribución de un fenómeno geográfico en función de su concentración o su dispersión, lo que permite inferir que los datos implicados en este tipo de medidas tienen un carácter puntual. Las medidas de resumen se clasifican en dos grupos: • Las medidas de tendencia central: moda, mediana y media • Las medidas de dispersión: desviación típica, varianza y covarianza.

Conclusiones de las medidas de tendencia central:

• Su aplicación es conveniente en casos que lo ameriten ya que existen fenómenos que no solo basta localizarlos, sino que hay tener en cuenta algunas condiciones para ello. • Se constituyen en una herramienta para el simple análisis de localizaciones ideales o artificiales, pero no para fenómenos que tienen un comportamiento natural que no todas las veces es predecible.