Artículos

7.1: Análisis dimensional - Matemáticas


Pensando en voz alta

La pizza pequeña mide 8 "y la pizza grande mide 16". ¿Obtenemos la misma cantidad de pizza si pedimos dos pizzas pequeñas en lugar de una grande?

Todos nos hemos enfrentado a una situación en la que necesitamos poder cambiar de una unidad de medida a otra unidad de medida. En esta sección, discutimos un método de conversión de unidades llamado análisis dimensional.

Hora

1 día = 24 horas,

1 hora = 60 minutos, y
1 minuto = 60 segundos.

Largo

Medida imperial

1 pulgada

1 pie = 12 pulgadas

1 yarda = 3 pies = 36 pulgadas

1 milla = 5289 pies

Métrico

milímetro (mm)

centímetro (cm), 1 cm = 10 mm

metro (m), 1m = 100 cm = 1000 mm

kilómetro (km). 1 km = 1000 m

Área

Volumen

Capacidad

Peso

Definición

Una razón unitaria es una fracción que tiene un valor de 1 si tanto el numerador como el denominador se expresan en las mismas unidades.

Ejemplo ( PageIndex {1} ):

Si el límite de velocidad dice 90 kilómetros por hora, ¿cuál es la velocidad en millas por hora?

Podemos usar el análisis dimensional para convertir esta velocidad a millas por hora. También podemos usar el razonamiento para deducir que necesitamos dividir 90 por 1.6.

Área

Ejemplo ( PageIndex {1} ):

John y James han decidido levantar su alfombra vieja y comprar una alfombra nueva. La habitación mide 15 pies por 11 pies, por lo que el área es de 165 pies cuadrados. Sin embargo, cuando van a la tienda de alfombras, descubren que los precios están en metros cuadrados. ¿Cuántas yardas cuadradas tiene su piso?

Temperatura

Temperatura: En 1714, un fabricante de instrumentos alemán llamado Gabriel Fahrenheit fabricó el primer termómetro de mercurio. Designó la temperatura más baja que podía crear en el laboratorio como 0 ° y la temperatura normal del cuerpo como 98 °. En su escala, el punto de congelación del agua es 32 ° y el punto de ebullición del agua es 212 °.


Derivación de ecuaciones a partir de datos de sensores mediante la síntesis de funciones dimensionales

Presentamos un nuevo método para derivar funciones que modelan la relación entre múltiples señales en un sistema físico. El método, al que llamamos síntesis de funciones dimensionales, se aplica a flujos de datos donde se conocen las dimensiones de las señales (por ejemplo, longitud, masa, etc.). El método consta de dos fases: una fase de síntesis en tiempo de compilación y una calibración posterior utilizando datos del sensor. Implementamos la síntesis de funciones dimensionales y usamos la implementación para demostrar el resumen eficiente de datos de sensores multimodales para dos sistemas físicos utilizando 90 experimentos de laboratorio y 10,000 mediciones sintéticas idealizadas. Los resultados muestran que nuestra técnica puede generar modelos en menos de 300 ms en promedio en todos los sistemas físicos que evaluamos. Esta es una mejora notable en comparación con un promedio de 16 s para el entrenamiento de redes neuronales de precisión comparable en la misma plataforma informática. Cuando se calibran con datos de sensores, nuestros modelos superan a los modelos tradicionales de regresión y redes neuronales en precisión de inferencia en todos los casos que evaluamos. Además, nuestros modelos funcionan mejor en la latencia de entrenamiento (mejora hasta 1096X) y requieren operaciones aritméticas en inferencia (mejora hasta 34X). Estas ganancias significativas son en gran parte el resultado de la explotación de información sobre la física de señales que hasta ahora ha sido ignorada.

1. Introducción

Los sistemas físicos equipados con sensores pueden generar grandes volúmenes de datos. Estos datos son útiles para comprender los comportamientos anteriores de los sistemas que los generan (p. Ej., Monitorear las propiedades de los componentes en aeronaves), así como para predecir comportamientos futuros de esos sistemas (p. Ej., Predecir fallas de componentes en maquinaria). A diferencia de las fuentes de datos como el habla o el texto, los datos de los sensores de fenómenos físicos deben obedecer las leyes de la física. Sin embargo, los métodos existentes para construir modelos predictivos a partir de datos de sensores no aprovechan por completo el conocimiento previo de la interpretación física de los datos de los sensores. En este trabajo, utilizamos información sobre las dimensiones físicas de las señales de los sensores para sintetizar modelos predictivos compactos a partir de los datos de los sensores. De acuerdo con la convención en física, usamos el término dimensiones para referirnos a cantidades como la longitud o el tiempo y usamos el término unidades para referirse a un valor en un sistema estandarizado para cuantificar valores de una dimensión dada, como centímetros o millas para la longitud y Pascales o mmHg para la presión. El estado del arte para derivar modelos de tales flujos de datos es aplicar alguna forma de aprendizaje automático. Sin embargo, la aplicación ciega del aprendizaje automático a los datos de los sistemas físicos ignora importantes conocimientos previos sobre las implicaciones físicas de las señales.

1.1. Los métodos contemporáneos ignoran la física

A pesar de su uso en lenguajes de programación para tareas como extender sistemas de tipos con unidades de medida, 1,2,3,5,8,12,10,14,17,23 información física en forma de dimensiones (por ejemplo, tiempo, temperatura , etc.) ha tenido un uso limitado en la construcción de modelos de sistemas físicos a partir de datos. Las limitaciones físicas pueden verse como una forma de prior bayesiano. 4 Los filtros de Kalman incorporan información sobre las limitaciones físicas de los sistemas, pero utilizan esta información principalmente para guiar sus ecuaciones de actualización de estado. Hoy en día, no existen técnicas basadas en principios que aprendan modelos a partir de datos de sensores aprovechando los requisitos de consistencia dimensional de los sensores para aprender modelos más compactos.

1.2. Síntesis de funciones dimensionales

La síntesis de funciones dimensionales es un nuevo método para derivar de manera eficiente funciones que relacionan los valores de múltiples flujos de datos de sistemas físicos con dimensiones físicas conocidas. La idea detrás del método es que cualquier ecuación que relacione cantidades físicas debe obedecer el principio de homogeneidad dimensional del análisis dimensional 6: los dos lados de una ecuación, una suma o una resta, deben tener las mismas dimensiones físicas.

En una primera fase de análisis fuera de línea, la síntesis de funciones dimensionales forma monomios de parámetros físicos cuyas dimensiones, cuando se combinan en un monomio, se cancelan. Luego, en una segunda etapa de tiempo de ejecución y utilizando datos de sensores de los parámetros físicos en cuestión, el método calibra ecuaciones dimensionalmente plausibles formadas a partir de esos monomios para obtener un conjunto de modelos predictivos.

La figura 1 muestra una vista esquemática del proceso. Las entradas para la síntesis de funciones dimensionales son una lista de señales con dimensiones conocidas relevantes para el sistema en estudio y un conjunto de valores de datos correspondientes a instancias de esas señales. El resultado es un modelo que relaciona las señales y predice la salida esperada del sistema físico. Desarrollamos el método de síntesis de funciones dimensionales con el objetivo de crear modelos de inferencia que puedan ajustarse a las limitaciones de memoria, cálculo y energía de los sistemas integrados de baja potencia. El método también puede aplicarse a sistemas informáticos que no están limitados por recursos informáticos o por energía, pero que, no obstante, necesitan modelos simples definidos en un gran espacio de parámetros.


Figura 1. La síntesis de funciones dimensionales utiliza información sobre dimensiones físicas para generar una familia de ecuaciones candidatas. A continuación, utiliza las medidas del sensor para calibrar el conjunto de ecuaciones candidatas.

2. Fundamento matemático

El análisis dimensional a menudo se introduce en los planes de estudio de ingeniería como un método simple para verificar la validez de los cálculos en cantidades físicas. Se utiliza con frecuencia en ingeniería, mecánica de fluidos y electrodinámica en casos como la deflexión de las palas de la turbina en diseños de máquinas turbo. 20 El enfoque del análisis dimensional familiar para la mayoría de los investigadores en sistemas informáticos y ciencias de la computación implica tomar alguna cantidad física (por ejemplo, aceleración) y expresarla en términos de dimensiones básicas como la longitud (L) y tiempo (T) para obtener sus dimensiones (LT -2 para aceleración). El análisis dimensional, sin embargo, tiene un marco matemático bien desarrollado que combina algunos principios básicos de la física con una formulación analítica basada en el álgebra lineal y la teoría de grupos. 6,9,16 El resto de la Sección 2 proporciona una breve descripción de esta formalización matemática del análisis dimensional.

2.1. Parámetros en ecuaciones físicas y productos adimensionales

Dejar I ser un índice sobre un conjunto de símbolos en una ecuación física y dejar QI ser uno de esos símbolos en una ecuación que describe un sistema físico. Normalmente, estos símbolos corresponderán a parámetros de algún modelo físico y, por lo tanto, usaremos el término parámetro y símbolo indistintamente. Dejar D(& middot) ser una función de símbolos a algún producto de dimensiones básicas. Para cualquier ecuación que describa un sistema físico, introducimos el conjunto Ssimbolos, dónde

Para el sistema descrito por Ssimbolos para ser físicamente plausible, cada miembro QI de Ssimbolos se puede reescribir en términos de un conjunto de dimensiones (por ejemplo, masa, longitud, tiempo) o de otra manera adimensional. Para la ecuación de ejemplo F = metro & middot a, relacionando una fuerza F aplicado a una masa metro y su aceleración resultante, a, tenemos Ssimbolos = <F, metro, a>, QI = F, Q2 = metro, y Q3 = una. Las dimensiones de los miembros de Ssimbolos un rojo(Q1) = MLT -2, D (Q2) = METROy D (Q3) = LT -2. La Tabla 1 muestra ejemplos adicionales de parámetros y sus dimensiones para datos de sensores en sistemas físicos que pueden instrumentarse con sensores para monitorear su comportamiento. Por ejemplo, el subsistema de altímetro de un rastreador de actividad física utiliza cambios en la presión atmosférica para estimar los cambios en la elevación y, por lo tanto, para estimar el número de tramos de escaleras subidos.


Tabla 1. Ejemplos de sistemas físicos y su Ssimbolos

La idea clave en la formulación matemática del análisis dimensional es que para un conjunto Ssimbolos como en el ejemplo anterior, a menudo podemos organizar los miembros QI de Ssimbolos en grupos de productos donde las dimensiones de los símbolos en el producto se anulan y, como resultado, cada monomio es adimensional. 6,7

Por qué es útil encontrar productos adimensionales: Dado un conjunto de parámetros Ssimbolos para un sistema físico, cada uno de los productos adimensionales que podemos formar a partir de un subconjunto de Ssimbolos directamente nos da una ecuación dimensionalmente válida entre esos parámetros: podemos igualar el producto adimensional a cualquier cantidad adimensional para obtener una ecuación dimensionalmente correcta si luego reorganizamos esa ecuación para mover uno de los parámetros para que sea el único término en un lado de la ecuación , tenemos una ecuación dimensionalmente válida de ese parámetro en términos de los otros parámetros en el producto adimensional.

Definición 1. Sea yo un índice sobre el conjunto Ssimbolos de símbolos en la descripción de un sistema físico, sea n la cardinalidad de Ssimbolos, y sea m un índice tal que m & le norte. Deje kI ser un valor extraído del conjunto de números racionales Q. Un producto adimensional &Pi de los parámetros QI & isin Ssimbolos es un monomio de parámetros elevados a potencias tales que D (y Pi) = 1, es decir,

Para un sistema físico definido por un conjunto de parámetros Ssimbolos, podemos definir grupos de uno o más productos adimensionales basados ​​en la Definición 1. Debido a la forma de la Ecuación (2), estos grupos de productos adimensionales a menudo se denominan &Pi grupos. 6,7

Ejemplo: para y el producto adimensional

podemos equiparar el producto adimensional a una constante para obtener

Entonces podemos obtener una expresión para cualquiera de los QI & isin Ssimbolos. Por ejemplo, para Q1,

Esta simple idea se generaliza a un método para obtener una función que relaciona todos los parámetros, QI & isin Ssimbolos, relevante para un sistema, en términos de uno o más productos adimensionales que podemos formar a partir de Ssimbolos.

2.2. Grupos de productos adimensionales y el teorema de Buckingham y Pi

La idea principal explotada en muchas aplicaciones contemporáneas del análisis dimensional 18, 21 es que para cualquier sistema físico representado por un conjunto de parámetros físicos Ssimbolos, a menudo es posible reparametrizar el sistema en términos de un número menor de parámetros. Esta observación básica se utiliza a menudo en la ingeniería y el diseño de sistemas mecánicos para reducir el número de parámetros necesarios en la experimentación. El principio detrás de la observación es lo que comúnmente se conoce como el teorema 6 de Buckingham & Pi:

Teorema 1. Sea n el número de parámetros en una descripción de un sistema físico, es decir, n = | Ssimbolos|. Sea r el número de dimensiones de algunas bases dimensionales ortogonales que son suficientes para expresar las dimensiones de los parámetros en Ssimbolos. Entonces, n & ndash r productos adimensionales &PiI se puede formar a partir de los parámetros.

La norte & ndash r productos adimensionales y PiI son las raíces de alguna función & Phi, es decir,

Sea & Phi & # 39 una función sobre los productos adimensionales & PiI. Sigue para el I-th producto, & PiI, que,

Cuándo norte & ndash r es igual a 1, es decir, cuando solo hay un producto & Pi en los grupos & Pi, entonces

De ello se deduce que existe una constante de valor real C tal que

Hay varios grupos & Pi posibles: para el mismo juego de parámetros Ssimbolos, de cardinalidad norte, existen múltiples grupos posibles de productos adimensionales (es decir, múltiples grupos & Pi posibles).

3. Síntesis de funciones dimensionales

Desde el conjunto Ssimbolos de parámetros que definen un sistema físico, podemos construir una representación matricial del sistema, donde las columnas son los parámetros que son miembros de Ssimbolos, las filas son dimensiones base como longitud, masa o tiempo, devueltas por la función D (Sección 2.1), y los elementos de la matriz son los exponentes de las dimensiones base.

La síntesis de funciones dimensionales consta de un paso en tiempo de compilación que calcula automáticamente todos los productos & Pi válidos en todos los grupos & Pi posibles. Luego, un paso de tiempo de ejecución calibra la relación funcional entre los productos derivados y Pi. Al igual que otras técnicas basadas en datos, utiliza las medidas de los sensores como entradas y produce un modelo que asigna esas medidas a una salida esperada. Su ventaja es el uso de información dimensional para aprender un modelo más simple de lo que sería posible de otra manera. Debido al pequeño tamaño del modelo producido y la pequeña cantidad de datos necesarios para calibrarlo, la síntesis de funciones dimensionales es muy adecuada para la ejecución en sistemas integrados con recursos limitados. La Figura 2 muestra los pasos utilizando la terminología introducida en esta sección y un sistema físico que comprende un objeto volador sin motor (planeador) como ejemplo.


Figura 2. Un planeador de masa metro lanzado con velocidad inicial v0 se mueve por el espacio con velocidad v bajo aceleración gravitacional gramo. La síntesis de funciones dimensionales puede derivar un conjunto de ecuaciones candidatas que relacionan su altura h a tiempo t. A continuación, utilizando los datos del sensor, puede calibrar ese conjunto de ecuaciones candidatas para obtener el modelo de altura en función del tiempo y la gravedad.

3.1. Derivando los grupos de productos adimensionales

Sea el conjunto de dimensiones base Sdimensiones de la base. Suponemos sin pérdida de generalidad que Sdimensiones de la base = <Yo y Theta, T, L, M, J, N> correspondiente a las dimensiones base S.I. para corriente eléctrica, temperatura termodinámica, tiempo, longitud, masa, intensidad luminosa y cantidad de materia, respectivamente. Dejar r ser la cardinalidad de Sdimensiones de la base, dejar j ser un índice sobre r, y deja qj & isin Sdimensiones de la base ser una de las dimensiones base. Como en la Sección 2.1 y la Ecuación (1), sea I ser un índice sobre el conjunto de parámetros de un sistema físico y dejar QI ser uno de esos parámetros. Dejar aij ser un exponente de una de las dimensiones base de QI como lo devuelve la función D de la Sección 2.1. Podemos expresar las dimensiones de cualquier QI en términos de las dimensiones de la base qj:

Podemos representar el sistema de norte = | Ssimbolos| ecuaciones, una para cada uno de los 1 & lt I & le norte instancias de la Ecuación (7) con una matriz llamada matriz dimensional. 7,9,13

Definición 2. Sea n el número de parámetros en Ssimbolos y sea r el número de dimensiones fundamentales necesarias para expresarlas. Sea i un índice sobre el conjunto de n parámetros para un sistema físico y sea j un índice sobre r. Luego definimos la matriz dimensional A, como

Los productos y Pi de la Definición 1 y la Ecuación (2) serán adimensionales (es decir, las dimensiones en el monomio se cancelarán) si y solo si Ak = 0, donde la matriz k contiene los exponentes de las dimensiones base necesarias para producir un producto adimensional. La solucion de Ak = 0 es el espacio nulo norte (A).

Restricciones físicas sobre soluciones de norte (A): Debido a nuestro objetivo de encontrar grupos adimensionales físicamente plausibles que sean computables de manera eficiente, restringimos las soluciones al cálculo del espacio nulo a las potencias racionales de aJi en lugar de permitir exponentes arbitrarios de valor real. Como resultado de esta información, calculamos la espacio nulo racional de A que por definición nos dará aJi valores que son proporciones de números enteros. Para calcular el espacio nulo racional de A, Primero usamos la eliminación de Gauss-Jordan para reducir las matrices a su forma escalonada reducida (RREF), donde todos los pivotes son iguales a uno, con ceros debajo de cada pivote. 22 Una vez que la matriz está en RREF, encontramos las soluciones especiales para Ak = 0. Si por un A, la única solución es el vector cero, luego concluimos que no hay espacio nulo no trivial disponible y, como resultado, no es posible formar un producto adimensional con exponentes racionales a partir del conjunto de parámetros en Ssimbolos.

El número de columnas linealmente independientes de la matriz dimensional. A es igual al rango (A). Así, para encontrar todas las posibles soluciones a Ak = 0 y por lo tanto, todos los grupos posibles de productos adimensionales, podemos reorganizar el norte columnas de A en formas de producir diferentes soluciones de espacio nulo. 6,13 Nuestro conjunto final de grupos de productos adimensionales es la unión de todos los grupos de productos adimensionales únicos que resultan de calcular los espacios nulos.

3.2. Calibración: uso de datos de sensores para transformar y grupos Pi en modelos ecuacionales

Los grupos adimensionales obtenidos al analizar una descripción del sistema físico en forma del conjunto Ssimbolos dar relaciones de proporcionalidad entre los parámetros en Ssimbolos. En el caso general donde más de uno de los productos adimensionales no son constantes, entonces, de la Ecuación (4), hay una función & Phi & # 39 que relaciona los valores de uno de los productos & Pi con el resto de ellos. Podemos utilizar un enfoque basado en datos para encontrar la forma de & Phi & # 39 y llamamos a este paso calibración. En este caso, aplicamos los productos & Pi generados para transformar los datos en el momento de la calibración y lograr la reducción de dimensionalidad. Esto permite que los modelos más simples funcionen mejor, lo que permite aprender modelos más pequeños con menos datos para un rendimiento de predicción determinado.

Cuando un grupo de productos adimensionales contiene un solo artículo, la ecuación (6) mostró que podemos equiparar el producto adimensional a una constante y obtener una relación de proporcionalidad entre los símbolos del producto adimensional. Todavía necesitamos determinar el valor de la constante de proporcionalidad y podemos hacerlo dados uno o más valores de los parámetros en el grupo adimensional. Cuando un grupo de productos adimensionales contiene más de un producto adimensional, aún podemos aplicar este método si podemos determinar que todos menos uno de los productos en cualquiera de los grupos adimensionales son efectivamente constantes para el rango de valores de los parámetros de interés.

Como cualquier método de construcción de modelos, la síntesis de funciones dimensionales producirá resultados incompletos si las entradas al método no describen completamente el problema que se está modelando: una S incompletasimbolos puede resultar en un conjunto vacío de productos adimensionales.

3.3. Implementación usando lenguaje Newton

Implementamos la síntesis de funciones dimensionales extrayendo el conjunto S simbolos a partir de la representación intermedia de descripciones de sistemas físicos escritas en Newton, 15 un lenguaje específico de dominio para describir sistemas físicos. Usamos Newton únicamente como una forma conveniente de obtener el conjunto Ssimbolos a partir de una descripción legible por humanos.

Ejemplo de péndulo: La figura 3 a muestra un péndulo equipado con un sensor que mide el movimiento. Midiendo, por ejemplo, el movimiento angular con un giroscopio o la aceleración con un acelerómetro, podemos medir el período de oscilación t calculando la transformada de Fourier de los datos de series de tiempo del sensor. Nuestro objetivo es obtener un modelo que relacione t, la longitud de la varilla l, y el componente gramo de la aceleración debida a la gravedad en el plano de rotación del péndulo. Los conocimientos de este ejemplo son aplicables a muchos sistemas mecánicos instrumentados por sensores, como aquellos en los que el período de oscilación podría verse afectado cuando las longitudes de las partes del sistema se expanden o contraen con la temperatura, o cuando el componente de la aceleración gravitacional que afecta al sistema cambia debido a la el sistema está inclinado en ángulo. La Figura 3b muestra una descripción física del péndulo ideal escrita en Newton. La síntesis de funciones dimensionales, implementada como un nuevo backend para el compilador de Newton, toma esta descripción como entrada y realiza los siguientes pasos.


Figura 3. (a) Un péndulo simple con masa metro, varilla de longitud l, periodo de swing t, y siendo la componente de la aceleración debida a la gravedad en su plano de movimiento gramo. (b) Descripción física del péndulo ideal escrita en Newton.

Paso 1: Construcción de matriz dimensional. Para el sistema de la Figura 3a, el conjunto de parámetros es Ssimbolos = <l, g, m, t>. La última fila de la Tabla 2 muestra las dimensiones de los miembros del conjunto de parámetros Ssimbolos junto con el grupo adimensional calculado por el método descrito anteriormente en la Sección 3.1. Siguiendo la formulación de la Sección 3.1, la matriz dimensional A para el conjunto de parámetros S del péndulosimbolos es


Tabla 2. Ejemplos de descripciones de sistemas físicos (Ssimbolos) y los grupos adimensionales que nuestra técnica genera para ellos. Nuestra implementación genera el LATEX para las ecuaciones que se muestran en la última columna.

Paso 2: Permutación de columna de matriz dimensional y cálculo de grupo & Pi. El número total de parámetros es norte = | Ssimbolos| = 4. De la Definición 1 (Sección 2.2), el sistema de péndulo tiene norte = 4 cantidades físicas y r = 3 dimensiones de la base. Como consecuencia, norte & ndash r = 1 y hay un único producto & Pi único:

De la ecuación (6) (sección 2.2), se deduce que podemos equiparar el monomio correspondiente a alguna constante C:

Dadas las medidas del sensor para diferentes valores de l, gramo, y t, podemos determinar el valor de la constante C.

4. Evaluación del modelo

Para demostrar el potencial de la síntesis de funciones dimensionales, la comparamos con los enfoques basados ​​en datos de caja negra para la caracterización de un sistema físico. La idea fundamental es que un científico ha ensamblado un sistema físico y es capaz de medir un subconjunto de sus parámetros ya sea por inspección (por ejemplo, midiendo la longitud de un componente) o usando sensores (por ejemplo, acelerómetros, tacómetros, etc.). Dado que un sistema físico complejo requiere esfuerzo y experiencia para ser definido analíticamente, su caracterización basada en datos es una idea prometedora. El diseñador puede recopilar un gran conjunto de datos de observaciones del sistema físico y luego usar la regresión y el aprendizaje automático para derivar un modelo que ajuste los parámetros medidos a un resultado esperado.

Sin embargo, derivar un modelo basado en datos efectivo requiere un buen muestreo de los parámetros del sistema físico y una exploración extensa del espacio de diseño de los modelos de ajuste de datos disponibles. En la práctica, ambos requisitos son difíciles o imposibles de cumplir, especialmente en el caso de sistemas complejos multiparamétricos. Por el contrario, el resultado de la síntesis de funciones dimensionales puede caracterizar completamente el sistema o actuar como un punto de partida para un análisis dirigido por datos. Además, las funciones dimensionales simples tienen requisitos computacionales significativamente menores en comparación con la mayoría de las técnicas de caracterización basadas en datos.

4.1. Evaluación de datos sintéticos

Primero comparamos la síntesis de funciones dimensionales con la regresión y las redes neuronales utilizando datos idealizados sintéticos. Examinamos varias topologías de redes neuronales de la familia FitNet de arquitecturas de redes neuronales de ajuste de curvas, que están optimizadas para el ajuste de ecuaciones. Apuntamos a un vehículo volador sin motor (planeador) con velocidad inicial v0, masa metro, aceleración debida a la gravedad gramo, y, altura de la trayectoria h en el momento t, similar al ejemplo de la Figura 2. Examinamos la capacidad de nuestro método para encontrar la relación entre la altura de la trayectoria y el resto de los parámetros físicos del planeador. Los parámetros utilizados para describir el planeador dan como resultado varios grupos & Pi, cada uno de los cuales incluye varios productos & Pi. En este caso, se desconoce la forma de la función & Phi & # 39 para combinar los productos & Pi en un modelo ecuacional y debemos utilizar un enfoque basado en datos para encontrar su forma. La síntesis de función dimensional proporciona dos opciones para la fase de calibración: (1) realizar la calibración en el sistema integrado de destino y (2) realizar la calibración fuera de línea en un sistema informático que no está limitado por los recursos. En ambos casos, los modelos calibrados apuntan a la plataforma integrada, por lo que la complejidad del modelo final sigue siendo una restricción clave.

A diferencia de & Phi y & Phi & # 39, que son funciones de productos adimensionales, sea & psi una función que relaciona directamente los parámetros de un sistema. Para el ejemplo del planeador, comparamos nuestro enfoque con un enfoque basado en datos para ajustar el vector de características & ltv0, metro, gramo, t& gt a la altura prevista h a través de la función & psi:

La ecuación de trayectoria ideal de un planeador es h = v0 & middot t & ndash 0.5 y middot (t 2 y middot gramo). Usando la ecuación de trayectoria ideal, sintetizamos un conjunto de datos muestreando uniformemente la velocidad inicial del planeador (v0) en el rango de 1 Sra a 10 Sra, con un tamaño de paso de 0,5 Sra. Consideramos la aceleración debida a la gravedad (gramo) desde 6.0 Sra 2 hasta 9,5 Sra 2, con 0,5 Sra Tamaño de 2 pasos y una ventana de tiempo para deslizarse (t) que van de 0,1 a 100 s, con un paso de 0,1 s.

Usando la síntesis de funciones dimensionales, la descripción elegida del sistema conduce a tres grupos & Pi, cada uno con dos productos & Pi, es decir, & Pi grupo 0 = <& Pi1 = t & middot g / v0, &Pi2 = h / t & middot v0>,, & PiGrupo 2 = <& Pi1 = t 2 y middot g / h, &Pi2 = h / t & middot v0>. En & Pi grupo 0, h aparece solo en & Pi2, por lo tanto, de acuerdo con la ecuación (4), podemos expresar h como función & Phi & # 39 de & Pi1:

En contraste con los métodos tradicionales que deben aprender una función en un espacio de cuatro dimensiones (v0, metro, gramo, t), la síntesis de funciones dimensionales solo necesita usar datos para aprender la función de variable única & Phi & # 39 de la Ecuación (11). Esta forma más simple es particularmente valiosa cuando nuestro objetivo es realizar la calibración final en un sistema integrado con recursos limitados. La Figura 4 muestra el rendimiento comparativo del uso de la regresión lineal para encontrar & Phi & # 39 dimensionalmente reducido, frente a la regresión lineal, cuadrática y basada en redes neuronales para encontrar & Psi. La regresión lineal en & Phi & # 39 supera a la misma técnica en & Psi en más de un 12%, aunque tiene requisitos computacionales similares. Las redes neuronales son capaces de minimizar el error de predicción, a expensas de un cálculo requerido 80 veces mayor. Cuantificamos los requisitos computacionales de cada red como el número total de operaciones de punto flotante (sumas, multiplicaciones) que requiere por instancia de inferencia. En general, los modelos de redes neuronales requieren entre 0,3 y 50 s de entrenamiento por modelo para una validación cruzada de 5 veces, con un promedio de 16 s. La latencia de entrenamiento total fue de aproximadamente 240 minutos en una CPU Intel Core i7-7820X a 3,60 GHz, con 32 GB de RAM. Esto es 1096 veces más lento que nuestro enfoque, que requiere 1,5 ms en promedio para el sistema físico examinado que se ejecuta en la misma estación de trabajo. Hemos examinado un total de 16 sistemas físicos de complejidad creciente y nuestro método requiere menos de 300 ms en promedio para generar las funciones dimensionales, con un máximo de 3428,7 ms.


Figura 4. Error de predicción versus requisitos computacionales para predecir la trayectoria de un planeador. Nuestro modelo utiliza regresión lineal para la función de ajuste & Psi & # 39 de la Ecuación (11) (denotado como & quot; nuestro modelo & quot en la esquina inferior izquierda). Pareto domina todas las variantes de redes neuronales (891 topologías de red diferentes), que se utilizan para ajustar la función y la Psi de la ecuación (10).

La Figura 5 muestra la aproximación del modelo realizada por redes neuronales entrenadas contra 20 puntos de datos, con (Figura 5b) y sin (Figura 5a) reduciendo dimensionalmente el número de parámetros de entrada haciendo uso de la síntesis de funciones dimensionales. La red neuronal más precisa para ajustar la función & Phi & # 39 en el espacio de cuatro dimensiones (v0, metro, gramo, t) tiene un error de predicción del 0,17%. Consta de dos capas con 2 y 5 neuronas, mientras que la más precisa para la función de ajuste & Psi se compone de dos capas de 6 neuronas cada una. Esto destaca la síntesis de funciones dimensionales como una herramienta para entrenar modelos en situaciones donde no hay datos suficientes para entrenar modelos más complejos.


Figura 5. Error de predicción versus requisitos computacionales para predecir la trayectoria de un planeador. La subfigura (a) corresponde a la aplicación directa de redes neuronales para ajustar la función y Psi de la ecuación (10). La subfigura (b) corresponde a nuestro enfoque utilizando una red neuronal para ajustar la función & Phi & # 39 de la Ecuación (11). Entrenamos todos los modelos contra un conjunto de 20 puntos de datos de entrada. Nuestro método logra un error de predicción del 0,17% a través de un modelo aproximadamente 2,5 veces menos exigente desde el punto de vista informático.

Los modelos más simples y la mayor precisión de predicción de la síntesis de funciones dimensionales son el resultado de su capacidad para utilizar la información física disponible. Esto permite un mejor entrenamiento de modelos más simples con menos datos. Más importante aún, estas reducciones no se basan en suposiciones o aproximaciones ad-hoc, sino que están dictadas por leyes físicas. Los modelos de síntesis de funciones dimensionales son más eficientes para sistemas integrados con recursos limitados, ya que requieren menos cálculos durante la inferencia y menos datos para su entrenamiento.

4.2. Evaluación sobre un péndulo físico

Evaluamos nuestro método en presencia de datos no sintéticos donde la relación subyacente es más compleja que una simple ecuación de forma cerrada. Realizamos una serie de experimentos en nuestro laboratorio utilizando un aparato conocido como péndulo de g variable (Figura 6a). Este aparato usa una masa sobre una varilla rígida que se balancea alrededor de un pivote que está en un ángulo que no es perpendicular al horizonte. Equipamos este aparato con un sensor inalámbrico que contiene un acelerómetro de 3 ejes en el extremo `` bob '' del péndulo para proporcionar un flujo de datos a partir del cual automatizamos la medición del período de oscilación. t. Realizamos 90 experimentos físicos en este aparato para diferentes valores de la longitud de la varilla del péndulo l en el rango de 3 & ndash33 cm en pasos de 3 cm y para un rango de aceleración gravitacional efectiva gramo resultante de los ángulos de pivote del péndulo de 0 & deg & ndash80 & deg, en incrementos de 10 & deg.


Figura 6. (a) Nuestra configuración experimental para la variable-gramo péndulo. (b) Datos recopilados del acelerómetro de 3 ejes a lo largo del tiempo utilizando el sensor inalámbrico en el péndulo. El mayor componente de oscilación se debe al movimiento del péndulo. (c) Transformada discreta de Fourier (DFT) de ventanas de 10 s de los datos de aceleración muestreados. A pesar de la variación de las propiedades de la señal a lo largo del tiempo, la frecuencia dominante permanece alrededor de 2 Hz. (d) El período de tiempo del péndulo, calculado de acuerdo con la frecuencia dominante en cada ventana de tiempo de DFT, exhibe una pequeña variación de aproximadamente 20 ms en un intervalo de 1 minuto.

La figura 6b muestra un ejemplo de los datos del sensor durante 1 minuto de oscilación del péndulo. Registramos una serie temporal de datos de oscilación del péndulo como la de la Figura 6b para cada uno de los 90 experimentos que realizamos. Luego usamos estos datos de series de tiempo para calcular el período de oscilación a través de su transformada discreta de Fourier (DFT). La Figura 6c muestra la salida DFT resultante para un experimento, para cuatro ventanas de procesamiento diferentes de datos registrados. La Figura 6d muestra el período de oscilación durante la duración de un experimento de 1 minuto, estimado usando la DFT.

La Figura 7 muestra la capacidad de nuestro método para generar un modelo que predice con precisión el período de oscilación de la variable:gramo péndulo. El paso de calibración de nuestro método toma como entrada los períodos estimados del experimento real. Nuestro método requiere datos mínimos de calibración. Para péndulos de más de 20 cm de longitud, el error de predicción es siempre inferior al 15%, aunque cada predicción requiere solo cuatro operaciones de coma flotante.


Figura 7. Error porcentual del período predicho de la variable-gramo péndulo, t para una longitud determinada l y aceleración gravitacional, gramo. La subfigura (a) incluye todos los casos experimentales en un subconjunto de los cuales se violan los supuestos del modelo de péndulo ideal, lo que da lugar a grandes desviaciones. La subfigura (b) hace zoom en la región, donde se minimiza el error de las funciones dimensionales sintetizadas.

Para longitudes de péndulo menores de 20 cm, el error en el modelo aumenta debido a no idealidades, como la fricción, que no son captadas por la forma de la relación de proporcionalidad generada por nuestra técnica. La precisión de la función dimensional sintetizada está limitada por el número de parámetros utilizados que describen el sistema físico. Una elección más rica en el conjunto de parámetros (por ejemplo, como la fricción del pivote y la masa de la varilla) es una posible solución para derivar funciones dimensionales más precisas.

También aplicamos las técnicas basadas en datos de caja negra en los datos reunidos del experimento del péndulo. De este conjunto de datos, el 75% se muestreó al azar para actuar como datos de entrenamiento, mientras que el resto se utilizó como muestras de prueba. Usamos una política de validación cruzada de 5 veces para entrenar los modelos. La Figura 8 resume el error de predicción del período de oscilación del péndulo promediado para todos los modelos en el caso del conjunto de datos de prueba. Los modelos de regresión tienen un error de predicción comparable a nuestro método, pero nuestro método supera a los modelos de regresión en el área ampliada de la Figura 7b. Las redes neuronales exhiben una amplia distribución de error de predicción, pero las redes simples pueden lograr una precisión muy alta dentro del mismo rango que nuestro modelo propuesto. Debido a que entrenamos los modelos de caja negra contra puntos de datos derivados de todo el rango de los experimentos del péndulo, pueden capturar efectivamente las características no ideales de la oscilación, logrando así una alta precisión.


Figura 8. Error porcentual del período predicho de la variable-gramo péndulo, t para una longitud determinada ly aceleración gravitacional, gramo. Predecimos usando redes neuronales y modelos de regresión.

5. Alcance, limitaciones y extensiones

La síntesis de funciones dimensionales utiliza información sobre las dimensiones físicas y las unidades de medida de las señales relevantes para un sistema físico para derivar un conjunto de ecuaciones candidatas que relacionan esas señales. Como muchos enfoques existentes para construir modelos basados ​​en parámetros elegidos por humanos, depende de un conjunto válido de parámetros en el conjunto Ssimbolos (introducido en la Sección 2.1) para describir el sistema a modelar. Cuando se le proporciona un conjunto de parámetros insuficientes para generar un modelo que captura el comportamiento de un sistema, el método generará, como era de esperar, un modelo que es, en el mejor de los casos, solo una aproximación al comportamiento real. Las áreas emocionantes de mayor desarrollo incluyen la automatización del proceso de identificación de parámetros en Ssimbolos en lugar de extraerlos de una descripción escrita por humanos e incorporar integrales y derivadas en formulaciones para funciones & Phi.

Para los parámetros físicos que no se pueden medir directamente, la síntesis de funciones dimensionales enfrenta los mismos desafíos que enfrentan los enfoques de modelado tradicionales. En la práctica, para los parámetros que no se pueden medir, los diseñadores miden sustitutos que se correlacionan con los parámetros faltantes, por ejemplo, midiendo la aceleración y el tiempo transcurrido en lugar de la velocidad. En este caso, la síntesis de funciones dimensionales tiene el efecto neto de explotar información sobre las unidades físicas de los parámetros en cuestión, mientras que las técnicas de modelado tradicionales no tienen otra opción que intentar ajustar los datos con modelos no lineales cada vez más complejos.La síntesis de funciones dimensionales permite la combinación de ambos enfoques en el caso de múltiples n grupos, como se examinó en la Sección 4.1.

5.1. Síntesis de circuitos dimensionales

La síntesis de circuitos dimensionales es una extensión de la síntesis de funciones dimensionales que proporciona un método en tiempo de compilación para generar circuitos lógicos digitales para el cálculo de grupos & Pi. Hemos implementado un backend de síntesis de nivel de transferencia de registro (RTL) Verilog en Newton, que utiliza la información de los grupos & Pi calculados de síntesis de funciones dimensionales y genera la descripción RTL de los módulos de hardware, cada uno de los cuales calcula un monomio & Pi (Ecuación (2) ) de un grupo & Pi seleccionado. Los módulos de hardware toman las señales de los sensores como entrada y realizan el procesamiento previo a la inferencia del módulo predictivo calibrado que derivamos de la síntesis de funciones dimensionales. Un motor de inferencia en el dispositivo (en el sensor) integrará los circuitos dimensionales sintetizados con el módulo que ejecuta el modelo predictivo calibrado utilizando, por ejemplo, una red neuronal. Este módulo de inferencia puede ser un componente RTL personalizado o un núcleo programable. La Figura 9 muestra un sistema de hardware de inferencia en el sensor generado usando síntesis de función dimensional y síntesis de circuito dimensional.


Figura 9. El hardware generado por los preprocesos de síntesis de circuitos dimensionales. k señales del sensor para calcular norte & lt k productos adimensionales &Pi1& hellip & Pinorte. Un modelo predictivo toma los valores del producto calculados como entrada y genera una inferencia de salida.

Evaluamos el hardware generado por el backend de síntesis de circuito dimensional utilizando un FPGA Lattice Semiconductor iCE40. El iCE40 es un FPGA en miniatura de bajo consumo en un paquete WLCSP a escala de oblea de 2,15 y 2,50 mm, que se enfoca en tareas de interfaz de sensores y aprendizaje automático en el dispositivo. Usamos un flujo de diseño FPGA de código abierto, que comprende la herramienta de síntesis YoSys ( versión 0.8 + 456 ) para síntesis y NextPNR ( versión git SHA1 5344bc3 ) para análisis de ubicación, enrutamiento y sincronización.

Realizamos nuestras mediciones en un kit de desarrollo móvil iCE40 (MDK) que incluye una resistencia de detección de corriente 1 & Omega en serie con cada uno de los rieles de suministro de la FPGA (núcleo, PLL, bancos de E / S). Medimos la corriente consumida por el núcleo FPGA midiendo la caída de voltaje a través de la resistencia del riel de suministro del núcleo FPGA (1.2 V) usando un Keithley DM7510, un multímetro digital de laboratorio de 7 1/2 que puede medir voltajes hasta 10 nV. Usando estas medidas de caída de voltaje, calculamos la potencia disipada por el núcleo FPGA para cada diseño RTL configurado. Usamos un generador de números pseudoaleatorios para alimentar los módulos del circuito de cálculo de los monomios & Pi bajo evaluación con datos de entrada aleatorios.

Evaluamos la síntesis de circuitos dimensionales en siete sistemas físicos diferentes descritos en Newton. La Tabla 3 presenta la utilización total de recursos FPGA para todos los módulos de cálculo de productos & Pi generados, expresada en términos del número de tablas de búsqueda de cuatro entradas (celdas LUT4) necesarias para su síntesis. Estos valores de utilización de recursos también incluyen los recursos necesarios para la síntesis de los módulos aritméticos de coma fija, que integramos en el módulo de cálculo de cada producto & Pi.


Tabla 3. Evaluación experimental en FPGA iCE40 de módulos de circuitos dimensionales generados a partir de descripciones de sistemas físicos.

La columna de latencia de ejecución enumera los ciclos necesarios para completar los cálculos de la ruta crítica de cada uno de los módulos RTL generados. Obtuvimos el número de ciclos simulando la ejecución de los módulos RTL para entradas pseudoaleatorias generadas por registros de desplazamiento de retroalimentación lineal (LFSR). En cada módulo RTL, paralelizamos el cálculo de diferentes productos & Pi, pero las operaciones requeridas por producto & Pi se ejecutan en serie.

La última columna de la Tabla 3 muestra la disipación de potencia medida de cada diseño configurado en el FPGA iCE40. En todos los casos, la disipación de potencia es inferior a 6 mW y tan baja como 1 mW, lo que demuestra la idoneidad de nuestro método para la inferencia en el dispositivo de factor de forma pequeño y operada por batería en el borde.

6. Conclusión

Los métodos existentes para construir modelos retrospectivos o predictivos para datos de sistemas físicos no explotan completamente la información sobre la física de los sistemas en cuestión. En este trabajo, presentamos un método automatizado para generar la familia de funciones a partir de las cuales aprender un modelo, basado en información sobre las dimensiones físicas de las señales en el sistema. El método, que llamamos síntesis de funciones dimensionales, se aplica a los flujos de datos donde se conocen las dimensiones de las señales.

Implementamos la síntesis de funciones dimensionales y evaluamos el costo de ejecución y la precisión de los modelos que genera nuestro método en comparación con los modelos de regresión y las redes neuronales. Cuando se calibran con datos de sensores, nuestros modelos superan la regresión tradicional y los modelos de redes neuronales en precisión de inferencia en todos los casos que evaluamos. Además, nuestros modelos funcionan mejor en la latencia de entrenamiento (mejora hasta 1096X) y requieren operaciones aritméticas en inferencia (mejora hasta 34X). Estas ganancias significativas son en gran parte el resultado de la explotación de información sobre la física de señales que hasta ahora ha sido ignorada.

Expresiones de gratitud

Esta investigación está apoyada por un premio TU / B / 000096 del Alan Turing Institute bajo la subvención EPSRC EP / N510129 / 1, por la subvención Royal Society RG170136 y por la subvención EPSRC EP / V004654 / 1. Youchao Wang, Vlad-Mihai Mandric y James Rhodes contribuyeron a la implementación de los métodos algebraicos lineales dentro del compilador de Newton.

Referencias

1. Allen, E., Chase, D., Luchangco, V., Maessen, J.-W., Steele, G.L., Jr. Unidades de medida orientadas a objetos. En Actas de la 19a Conferencia Anual de ACM SIGPLAN sobre programación, sistemas, lenguajes y aplicaciones orientados a objetos, OOPSLA & # 3904 (2004), ACM, Nueva York, NY, EE. UU., 384 & ndash403.

2. Antoniu, T., Steckler, P.A., Krishnamurthi, S., Neuwirth, E., Felleisen, M. Validación de la corrección unitaria de los programas de hojas de cálculo. En Actas de la 26a Conferencia Internacional de Ingeniería de Software, ICSE & # 3904 (2004), IEEE Computer Society, Washington, DC, EE. UU., 439 & ndash448.

3. Babout, M., Sidhoum, H., Frecon, L. Ampere: Un lenguaje de programación para la física. European J. Phys. 11, 3 (1990):163.

4. Barber, D. Razonamiento bayesiano y aprendizaje automático. Cambridge University Press, Cambridge, 2012.

5. Biggs, G., Macdonald, B.A. Un enfoque pragmático del análisis dimensional para la programación robótica móvil. Auton. Robots 25, 4 (noviembre de 2008), 405 y ndash419.

6. Buckingham, E. Sobre sistemas físicamente similares Ilustraciones del uso de ecuaciones dimensionales. Phys. Apocalipsis 4, 4 (1914), 345 y ndash376.

7. Carlson, D.E. Una teoría matemática de unidades físicas, dimensiones y medidas. Arco. Anal Mecánica Racional. 70, 4 (1979), 289 y ndash305.

8. Cmelik, R.F., Gehani, N.H. Análisis dimensional con C ++. IEEE Softw. 5, 3 (1988), 21 y ndash27.

9. Carlson, D.E. Sobre algunos resultados nuevos en análisis dimensional. Arco. Racionar. Mech. Anal. 68, 3 (1978), Springer 191 y ndash210.

10. Hilfinger, P.N. Un paquete ada para análisis dimensional. ACM Trans. Programa. Lang. Syst. 10, 2 (abril de 1988), 189 & ndash203.

11. Hills, D.J.A., Gr & uumltter, A.M., Hudson, J.J. Un algoritmo para descubrir lagrangianos automáticamente a partir de datos. Peer J Comput. Sci. 1, (Noviembre de 2015), e31.

12. Hills, M., Chen, F., Rou, F.Un enfoque lógico de reescritura de la verificación estática de unidades de medida en C. Electrón. Notas Theor. Computación. Sci. 290, (Diciembre de 2012), 51 & ndash67.

13. Jonsson, D. Análisis dimensional: una actualización del centenario. preimpresión de arXiv arXiv: 1411.2798 (2014).

14. Kennedy, A. Tipos de dimensiones. En Actas del V Simposio Europeo de Programación: Lenguajes y sistemas de programación, ESOP & # 3994 (1994), Springer-Verlag, Londres, Reino Unido, 348 & ndash362.

15. Lim, J., Stanley-Marbell, P. Newton: un lenguaje para describir la física. CoRR, abs / 1811.04626 (2018).

16. Rayleigh, L. El principio de similitud. Naturaleza 95 (Diciembre de 1915), 66 & ndash68.

17. Rittri, M. Dimensión inferencia bajo recursión polimórfica. En Actas de la Séptima Conferencia Internacional sobre Lenguajes de Programación Funcionales y Arquitectura de Computadoras, FPCA & # 3995 (1995), ACM, Nueva York, NY, EE. UU., 147 & ndash159.

18. Rudy, S.H., Brunton, S.L., Proctor, J.L., Kutz, J.N. Descubrimiento basado en datos de ecuaciones diferenciales parciales. Sci. Adv. 3, 4 (2017), e1602614.

19. Schmidt, M., Lipson, H. Destilación de leyes naturales de forma libre a partir de datos experimentales. Ciencia 324, 5923 (2009), 81 y ndash85.

20. Simon, V., Weigand, B., Gomaa, H. Análisis dimensional para ingenieros. Springer, Gewerbestrasse, Cham, Suiza, 2017.

21. Sonin, A.A. Una generalización del &Pi-teorema y análisis dimensional. Proc. Natl. Acad. Sci. 101, 23 (2004), 8525 y ndash8526.

22. Strang, G. Introducción al álgebra lineal, 5ª ed. Wellesley-Cambridge Press, Wellesley, MA, 2016.

23. Umrigar, Z.D. Análisis dimensional completamente estático con C ++. SIGPLAN No. 29, 9 (septiembre de 1994), 135 & ndash139.

Autores

Vasileios Tsoutsouras ([email protected]), Universidad de Cambridge, Cambridge, Reino Unido.

Sam Willis ([email protected]), Universidad de Cambridge, Cambridge, Reino Unido.

Phillip Stanley-Marbell ([email protected]), Universidad de Cambridge, Cambridge, Reino Unido.

Notas al pie

La versión original de este artículo se publicó en Transacciones ACM en sistemas informáticos integrados, Octubre de 2019.

La Biblioteca Digital es una publicación de la Asociación de Maquinaria de Computación. Copyright y copia 2021 ACM, Inc.


MATEMÁTICAS 3001-200, Análisis I

La Mediano plazo se llevará a cabo durante el horario de clase programado el Viernes 24 de julio. La examen final tendrá lugar durante el horario de clase programado el Viernes, 7 de agosto de 2020. Las tareas se recogerán en las fechas de vencimiento de nuestro programa: las enviará en Canvas. Los cuestionarios se administrarán durante el horario de clases en los días de cuestionarios programados y se enviarán en Canvas.

Sin exámenes de maquillaje y sin cuestionarios de maquillaje se permitirá, sin la documentación adecuada. ¡Hagamos que esta clase se desarrolle sin problemas, porque hay mucho que cubrir y la puntualidad es esencial! La política oficial es la siguiente: Si sabe que se va a perder un examen o no puede realizar el examen final a la hora programada, notifique a su instructor al menos dos clases antes. Si pierde un examen de mitad de período por cualquier motivo aceptable (por ejemplo, obligación religiosa, enfermedad documentada), la puntuación del examen de mitad de período será reemplazada por una puntuación estimada basada en su desempeño en el otro período de mitad de período. Si se pierde ambos exámenes por razones aceptables, sus calificaciones de mitad de período serán reemplazadas por calificaciones estimadas basadas en su desempeño en la final. Si se pierde el examen final y no lo ha reprogramado con anticipación, obtendrá un puntaje de cero en el final o recibirá un incompleto en el curso, según las circunstancias. No puede reprogramar un examen final después de que haya comenzado. Para ser excusado de un examen por razones médicas, debe presentar una nota de un médico o debe obtener el permiso previo del instructor para faltar al examen. El autodiagnóstico y la automedicación no son aceptables para este propósito.

Tarea: Los problemas de tarea en rojo se calificarán (consulte la pestaña Tareas). No es necesario entregar los otros problemas de tarea, pero Todos los problemas asignados se consideran un juego limpio para las pruebas y los exámenes.. Este curso se basará al 100% en nuestro libro de texto del curso, que en su mayoría son problemas. Gran parte de la teoría se deja como problemas. Yo mismo resolveré muchos problemas, tanto en conferencias como en 'sesiones de problemas' que se llevan a cabo en ZOOM durante el tiempo de clase. Existen camino demasiados problemas para nuestro corto período de cinco semanas. Por lo tanto, consideremos estas tareas como la Fundación de este curso. Los problemas graduados son solo la punta del iceberg. Toda la extensión del tema necesitará mucho más trabajo y devoción que eso. La ideal para nosotros es trabajar tantos problemas como sea posible, pues con cada problema resuelto avanzamos una milla hacia el territorio conceptual que deberíamos desear trazar.

Desde mi experiencia la primavera pasada, creo que la mejor solución es usar una aplicación de escaneo en su teléfono, en lugar de convertir un jpeg. Las aplicaciones de escaneo generan automáticamente un pdf y el camino lo genera es mucho mejor para fines de impresión: tamaño mucho más pequeño, coloración simple en blanco y negro, no consume tóner y la impresora tarda 5 minutos en cargarse. Utilice una aplicación de escaneo (o equivalente) para escanear todas las asignaciones enviadas.

¡Los problemas con las tareas deben ser TeXed! Si conoces LaTeX, debes escribir a máquina tus propiedades. En cualquier caso, quiero un pdf, incluso si eso significa tomar una foto y convertirla a pdf. Es importante para fines de calificación, porque quiero hacer comentarios y observaciones sobre archivos PDF, que puedo devolverles fácilmente.

Se le permite utilizar Internet y otros recursos (por ejemplo, los libros complementarios recomendados). ¡Sin embargo! Primero que nada, tu debe citar sus fuentes cuando los usa. Si copia directamente una prueba, está requerido confesar el hecho, y le costará un punto (queda por determinar exactamente cómo puntuaré las tareas, pero basta con decir que le daré aproximadamente un 20% de descuento). Los animo a todos a que trabajen juntos en las tareas, tal vez incluso dividan los problemas en grupos más pequeños y luego se reúnan para compartir soluciones. Discutiremos estrategias en clase.

No se aceptarán tareas tardías, para ayudar a desarrollar la regularidad de los hábitos, así como para hacer que la vida de todos sea más llevadera: ¡tenemos una agenda apretada de cinco semanas! Dejaré caer su puntuación más baja en la tarea para compensar, y también haré lo mismo con las pruebas.

Estudiantes con discapacidades: Si califica para adaptaciones debido a una discapacidad, envíe su carta de adaptaciones de Disability Services a su miembro de la facultad de manera oportuna (al menos una semana antes del examen) para que se puedan abordar sus necesidades. Los servicios para discapacitados determinan adaptaciones basadas en discapacidades documentadas en el entorno académico. La información sobre cómo solicitar adaptaciones se encuentra en el sitio web de Servicios para discapacitados www.colorado.edu/disabilityservices/students. Comuníquese con Servicios para Discapacitados al 303-492-8671 o [email protected] para obtener más ayuda. Si tiene una condición médica o lesión temporal, consulte Condiciones médicas temporales en la pestaña Estudiantes en el sitio web de Servicios para discapacitados y discuta sus necesidades con su profesor.

Comportamiento del estudiante en el aula y en relación con el curso: Los estudiantes y el profesorado tienen la responsabilidad de mantener un entorno de aprendizaje apropiado. Aquellos que no cumplan con dichos estándares de comportamiento pueden estar sujetos a medidas disciplinarias. La cortesía y la sensibilidad profesionales son especialmente importantes con respecto a las personas y los temas relacionados con la raza, el color, el origen nacional, el sexo, el embarazo, la edad, la discapacidad, el credo, la religión, la orientación sexual, la identidad de género, la expresión de género, la condición de veterano, la afiliación política o política. filosofía. Las listas de clases se proporcionan al instructor con el nombre legal del estudiante. Con mucho gusto honraré su solicitud de dirigirme a usted con un nombre alternativo o pronombre de género. Por favor avíseme de esta preferencia a principios del semestre para que pueda hacer los cambios apropiados en mis registros. Para obtener más información, consulte las políticas sobre comportamiento en el aula y el Código de conducta estudiantil.

Declaración sobre discriminación y acoso: La Universidad de Colorado Boulder (CU Boulder) se compromete a fomentar un entorno de aprendizaje, trabajo y vida positivo y acogedor. CU Boulder no tolerará actos de conducta sexual inapropiada, abuso de pareja íntima (incluida la violencia en el noviazgo o doméstica), el acecho, la discriminación de clase protegida o el acoso por parte de miembros de nuestra comunidad. Las personas que crean que han sido objeto de mala conducta o represalias por informar una inquietud deben comunicarse con la Oficina de Cumplimiento y Equidad Institucional (OIEC) al 303-492-2127 o [email protected] La información sobre la OIEC, las políticas universitarias, los informes anónimos y los recursos del campus se pueden encontrar en el sitio web de la OIEC.

Codigo de honor: Todos los estudiantes inscritos en un curso de la Universidad de Colorado Boulder son responsables de conocer y adherirse a la política de integridad académica. Las violaciones de la política pueden incluir: plagio, trampa, fabricación, mentira, soborno, amenaza, acceso no autorizado a materiales académicos, fraude con clicker, enviar el mismo trabajo o trabajo similar en más de un curso sin permiso de todos los instructores del curso involucrados y ayudar deshonestidad. Los incidentes de mala conducta académica se pueden informar al Consejo del Código de Honor ([email protected] 303-735-2273). Los estudiantes que sean encontrados responsables de violar la política de integridad académica estarán sujetos a sanciones no académicas del Consejo del Código de Honor, así como a sanciones académicas del miembro de la facultad. Se puede encontrar información adicional sobre la política de integridad académica en el sitio web de la Oficina del Código de Honor.

Pascal, en las primeras líneas de su Del espíritu geométrico (c 1657) dice: «Podemos tener tres objetivos principales en el estudio de la verdad: uno para descubrirla cuando se busca, otro para demostrar cuando se posee y un tercero, discriminarlo de lo falso cuando se examina. No hablo del primero [esto es especulación o percepción, e implica ingenio y creatividad; estos no se distribuyen uniformemente entre las personas y, por lo tanto, hacer no constituir un método] Trato particularmente del segundo, e incluye al tercero. Pues si conocemos el método de probar la verdad, tendremos, al mismo tiempo, el de discriminarla, ya que, al examinar si la prueba que se da de ella se ajusta a las reglas que se entienden, sabremos si está exactamente demostrado.

Luego procede a explicar el método de prueba. El primer paso es estableciendo claro definiciones, el paso dos es pruebas, 'nunca adelantando ninguna proposición que no pueda ser demostrada por verdades ya conocidas,' ya sea que sean proposiciones previamente probadas, nuestro establecido definiciones o lo asumido axiomas del sujeto.

Pascal elabora con más detalle el métodos adecuados de prueba en otro ensayo, El arte de la persuasión : 'Este arte, que yo llamo el arte de persuadir, y que, propiamente hablando, es simplemente el proceso de perfectas demostraciones metódicas, consta de tres partes esenciales: de definir los términos de los que debemos valemos de definiciones claras de proponer principios o axiomas evidentes para probar la cosa en cuestión y de siempre. sustituyendo mentalmente en las demostraciones la definición en lugar de la cosa definida.

'La razón de este método es evidente', dice Pascal, 'ya que sería inútil proponer lo que se pretende probar, y emprender la demostración de ello, si no se hubieran definido previamente con claridad todos los términos que no son inteligibles. y como es necesario igualmente que la demostración sea precedida por la exigencia de los principios evidentes que le son necesarios, pues si no aseguramos los cimientos no podemos asegurar el edificio y ya que, en fin, es necesario al demostrar mentalmente, sustituir las definiciones en lugar de las cosas definidas, ya que de lo contrario podría haber un abuso de los diferentes significados que se encuentran en los términos. Es fácil ver que, al observar este método, estamos seguros de convencer, ya que todos los términos se entienden, y están perfectamente exentos de ambigüedad por las definiciones y los principios que se otorgan, si en la demostración siempre sustituimos mentalmente las definiciones. para las cosas definidas, la fuerza invencible de las conclusiones no puede dejar de tener todo su efecto ”.

    Sobre definiciones , hace la importantísima distinción entre definiciones primitivas y definiciones complejas , que refleja la distinción entre obvio y no obviocondiciones.

    Las definiciones primitivas son las de las cosas que directamente percibir (pero aún no comprender) - sus ejemplos son movimiento (un término primitivo del sujeto de mecánica), número, igualdad, mas grande que, menos que (términos primitivos del sujeto de aritmética), espacio (un término primitivo de geometría), y hora (un primitivo de la mecánica y la geometría de hoy). No definimos estos términos porque todos entendemos lo que queremos decir con ellos, aunque hacemos no conocer su naturaleza oculta y significado más profundo (que es, después de todo, el propósito declarado del desarrollo teórico posterior de cada tema).

    Primero, el tema de infinito . En realidad, hay dos lados del infinito, el infinitamente grande y el infinitamente pequeño o infinitesimal . Pascal, por supuesto, vivió aproximadamente una generación antes de la invención del cálculo de Newton y Leibniz, por lo que no es sorprendente ver uno de los temas fundamentales del análisis discutido minuciosamente aquí. Descartes, el predecesor inmediato de Pascal, unió los números y la medición en un solo marco, y todas las cosas a las que se aplica la medición están sujetas a los problemas aquí involucrados: tiempo, espacio, movimiento.

Es decir, en una palabra, cualquier movimiento, cualquier número, cualquier espacio, cualquier tiempo que haya, siempre hay un mayor y un menor que estos: de modo que todos se sitúan entre la nada y el infinito, estando siempre infinitamente distantes de estos extremos. Todas estas verdades no se pueden demostrar y, sin embargo, son los fundamentos y principios de la geometría. Pero como la causa que los vuelve incapaces de demostración no es su oscuridad, sino por el contrario su extrema obviedad, esta falta de prueba no es un defecto, sino una perfección. De lo cual vemos que la geometría no puede definir objetos ni probar principios sino por esta única y ventajosa razón de que ambos se encuentran en una extrema claridad natural, lo que convence más poderosamente a la razón que al discurso. Porque, ¿qué es más evidente que esta verdad de que un número, cualquiera que sea, se puede aumentar, se puede duplicar? Una vez más, ¿no se puede duplicar la velocidad de un movimiento y no se puede duplicar un espacio de la misma manera?

Se ha preparado el escenario para el desarrollo del cálculo, cuya articulación lógica completa es análisis.

  • topología de los números reales (límites, continuidad, compacidad, conectividad, secuencias y series)
  • diferenciabilidad, linealización local, y Aproximación de polinomios de orden superior (polinomios de Taylor)
  • integración y anti-diferenciación
  • serie de funciones (especialmente serie de potencia y Serie de taylor)
  • La Teorema de Heine-Borel caracteriza subconjuntos compactos de la línea real (aquellas para las que cualquier tapa abierta puede reducirse a una subtapa finita): son precisamente las subconjuntos cerrados y acotados (por ejemplo, intervalos cerrados), y simultáneamente son los subconjuntos secuencialmente compactos (aquellos que contienen los límites de sus secuencias convergentes). Por lo tanto, "cerrado" + "delimitación" = "compacidad", y acabamos de obtener una comprensión más rica: ya sea que miremos los puntos límite, los límites de las secuencias o la reducibilidad finita de las cubiertas abiertas, estamos discutiendo el mismo concepto, la compacidad.
  • Teorema de Cantor dice que los números reales son incontables. Además, cualquier intervalo abierto tiene la misma cardinalidad que toda la línea real. Esto le da una idea del "tamaño" de los números reales - "tamaño", ahora, entendido en términos funcionales nítidos - los números reales (y por lo tanto todos los intervalos abiertos) son tan enormes, en términos de la cantidad de puntos que contienen, que ni siquiera pueden ser enumerados indefinidamente.
  • Teorema de Baire dice que los números reales no se pueden escribir como la unión contable de conjuntos densos en ninguna parte. Olvídese de unir un conjunto finito de puntos para formar una línea continua. No puedes hacerlo ni siquiera con contablemente muchos, ese era el teorema de Cantor. Pero, de hecho, ni siquiera puede hacerlo con innumerables conjuntos magros contables (un subconjunto 'escaso' aquí significa que no tiene interior, como puede tener un intervalo, por ejemplo, un solo punto no tiene interior). Que es lo grandes que son los números reales, una fascinante revelación conceptual.
  • La Teorema del valor extremo y el Teorema del valor intermedio juntos dicen que las funciones continuas toman intervalos cerrados a intervalos cerrados. El EVT garantiza la puntos finales están en la imagen de la función, y el IVT garantiza la puntos interiores están en la imagen. Esto tiene valor práctico para aproximaciones numéricas, que discutiremos. Existe un concepto unificador que une estos teoremas: conectividad. Las funciones continuas llevan subconjuntos conectados a subconjuntos conectados.
  • La Teorema del valor medio es el caballo de batalla del cálculo. La derivada dicta, o determina, los valores de y de una función diferenciable en un intervalo abierto. Este teorema es invaluable, ya que te da la significado de cálculo: la derivada, que mide la tasa de crecimiento instantáneo local de una función, conduce la tasa de crecimiento global de la función. Este es el 'por qué' del cálculo: ¿Por qué necesitamos la derivada? Porque nos permite comprender el comportamiento cualitativo de funciones diferenciables. Siguen varios resultados inmediatos, que incluyen mejoramiento y Regla de L'Hospital, pero también, más tarde, el Teorema fundamental del cálculo.
  • Habiendo motivado la diferenciación, es hora de comprender que funciones poseer esta propiedad deseable. Al desglosar esta clase de funciones, haremos comparaciones rigurosas entre ella y varias otras clases: funciones continuas, k veces funciones continuamente diferenciables, funciones suaves, funciones analíticas (los representables por su serie de Taylor), y polinomios. El clímax es el Teorema de aproximación de Weierstrass, que dice que en intervalos cerrados (es decir, conjuntos compactos) incluso las funciones continuas pueden aproximarse mediante polinomios. Por tanto, el teorema de Taylor se supera en generalidad, si no en eficacia computacional. Sin embargo, hay muchas aplicaciones numéricas del resultado, que discutiremos.
  • Con respecto a la lista anterior de clases de funciones, a continuación debemos preguntar cómo se comporta cada clase con respecto a la convergencia (¡secuencias y series de funciones!). Y suponiendo convergencia, ¿Podemos diferenciar o integrar término por término? En otras palabras, ¿cuál es el topología de estas clases de funciones? Hacer límites de secuencias de funciones de cada clase permanecer en la clase (son las clases cerrado)? ¿Qué más se puede requerir para garantizar esto?

Día laborable METRO Tu W Th F
1 - 7/6 -

Tarea 1 (vence el viernes 7/10):
(Problemas calificados en rojo).
1.2.4, 1.2.6 (b), (d), 1.3.2 (c), 1.3.3 (a), 1.4.3, 1.5.4 (a) - (c), 1.5.9 (a) -(C)
1.2.2, 1.2.3, 1.2.5 (c), 1.2.7, 1.2.8, 1.2.9, 1.2.13, 1.3.3 (b), 1.3.6, 1.4.1, 1.4.4, 1.4.7, 1.4.8, 1.5.11

Tarea 2 (vence el miércoles 15 de julio):
(Problemas calificados en rojo).
2.2.2 (b), 2.2.6, 2.3.1 (b), 2.3.7 (a), (b), 2.3.8 (a), (b), 2.3.10 (a) - (d) , 2.4.3 (a), 2.4.5 (a), 2.5.4, 2.5.5, 2.6.2.
2.2.2 (a), 2.2.4 (a), (b), 2.3.3, 2.3.7 (c) - (e), 2.3.13 (a) - (e), 2.4.8 (a) - (c), 2.5.1 (a) - (c), 2.5.2 (a) - (c), 2.5.6, 2.5.7, 2.6.2 (a) - (d), 2.6.7.

Tarea 3 (hasta el 21 de julio):
(Problemas calificados en rojo).
2.7.2 (a) - (c), 2.7.4 (a), (c), (d), 2.7.5, 2.7.7 (a), 2.7.9
2.7.1, 2.7.3, 2.7.13, 2.7.14

Tarea 4 (hasta el jueves 30 de julio):
(Problemas calificados en rojo).
3.2.1 (b), 3.2.3 (a), (b), 3.2.4 (a), (b), 3.2.8, 3.2.14 (a), (b), (12) de la Clase 10 notas
3.2.6 (a), (b), 3.2.7 (a), (b), 3.2.9 (b), 3.2.10, 3.2.11 (a), (b), 3.2.13, De la conferencia 10 notas: (1) - (11), (20) - (24)

Tarea 5 (debe entregarse el jueves 5 de agosto):
3.3.1, 3.3.2 (a) - (d), 3.3.8, 3.3.12, 3.4.1, 3.4.5, 3.4.7, 3.4.9, 4.2.5, 4.2.7, 4.3.1 (b), 4.3.9, 4.3.11
3.3.3, 3.3.9, 3.3.11, 3.4.2, 3.4.8, 3.5.4, 3.5.5, 3.5.8-10, 4.2.6, 4.2.9-11, 4.3.3 (a) , 4.3.4, 4.3.10, 4.4.2 (a),

Tarea 6 (no debida):
4.4.1 (a) - (b), 4.4.11, 4.5.6 (a) - (b), 4.5.8, 5.2.6 (a) - (b), 5.2.6 (a) - (b ), 5.3.1 (a), 5.3.2
4.4.4 (a) - (c), 4.4.7, 4.4.9 (a) - (b), 4.5.5, 4.5.7, 5.2.1, 5.2.11 (a) - (b), 5.3 .5


7.1: Análisis dimensional - Matemáticas

Todos los artículos publicados por MDPI están disponibles inmediatamente en todo el mundo bajo una licencia de acceso abierto. No se requiere un permiso especial para reutilizar todo o parte del artículo publicado por MDPI, incluidas las figuras y tablas. Para los artículos publicados bajo una licencia Creative Common CC BY de acceso abierto, cualquier parte del artículo puede ser reutilizada sin permiso siempre que el artículo original esté claramente citado.

Los artículos de fondo representan la investigación más avanzada con un potencial significativo de alto impacto en el campo. Los artículos de fondo se envían por invitación individual o recomendación de los editores científicos y se someten a una revisión por pares antes de su publicación.

El artículo destacado puede ser un artículo de investigación original, un estudio de investigación novedoso y sustancial que a menudo implica varias técnicas o enfoques, o un artículo de revisión completo con actualizaciones concisas y precisas sobre los últimos avances en el campo que revisan sistemáticamente los avances científicos más interesantes. literatura. Este tipo de artículo proporciona una perspectiva sobre las futuras direcciones de la investigación o las posibles aplicaciones.

Los artículos de Editor's Choice se basan en las recomendaciones de los editores científicos de las revistas de MDPI de todo el mundo. Los editores seleccionan una pequeña cantidad de artículos publicados recientemente en la revista que creen que serán particularmente interesantes para los autores o importantes en este campo. El objetivo es proporcionar una instantánea de algunos de los trabajos más interesantes publicados en las diversas áreas de investigación de la revista.


La regularidad de las hipersuperficies que minimizan el área

10.4 Principio máximo

Para n ≥ 2, deja S1 y S2 ser (norte − 1)-corrientes rectificables dimensionales que minimizan el área en R norte , y deja que MI = spt SI. Suponga que M1 y M2 se cruzan en un punto a que, en alguna vecindad de a, M1 y M2 son subvariedades lisas y que M2 se encuentra a un lado de M1. Luego, en algún vecindario de a, M1 y M2 coincidir.

Observación. El principio máximo se aplica a las hipersuperficies que minimizan áreas singulares y de manera más general. De hecho, Ilmanen lo generaliza a hipersuperficies mínimas (variables integrales estacionarias, no necesariamente minimizadoras de áreas) cuyos conjuntos singulares tienen (norte - 3) medida de Hausdorff -dimensional 0. Solomon y White tratan las hipersuperficies estacionarias para integrandos elípticos uniformes y uniformes, al menos uno de los cuales es suave.

Prueba. A soy1 y METRO2 puede verse localmente como gráficos de funciones tu1 y tu2, satisfaciendo la ecuación de superficie mínima (6.2 (1)). Por un principio máximo estándar, debido esencialmente a Hopf [Satz 1 ′], las funciones tu1 y tu2 coincidir.

El siguiente lema de Simons proporcionó el ingrediente final del teorema de regularidad. En una observación que sigue a la demostración del teorema, discutimos su falla para norte ≥ 8. Este lema marca una aparición en solitario de geometría diferencial sin teoría de la medida.


7.4 Deconvolución del tipo de célula

Hay otro aspecto sobre cómo los datos espaciales y scRNA-seq se complementan entre sí. En técnicas basadas en matrices que no tienen resolución de una sola célula, la composición del tipo de célula de cada punto se puede estimar con datos de scRNA-seq. Quizás debido a la creciente popularidad de ST y Visium, el año pasado se desarrollaron varios métodos de deconvolución de tipo celular, que se clasifican en tres categorías: parte de otros paquetes, NMF y modelado estadístico. Si bien se puede utilizar cualquier herramienta diseñada para la deconvolución de tipo celular de datos de secuencia de ARN a granel, esta sección se centra específicamente en las herramientas de desconvolución de tipo celular diseñadas con datos espaciales en mente.

Tabla 7.4: Paquetes mencionados para la deconvolución de tipo celular
Nombre Idioma Título Fecha de publicación
NMFreg Python MATLAB Slide-seq: una tecnología escalable para medir la expresión de todo el genoma a alta resolución espacial 2019-03-29
Seurat3 R Integración completa de datos de celda única 2019-06-13
Tangram Pitón Aprendizaje profundo y alineación de transcriptomas completos resueltos espacialmente de células individuales en el cerebro del ratón con Tangram 2020-08-30
estereoscopio Pitón La transcriptómica unicelular y espacial permite la inferencia probabilística de la topografía del tipo de célula 2020-10-09
DSTG Pitón DSTG: Desconvolutión de datos de transcriptómica espacial a través de inteligencia artificial basada en gráficos 2021-01-22
Destacar R SPOTlight: Regresión NMF sembrada para deconvolucionar puntos transcriptómicos espaciales con transcriptomas unicelulares 2021-02-05
RCTD R Descomposición robusta de mezclas de tipos de células en transcriptómica espacial 2021-02-18
Giotto R Giotto, una tubería para el análisis integrador y la visualización de datos transcriptómicos espaciales unicelulares 2021-03-08

Algunos de los paquetes ya mencionados en secciones anteriores también tienen funcionalidades de deconvolución de tipo celular. Por ejemplo, la transferencia de datos de Seurat basada en anclajes entre conjuntos de datos también se puede utilizar para transferir anotaciones de tipo de celda, y el ad hoc La puntuación para los tipos de células transferidos se ha utilizado como una medida cualitativa de la composición del tipo de células en manchas Visium (Mantri et al. 2020). Giotto implementa 3 métodos para la deconvolución de tipo celular cualitativo: Primero, una puntuación basada en el cambio de veces en la expresión de genes marcadores en un punto en comparación con la media entre puntos. En segundo lugar, otra puntuación que puntúa los genes para la especificidad tanto en los tipos de células scRNA-seq como en las manchas ST o Visium y la suma de las 100 puntuaciones genéticas principales es la puntuación de enriquecimiento del tipo celular para cada mancha. Para estos dos métodos, los valores p se calculan a partir de pruebas de permutación. En tercer lugar, dado un conjunto fijo de genes marcadores de tipo celular, se usa una prueba hipergeométrica para probar el enriquecimiento de genes marcadores entre el 5% superior de genes expresados ​​de la mancha. En Tangram, la matriz de mapeo celular de scRNA-seq a ST o Visium se puede inferir ya que la densidad de células de verdad del suelo por punto se puede medir a partir de la tinción H & ampE. Cuando las células de scRNA-seq se mapean en puntos en ST y Visium, también se mapean las anotaciones del tipo de célula.

Tanto en la precuela como en la era actual, NMF es bastante popular entre los métodos de análisis de datos, ya que los factores (incrustaciones de células) y las cargas de genes tienden a exhibir estructuras de bloques y los valores de la base y las cargas se imponen para que no sean negativos. correspondiente a la naturaleza no negativa de los datos de expresión génica y haciendo que los resultados sean más interpretables. Los bloqueos en los factores pueden reflejar tipos de células o agrupaciones, y los bloqueos en las cargas de genes pueden reflejar genes marcadores de tipo celular. También se ha utilizado NMF para la deconvolución de tipo celular. Para abordar la falta de resolución de una sola célula y la baja eficiencia de slide-seq (versión 1), se desarrolló NMFreg para reconstruir el perfil de expresión de cada punto como una suma ponderada de firmas de tipo celular de scRNA-seq (Rodriques et al. 2019) . Primero, la matriz de recuento de genes scRNA-seq de los tipos de células de interés y las anotaciones de tipos de células se descompone con NMF, y cada factor se asigna a un tipo de célula y un tipo de célula puede tener múltiples factores. Luego, se utilizan mínimos cuadrados no negativos para calcular los pesos de la suma ponderada de los factores para cada lugar. Como tales pesos tienden a no asignar claramente puntos a los tipos de células, quizás debido a la escasez de datos de scRNA-seq y slide-seq, los pesos se establecen en umbrales. El umbral es la carga celular máxima de las celdas no asignadas al tipo de celda de interés entre los factores de este tipo de celda. Los pesos para este tipo de celda solo se mantienen si la norma (l_2 ) del vector de peso para estos factores excede el umbral. Otro método basado en NMF, SPOTlight (Elosua et al. 2020), utiliza un principio muy similar.

La deconvolución del tipo celular también se puede realizar modelando explícitamente la expresión génica a nivel local en términos de tipos de células individuales. En el estereoscopio (Andersson et al.2019), se ajusta una distribución binomial negativa a la expresión de cada gen en cada tipo de célula en los datos de scRNA-seq. Luego, en cada punto, la expresión génica se modela como una suma ponderada de las distribuciones binomiales negativas de cada tipo de célula, y los pesos se estiman mediante la estimación de máxima verosimilitud (MLE). En Robust Cell Type Decomposition (RCTD) (Cable et al. 2020), la expresión génica en cada punto se modela como una distribución de Poisson, cuya media es una tasa esperada escalada por el recuento total de transcripciones en el punto. La tasa logarítmica es la suma del logaritmo de la suma ponderada de la expresión génica media para cada tipo de célula de una referencia de scRNA-seq, un término de efecto específico de punto fijo, un efecto aleatorio de plataforma específica de gen y otro término de efecto aleatorio específico de gen para la sobredispersión . Los parámetros, incluidos los pesos de los tipos de células, se estiman luego con MLE.

Más recientemente, la red neuronal convolucional gráfica (GCN) se ha aplicado a la deconvolución de tipo celular, en DSTG (Su y Song 2020). Primero, las células scRNA-seq se asignan aleatoriamente a "puntos" de 2 a 8 células, formando un conjunto de datos pseudo-ST.Luego, los datos pseudo-ST y ST real se proyectan a un espacio CCA, y se construye un gráfico vecino más cercano mutuo (k ) en este espacio. Después de eso, tanto los datos de ST pseudo y reales como el gráfico se introducen en un GCN, entrenado para minimizar la entropía cruzada entre la composición celular imputada y la composición celular real en los puntos pseudo-ST. Finalmente, el modelo entrenado se utiliza para predecir la composición celular en datos ST reales.


Burcu Gürbüz

(2019) J. Paez Chavez, B. Gürbüz, C.M. A. Pinto, El efecto de la quimioterapia agresiva en un modelo para la dinámica del cáncer de VIH / SIDA, Commun Nonlinear Sci Numer Simul, (75) 109--120, DOI: 10.1016 / j.cnsns.2019.03.021.

(2018) M. Çetin, B. Gürbüz, M. Sezer, método de colocación de Lucas para el sistema de ecuaciones diferenciales funcionales lineales de alto orden, J Sci Arts, 4 (45) 891-910.

(2018) E. Gökmen, B. Gürbüz, M. Sezer, Una técnica numérica para resolver ecuaciones integro-diferenciales funcionales con límites variables, Comput Appl Math, 1-15, DOI: 10.1007 / s40314-018-0653-z.

(2018) B. Gürbüz, M. Sezer, Método de colocación de Laguerre modificado para resolver problemas de difusión-convección parabólica unidimensionales, Math Meth Appl Sci, 41, 8481--8487, DOI: 10.1002 / mma.4721.

(2017) B. Gürbüz, M. Sezer, Un nuevo método computacional basado en polinomios de Laguerre para resolver ciertas ecuaciones diferenciales integro parciales no lineales, Acta Phys Pol A, 132 (3) 561--563, DOI: 10.12693 / APhysPolA.132.561.

(2017) B. Gürbüz, M. Sezer, Soluciones polinomiales de Laguerre de una clase de ecuaciones diferenciales funcionales parciales de retardo, Acta Phys Pol A, 132 (3) 558--560, DOI: 10.12693 / APhysPolA.132.558.

(2017) B. Gürbüz, M. Sezer, Enfoque polinomial de Laguerre para resolver ecuaciones no lineales de Klein-Gordon, Malasia J Math Sci, 11 (2) 191-203.

(2017) B. Gürbüz, M. Sezer, Soluciones numéricas de problemas de convección-difusión parabólica unidimensionales que surgen en biología por el método de colocación de Laguerre, BIOMATH, 6 (1) 1--5 1706047, DOI: 10.11145 / j.biomath .2017.06.047.

(2017) B. Gürbüz, M. Sezer, Una solución numérica de ecuaciones integro-diferenciales parciales de Volterra de tipo parabólico por el método de colocación de Laguerre, Int J Appl Phys Math, 7 (1) 49--58, DOI: 10.17706 / ijapm. 2017.7.1.49-58.

(2016) B. Gürbüz, M. Sezer, Un algoritmo numérico híbrido con estimación de error para una clase de ecuaciones integro-diferenciales funcionales, Gazi Uni J Sci, 29 (2) 419-434.

(2016) B. Gürbüz, M. Sezer, Soluciones polinomiales de Laguerre de una clase de problemas de valores iniciales y de frontera que surgen en los campos de la ciencia y la ingeniería, Acta Phys Pol A, 129 (1) 194-197, DOI: 10.12693 / APhysPolA. 130.194.

(2016) B. Türkyılmaz, B. Gürbüz, M. Sezer, Método polinomial de Morgan-Voyce para la solución de ecuaciones en diferencias diferenciales lineales de orden alto con estimación de error residual, Düzce Uni J Sci Tech, 4252-263.

(2015) B. Aslan Bülbül, B. Gürbüz, M. Sezer, Un método de colocación de matrices de Taylor basado en el error residual para resolver ecuaciones diferenciales de tipo Lane-Emden, New Trends Math Sci, 3 (2) 219-224.

(2015) B. Aslan Bülbül, B. Gürbüz, M. Sezer, Un nuevo método de colocación para la solución de ecuaciones en diferencias integro-diferenciales lineales mixtas, New Trends Math Sci, 3 (2) 133--146.

(2014) B. Gürbüz, M. Sezer, C. Güler, Método de colocación de Laguerre para resolver ecuaciones integro-diferenciales de Fredholm con argumentos funcionales, J Appl Math, 2014, DOI: 10.1155 / 2014/682398.

(2014) B. Gürbüz, M. Sezer, Enfoque polinomial de Laguerre para resolver ecuaciones diferenciales funcionales de tipo Lane-Emden, Appl Math Comput, 242, 255--264, DOI: 10.1016 / j.amc.2014.05.058.

(2011) B. Gürbüz, M. Gülsu, M. Sezer, Enfoque numérico de ecuaciones de diferencia de retardo lineal de orden superior con coeficientes variables en términos de polinomios de Laguerre, Math Comput Appl, 16 (1) 267-278.

(2011) M. Gülsu, B. Gürbüz, Y. Öztürk, M. Sezer, Enfoque polinomial de Laguerre para resolver ecuaciones de diferencia de retardo lineal, Appl Math Comput, 217, 676--6776, DOI: 10.1016 / j.amc.2011.01. 112.

(2011) B. Gürbüz, M. Gülsu, M. Sezer, Diferansiyel fark denklemlerinin Laguerre sıralama yöntemi ile nümerik çözümleri, Erciyes Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 27 (1) 75-87.


Análisis dimensional. O: ¿por qué el cielo es azul?

"¿Porque el cielo es azul?" es una de esas preguntas canónicas para niños pequeños que es una abreviatura de "humano diminuto curioso que confunde a sus adultos". Si bien es posible que un adulto promedio no sepa por qué el cielo es azul en la parte superior de su cabeza, este es el futuro, e Internet tiene muchas explicaciones útiles de las muy interesantes razones detrás de esto.

Sin embargo, una cosa que siempre me molesta acerca de las explicaciones es que tienen que analizar una de las piezas más importantes (a saber, por qué la luz de alta frecuencia se dispersa más que la luz de frecuencia corta. Si eso no tiene sentido para usted, no lo haga). No te preocupes, lo cubriré en breve). Pasar por alto por qué sucede esto significa que la respuesta a "¿por qué el cielo es azul?" solo causará otro ¿Por qué? pregunta. Por supuesto, estoy informado de manera confiable de que los niños que están en las profundidades de las preguntas sobre por qué seguirán haciendo esto de todos modos, pero algunos de nosotros nunca lo superamos y nos convertimos en científicos.

De todos modos, pensé que sería interesante explorar el ¿Por qué? que el cielo azul se eleva, especialmente porque una forma de ver la respuesta llega a una herramienta muy importante en el juego de herramientas del teórico: el análisis dimensional. Hablar de esto sin duda suscitará muchos más ¿Por qué ?, pero eso es lo más divertido de la física: siempre hay otro por qué.

Bien, primero repasemos la respuesta a la pregunta "¿Por qué el cielo es azul?" que encontrará si lo escribe en el google omnisciente. Señalaré la parte que, para mí, pide más explicación.

Durante el día, el cielo (sin nubes) es azul. ¿Cómo puede ser esto? Después de todo, si no estás mirando al Sol y quemando tus retinas, cuando miras al cielo, no estás mirando nada más que el aire vacío. No hay nada allá arriba que refleje o emita luz: no hay una fuente de fotones que golpee tu ojo cuando miras al cielo vacío.

La prueba de esto es simple. Ve a mirar el cielo por la noche, y sí, nada allí arriba excepto lunas, planetas y estrellas, ninguno de los cuales es lo suficientemente brillante como para iluminar el cielo de manera significativa.

Está bien, pero definitivamente estamos viendo algo cuando miramos el espacio vacío: estamos viendo una luz azul. ¿De dónde viene? La única fuente lo suficientemente brillante es el Sol, y sabemos que cuando el Sol se pone, la iluminación del cielo azul lo acompaña. Entonces, la luz que estamos viendo desde el cielo azul se origina en el Sol y de alguna manera está siendo redirigida para golpear nuestros ojos.

Entonces, lo que debe estar sucediendo es que la luz del Sol que atraviesa la atmósfera, la luz que va en la dirección incorrecta para golpear tus ojos, está siendo disperso por el aire. Esa luz dispersa viaja en todas direcciones, algunas de las cuales golpean su ojo, lo que le permite ver la luz que aparentemente se origina en el "aire", un lugar que no tiene una fuente intrínseca de fotones.

Espectro de luz visible, relacionando el color percibido con la longitud de onda en nanómetros. (Imagen de Wikipedia)

Ahora, aquí es donde suele entrar la batea. Para que el cielo parezca azul, debe aceptar el siguiente hecho: la luz de mayor frecuencia (longitud de onda más corta) se dispersa más en la atmósfera que la luz de baja frecuencia (longitud de onda larga).

He incluido una imagen del espectro visible aquí. La luz de longitud de onda larga, la luz donde la distancia entre los "picos" de la onda electromagnética es relativamente grande, corresponde a una frecuencia baja y una energía más baja, y nuestros ojos la perciben como colores más rojos. El rojo tiene aproximadamente 650 nm (650 mil millonésimas de metro) o aproximadamente 2 "electronvoltios" (eV) de energía. Las longitudes de onda cortas son de mayor energía y son colores más azules. El violeta a una longitud de onda de 400 nm es de aproximadamente 3 eV. El factor de conversión es $ E_ gamma = frac < lambda> = frac <1240

mbox> < lambda>, $ donde $ h $ es la constante de Planck, $ c $ es la velocidad de la luz y $ lambda $ es la longitud de onda de la luz.

Entonces, la luz azul se dispersa en el aire más que la luz roja. Si acepta eso, entonces el cielo azul tiene sentido. El Sol en sí es prácticamente luz blanca: una mezcla aproximadamente uniforme de todas las longitudes de onda. Dado que la luz azul se dispersa más que la luz roja, cuando el Sol está alto en el cielo y miras un punto aleatorio en el cielo (no directamente al Sol), entonces la luz que golpea tu ojo tiene más fotones azules. que los fotones rojos, porque el aire redirige más luz azul.

Cuando el sol se pone o sale, y miras en la dirección del sol, el cielo está rojo. Esto se debe a que está viendo que la luz viaja a través de más aire (no solo tiene que viajar desde el espacio hasta la superficie, sino también de lado a lo largo del horizonte). Más de los fotones azules se han dispersado debido al mayor tiempo de viaje que las personas sobre el horizonte que miran hacia el cielo ven tu azul perdido, dejando solo esos hermosos rojos, naranjas y amarillos.

Por otro lado, la luz solar en sí es casi blanca, debido a la temperatura de la superficie del Sol. No me queda claro por qué lo vemos intrínsecamente como amarillo. Tal vez sea porque no podemos mirar directamente al Sol cuando está alto en el cielo (cuando la luz solar directa se dispersa menos), y solo cuando está bajo en el cielo (cuando se dispersa más azul, dejando amarillos, naranjas y rojos). Tal vez sea un problema de procesamiento mental donde el blanco sobre azul se ve amarillento. Tal vez haya suficiente azul disperso para que veamos el resto como amarillo / rojo. Esto plantea una pregunta interesante (y digna de una publicación de blog totalmente separada) sobre cómo percibimos el color. En resumen, está el color intrínseco de la luz: la longitud de onda. Luego está la forma en que esos diferentes paquetes de energía interactúan con el complejo sistema químico de nuestros ojos para enviar señales a nuestro cerebro. Luego está cómo nuestro cerebro procesa esas señales para ver el "color". En esta publicación, estoy hablando solo del primer tipo de color, que en realidad es solo longitud de onda o energía roja es solo luz a alrededor de 600 nm, que es solo la primera parte de un largo proceso que nos dice si vemos esa luz como "rojo."

Flash verde al atardecer. Imagen de Brocken Inaglory, vía wikipedia.

Como otro aparte, ¿qué pasa con la luz verde del sol? El cielo diurno es azul, el amanecer y el crepúsculo de amarillo a naranja. ¿Dónde está nuestro verde? Bueno, aparentemente debido a esos complicados problemas de procesamiento químico y neurológico, no es posible ver objetos que brillan debido a su temperatura como "verdes". Entonces, incluso si estuviéramos alrededor de una estrella más fría que nuestro Sol, una estrella que emite luz principalmente en las longitudes de onda verdes, nuestros ojos no la verían como verde, los procesos químicos en nuestros bastones y conos captarían demasiadas otras longitudes de onda. y no nos parecería verde. Esto es algo extraño, ya que a medida que los animales evolucionaron en un planeta lleno de follaje verde, en realidad somos increíblemente buenos para seleccionar diferentes tonos de verde, pero ahí está. No hay estrellas verdes, debido a la forma en que funciona nuestro ojo y cómo funcionan las cosas que brillan por su propio calor.

Sin embargo, si las condiciones atmosféricas son las adecuadas, al atardecer se puede ver ocasionalmente el "destello verde", un breve momento en el que todos los demás colores del Sol pueden dispersarse o refractarse, y solo se ve el verde. Requiere que la temperatura y la calidad del aire sean las adecuadas, y es muy poco común. Nunca lo he visto.

Entonces esa historia tiene mucho sentido, ¿verdad? El cielo es azul por un simple hecho: la luz azul se dispersa más que la roja. Lo único que puede ver cuando mira hacia arriba durante el día es luz dispersa, por lo que ve más azul que rojo. Por tanto, el cielo es azul.

Pero espera, ¿por qué? ¿Por qué el azul se dispersa más que el rojo? ¿Por qué no al revés? ¿O por qué una longitud de onda se dispersa más que la otra, no se pueden dispersar todas de manera uniforme? Todo lo que he hecho es reemplazar un problema por otro.

A lo que digo, bienvenido a la ciencia.

Así que ahora quiero intentar explicar un poco por qué las moléculas de aire dispersan más luz azul que roja. Algunos de los conceptos son engañosos, y resulta que abarcan muchas áreas diferentes de la física de partículas, y la explicación probablemente no tenga mucho sentido para el niño curioso que pregunta "¿Por qué?" Sin embargo, es un buen ejemplo de cómo pensar en la física de partículas, por lo que tal vez algún pequeño rincón de Internet lo encuentre interesante y útil.

Primero, permítanme volver a algo que arrojé antes sin muchos comentarios: el hecho de que las altas energías corresponden a pequeñas distancias y viceversa. El hecho de que pueda convertir libremente entre longitud y energía (inversa) es posible gracias a las constantes de la naturaleza, la constante de Planck y la velocidad de la luz, en particular. Esto puede parecer una cosa realmente arbitraria, después de todo, en nuestro mundo macroscópico las cosas con mucha energía tienden a ser grandes. Pero a nivel de partículas, cuanta más energía se empaqueta en una partícula, la menor podemos pensar en esa partícula como ser. Por eso a veces llamamos al Gran Colisionador de Hadrones "el mejor microscopio del mundo". Empaqueta mucha energía en partículas, por lo que "ve" distancias muy pequeñas.

Esta conexión entre energía y distancia es increíblemente importante en física. Probablemente sea lo más importante para comprender en toda esta publicación, así que incluso lo pondré en negrita: en física de partículas las energías altas corresponden a distancias pequeñas y tiempos cortos y viceversa. Una vez que haya estado haciendo física teórica por un tiempo, de hecho, comenzará a pensar en todas las cantidades dimensionales en términos de unidades de energía y dejará de pensar en términos de longitud o tiempo. Para mí, la energía tiene dimensión 1 (esa dimensión: energía, generalmente en unidades de "giga-electronvoltios" o GeV, ya que trabajo mucho en la física del LHC). Una distancia es una longitud y también lo es la dimensión -1 (energía inversa). Una temperatura es energía, dimensión 1. Un intervalo de tiempo es como una longitud (convierto entre los dos preguntando "qué distancia viajaría la luz en este tiempo", con lo que todos están de acuerdo debido a la relatividad. Gracias Einstein), así que el tiempo tiene dimensión -1. Y así.

Bien, entonces la luz de mayor energía corresponde a distancias más pequeñas. ¿Lo que de ella?

Bueno, pregúntese ahora cómo interactúa la luz con los objetos del mundo que nos rodea. La luz es una onda de radiación electromagnética. Si mueve una carga eléctrica, los campos eléctricos y magnéticos cercanos a la carga se alteran. Esta perturbación es autosostenida y se propaga por el espacio, como si perturbaras la superficie del agua. Es decir, mover una carga eléctrica te da una onda electromagnética, a la que llamamos luz.

Cuando esa luz golpea otra carga eléctrica, hace que esa carga se mueva, lo que puede permitir que la luz sea absorbida y reradiada. Esto es lo que hace que la luz sea dispersada o reflejada por los materiales: el movimiento de los electrones cargados en los átomos.

Pero las moléculas de aire, como la mayoría de los materiales que nos rodean, son eléctricamente neutrales. Entonces, para que la luz sea dispersada por el aire, la onda electromagnética debe "ver" que no hay un átomo neutro de oxígeno o nitrógeno, pero que realmente hay un montón de electrones cargados separados del núcleo cargado. Es decir, la luz tiene que poder resolver pequeñas distancias. Y eso requiere, lo has adivinado, altas energías (donde "alto" significa aquí suficiente energía para que la longitud de onda de la luz sea al menos vagamente comparable a las distancias dentro de moléculas y átomos).

Entonces eso nos da una pista: los fotones de mayor energía (luz más azul) tienen una longitud de onda más pequeña, por lo que pueden "ver" mejor que los átomos de aire que atraviesan son en realidad un montón de pequeñas cargas separadas en comparación con los átomos como "se ve" "por luz roja de baja energía y longitud de onda larga. Y esto tiene más sentido cuando se piensa en luz de longitud de onda realmente larga, como las ondas de radio, que tienen longitudes de onda de un metro o más. Puede obtener ondas de radio dentro de su casa, pasando directamente a través de una pared que la luz visible no puede, porque la onda de radio es demasiado grande y de energía demasiado baja para ver la pequeña separación entre las cargas en los átomos de la pared que la luz visible puede hacer.

Ahora vayamos un poco más profundo. Mencioné en una publicación anterior que a los físicos les gusta pensar en los tamaños de los objetos en términos de "secciones transversales". Así que podemos intentar pensar en el "tamaño" de las moléculas de aire vistas por la luz visible en términos del "área" (la sección transversal, o $ sigma $ que tiene cada molécula de aire con respecto a la luz. Más grande $ sigma $ significa que el aire es "más fácil" para que la luz interactúe, por lo que la luz se dispersaría más.

Ahora, una sección transversal es un área. Un área es la longitud al cuadrado. Entonces, según mis reglas sobre longitud y energía, esto significa que $ sigma $ tiene dimensión -2: necesita depender de $ 1 / mbox^ 2 $ por algo de energía. Este tipo de proceso de pensamiento, por cierto, se llama "análisis dimensional". Es realmente útil tener una idea de lo que podría ser importante en un problema de física.

Entonces, necesito algo de energía para obtener una sección transversal. ¿Qué energía? Bueno, mi primera suposición podría ser la energía del fotón. Después de todo, todo lo que tengo es una molécula de aire y un fotón que la golpea. No hay muchas cosas para elegir. Entonces, mi primera suposición sobre el tamaño de una molécula para interactuar con la luz podría ser:

Pero pensemos un poco más en esto. Esta suposición diría que a medida que mi energía fotónica se hace más pequeña, la sección transversal debería hacerse cada vez más grande. Pero eso no se corresponde con lo que nos dice nuestra intuición física, que es que los fotones de energía realmente baja no pueden ver los átomos "dentro" para mover las cargas. Entonces $ sigma $ debería depender de las potencias positivas de $ E _ < rm photon> $, no de las negativas.

Intentemos de nuevo. Hay otra escala en el problema además de la energía del tamaño del átomo o molécula. Podría caracterizar esto como una longitud, pero déjeme llamarlo energía en su lugar: la energía característica de los electrones dentro de la molécula de aire. Voy a llamar a esto $ Lambda $. No tengo idea de qué es $ Lambda $ en este momento, el análisis dimensional no nos dirá esa información, pero nos permitirá seguir adelante.

Con esto, una segunda estimación del tamaño del aire visto por la luz podría ser

pero sabemos que eso no es correcto, ya que predice que todos los fotones ven el mismo tamaño de aire, y sabemos que los fotones de baja energía no deberían interactuar con el aire en absoluto. Entonces, combinando nuestro análisis dimensional con nuestra nueva comprensión de la relación entre energía y tamaño, podemos decir que

Nuestro análisis dimensional no nos dirá sólo a partir de este nivel de consideración cuál debería ser ese valor de $ n $.

Resulta que la respuesta correcta es

Por qué es el cuarto poder de la energía es otra madriguera de conejo que con suerte bajaré más tarde (hay una buena explicación en términos de operadores efectivos que he visto por Iain Stewart). Sin embargo, las ideas clave están todas aquí: tenemos una cuestión de física. Solo puede depender de unos pocos parámetros clave (tamaño del átomo o molécula, energía del fotón). Lo que quiero calcular tiene una dimensionalidad particular, en este caso es un área, por lo que es -2 unidades de algo de energía. Combinar eso con algo de intuición sobre cuál debe ser la respuesta en límites particulares de la energía del fotón nos da una idea general de cómo la dependencia de la respuesta debe depender de las cantidades disponibles. Todo el resto del cálculo detallado "solo" nos dará las constantes de proporcionalidad para convertir entre algo que "depende de" cantidades (representado por el símbolo $ propto $) a algo que es igual a ($ = $) alguna colección de cantidades y constantes de la naturaleza. Eso es mucho trabajo que está haciendo ese "solo" allí, y puede parecer que continúo con la gran tradición de seguir adelante con el problema difícil, y de alguna manera lo estoy haciendo.

Pero esta idea de análisis dimensional es realmente útil, y espero haber dado una demostración interesante de por qué.


Objetos geométricos¶

Los objetos geométricos se crean de la manera típica de Python, utilizando las propias clases como fábricas de instancias. Algunas de sus propiedades intrínsecas se discutirán en esta sección, otras en las siguientes secciones sobre operaciones y serializaciones.

Las instancias de Point, LineString y LinearRing tienen como atributo más importante una secuencia finita de coordenadas que determina sus conjuntos de puntos interiores, límites y exteriores. Una cadena de líneas se puede determinar con tan solo 2 puntos, pero contiene un número infinito de puntos. Las secuencias de coordenadas son inmutables. Se puede utilizar un tercer valor de coordenada z al construir instancias, pero no tiene ningún efecto sobre el análisis geométrico. Todas las operaciones se realizan en el plano x-y.

En todos los constructores, los valores numéricos se convierten al tipo float. En otras palabras, Point (0, 0) y Point (0.0, 0.0) producen instancias geométricamente equivalentes. Shapely no comprueba la simplicidad topológica o la validez de las instancias cuando se construyen, ya que el costo es injustificado en la mayoría de los casos. Las fábricas de validación se implementan fácilmente mediante el predicado: attr: is_valid por parte de los usuarios que las requieren.

Shapely es una biblioteca de geometría plana y z, la altura por encima o por debajo del plano, se ignora en el análisis geométrico. Aquí existe un peligro potencial para los usuarios: las tuplas de coordenadas que difieren solo en z no se distinguen entre sí y su aplicación puede resultar en objetos geométricos sorprendentemente no válidos. Por ejemplo, LineString ([(0, 0, 0), (0, 0, 1)]) no devuelve una línea vertical de longitud unitaria, sino una línea no válida en el plano con longitud cero. Del mismo modo, el polígono ([(0, 0, 0), (0, 0, 1), (1, 1, 1)]) no está delimitado por un anillo cerrado y no es válido.

Atributos y métodos generales¶

Devuelve el área (flotante) del objeto.

Devuelve una tupla (valores flotantes) (minx, miny, maxx, maxy) que delimita el objeto.

Devuelve la longitud (flotante) del objeto.

Devuelve la distancia más pequeña por la que se podría mover un nodo para producir una geometría no válida.

Esto se puede considerar como una medida de la robustez de una geometría, donde valores más grandes de juego mínimo indican una geometría más robusta. Si no existe un espacio libre mínimo para una geometría, como un punto, esto devolverá math.infinity.

Requiere GEOS 3.6 o superior.

Devuelve una cadena que especifica el tipo de geometría del objeto de acuerdo con 1.

Devuelve la distancia mínima (flotante) al otro objeto geométrico.

Devuelve la distancia de Hausdorff (flotante) al otro objeto geométrico. La distancia de Hausdorff entre dos geometrías es la distancia más lejana que un punto en cualquier geometría puede estar desde el punto más cercano a él en la otra geometría.

Devuelve un punto calculado de forma económica que se garantiza que está dentro del objeto geométrico.

En general, esto no es lo mismo que el centroide.

Puntos¶

El constructor de puntos toma valores de coordenadas posicionales o parámetros de tuplas de puntos.

Un punto tiene área cero y longitud cero.

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Se accede a los valores de coordenadas a través de las propiedades de coords, x, y, z.

Las coordenadas también se pueden cortar. Nuevo en la versión 1.2.14.

El constructor de Point también acepta otra instancia de Point, haciendo así una copia.

LineStrings¶

El constructor LineString toma una secuencia ordenada de 2 o más tuplas de puntos (x, y [, z]).

El objeto LineString construido representa una o más splines lineales conectadas entre los puntos. Se permiten puntos repetidos en la secuencia ordenada, pero pueden incurrir en penalizaciones de rendimiento y deben evitarse. Un LineString puede cruzarse (es decir. ser complejo y no simple).

Figura 1. Un LineString simple a la izquierda, un LineString complejo a la derecha. El límite (multipunto) de cada uno se muestra en negro, los otros puntos que describen las líneas se muestran en gris.

Un LineString tiene un área cero y una longitud distinta de cero.

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Se accede a los valores de coordenadas que definen a través de la propiedad coords.

Las coordenadas también se pueden cortar. Nuevo en la versión 1.2.14.

El constructor también acepta otra instancia de LineString, haciendo así una copia.

Un LineString también se puede construir usando una secuencia de instancias de Point mixtas o tuplas de coordenadas. Las coordenadas individuales se copian en el nuevo objeto.

LinearRings¶

El constructor LinearRing toma una secuencia ordenada de (x, y [, z]) tuplas de puntos.

La secuencia puede cerrarse explícitamente pasando valores idénticos en el primer y último índice. De lo contrario, la secuencia se cerrará implícitamente copiando la primera tupla al último índice. Al igual que con LineString, se permiten puntos repetidos en la secuencia ordenada, pero pueden incurrir en penalizaciones de rendimiento y deben evitarse. Un LinearRing no puede cruzarse ni tocarse en un solo punto.

Figura 2. Un LinearRing válido a la izquierda, un LinearRing que se toca por sí mismo no válido a la derecha. Los puntos que describen los anillos se muestran en gris. El límite de un anillo está vacío.

Shapely no impedirá la creación de tales anillos, pero se generarán excepciones cuando se operen.

Un LinearRing tiene un área cero y una longitud distinta de cero.

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Se accede a la definición de valores de coordenadas a través de la propiedad coords.

El constructor LinearRing también acepta otra instancia de LineString o LinearRing, haciendo así una copia.

Al igual que con LineString, una secuencia de instancias de Point no es un parámetro de constructor válido.

Polígonos¶

El constructor de polígono toma dos parámetros posicionales. La primera es una secuencia ordenada de (x, y [, z]) tuplas de puntos y se trata exactamente como en el caso LinearRing. El segundo es una secuencia opcional desordenada de secuencias en forma de anillo que especifican los límites interiores o "huecos" de la característica.

Los anillos de un polígono válido no pueden cruzarse entre sí, pero pueden tocarse en un solo punto. Una vez más, Shapely no evitará la creación de características no válidas, pero se generarán excepciones cuando se operen.

Figura 3. A la izquierda, un Polígono válido con un anillo interior que toca el anillo exterior en un punto, ya la derecha un Polígono que no es válido porque su anillo interior toca el anillo exterior en más de un punto. Los puntos que describen los anillos se muestran en gris.

Figura 4. A la izquierda, un Polígono que no es válido porque sus anillos exterior e interior se tocan a lo largo de una línea, ya la derecha, un Polígono que no es válido porque sus anillos interiores se tocan a lo largo de una línea.

Un polígono tiene un área distinta de cero y una longitud distinta de cero.

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Se accede a los anillos de componentes a través de propiedades exteriores e interiores.

El constructor Polygon también acepta instancias de LineString y LinearRing.

Los polígonos rectangulares ocurren comúnmente y se pueden construir convenientemente usando la función shapely.geometry.box ().

bien formada geometría. caja ( marta , miny , maxx , maxy , ccw = Verdadero ) ¶

Crea un polígono rectangular a partir de los valores del cuadro delimitador proporcionados, con orden en sentido antihorario de forma predeterminada.

Esta es la primera aparición de una mano explícita de polígonos en Shapely.

Para obtener un polígono con una orientación conocida, use shapely.geometry.polygon.orient ():

polígono.geometría.conformada. orientar polígono , signo = 1.0 ) ¶

Devuelve una copia correctamente orientada del polígono dado. El área firmada del resultado tendrá el signo dado. Un signo de 1.0 significa que las coordenadas del anillo exterior del producto estarán orientadas en sentido antihorario.

Colecciones¶

Las colecciones heterogéneas de objetos geométricos pueden resultar de algunas operaciones de Shapely. Por ejemplo, dos LineStrings pueden cruzarse a lo largo de una línea y en un punto. Para representar este tipo de resultados, Shapely proporciona colecciones inmutables de objetos geométricos similares a conjuntos congelados. Las colecciones pueden ser homogéneas (MultiPoint, etc.) o heterogéneas.

Figura 5. a) una línea verde y una amarilla que se cruzan a lo largo de una línea y en un solo punto b) la intersección (en azul) es una colección que contiene una LineString y un Point.

Se accede a los miembros de una GeometryCollection a través de la propiedad geoms o mediante el protocolo de iterador usando in o list ().

Las colecciones también se pueden cortar.

Cuando sea posible, es mejor utilizar uno de los tipos de colección homogéneos que se describen a continuación.

Colecciones de puntos¶

El constructor MultiPoint toma una secuencia de tuplas de puntos (x, y [, z]).

Un MultiPoint tiene área cero y longitud cero.

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Se accede a los miembros de una colección multipunto a través de la propiedad geoms o mediante el protocolo de iterador usando in o list ().

El constructor también acepta otra instancia de MultiPoint o una secuencia desordenada de instancias de Point, haciendo así copias.

Colecciones de líneas¶

El constructor MultiLineString toma una secuencia de secuencias u objetos similares a líneas.

Figura 6. A la izquierda, un MultiLineString simple desconectado, y a la derecha, un MultiLineString no simple. Los puntos que definen los objetos se muestran en gris, los límites de los objetos en negro.

Un MultiLineString tiene un área cero y una longitud distinta de cero.

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Sus miembros son instancias de LineString y se accede a ellos a través de la propiedad geoms o mediante el protocolo iterador usando in o list ().

El constructor también acepta otra instancia de MultiLineString o una secuencia desordenada de instancias de LineString, haciendo así copias.

Colecciones de polígonos¶

El constructor MultiPolygon toma una secuencia de tuplas de lista de agujeros y anillos exteriores: [((a1,…, aM), [(b1,…, bN),…]),…].

Más claramente, el constructor también acepta una secuencia desordenada de instancias de Polygon, haciendo así copias.

Figura 7. A la izquierda, un MultiPolygon válido con 2 miembros, ya la derecha, un MultiPolygon que no es válido porque sus miembros tocan en un número infinito de puntos (a lo largo de una línea).

Su cuadro delimitador x-y es una tupla (minx, miny, maxx, maxy).

Sus miembros son instancias de Polygon y se accede a ellos a través de la propiedad geoms o mediante el protocolo de iterador usando in o list ().

Funciones vacías¶

Una característica “vacía” es aquella con un conjunto de puntos que coincide con el conjunto vacío, no Ninguno, sino como el conjunto ([]). Se pueden crear características vacías llamando a los distintos constructores sin argumentos. Casi ninguna operación es compatible con características vacías.

Se pueden establecer las coordenadas de una entidad vacía, después de lo cual la geometría ya no está vacía.

Secuencias de coordenadas¶

La lista de coordenadas que describen una geometría se representa como el objeto CoordinateSequence. Estas secuencias no deben inicializarse directamente, pero se puede acceder a ellas desde una geometría existente como la propiedad Geometry.coords.

Las secuencias de coordenadas se pueden indexar, dividir e iterar como si fueran una lista de tuplas de coordenadas.

Los polígonos tienen una secuencia de coordenadas para su exterior y cada uno de sus anillos interiores.

Las geometrías multiparte no tienen una secuencia de coordenadas. En cambio, las secuencias de coordenadas se almacenan en las geometrías de sus componentes.

Métodos de referencia lineal¶

Puede ser útil especificar la posición a lo largo de entidades lineales como LineStrings y MultiLineStrings con un sistema de referencia unidimensional. Shapely admite referencias lineales basadas en la longitud o la distancia, evaluando la distancia a lo largo de un objeto geométrico hasta la proyección de un punto dado, o el punto a una distancia dada a lo largo del objeto.

Los métodos de referencia lineal requieren GEOS 3.2.0 o posterior.

Devuelve un punto a la distancia especificada a lo largo de un objeto geométrico lineal.

Si el argumento normalizado es Verdadero, la distancia se interpretará como una fracción de la longitud del objeto geométrico.

Devuelve la distancia a lo largo de este objeto geométrico hasta un punto más cercano al otro objeto.

Si el argumento normalizado es Verdadero, devuelve la distancia normalizada a la longitud del objeto. El método project () es el inverso de interpolate ().

Por ejemplo, los métodos de referencia lineal se pueden utilizar para cortar líneas a una distancia específica.


Burcu Gürbüz

(2019) J. Paez Chavez, B. Gürbüz, C.M. A. Pinto, El efecto de la quimioterapia agresiva en un modelo para la dinámica del cáncer de VIH / SIDA, Commun Nonlinear Sci Numer Simul, (75) 109--120, DOI: 10.1016 / j.cnsns.2019.03.021.

(2018) M. Çetin, B. Gürbüz, M. Sezer, método de colocación de Lucas para el sistema de ecuaciones diferenciales funcionales lineales de alto orden, J Sci Arts, 4 (45) 891-910.

(2018) E. Gökmen, B. Gürbüz, M. Sezer, Una técnica numérica para resolver ecuaciones integro-diferenciales funcionales con límites variables, Comput Appl Math, 1-15, DOI: 10.1007 / s40314-018-0653-z.

(2018) B. Gürbüz, M. Sezer, Método de colocación de Laguerre modificado para resolver problemas de difusión-convección parabólica unidimensionales, Math Meth Appl Sci, 41, 8481--8487, DOI: 10.1002 / mma.4721.

(2017) B. Gürbüz, M. Sezer, Un nuevo método computacional basado en polinomios de Laguerre para resolver ciertas ecuaciones diferenciales integro parciales no lineales, Acta Phys Pol A, 132 (3) 561--563, DOI: 10.12693 / APhysPolA.132.561.

(2017) B. Gürbüz, M. Sezer, Soluciones polinomiales de Laguerre de una clase de ecuaciones diferenciales funcionales parciales de retardo, Acta Phys Pol A, 132 (3) 558--560, DOI: 10.12693 / APhysPolA.132.558.

(2017) B. Gürbüz, M. Sezer, Enfoque polinomial de Laguerre para resolver ecuaciones no lineales de Klein-Gordon, Malasia J Math Sci, 11 (2) 191-203.

(2017) B. Gürbüz, M. Sezer, Soluciones numéricas de problemas de convección-difusión parabólica unidimensionales que surgen en biología mediante el método de colocación de Laguerre, BIOMATH, 6 (1) 1--5 1706047, DOI: 10.11145 / j.biomath .2017.06.047.

(2017) B. Gürbüz, M. Sezer, Una solución numérica de ecuaciones integro-diferenciales parciales de Volterra de tipo parabólico por el método de colocación de Laguerre, Int J Appl Phys Math, 7 (1) 49--58, DOI: 10.17706 / ijapm. 2017.7.1.49-58.

(2016) B. Gürbüz, M. Sezer, Un algoritmo numérico híbrido con estimación de error para una clase de ecuaciones integro-diferenciales funcionales, Gazi Uni J Sci, 29 (2) 419-434.

(2016) B. Gürbüz, M. Sezer, Soluciones polinomiales de Laguerre de una clase de problemas de valores iniciales y de frontera que surgen en los campos de la ciencia y la ingeniería, Acta Phys Pol A, 129 (1) 194-197, DOI: 10.12693 / APhysPolA. 130.194.

(2016) B. Türkyılmaz, B. Gürbüz, M. Sezer, Enfoque polinomial de Morgan-Voyce para la solución de ecuaciones en diferencias diferenciales lineales de alto orden con estimación de error residual, Düzce Uni J Sci Tech, 4252-263.

(2015) B. Aslan Bülbül, B. Gürbüz, M. Sezer, Un método de colocación de matrices de Taylor basado en el error residual para resolver ecuaciones diferenciales de tipo Lane-Emden, New Trends Math Sci, 3 (2) 219-224.

(2015) B. Aslan Bülbül, B. Gürbüz, M. Sezer, Un nuevo método de colocación para la solución de ecuaciones en diferencias integro-diferenciales lineales mixtas, New Trends Math Sci, 3 (2) 133--146.

(2014) B. Gürbüz, M. Sezer, C. Güler, Método de colocación de Laguerre para resolver ecuaciones integro-diferenciales de Fredholm con argumentos funcionales, J Appl Math, 2014, DOI: 10.1155 / 2014/682398.

(2014) B. Gürbüz, M. Sezer, Enfoque polinomial de Laguerre para resolver ecuaciones diferenciales funcionales de tipo Lane-Emden, Appl Math Comput, 242, 255--264, DOI: 10.1016 / j.amc.2014.05.058.

(2011) B. Gürbüz, M. Gülsu, M. Sezer, Enfoque numérico de ecuaciones de diferencia de retardo lineal de alto orden con coeficientes variables en términos de polinomios de Laguerre, Math Comput Appl, 16 (1) 267-278.

(2011) M. Gülsu, B. Gürbüz, Y. Öztürk, M. Sezer, Enfoque polinomial de Laguerre para resolver ecuaciones de diferencia de retardo lineal, Appl Math Comput, 217, 676--6776, DOI: 10.1016 / j.amc.2011.01. 112.

(2011) B. Gürbüz, M. Gülsu, M. Sezer, Diferansiyel fark denklemlerinin Laguerre sıralama yöntemi ile nümerik çözümleri, Erciyes Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 27 (1) 75-87.


Ver el vídeo: Dimensional Analysis (Septiembre 2021).