Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
tensorflow
GitHub Repository: tensorflow/docs-l10n
Path: blob/master/site/es-419/neural_structured_learning/framework.md
25115 views

Marco de trabajo de aprendizaje estructurado neuronal

El aprendizaje estructurado neuronal (NSL) se centra en el entrenamiento de redes neuronales profundas aprovechando las señales estructuradas (cuando hay) junto con las entradas de las características. Tal como lo presenta Bui et al. (WSDM'18), estas señales estructuradas se usan para regularizar el entrenamiento de una red neuronal, forzando al modelo a aprender predicciones exactas (al minimizar la pérdida supervisada); mientras, a la vez, se mantiene la similitud estructural de la entrada (al minimizar, esta vez, la pérdida vecina; consulte la imagen a continuación). Esta técnica es genérica y se puede aplicar en arquitecturas neuronales arbitrarias (como las redes neuronales prealimentadas, las convolucionales o las recurrentes).

Concepto de NSL

Tenga en cuenta que la ecuación de pérdida por vecino generalizada es flexible y puede tener otras formas además de la ilustrada arriba en estas notas. Por ejemplo, también podemos seleccionar xjN(xi)E(yi,gθ(xj))\sum_{x_j \in \mathcal{N}(x_i)}\mathcal{E}(y_i,g_\theta(x_j)) para que sea la pérdida por vecino, que calcula la distancia entre la verdad fundamental yiy_i y la predicción del vecino gθ(xj)g_\theta(x_j). Por lo común, esto se usa en el aprendizaje adversativo (Goodfellow et al., ICLR'15). Por lo tanto, el NSL generaliza en aprendizaje con redes neuronales de grafos, si los vecinos están explícitamente representados por grafos; y como aprendizaje adversativo, si a los vecinos los induce implícitamente la perturbación adversativa.

El flujo de trabajo general para el aprendizaje estructurado neuronal se ilustra a continuación. Las flechas negras representan al flujo de entrenamiento convencional y la rojas, al nuevo flujo de trabajo introducido por las señales estructuradas aprovechadas del NSL. Primero, las muestras de entrenamiento se aumentan para incluir las señales estructuradas. Cuando estas señales no son explícitamente provistas, se pueden construir o inducir (esto último en aprendizaje adversativo). Después, las muestras aumentadas de entrenamiento (incluidas tanto las muestras originales como sus correspondientes muestras vecinas) se envían a la red neuronal para calcular sus incorporaciones. Se calcula la distancia entre la incorporación de una muestra y la de su vecina y se usa como pérdida por vecino, lo que se trata como un término de regularización y se agrega a la pérdida final. Para la regularización basada en vecinos explícitos, normalmente calculamos la pérdida por vecino como la distancia entre la incorporación de la muestra y la incorporación de la vecina. Pero, en realidad, se puede utilizar cualquier capa de red neuronal para calcular la pérdida por vecino. Además, por otra parte, calculamos la pérdida por vecino como la distancia entre la predicción de salida del vecino adversativo inducido y la etiqueta de verdad fundamental.

Flujo del NSL

Por qué conviene usar NSL

El NSL aporta las siguientes ventajas:

  • Mayor exactitud: las señales estructuradas entre las muestras aportan información que no siempre está disponible en las entradas de características; por lo tanto, el entrenamiento conjunto (con las características y las señales estructuradas) ha demostrado tener un mayor rendimiento que muchos otros métodos (que dependen del entrenamiento solo con características) en una amplia gama de tareas, como la clasificación de documentación y la clasificación de intención semántica (Bui et al., WSDM'18 y Kipf et al., ICLR'17).

  • Robustez: los modelos entrenados con ejemplos adversativos han demostrado ser robustos ante las perturbaciones adversativas diseñadas para engañar a las predicciones o clasificaciones del modelo (Goodfellow et al., ICLR'15 y Miyato et al., ICLR'16). Cuando la cantidad de muestras para entrenamiento es pequeña, el entrenamiento con ejemplos adversativos también ayuda a mejorar la exactitud del modelo (Tsipras et al., ICLR'19).

  • Se requieren menos datos etiquetados: el NSL permite que las redes neuronales admitan tanto los datos etiquetados como no etiquetados. Esta facilidad extiende el paradigma del aprendizaje hasta convertirlo en aprendizaje semisupervisado. Específicamente, el NSL permite que la red haga el entrenamiento con datos etiquetados como en el entorno supervisado y, a la vez, hace que la red aprenda representaciones ocultas similares para las "muestras vecinas" que pueden o no tener etiquetas. Esta técnica ha demostrado ser muy prometedora para mejorar la exactitud del modelo cuando la cantidad de datos etiquetados es relativamente pequeña (Bui et al., WSDM'18 y Miyato et al., ICLR'16).

Tutoriales paso a paso

Para obtener experiencia práctica con el aprendizaje estructurado neuronal, tenemos tutoriales que abarcan varios escenarios posibles en los cuales las señales estructuradas pueden ser dadas explícitamente, construidas o inducidas. A continuación, compartimos algunos:

Puede encontrar más ejemplos y tutoriales en el directorio de ejemplos de nuestro repositorio de GitHub.