La luz es geometría: se pronuncia «gueich»

Hoy voy a dedicar la primera entrada del blog a dar una pequeña introducción a un tema que considero tan interesante como útil: la descripción matemática de las teorías gauge. No pretendo con ello presentar un tratado sistemático y detallado Más bien se trata de una pequeña reformulación de unas ideas <<básicas>> que en su día me parecieron profundamente interesantes y constituyeron un pequeño cambio de paradigma en mi cabeza. He escrito <<básicas>>, entre comillas, porque el punto de partida del desarrollo presupone unos ciertos conocimientos sobre teoría clásica de campos (en especial, la formulación covariante del electromagnetismo). Advierto ya de primeras que es altamente probable que se me vaya la mano escribiendo, pero espero que la lectura no se haga bola.

Comencemos por el principio: ¿Qué demonios es una teoría gauge? De forma lo más general posible, podríamos definir una teoría gauge como una teoría que describe un sistema con grados de libertad redundantes. Es decir, simple y llanamente, información que nos sobra. Por ejemplo, en la teoría del electromagnetismo que hoy nos incumbe, el campo con el que describimos un fotón es A_{\mu}(x), un 4-vector. No obstante, si habéis sido obligados por vuestras respectivas universidades a tragaros más ECTS de óptica de los que os gustaría admitir, sabréis que un fotón puede describirse empleando dos ejes de polarización. Por lo tanto, hay dos componentes (mejor dicho, grados de libertad) de A_{\mu}(x) que sobran. Esto es una cosa que quiero que cale bien: las <<simetrías>> gauge no son realmente simetrías al uso, sino transformaciones que conectan configuraciones equivalentes del sistema que estamos estudiando. En ambos casos, la acción ha de ser invariante bajo dichas transformaciones, pero la diferencia es algo más sutil. Más adelante explicaré en detalle por qué para el electromagnetismo esto tiene sentido. En principio, puede parecer que al plantear una teoría que tenga en cuenta estas equivalencias (o ambiguedades, como quiera verse), lo único que estamos haciendo es <<tirar grados de libertad por la borda>>, pero la realidad es muy distinta. Resulta que la manera en la que se dan estas equivalencias determina en gran manera los resultados físicos de nuestra teoría. Claro ejemplo de ello es el comportamiento tan distinto de la electrodinámica cuántica (QED) y las teorías de Yang-Mills. En esta entrada (por brevedad), repasaremos la primera, y la reformularemos de tal manera que la segunda sea una generalización directa. Como nota final, cabe destacar que otro ejemplo de una teoría gauge es la Relatividad General, en la que las reparametrizaciones de las coordenadas con las que describimos el sistema juegan el papel de las transformaciones gauge.

Pues bien, metámonos en harina. Nos centraremos primero en QED (aunque no nos será necesario hacer un tratamiento cuántico), la teoría gauge por antonomasia. En aras de una cierta completitud, y para dejar claro el cambio de perspectiva sobre la misma cosa, resumiremos muy brevemente la introducción estándar (y de miras muy estrechas) a esta teoría. En primer lugar, supongamos que hemos definido el electromagnetismo de forma covariante. Es decir, tenemos definidos el 4-vector A_{\mu}(x)=(\varphi(x), A_1(x), A_2(x), A_3(x)) (si somos matemáticamente exqusitos, esto es realmente, y de forma natural, un co-vector), el tensor (a efectos de la explicación entendido como una matriz <<spicy>>) F_{\mu\nu}=\frac{1}{2}(\partial_{\mu}A_{\nu}-\partial_{\mu}A_{\nu}), y además tenemos una noción de algo a lo que llamamos transformación gauge, que transforma A_{\mu}(x) en A'_{\mu}(x)=A_{\mu}(x)+\partial_{\mu}(x)\alpha(x), y deja (como debe ser) invariante a F_{\mu\nu}. Finalmente, las ecuaciones de Maxwell, en todo su esplendor covariante, se reducen a \partial_{\mu}F^{\mu\nu}=0. Estas pueden ser obtenidas del siguiente lagrangiano:

\displaystyle\mathcal{L}_M=-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}.

Una vez tenemos el electromagnetismo por un lado, consideramos por otro una teoría con un campo fermiónico masivo. El lagrangiano que gobierna uno de estos campos (salvo posibles virguerías) es

\displaystyle \mathcal{L}_D=\overline{\psi}(i\gamma^{\mu}\partial_{\mu}-m)\psi.

Debido a la aparición del conjugado (de Dirac), este es invariante bajo un cambio de fase global, es decir, una transformación \psi'(x)=e^{i\alpha}\psi(x), donde \alpha es una constante real. Ahora, por algún motivo, Dios sabe cuál, hacemos que \alpha pase a depender de las coordenadas espaciotemporales, de tal modo que \alpha=\alpha(x), y la transformación anterior pasa a ser un cambio de fase local. Esto nos induce ciertos problemas, ya que ahora, tras una de estas transformaciones, la derivada \partial_{\mu} produce un término extra, y el lagrangiano deja de ser invariante. Esto solo es una inconveniencia, pues resulta que lo último que se pierde es la invariancia, y si sustituimos \partial_{\mu} por D_{\mu}=\partial_{\mu}+ieA_{\mu}, operador al que llamamos derivada covariante, podemos compensar este término extra por una transformación gauge sobre A_{\mu}. Este paso es el que suele poner fin a la construcción del lagrangiano de la electrodinámica.

Personalmente, creo que este tipo de explicaciones hacen aguas por todos lados, y lo único que hacen es generar muchas más preguntas de las que resuelven. Antes de plantear otra introducción, y como buenas personas curiosas que somos, empecemos por identificar los puntos problemáticos. En primer lugar podemos preguntar el porqué de la necesidad de invariancia bajo transformaciones de fase locales. Pero es que esto no es lo peor, porque el requerimiento de esta invariancia abre la caja de Pandora de la incertidumbre. Resulta que a través de esta decisión aparentemente arbitraria, vemos que las transformaciones locales de fase están íntimamente relacionadas con las transformaciones gauge, aunque a priori sean cosas independientes. Si quisiésemos meter el dedo un poco más en la llaga, nos preguntaríamos por qué el operador que resuelve toda la cuestión de la invariancia se llama derivada covariante. ¿Cómo que covariante? ¿Las derivadas covariantes no eran las de Relatividad General? ¿Será que ambas cosas tienen algo que ver? Estas son el tipo de preguntas sobre las que trataré de arrojar algo de luz en lo que sigue.

Por conveniencia, delegaré la motivación de la invariancia de la teoría bajo la transformación \psi'(x)=e^{i\alpha(x)}\psi(x) para el final, y la tomaremos como punto de partida. Es decir, nos olvidamos del campo electromagnético por el momento, y nos centramos en construir una acción para una teoría de fermiones masivos que sea invariante bajo esta transformación. Con este campo, podemos escribir un <<término de masa>> sin problema alguno, ya que estos son de la forma general \sim m\overline{\psi}\psi. Ambas partes se transforman a la inversa tanto por cambios de fase globales como locales, y por lo tanto el término es invariante. El problema, como antes, viene cuando intentamos incluir términos dinámicos en la acción (algo que es deseable, si no queremos que nuestra teoría sea trivial), dado que contienen derivadas actuando sobre los campos. Merece la pena ponderar esto más allá del hecho de que <<hay una cosa más que depende de x y por lo tanto me sale un término más. En esencia, una derivada es una comparación de una función entre dos puntos que están infinitesimalmente cercanos el uno del otro (¡pero no son el mismo!). En nuestro caso, tendríamos

\displaystyle n^{\mu}\partial_{\mu}\psi(x)=\lim_{h\to 0}\frac{\psi(x+hn)-\psi(x)}{h},

siendo n^{\mu} un vector unitario que determina la dirección de la derivada. El problema fundamental es que este límite no está bien definido. Esto se debe a que los dos campos que estamos comparando se transforman de forma distinta bajo un cambio de fase local, ya que están evaluados en puntos distintos, y por lo tanto el límite depende de la fase local que escojamos. Este no es el caso si consideramos cambios de fase globales, que son independientes del punto en el que evaluemos el campo. Una manera sencilla de visualizar la situación es asumiendo que estamos trabajando en una sola dimensión espacial, y por tanto los campos \psi toman valores en la recta real. Como una fase está determinada (salvo periodicidad) por un ángulo, hay entonces una correspondencia entre fases y puntos sobre un círculo \mathbb{S}^1, y como sobre cada punto podemos tomar una elección de fase, nos podemos imaginar que sobre cada punto de nuestro espacio x\in\mathbb{R} colocamos una copia de \mathbb{S}^1. Esto hace que nuestro espacio total sea un cilindro como el de la figura

Vemos que <<abajo>> o, en términos más rigurosos (que no explicaré ahora), en la base del espacio, la derivada está perfectamente bien definida. Por contra, una vez implementamos la invariancia bajo cambios de fase locales, nos vamos <<arriba>> o, rigurosamente (por los mismos motivos que antes, que seguiré sin explicar), al espacio total, la derivada depende de la elección de fase que tomemos.

Pues bien, ya hemos identificado el problema. Esto, en física y en matemáticas suele ser el 75% del camino a la solución, y el resto suele dejarse como ejercicio al lector o al becario, dependiendo de la importancia del autor. Como yo no soy importante, cargaré también con el peso del 25% restante. Lo primero de lo que nos podemos dar cuenta es de que el problema de la mala definición de la derivada viene, de alguna manera, de la libertad que tenemos para colocar \psi(x), con x fijo, en cualquier punto de \mathbb{S}^1. Por contra, intuimos que la derivada estaría bien definida si, para cualquier transformación de fase, pudiésemos colocar los campos en distintos puntos <<a la misma altura>>. Dicho de otra manera, el problema de la derivada viene de la verticalidad en el espacio total, y desaparecería si pudiésemos imponer una cierta horizontalidad en el mismo. Para resolver este dilema, supongamos que podemos definir una cierta función W(x,y), que bajo un cambio de fase local se transformase como

W(x,y)\mapsto e^{i\alpha(x)}W(x,y)e^{-i\alpha(y)}.

Es sencillo ver por qué una transformación tan esotérica haría que tuviésemos una noción bien definida de derivada. Ahora podemos restar (comparar) dos valores del campo en distintos puntos, ya que bajo un cambio de fase local

\begin{aligned} \psi(x)-W(x,y)\psi(y) &\mapsto e^{i\alpha(x)}\psi(x)-e^{i\alpha(x)}W(x,y)e^{-i\alpha(y)}e^{i\alpha(y)}\psi(y) \\ &=e^{i\alpha(x)}\left[\psi(x)-W(x,y)\psi(y)\right]\end{aligned}.

Por lo tanto, las restas están definidas salvo un factor global (es decir, que multiplica a toda la expresión) de fase. Esto es fantástico, ya que en el lagrangiano dicha fase se cancelaría con el factor opuesto que viene de \overline{\psi}, lo cual nos dejaría en la misma situación que con el término de masa, y nos permitiría incluir un término con derivadas. En particular nos permitiría definir el operador D_{\mu} como sigue

\displaystyle n^{\mu}D_{\mu}\psi(x)=\lim_{h\to 0}\frac{\psi(x+hn)-W(x+hn, x)\psi(x)}{h}.

Llamamos a dicho operador la derivada covariante, y a la función W(x,y) una conexión.

«Todo esto está muy bien»-te escucho decir-«pero eso de la conexión te lo acabas de sacar de la manga, ¡estás haciendo lo que criticabas en la introducción! Eres un fraude que no tiene ni idea de lo que habla, un charlatán que nos tiene engañados a todos y probablemente no tengas ni un ápice de originalidad intelectual». Escucho tu frustración, es cierto que no he argumentado que tal conexión pueda existir. En matemáticas, este tipo de cosas suelen ir acompañadas de teoremas de existencia (y posiblemente unicidad, aunque no es el caso), de elevada dificultad técnica. No obstante, recurriré a la que posiblemente es la mejor clase de demostraciones de existencia: existe porque te lo puedo escribir. En efecto, para el caso que tenemos entre manos podemos dar una expresión explícita de la conexión como sigue

\displaystyle W(x,y)=\exp\left(ie\int^y_xdz^{\mu}A_{\mu}(z)\right).

Aunque no aparezca de forma explícita, la integral se define sobre un camino parametrizado por z^{\mu} que empieza en x y acaba en y. Finalmente, e es (por el momento) una constante arbitraria y real. Ahora queda por ver que esta cantidad se transforme exactamente como queremos. Ahora vemos que el uso de un vector, y más aún, la elección de llamarlo A_{\mu} no es para nada fortuito. Resulta que si hacemos la transformación A_{\mu}(z)\mapsto A_{\mu}+\partial_{\mu}\alpha(z), y aplicamos el teorema fundamental del cálculo, obtenemos precisamente la transformación que profetizamos más arriba. Es por esto que el requerimiento de construir una teoría invariante bajo cambios de fase locales requiere y produce un cierto vector que se transforma por lo que comúnmente llamamos transformación gauge. Nos damos cuenta de que ambas cosas son dos caras de la misma moneda, y por lo tanto a partir de ahora llamaremos a ambas del mismo modo.

Todavía quedan un par de cabos sueltos en todo esto, y resolveremos el primero ahora mismo. Si volvemos sobre la definición que dimos de derivada covariante, ahora armados con una expresión explícita de W(x,y), vemos que como los dos puntos sobre los que está evaluada la conexión están infinitesimalmente cerca, podemos hacer una expansión a primer orden, y obtenemos

W(x+hn,x)=1+iehn^{\mu}A_{\mu}(x)+\mathcal{O}(h^2).

Aquí hemos usado que W(x,x)=1, algo que podríamos haber deducido sin la necesidad de la fórmula explícita, y hemos aproximado el valor de la integral en un intervalo infinitesimal por la regla del trapecio (valor del integrando en un punto multiplicado por la longitud del intervalo). Si ahora sustituimos en la definición de la derivada, encontramos que toma una forma muy familiar:

D_{\mu}\psi(x)=\partial_{\mu}\psi(x)-ieA_{\mu}(x)\psi(x).

Cabe destacar que, de haber incluido términos de orden superior en h, se habrían cancelado. Además de recuperar una expresión conocida, nos da una intuición del papel que juega la constante e (que, en efecto, es la carga asociada a \psi). Esta tiene que ver con como se transforma el campo bajo transformaciones gauge. Dependiendo de cómo se transforme un campo, tendrá una carga u otra.

Estamos ya casi al final de esta discusión, pero hay algo muy crucial que todavía nos falta para completar la teoría. Para obtenerla, recurriremos a una analogía con la teoría de la relatividad general. Una de las cosas que se aprende en esta disciplina es que, cunado uno está trabajando con una variedad (geométricamente) curvada, el camino sí importa, y cúanto importa depende de lo curvada que esté la variedad. En particular, resulta que, si denotamos por \nabla_{\mu} la derivada covariante (geométrica), y por V^{\rho} un vector tangente a la variedad,

[\nabla_{\mu}, \nabla_{\nu}]V^{\rho}={R^{\rho}}_{\sigma\mu\nu}V^{\rho}.

El commutador de dos derivadas covariantes, que mide la diferencia entre el recorrido x\to\mu\to\nu y el x\to\nu\to\mu, viene precisamente dado por el tensor de Riemann, que mide la curvatura de la variedad. La pregunta lógica, dado todo lo que llevamos visto es, ¿qué pasa si en vez de derivadas covariantes geométricas hacemos el cálculo con derivadas covariantes gauge? ¿Qué nos dará la diferencia entre dos caminos en el espacio total?

La respuesta requiere solo una pequeña cuenta:

\begin{aligned} [D_{\mu},D_{\nu}]\psi&=[\partial_{\mu}, \partial_{\nu}]\psi-ie\left([\partial_{\mu}, A_{\nu}]+[A_{\mu}, \partial_{\nu}]\right)\psi-e^2[A_{\mu},A_{\nu}]\psi \\ &-ie(\partial_{\mu}A_{\nu}-\partial_{\nu}A_{\mu})\psi \\ &-ieF_{\mu\nu}\psi \end{aligned}.

Si lo anterior no te había sorprendido, esto seguro que lo ha hecho. Por lo menos a mí en su momento me dejó un poco boquiabierto. Resulta que este tensor que habíamos construido para describir el electromagnetismo surge naturalmente como curvatura asociada a una estructura gauge. Más aún, todo el electromagnetismo de Maxwell puede resumirse en que la función de onda del electrón es invariante gauge.

Además de haber recuperado el electromagnetismo por completo, esta nueva manera de ver las cosas nos invita a hacer una generalización de forma relativamente sencilla. Hasta ahora, habíamos considerado cambios de fase locales como transformaciones gauge. En el argot técnico, esto se expresa diciendo que <<el grupo gauge es U(1)>>. La generalización más directa es entonces cambiar este grupo gauge de rotaciones complejas de un número por otros grupos más complejos. En particular, podemos cambiar U(1)=SU(1) por SU(N), el grupo especial unitario en N dimensiones. Este es precisamente el primer paso en las teorías de Yang-Mills. Si el grupo U(1) describe la interacción electromagnética, el grupo SU(2) describe la fuerza débil, y el grupo $SU(3)$ la fuerte. Hay una serie de complicaciones técnicas que son necesarias para tratar con estas teorías (principalmente como consecuencia de que U(1) es un grupo abeliano, mientras que el resto no lo son), con lo que no discutiré más sobre este tema.

Antes de por fin rematar el post, trataré de explicar la raison d’être de la invariancia gauge. Hemos visto que imponer dicha invariancia sobre un campo fermiónico es precisamente lo que nos da dos cosas: a) una noción de carga y b) un campo mediador sin masa y que obedece las ecuaciones de Maxwell (o podemos hacer que lo haga de forma natural). Esto es importante, pues está a la base de la localidad de nuestra teoría (entendiendo localidad como no-violación de los principios de la relatividad especial). Supongamos que tenemos dos observadores en el espacio, llamémoslos Alice y Bob, moviéndose con velocidades distintas, y supongamos que, de repente, por arte de magia, aparece una carga (descrita por uno de nuestros \psi) en reposo con respecto a uno de Alice. Para que una carga pueda ser detectada, necesita interactuar con un aparato de medida, lo cual hace a través del campo A_{\mu}. Si este campo no se moviese a la velocidad de la luz, podríamos plantear una situación en la que Bob se moviese tan rápido que, antes de que le llegue la señal de la aparición de la partícula, a Alice le de tiempo a detectarla e informarle de su existencia. Esto es claramente incoherente con la conservación de la carga en un punto, y es en general una situación absurda. Por lo tanto, el campo mensajero ha de moverse a la velocidad de la luz y, como consecuencia de esto, necesariamente ha de carecer de masa.

La intolerable cantidad de ECTS que me he tragado de óptica me obliga a dar otra motivación a nivel de la propagación de la luz. Hemos visto que para que la teoría sea consistente, una transformación gauge sobre $\psi$ induce una transformación gauge sobre el campo asociado al fotón, A_{\mu}. Esta es necesaria, ya que A_{\mu} dispone de 4 componentes, pero es sabido (aunque hubiese preferido no saberlo tan bien), que la propagación del fotón se puede describir a través de dos ejes transversales de polarización. Justamente, se puede comprobar que mediante sucesivas transformaciones gauge sobre A_{\mu} podemos fijar dos de sus componentes, dejando únicamente los dos grados de libertad que son precisos para describir el fotón.

Como última nota, y para concluir el post, diré que todo lo que hemos visto hasta ahora se enmarca dentro de la teoría gauge matemática (mathematical gauge theory en inglés). En particular, hemos estado discutiendo versiones concretas y simples de conexiones en fibrados principales. Cabe destacar que la conexión y derivada covariante de la relatividad especial también cae dentro de esta disciplina. A lo largo de la explicación, he tratado de ser lo más honesto posible a la hora de nombrar los diferentes elementos, y orientar las interpretaciones y explicaciones de tal manera que, si uno se interesa más por este campo, las explicaciones más rigurosas y generales sean lo más naturales posibles.