Saturday, November 7, 2009

Curvas Elipticas y Espacios Proyectivos

Hace poco tiempo con mi amigo Javier Ronquillo comenzamos a estudiar curvas elípticas con un libro muy interesante que se enfoca en describir los puntos racionales que una curva elíptica puede tener. Una curva elíptica se puede definir en general sobre cualquier anillo $R$ como el conjunto de soluciones en $R$ de la ecuación

$p(x,y)=Ax^3+By^2+Cxy+Dx^2+Ex+Fy+G=0$

donde las constantes $A,B,C,D,E,F,G\in R$. Propiedades interesantes surgen cuando se dota de una operación binaria a este conjunto. Resulta que una curva elíptica $C(p,R)$ puede convertirse en un grupo abeliano de acuerdo con las siguientes reglas:

  • Se fija un punto $O\in C(p,R)$
  • Si $P,Q\in C(p,R)$, se denota por $P*Q$ el tercer punto de intersección de la recta que pasa por $P,Q$ con la curva elíptica $C(p,R)$
  • Se define $P+Q=O*(P*Q)$


La definición arriba descrita hace a $C(p,R)$ un grupo aditivo, y esto es gracias a la propiedad que si una recta pasa por dos puntos de $C(p,R)$, pasa por un tercero necesariamente, contando multiplicidades, así la recta tangente a un punto $P$ de $C(p,R)$ necesariamente pasa por otro punto de la curva, y solamente uno, por lo que nuestra definición de suma está bien definida.

Gracias a esta estructura de grupo que se le da a $C(,p,R)$, las curvas elípticas han cobrado gran auge en campos como teoría de codigos y criptografía.

Hace un mes aproximadamente, asistí a una charla dada por uno de mis profesores de algebra, Dr. David Arnold, y estaba hablando precisamente sobre curvas elípticas y su relación con números congruentes. En su charla definió de una manera distinta la suma en $C(p,R)$ y a primera vista no me pareció una forma equivalente a la que había aprendido unas semanas atrás, sin embargo, luego de pensar un poco me resultó bastante claro y conveniente esta extraña definición.

Definió una curva eliptica sobre $\mathbb{R}$ como las soluciones a

$y^2=x^3+ax^2+bx+c$

y la suma de dos puntos $P,Q$ simplemente como la reflexión sobre el eje $X$ de $P*Q$.

La ventaja de esta definición es que el grupo no depende de la elección de $O$, sino que en este caso, el neutro aditivo es el punto en el infinito dado por $(\infty,\infty)$.

Despues de investigar un poco, me di cuenta que la definición usual de curvas elípticas y adición en ellas es esta que él habia dado, y que la que había aprendido yo era la rara, lo cual me hizo interesarme más en el asunto.

Una forma un poco simple de pensar en esta aparente ambigüedad de conceptos, es ver al segundo punto de vista como un caso particular del primero. Si tomamos $C(p,R)$ con un punto fijo $O$, podemos realizar una transformación puntual al infinito y mandar el punto $O$ al punto en el infinito y así obtener el segundo punto de vista.

Una transformación puntual es una transformación del plano en sí mismo que transforma lineas en lineas, así que, dado que nuestra definición primera de adición está en términos de rectas e intersecciones, la misma definición seguirá siendo válida luego de aplicar una transformación de este tipo.

En general, dichas transformaciones puntuales mapean un punto $P=(x,y)$ a un punto $\tilde{P}=(\tilde{x},\tilde{y})$ en donde las nuevas coordenadas están dadas por

$\tilde{x}= \frac{ax+by+c}{gx+hy+i}$
$\tilde{y}= \frac{dx+ey+f}{gx+hy+i}$

en donde se manda la recta $gx+hy+i$ al infinito.

Para ver las bondades de esta transformación, resulta adecuado reescribirla como

$\begin{pmatrix}a&b&c\\d&e&f\\g&h&i\end{pmatrix}\begin{pmatrix}x\\y\\1\end{pmatrix}=\begin{pmatrix}\bar{x}\\\bar{y}\\\bar{z}\end{pmatrix}$

y las nuevas coordenadas del punto $\tilde{P}$ son $\tilde{x}=\frac{\bar{x}}{\bar{z}}$ y $\tilde{y}=\frac{\bar{y}}{\bar{z}}$.

Esta ultima descripción puede verse como una transformación lineal de $R^2$ en $R^3$, o bien, puede generalizarse como una transformación entre espacios proyectivos.

Si se tiene un punto $(x:y:z)\in\mathbb{P}^2(R)$, donde $\mathbb{P}^2(R)$ es el espacio 2-proyectivo de $R$, tenemos que dicha transformación se puede escribir como

$T\begin{pmatrix}x\\y\\z\end{pmatrix}=\begin{pmatrix}a&b&c\\d&e&f\\g&h&i\end{pmatrix}\begin{pmatrix}x\\y\\z\end{pmatrix}=\begin{pmatrix}\bar{x}\\\bar{y}\\\bar{z}\end{pmatrix}$

Como consecuencia de trabajar en el espacio proyectivo $\mathbb{P}^2(R)$, debemos cambiar nuestro polinomio $p(x,y)$ que genera la curva elíptica por

$p(x:y:z)=Ax^3+By^2z+Cxyz+Dx^2z+Exz^2+Fyz^2+Gz^3$

Ahora nuestro objetivo es estudiar que pasa con dicha curva elíptica al aplicarle una transformación puntual como la anteriormente descrita. Para esto, podemos ver que tipo de condiciones se pueden imponer sobre la matriz $T$. Luego de analizar un poco la situación, se puede concluir que sin pérdida de generalidad $det(T)=1$, con lo que se tiene que el conjunto de todas las transformaciones puntuales de $\mathbb{P}^2(R)$ en sí mismo es el grupo lineal proyectivo $\text{PSL}(R,3)$ de matrices sobre $R$ con determinante igual a la identidad.

El único problema es que luego de aplicar una transformación $T\in\text{PSL}(R,3)$, puede darse el caso que una curva elíptica $C(p,R)$ no sea transformada en otra curva elíptica, sino que en algo más, es decir, el conjunto de curvas elípticas en $\mathbb{P}^2(R)$ no es invariante respecto de $\text{PSL}(R,3)$. Un ejemplo de conjuntos de curvas invariantes respecto de $\text{PSL}(R,3)$ son las cónicas, puesto que al aplicar una transformación puntual a una cónica el resultado es otra cónica.

Con esta idea en mente, es posible ampliar el concepto de curva elíptica de tal manera que sea invariante respecto de transformaciones puntuales.

Si definimos una curva elíptica en $\mathbb{P}^2(R)$ como el conjunto de ceros de un polinomio de la forma

$p(x:y:z)=\sum_{r+s+t=3}c_{r,s,t}x^ry^sz^t$

con $r,s,t\geq 0$ y $c_{r,s,t}\in R$, tenemos ahora que el conjunto de curvas elípticas en $\mathbb{P}^2(R)$ es invariante respecto de $\text{PSL}(R,3)$, y con esta descripción es posible estudiar el comportamiento de curvas elípticas bajo transformaciones puntuales y ver que los cambios de coordenadas son funciones racionales de las coordenadas originales, y por ejemplo, $C(p,\mathbb{Q})$ es mapeado en otra curva elíptica luego de aplicar una transformación puntual. Más en general, para un $F$ es un campo, $C(p,F)$ es mapeado en otra curva elíptica sobre $F$ de manera isomorfa, por lo que propiedades como ordenes de elementos, generadores, número de subgrupos y demás permanecen invariantes luego de aplicar una transformación puntal.

Saturday, October 31, 2009

On general derivatives

Long time ago I remember one of my former professors back home talking about a way of generalize the order of derivatives to real and then complex numbers. At the moment I was maybe in introduction to analysis or so, and I only did understand the meaning of the $n$th derivative, or at least, I knew how to calculate them.

Then, I came to graduate school and people where talking about fractional calculus, which in some sense is a generalization for the usual derivatives, providing a way of calculating the $\frac{p}{q}$ derivative of a function.

The purpose is to calculate $\frac{d^\alpha}{dt^\alpha}f(x)$ for $\alpha\in\mathbb{R}^+,\mathbb{R},\mathbb{C}$.

I was thinking of some sort of an easy and non-elaborated way of generalizing this idea, and it came to my mind the spectral theorem. If we define an operator $T=\frac{d}{dx}$ to be the derivative operator for a space of functions $H$ to itself, one would like to calculate $T^\alpha$ of a function, and a nice way of solving this would be to use functional calculus by means of the spectral theorem, which would say that

$T^\alpha(f)(x)=\int_{\sigma(T)}\lambda^\alpha dE(\lambda)(f)(x)$

where $\sigma(T)$ is the spectrum of the operator $T$ and $E(\lambda)$ is a partition of unity. This would provide a quick and dirty way of accomplish our mission, but we have one problem: $T$ is not a bounded operator, and we cannot quite use this same result.

Anyhow, trying to go further with this first approach, one has some classical results when applying this idea.

It is well known that the eigenfunctions of $T$ are exponentials given by the solutions of

$Tf-\lambda f=0$

subject to some boundary/initial conditions. Suppose that we work in the space $H=L^2$ with the usual inner product and the condition for the eigenfunctions to be $f(0)=1$. Then this result is the same as taking the Fourier transform of the function and passing the derivative along the integration sign

$T^\alpha (f)(x)=\int_{-\infty}^\infty \hat{f}(t) (2\pi i t)^\alpha e^{2\pi i xt}dt$

for $\alpha=0$ we have $T^0(f)(x)=f(x)$. When $\alpha=n\in\mathbb{N}$ we have the old result from Fourier analysis and in fact, we have that $T^n(f)(x)=\frac{d^n}{dx^n}f(x)$.

Also, for negative integers $\alpha=-n\in\mathbb{Z}^-$, this realization for the generalized derivative agrees with the result od Fourier transforms, having that $T^{-n}(f)(x)=F^{(n)}(x)$, where $F^{(n)}(x)$ is the $n$th antiderivative of $f(x)$.

But this method is not so true, since as we pointed out before, $T$ is not bounded in $L^2$, so the idea is to use some kind of spectral theorem for symmetric unbounded operators. This can be done by finding a self adjoint extension of $T$ and apply the spectral theorem to it or equivalently, to use the symmetric unbounded version of this result to $T$.

By this means, one can calculate the derivative of any complex order $\alpha$ of (in general) any $L^2$ function.

Thursday, October 15, 2009

Posible vs Probable

Hace unos días discutí con mi amigo Andrés sobre el post de como calcular la probabilidad de obtener un triángulo al partir un palillo en 3 trocitos. Él me preguntaba que pasaría si decidiéramos imponer la restricción que el triángulo obtenido fuera equilátero o isóceles.

Obviamente, dichos casos son posibles, sin embargo al calcular la probabilidad de ocurrencia, esta es cero.

Por ejemplo, en el caso de un triángulo equilátero, existe solamente una manera de obtener dicha configuración, esto es, cuando los 3 trocitos miden lo mismo. Sin embargo, el número total de posibilidades es infinita, por lo que podríamos decir que la probabilidad de obtener un triángulo equilátero es

$\frac{1}{\infty}=0$

Ahora bien, al calcular el número de triángulos isóceles que pueden ser obtenidos, este es infinito, sin embargo la probabilidad asociada sigue siendo cero. Este fenómeno puede ser explicado si utilizamos una interpretación geométrica de la probabilidad.

Así como vimos anteriormente la probabilidad se obtiene al dividir el área correspondiente a la región que representa los casos deseados sobre el área de los casos totales. En el caso de obtener un triángulo isóceles, el conjunto de casos favorables está dado por las tres rectas

$x=y \quad \cup\quad y=1-2x\quad \cup \quad 2y=1-x$

Puesto que este conjunto es unidimensional, su área es 0, y por lo tanto la probabilidad asociada a los triángulos isóceles es

$\frac{\text{area de las rectas}}{\text{area roja}}=\frac{0}{1/2}=0$

Esto quiere decir que dichos casos son posibles sin embargo no son probables. Pero ¿qué significa que algo sea posible pero no probable?

Matemáticamente, que algo sea posible significa que el conjunto de sucesos deseados en el espacio muestral sea no vacio. Por otra parte, que algo sea probable significa que la probabilidad asociada sea no nula. Resulta un poco dificil de convencerse al principio que esto pueda ocurrir, sin embargo al ver la probabilidad como la medida de un conjunto no suena tan artificial este concepto.

Si se tiene un conjunto $M$ una medida es una función que asigna a una familia de subconjuntos de $M$ un número real no negativo llamado medida. Por ejemplo, en la recta real, la medida mas usual es la de Lebesgue, la cual asigna a cada intervalo $[a,b]$ la medida $b-a$.

Este dilema se reduce a obtener subconjuntos no vacíos en $M$ cuya medida sea 0. El el caso de los reales, conjuntos discretos o conjuntos de cantor son buenos ejemplos de casos posibles mas no probables.

Luego de pensar un poco, no es difícil convencerse que si el espacio muestreal es un subconjunto con dimensión euclideana igual a $n$, cualquier conjunto no vacío con dimensión menor que $n$ será posible pero no probable, como el caso anterior, en el que el espacio muestreal tiene dimensión 2 (triángulo rojo) y el conjunto estudiado tiene dimensión menor, dimensión 1 para el caso de triángulos isóceles y dimensión 0 para el caso del equilátero.

Así, la unica manera de obtener probabilidad no nula es al comparar conjuntos de la misma dimensión, esto en el caso de espacios euclideanos, como fue el resultado en el caso anterior en donde comparamos la medida (área) de ambos conjuntos (triágulo rojo y triángulo azul)

Por lo tanto se puede tener algo posible pero no probable.

Monday, October 5, 2009

Elementary symmetric functions of the first natural numbers

About a month ago, my good friends Esteban and José Carlos were working in a really interesting problem in number theory involving harmonic series of sequences of something that they called the Esteban primes for $p_0$.

They were (or are, I hope) trying to find out if a particular series involving this sequences of primes, converges or not. They told me about the problem, and as always, I got really interested by this strange problem relating primes and analysis.

After working out a little bit the series, one can show that it is equivalent to prove that some infinite product converges to a nonzero value. Working with these expressions, I ended up looking at polynomials of the form

$p(x)=\prod_{k=1}^n (p_k-x)$

where the $p_k$ are primes. So, at first, I tried to not work with primes directly, but with the natural numbers $1,2,3,\dots,n$ so the polynomial will be

$p(x)=\prod_{k=1}^n (k-x)$

Expanding out this polynomial gives, by Cardano equations,

$p(x)=\sum_{k=0}^n (-1)^k s_{n-k} x^{k}$

were the $s_k$ are the elementary functions for $1,2,3\dots,n$, that are given by the sum of all possible $k$ products of these numbers, so for instance, $s_n=n!$, $s_1=1+2+\dots+n$ and $s_0=1$.

Therefore, evaluating $p(1)$ we have that $p(1)=\sum_{k=0}^n (-1)^k s_{n-k}=0 $ and hence, the sum of the even elementary functions is equal to the sum of the odd ones.

For example, $n=3$ gives

$s_0=1$
$s_1=1+2+3=6$
$s_2=1\cdot 2+1\cdot 3+2\cdot 3=11$
$s_3=1\cdot 2\cdot 3=6$

and the result is

$s_0+s_2=s_1+s_3=12$

This reminds me of the property of the Binomial coefficients and must be somehow related, because these count the number of subsets with cardinality $k$, that is, for each subset of size $k$, we correspond to it a 1, then we add this results and that is $\binom{n}{k}$, while for the symmetric functions, for each subset of size $k$, we correspond to it the product of its elements, and then add over all subsets, and that gives $s_k$.

In other words, let $S=\{1,2,3,\dots,n\}$ and let $f$ be a function defined on the subsets of $S$.

If $f(A)=1$, for all $A\subset S$, we have that

$\binom{n}{k}=\sum_{A\subset S, |A|=k}f(A)$

on the other hand, if we define $f(A)=\prod_{k\in A} k$, then

$s_k=\sum_{A\subset S, |A|=k}f(A)$

so both forms have the same structure. I don't know what is the underlying property of such $f$ functions, so that the sum of the evens equals the sum of the odd ones, but I find it really interesting.



Friday, September 25, 2009

Probabilidad de primos y la función mu de Möbius

Hace un par de días me puse a jugar un poco con la distribución de primos y con algo que he denominado primos de orden k, y me topé con una interpretación probabilistica de un resultado que involucra la función $\mu$ de Möbius.

Nunca en realidad he llevado un curso formal sobre teoría analítica de números, ni nada parecido con teoría de números avanzada, por lo tanto no había analizado la posible motivación detrás de la definición de la función $\mu$.

Para un natural $n$, $\mu(n)$ se define como 0 si $n$ tiene un factor primo cuyo exponente es mayor que 1, y $(-1)^k$ si $n$ tiene $k$ factores primos diferentes. Por lo tanto esta función es diferente de 0 únicamente para los números libres de cuadrado, -1 si el número posee un número impar de factores, y 1 si posee un número par.

Al principio, esta definición suena muy artificial, sin embargo, desde un contexto diferente, se puede tener una concepción un tanto más natural.

Supongamos por un momento que tenemos un entero cualquiera y queremos calcular la probabilidad que este sea compuesto. Bueno, si conocemos explicitamente dicho número podemos responder esta pregunta deterministicamente, sin embargo, si escogemos un número al azar, podemos hablar de la probabilidad de que sea compuesto.

Bueno, si un número es compuesto, esto significa que es producto de primos, así que podemos calcular dicha probabilidad $P$ encontrando cuál es la probabilidad que sea un multiplo de 2, 3, 5, 7, 11, etc.

Obviamente, la probabilidad que un número sea multiplo de 2 es $1/2$, puesto que la mitad de los numeros son pares, de igual manera, $1/3$ de los números son multiplos de 3 y así, la probabilidad de ser múltiplo de $p$ es $1/p$.

Por lo tanto, para calcular la probabilidad total, no es dificil convenserse que es necesario utilizar el principio de inclusión-exclusión para calcular la probabilidad de ser multiplo de algún primo, es decir, de ser compuesto.

Con esto, la probabilidad queda

$P=\frac{1}{2}+\frac{1}{3}+\frac{1}{5}\dots-\frac{1}{2\cdot 3}-\frac{1}{2\cdot 5}-\frac{1}{3\cdot 5}-\dots+\frac{1}{2\cdot 3\cdot 5}\dots$

Tratando de reescribir esta expresión, no es dificil concluir que esto se puede escribir como

$\sum_{n=2}^\infty \frac{a_n}{n}$

en donde $a_n$ es 0 si $n$ tiene factores primos repetidos, $1$ si $n$ es elproducto de un número impar de primos y $-1$ si $n$ es el producto de un número par de primos, lo cual puede escribirse jústamente usando $\mu$ como $a_n=-\mu(n)$.

Por otro lado, como es bien sabido, la mayoría de números son compuestos, de hecho el Teorema de los Números Primos establece que la razón entre el número de primos menores que $x$ y $x$ tiende a 0, por lo que la probabilidad de ser compuesto (razón entre "el número de compuestos y todos los números") es 1, así que $P=1$. Con esto tenemos que

$\sum_{n=2}^\infty -\frac{\mu(n)}{n}=1$

y como $\mu(1)=1$, podemos decir que

$\sum_{n=1}^\infty \frac{\mu(n)}{n}=0$

Es facinante como es posible interpretar la función $\mu$ simplemente como el principio de inclusión-exclusión para los números primos, y por medio de este mismo argumento, se puede mostrar facilmente que

$\sum_{n=1}^\infty \frac{\mu(n)}{n^s}=\frac{1}{\zeta(s)}$

donde $\zeta(s)$ es la función Zeta de Riemann. Justamente, para $s=1$, la función Zeta posee un polo de orcden 1 y por lo tanto $\frac{1}{\zeta(1)}=0$.

De esta manera, la función $\mu$ surge de una forma un tanto más natural y, al menos para mí, deja de ser un ente muy raro y misterioso.

Sunday, September 20, 2009

Atractors for the Differential Operator

The other day, I was thinking about how you can find fixed points for some functions in an easy way, for example, for $f(t)=\cos(t)$, if you start with any initial point $t_0$ and iterate the function on it, you will reach a fixed point, i.e. $f^n(t_0)\to t_{fix}$ as $n\to \infty$ which is approximately $0.739085$.

Then I ask myself if you can mimic the same procedure for finding fixed points, and hence attractors when instead of treating numbers one uses functions. In this particular case, I picked the differential operator $T=\frac{d}{dt}$, so the idea was to study the behavior of $\{T^n(x_0)\}_{n=0}^\infty$ for $x_0$ a initial function.

For instance, looking for the fixed points of this operator is a rather easy task, since it is the same as solving the differential equation $\frac{d}{dt}f(t)=f(t)$, which has general solution given by $f(t)=Ae^t$.

This approach give us more than just the fixed points for this operator, but also tells us that the space of functions in which we are interested for this operator to act, is the space of smooth funtions, i.e functions which have infinite number of derivates. Then we can formalize our discussion as studying the dinamics of the differential operator $T:C^\infty\to C^\infty$.

The natural question would be what happens to a general function when iterate $T$ to it? Is it going to be atracter by one of the fixed points? Or is it going to be blown up to "infinity"?

For example, if our initial function $x_0$ is a polynomial with degree $n$, we have that $T^{n+1}x_0=0$, so all polynomials are in the basin of atraction of 0, that is, after aplying many finite times the operator $T$, every polynomials will get map to 0.

On the other hand, if we start with $x_0=\cos(t)$ or $x_0=\sin(t)$, we have that this leads to a periodic orbit, namely $T^2x_0=x_0$, so the sequence $\{T^nx_0\}$ does not converge, but rather stays in a cycle.

In general, for having a periodic orbit when starting at a function $x$, one has to have that $T^mx=x$ for some $m\in\mathbb{N}$. Solving the differential equation gives that $x=\sum_{k=0}^{m-1}A_k e^{\lambda_m^k t}$, where $\lambda_m$ is the primitive $m$-root of unity in the complex numbers, and $A_k$ are constants.

Here we looked at some examples where the sequence converges or stays in a cycle, but it can also happen that the sequence diverges, for instance if we let $x_0=e^{cx}$, with $c\neq 1$, we will have that $\{T^nx_0\}$ diverges.

Now, if we try to analyze what the behaviour would be for a general smooth $x_0$ function, in order to stablish wheter the orbit of $x_0$ is attracted to a fixed point, it is periodic or it diverges, we need te notion of a distance in between functions or a norm. $C^\infty$ is a vector space, since the linear combination of smooth functions is again a smooth function, but it lacks the structure of a Banach space, which is that there doesn't exist any norm such that the space is complete. This doesn't help too much in pursue of a simple way of finding these attractors like we did with real and complex numbers via a analityc function. So the idea of finding these orbits for $T$ requires a little bit of more effort.

Trying to fix this impediment, I found that $C^\infty$ has the structure of a Fréchet space, with is endowed not with a norm, but instead with a family of seminorms. This way we can talk about being close to a fixed point and the notion of being attracted to.

I'm still reading at this point what can be done to generate this sets that are being attracted or repeled by this fixed points, which would be somehow equivalent to the notion of a Julia and Fatou sets for $T$. The idea of finding these fractals of functions seems to me really interesting and I haden't tought of it until I was actually writing this post, so it was somehow related to the previous post just by chance and it wasn't made on purpouse.

Wednesday, September 16, 2009

Antenas Fractales

Muchos de nosotros hemos oído las palabras antena y fractal en algunos lugares por separado, y apuesto a que pensamos que son cosas que no pudieran tener nada en común.

Por un lado, una antena es un dispositivo pasivo que se utiliza para radiar ondas electromagnéticas y así poder transmitir información o energía a través de largas distancias sin la necesidad de cables.

Por el otro lado, muchas veces asociamos la palabra fractal con descanzadores de pantalla, gráficas y obras de arte con patrones de espirales y picos, y los más conocedores en el tema saben que un fractal es un objeto matemático asociado con funciones de variable compleja y recurrencia.

¿Cómo es posible conectar estos dos conceptos? Bueno, la respuesta la poseen muchos en los bolsillos de sus pantalones en estos momentos: un celular.

Al estudiar sobre telecomunicaciones, uno aprende que es posible diseñar una antena para un tipo de señal moduladora dependiendo de la frecuencia de la misma. Así, generalmente para transmitir una onda que esta siendo modulada a una frecuencia $f$, la antena se diseña típicamente para que tenga una longitud de $\frac{c}{2f}$, donde $c$ es la velocidad de la luz ( o la velocidad de propagación de onda en un medio más general ). Así que la longitud de la antena está determinada por la frecuencia a la que se transmite, algo no muy difícil de creer, por esa razón vemos en las calles antenas grandes, generalmente con partes rojas y blancas, para las transmisiones de radio AM, y antenas pequeñas que parecen bocinas de computadora, para las transmisiones de celulares e internet.

En nuestros días, la gran mayoría de servicios de telefonía móvil utilizan un tipo de transmisión a base de SDH, que significa que no se transmite en una sola frecuencia, sino que se tiene un rango de frecuencias en el que se transmite, alrededor de unas 75 frecuencias diferentes. Entonces, según la forma tradicional de diseño de antenas, deberíamos tener unas 75 antenas en nuestros teléfonos móviles, sin embargo esto no sucede así, puesto que resultaría demasiado ineficiente.

Pero entonces ¿cómo solucionar el problema de recibir 75 frecuencias diferentes usando la misma antena? Bueno, los fractales saltan al rescate. Una de las propiedades que poseen los fractales, es que tienen patrones de autosimilitud, es decir, la forma básica del fractal se repite una y otra vez en diferentes escalas.


Por medio de un diseño fractal de antena como el anterior, es posible lograr recibir una frecuencia fundamental $f$, la mitad de esta $f/2$, las cuartas partes $f/4$ y $3f/4$ y las octavas partes $f/8$, $3f/8$, $5f/8$ y $7f/8$.




De esta manera es posible utilizar la autosimilitud para recibir ondas similares transmitidas en diferentes frecuencias fundamentales. El tipo de fractal utilizado depende de otros parámetros como tipo de modulación, rango de transmisión, tipo de transmisión, etc.

Thursday, September 10, 2009

Roots of unity and quadratic residues modulo p

Yesterday, I attended to a talk of Brian Conrey while his visit to Baylor, and among other things of his talk, I found this fact really interesting.

He was talking about prime numbers, their distribution and the connection with the Riemann Zeta function, in other words, some kind of connection with complex numbers.

He showed that when taking the unit circle and diving it into $p$ equal slices, one can enumerate each edge from 0 to $p-1$ and then take the quadratic residues modulo $p$ and the sum of the correspondent vectors has norm equal to $\sqrt{p}$.

Here is the picture for $p=5$. After doing this, I found out that, I didn't remember the fact way it was, since if we calculate this resultant vector, it has norm equal to 1.61803, which is not $\sqrt{5}$, so I tried to figure what the statement was. After a little of work, I found that I was not able to remember the statement at all, but I came with something that was pretty close to it, if instead of summing along the quadratic residues, we sum along the residues squared, we have the desired result, that is, instead of summing the 0,1,4 vectors, we sum $0^2,1^2,2^2,3^2,4^2$, that is $0,1,4,4,1$, we'll have that the norm of the resultant is in fact $\sqrt{5}$.


So I thought that maybe for the general case, if we add the vectors corresponding to squares of the residues, we would have the same result. For proving this, we can write the problem as follows:

Let $p$ be a prime, then $z=\sum_{k=0}^{p-1} e^{\frac{2 \pi i}{p}k^2}$ has norm $\sqrt{p}$.

The proof of this fact is quite simple. This is the same as $z\bar{z}=p$, so calculating that gives

$|z|^2=\left(\sum_{k=0}^{p-1} e^{\frac{2 \pi i}{p}k^2}\right)$ $\left(\sum_{k=0}^{p-1} e^{-\frac{2 \pi i}{p}k^2}\right) $ $=\sum_{n,m}^{p-1} e^{\frac{2 \pi i}{p}(n+m)(n-m)}$

Since $p$ is prime, we can rearrange terms, and write the previous expression as $\sum_{r=0}^{p-1}\sum_{s=0}^{p-1}\left(e^{\frac{2\pi i}{p}r}\right)^s$, which is just a bunch of geometric sums added up. Each sum is easily calculated for $r\neq 0$ as $\frac{\left(e^{\frac{2\pi i}{p}r}\right)^p-1}{e^{\frac{2\pi i}{p}r}-1}$ which is equal to 0 for $r\neq0$. When $r=0$, the sum is exactly $p$, so in the end, $z\bar{z}=p$.

Then after, I tried the same kind of result with a general natural number, and it seems to work also with the odd numbers, but with the evens the pattern is a little different. For some, the norm is the square root of twice the number and for others it is zero. It is a really interesting question what happens for the general case, in particular for the even numbers, since it seems to depend if the number is multiple of 4.

The reason why the previous procedure does not work in general is that for a composite number, the double summation cannot be rearranged as we did, because $\mathbb{Z}_n$ is not a multiplicative group and $k \mathbb{Z}_n\neq \mathbb{Z}_n$ for all non-zero $k\in\mathbb{Z}_n$.

Monday, September 7, 2009

Probabilidad de obtener un triángulo

¿Quién al ir a un restaurante no ha hecho trocitos los palillos de dientes mientras espera la comida? A pesar que partir palillos en muchos pedazos suena una alternativa para matar el tiempo de espera, una pregunta un poco mas interesante es calcular la probabilidad que al quebrar dos veces el palillo, los 3 segmentos resultantes constituyan los lados de un triángulo.

A primera vista parece que esto siempre se puede hacer, sin embargo al probar unas cuantas veces, uno se da cuenta que pocas veces se logra constuir un triángulo con los pedazos.

Para lograr calcular exactamente cual es la probabilidad de que esto ocurra, podemos hacer un modelo de que es lo que pasa al quebrar un palillo dos veces,

Para tener que dichos pedazos logren formar un triángulo, debemos tener que las longitudes cumplan la desigualdad del tríangulo.

Si tenemos un triángulo con lados $a,b,c$, la desigualdad del triángulo dice que $a\leq b+c$ $b\leq c+a$ y $c\leq a+b$. Aún más, si se tienen 3 reales que satisfacen dichas desigualdades, es posible construir un triángulo cuyos lados seas dichos reales. Asi que si $x,y$ y $1-x-y$ satisfacen dichas desigualdades, tendremos que es posible construir un triángulo a partir de los pedazos.

Para lograr encontrar la probabilidad, primero debemos hallar el total de casos posibles, y para eso encontramos los posibles resultados al quebrar el palillo, es decir, la región donde $0\leq x$, $0\leq y$ y $0\leq 1-x-y$. Dicha región está dada por




Así que el área total del espacio muestral es $1/2$. Para calcular el total de casos favorables, debemos tener que se satisfagan las desigualdades del triángulo, es decir, $x\leq 1-x-y+y$, $y\leq 1-x-y+x$ y $1-x-y\leq x+y$, lo cual da la región

cuya área es $1/8$, por lo que la probabilidad de lograr construir un triángulo está dada por

$\frac{\text{casos en los que se forma un triangulo}}{\text{casos totales}}=\frac{1/8}{1/2}=1/4$
Así que en un 25% de los casos, es posible construir un triángulo con dichos pedazos, lo cual resulta ser mucho menos de lo esperado, asi que la proxima vez que vaya a un restaurante, intentelo al menos 4 veces.


Thursday, September 3, 2009

Why a melody one octave higher feels the same?

A couple of weeks ago, while a road trip to Pittsburgh with my good friend Antonio, one topic jumped to the conversation, and it was why do we feel like a melody played in different octaves is the same.

The answer was not so difficult to find: Because we are hearing the same fundamental frequencies and their harmonics, but that is the mathematical point of view and unless the ear is good with Fourier series, this answer is not so obvious.

In fact, it happens to be that the ear is a good mathematician, or at least designed by a great one.

First of all, what is an octave. When you rise or decrease a note by an octave, it means you are multiplying or dividing the frequency by 2, therefore, an octave higher of a central A note (440Hz) has a frequency of 880Hz, and an octave lower, 220Hz. So there is an easy way to know if two melodies are alike, if their ratio is a power of 2, they must be the same!

Now our good ear has a pretty concrete task, still a little uncertain how can it be achieved though. Well the answer lies within would a Dream Theater song say, if we look at the process of how hearing is made, we can go deeper into the inner ear or labyrinth and find our answers. Here, after a mechanical process of sound transmission, there are located two chambers, each filled by liquids of different electronegativity.

These two chambers are separated by a thin layer that has several valves that can allow the two fluid to be mixed. Each of these valves are opened by a thin filament that, when excited, opens the valve. When the liquids mix, this produce an impulse that triggers a neuron and sends the sound information to the brain.

Now, here magic happens, one of these chambers is connected to the mechanical system that transmits the incoming sound wave, and it produces a standing wave in this chamber. The little filaments are arranged in such a way that the smaller ones are in front and the bigger ones in the back of the chamber. All the detection work is done by these little filaments, that have lengths growing exponentially, and moreover, each one is twice or half as long as its neighbors.

Hence, for a fixed frequency, any octave of it would excite the same filaments inside our inner ear, and therefore the same neurons are triggered and that makes us feel like is the same sound or melody we played a different octave, just with a little different flavor.

Tuesday, September 1, 2009

Bloggeando con Latex

Buenas noticias para los bloggeros, es posible postear $\LaTeX$ en la mayoría de los Blogs que nativamente no lo soportan. Simplemente es cuestión de añadir un JavaScript al Blog y voilà, $\LaTeX$ en la página.

Aca está el link para que lo vean

http://watchmath.com/vlog/?p=438