Friday, November 26, 2010

Irracionalidad de armonías

Hace poco estaba viendo un documental sobre el último teorema de Fermat, grabado cuando recién se había anunciado la prueba de Andrew Wiles. El documental es muy interesante y abarca una muy buena introducción histórica y matemática del teorema, así como de la teoría empleada en su demostración.

En una parte del documental, Robert Osserman hace una muy bonita conección entre la naturaleza de los números y armonías entre sonidos. Muestra un par de triángulos rectángulos, uno pitagórico y otro un triágulo isóceles, tales que cada uno de los lados era una cuerda con la misma tensión.

Al final de la demostración, resulta que el triángulo pitagórico resuena armoniosamente, mientras que el isóceles es uno de los ejemplos de sonidos menos armoniosos que pueden haber.

Me pareció muy interesante la conección existente entre armonía musical y la relación pitagórica de los números, la cual resulta muy coherente luego de analizarla.

No hay mejor manera de analizar sonidos creados por cuerdas que utilizar la ecuación de la cuerda vibrante, la cual es la ecuación de onda con condiciones Dirichlet a la frontera:

$\Delta \phi(x) =\lambda \phi(x)$

donde $\lambda$ es un armónico del sonido producido por la cuerda. Como bien es sabido, la solución general al problema de la cuerda vibrante es una superposición de todos los armónicos posibles, que puede ser escrito como serie de Fourier como

$\phi(x)=\sum_{n=0}^\infty a_n\sin(\sqrt{\lambda_n}x)$

donde $\lambda_n=\frac{n\pi}{L}$ debido a las condiciones de frontera $\phi(0)=\phi(L)=0$, con $L$ el largo de la cuerda.

Por otra parte, desde Pitágoras con el monocordio, es sabido que al dividir una cuerda en partes iguales, se producen sonidos armoniosos, por lo que pudiéramos decir que el grado en que dos sonidos resuenan armoniósamente está relacionado con la relación que guardan sus frecuencias fundamentales. Si una frecuencia divide exactamente a la otra, el sonido es muy armonioso, tal es el caso de las octavas, en donde una frecuencia es el doble de la otra (o una potencia de 2). Luego, el grado de armonía puede medirse por medio de que tan grande sea el minimo común multiplo de ambas frecuencias, el cual puede interpretarse como que tanto hay que esperar para que los dos sonidos lleguen a producir un armónico en común.

Por esta razón, las octavas suenan muy armoniosas mientras que una nota y su sostenido no tanto. En el caso de tener dos cuerdas con logitudes cuya razón es un número racional, es posible obtener sonidos armoniosos, dependiendo del tipo de número obtenido, mientras que si la razón es un número irracional, eso quiere decir que hay que nunca es posible obtener un armónico en común, y por lo tanto el sonido obtenido es lo menos armonioso posible.





Sunday, November 14, 2010

Strings of digits and prime numbers

This weekend, I attended a conference about geometry and topology. Last night was the conference banquet and there I was sitting in a table at dinner time with a bunch of mathematicians. After some egg rolls and a wonton soup, and obvious topic made its appearance: prime numbers.

My friend Brian Streit was sitting next to me, and in the middle of the dinner he proposed this interesting and rather old question:

Given any string of digits, can one find a prime number ending in such a string? How about beginning in it?

My immediate reaction was to answer yes to both questions, as I recall seen them before in my early olympic training days.

That also made me remember a conjecture that was given to me few months ago by one of my friends back home, Rafa Martinez, who was claiming the following:

Given any string of digits, there exists a digit such that you can insert it in at a position in the original string such that the resulting number is prime.

This statement is in a sense much stronger than the previous one, and as strong as it seems, it turns out to be false, but thinking about it can make you discover some interesting properties about prime numbers and base representation of numbers.

When Rafa gave me this problem, he was so convinced of its validity and I was so convinced of its falsity, that I started looking for a counterexample. First, I started with a single digit prime number, then I start looking for two digit prime numbers that contained the first one. Then I looked for 3-digit prime numbers that contained the previous one and so on.

The first counterexample that I found by this method was 612113, but thinking of this led me to state the same question but in a different base, say $b$. Of course, the statement will still be false, but now, depending on $b$, the length of the counterexample would be different. For instance, if we are in base 2, a counterexample would be 1 (which is not prime), in base 3 we have for example 212, etc.

Basically, this phenomenon is due to the rate of growth of the prime numbers and how that can be related with the base in which numbers are written in.

Broadly speaking, we can make use of the prime number theorem to establish the rate of growth of prime numbers. It basically says, in simple words, that prime numbers grow in a logarithmic way, notice I'm not talking about the density of the primes, but about the size of a prime itself.

Hence, there is a high probability that if a number $p$ is prime, then "$ep$" is also a prime number, which, in some sense says that the most natural "base" to write prime numbers in is un "base $e$".

Of course $ep$ is not a prime number, as it is irrational, even more, what does "base $e$" mean anyway? The idea is to use this approach to find some appropriate bases for writing prime numbers. An appropriate base would be one such $b$ is close to a power of $e$. The first of these such powers is
$b=20\sim e^3=20.085536923187667740928529654581717896987907838554150144...$
The next one is
$b\sim e^8=2980.9579870417282747435920994528886737559679391328357022089...$
and so on.

Of course, changing base representation wont make the behavior of prime numbers different or anything like that, but maybe using this representations could lead to nice patterns on its representations.

After this little digression, I was then left with the original question of Brian, which I didn't think until today in the morning when I was discussing it about with other participant of the conference.

About the question that if you could find a prime number starting with a given string of digits (not ending in even or 5,0 of course) the simplest solution I could think was using Dirichlet's theorem on arithmetic progressions. Given a string of digits $a$, we look at the sequence

$a+k10^n$

with $k$ running over the positive integers and $n$ been the length of $a$. Hence Dirichlet's theorem asserts that there are in fact, infinitely many primes in this sequence, and hence, infinitely many numbers answering positively the question posed.

For the remaining question, my proof didn't come as quickly as the previous one, and it took me the entire last talk (which sadly I didn't pay attention to) to come up with a proof, aided with my good old friend Wikipedia.

I found this interesting fact about prime gaps due to Hoheisel, that states that

$p_{n+1}-p_n \leq p_n^\theta$ for $\theta$ less than 1

where $p_n$ is the $n$th prime number.

With the help of this, proving the statement is not really hard. Proceeding by contradiction, suppose that $a$ is a given string of digits, and that there is no prime number in between $a10^m$ and $(a+1)10^m$ for all $m$, hence this would imply that the relative gap of prime numbers would be of at least
$\frac{ a 10^m- (a+1) 10^m}{a 10^m}=\frac{1}{a} $
but by Hoheisel's result, as $n\to\infty$
$ \frac{p_{n+1}-p_n}{p_n}\to 0$
which leads to a contradiction.

I particularly find really interesting this connections between prime distributions and base representations, it seems that we don't completely understand yet the interaction of these two, but definitely there is an intimate relation among them.

Sunday, September 5, 2010

Ecuaciones cónicas y extensiones algebráicas

Hace un par de meses discutiamos con mi amigo José Carlos sobre ecuaciones diofantinas y de posibles métodos para poder resolverlas completamente sobre los enteros.

Este tipo de ecuaciones han sido sujeto de estudio intenso a través de la historia, siendo uno de los ejemplos más famosos el del último teorema de Fermat, dado un natural $n$, determinar las soluciones enteras de la ecuación

$x^n+y^n=z^n$

Como es bien sabido, gracias a Andrew Wiles, dicha ecuación no posee soluciones enteras a menos que $n=1$ o $n=2$.

Proponiendo una meta menos ambisiosa, consideremos una ecuación diofantina de segundo grado

$ax^2+bxy+cy^2=z$

La idea era caracterizar todos los enteros $z$ que pueden ser escritos de la forma $ax^2+bxy+cy^2$, y en el mejor de los casos, dar la forma de los enteros $x$ y $y$ que cumplen con el trabajo.

Con un poco de ejemplos numericos para ciertos valores de $a,b,c$, José Carlos conjeturó que las soluciones $x,y$ de la ecuación son multiplicativas, es decir, si

$ax_1^2+bx_1y_1+cy_1^2=z_1$

$ax_2^2+bx_2y_2+cy_2^2=z_2$

con $x_1,y_1$ y $x_2,y_2$ primos relativos, entonces existen $x_3,y_3$ tales que

$a(x_3)^2+b(x_3)(y_3)+c(y_3)^2=(z_1z_2)$

con afán de simplificar un poco la notacion, podemos denotar la ecuación como

$p(x,y)=z$

y si reescribimos la propiedad multiplicativa como

$p(x_1,y_1)\cdot p(x_2,y_2)=p(x_3,y_3)=z_1z_2$

Esto da una noción de un cierto tipo de norma en $Z^2$. Esto no es más que una extensión de la idea de los enteros gaussianos, en donde se hacen corresponder a los pares $(x,y)$ con $x+iy$, ahora, en este caso, es necesario trabajar con otra extensión algebraica de segundo orden distinta de $\mathbb{Z}\oplus i\mathbb{Z}$.

En pocas palabras, la idea es hacer corresponderle a cada par de enteros $(x,y)$ un numero $x+\alpha y$, donde $\alpha$ es un numero algebraico sobre $\mathbb{Z}$ de grado 2, y de tal manera que $p(x,y)$ sea una norma en dicha extensión algebráica.

Para esto, consideremos el conjunto $G_\alpha=\mathbb{Z}\oplus\alpha\mathbb{Z}$, con $\alpha$ un número algebráico de segundo orden con polinomio mínimo $p(x)=x^2+ex+f$. La idea es convertir $G_\alpha$ en algo que posea una estructura muy parecida a la de los numeros complejos, digamos, un anillo junto con una operación de conjugación.

En primer lugar, la multiplicación de dos elementos se puede hallar utilizando el hecho que $\alpha^2=-b-a\alpha$, lo cual da

$(x,y)(w,z)=(xw-byz,yw+xz-ayz)$

Ahora, es necesario tener un cirto tipo de $\alpha$-conjugado, es decir, un homomorfismo involutivo en $G_\alpha$. Esta conjugación queda totalmente determinada por su valor en $\alpha$. Si tenemos que $\overline{\alpha}=k+d\alpha$, utilizando la propiedad involutiva y la de ser homomorfismo, llegamos a que la única conjugación no trivial es $k=-e$ y $d=-1$.

Ahora, podemos definir la norma en $G_\alpha$ como

$|(x,y)|^2=(x,y)\overline{(x,y)}$

lo cual, por puede escribirse como

$|(x,y)|^2=x^2-exy+fy^2$

con esto tenemos que es inmediata la observación dada por José Carlos, puesto que si $p(x,y)=x^2-exy+fy^2$, y si $p(x_1,y_1)=z_1$ y $p(x_2,y_2)=z_2$, entonces $p(x_3,y_3)=z_1z_2$, donde $x_3,y_3$ están dados por la multiplicación en $G_\alpha$

$(x_1,y_1)(x_2,y_2)=(x_3,y_3)$

Así, el problema inicial de resolver $p(x,y)=z$ se reduce a encontrar puntos con coordenadas enteras en el círculo de radio $z$ centrado en el origen en $G_\alpha$, donde $\alpha$ es una de las raices de $p(x,1)$.

Es importante observar que cualquier polinomio $ax^2+bxy+cy^2$ sustituirse por un polinomio de la forma $x^2-exy+fy^2$ sin afectar el problema inicial.


Tuesday, July 13, 2010

Projectivizations and orthogonal groups


Few days ago, I went to a summer school in algebraic geometry in Peru, and ithere was one course in projectivization of some special types of curves and properties of them.

One of the examples was doing the projectivization of a general conic over $\mathbb{C}^n$ and finding some nice properties that the resulting curves have.

The idea of the projectivization of a curve, is to grab the domain of definition and then do its compactification, for instance, in the case of a conic in $\mathbb{C}^2$, the result is to have a conic in a sphere (Riemann sphere). Algebraically, the idea is to have a curve defined as the zero set of a polynomial, for example, $p(x,y)=ax^2+bxy+cy^2=0$ with $(a,b,c)\in\mathbb{C}^3$, and then to extend the domain where the parameters are defined, i.e. $[a:b:c]\in\mathbb{P}(\mathbb{C}^2)$.


The speaker was talking about the cases in dimension 2 and 3, where the proyective spaces are $\mathbb{P}(\mathbb{C}^2)$ and $\mathbb{P}(\mathbb{C}^5)$ , and she defined a nice realization of the later one as the set of $3\times 3$ complex symmetric matrices, i.e.

$p(x,y,z)=a_1x^2+a_2xy+a_3xz+a_4y^2+a_5yz+a_6z^2$

$\mapsto \begin{pmatrix} a_1 & a_2 & a_3\\ a_2 & a_4 & a_5 \\ a_3 & a_4 & a_6 \end{pmatrix}$

This reminded me of the good old $O(3)$ with some differences. First of all, we have complex entries in our matrix, and second, the entries must satisfy and extra condition, we identify set of parameters with a common factor ($A\sim B$ iff $A=\lambda B$ for some $\lambda\in\mathbb{C}^x$), that is, the matrix defines the same curve up to a scalar multiple, which means that we need to scale it in some sense.

This two things can be fixed by considering $SO(3)$ instead of the whole $O(3)$ and then, by doing its complexification, $SO(3)\times_{\mathbb{R}}\mathbb{C}$.

So, my natural conjecture was that

$\mathbb{P}(S^n_2)\sim SO(n)\otimes_{\mathbb{R}}\mathbb{C}$

where $S^n_2$ is the space of homogeneous polynomials with degree 2 in $n$ variables and the isomorphism is as complex manifolds.

After discussing with a couple of people, I found that there were reasons to believe that this is true, since some topological properties of both spaces matched, but so far, I haven't found yet a formal proof of this fact.

In the case of this being true, it would turn out to be a really interesting property, since the object on the right is a Lie group, being isomorphic will imply that one can define a group structure in the set of conics, which is rather an interesting fact.









Thursday, July 1, 2010

El calor y la redondez de los objetos


Una pregunta muy tonta aparentemente es la de ¿cómo saber si un objeto es plano o no?, sin embargo, al tratar de determinar si algo es plano o no, frecuentemente nos referimos a algún objeto patrón, el cual acordamos en decir que es plano, pero cómo saber si es plano en realidad, y más aún, ¿qué significa que algo sea plano?

Esta linea de pensamientos anterior puede resultar un poco sin sentido y muy abstracta, sin embargo al meditar sobre el asunto es posible darse cuenta del problema latente que se tiene en esta situación. Nuestra referencia de algo plano está dada principalmente por la superficie del suelo en donde vivimos, la cual, desafortunadamente, no es para nada plana.

En términos matemáticos, la pregunta es cómo saber si un objeto tiene curvatura $0$ o no. Una manera indirecta de aproximarse a la respuesta es por medio de la propagación del calor.

Por ejemplo, para determinar si una superficie es plana o no, bastaría con aplicarle una fuente de calor puntual y analizar las curvas isotérmicas, si éstas son círculos, entonces la superficie tiene curvatura constante, y en especial, si es $0$, la superficie es plana (un plano o un cilindro)



Para lograr determinar en sí si se trata de un plano o no, es posible analizar el flujo del calor a cortos tiempos. Básicamente, si el calor se propaga aproximadamente a una razón constante o menos, entonces la superficie es plana. En otras palabras, la forma más lenta en que el calor puede propagarse es en un medio plano, lo cual tiene sentido, puesto que al haber curvatura, existe más proximidad entre las partículas del material y por lo tanto el calor puede propagarse a mayor velocidad.

Esto puede obtenerse por medio de analizar la ecuación de propagación de calor, la cual en coordenadas locales puede escribirse como

$\Delta f(x,t) =\frac{\partial f(x,t)}{\partial t}$

donde $\Delta$ es el laplaciano en $\mathbb{R}^2$ y $x\in M$ una variedad diferencial compacta sin frontera de dimensión 2.

Unos de los métodos más comunes para resolver esta ecuación es por medio de la utilización del kernel o núcleo de calor $K(t,x,x')\in C^\infty\left(\mathbb{R}^+\times M \times M\right)$, el cual da una solución a la ecuación diferencial con condición inicial $f(x,0)=g(x)$

$f(x,t)=\int_M K(t,x,y)g(y)dy.$

Para tiempos cortos, ie. $t\to 0$, se tiene la expansión asintótica del kernel

$K(t,x,x)\sim t^{-1}\sum\limits_{k=0}^\infty a_k(x)t^{k}$

en donde los coeficientes del kernel de calor dependen unicamente de la variedad $M$, su métrica y sus derivadas.

Es un resultado conocido que el primer coeficiente $a_0$ es un múltiplo de la curvatura escalar de la variedad, y en nuestro caso, estamos interesados en que esta sea $0$, por lo tanto para que la superficie sea plana, debemos tener que para tiempos pequeños ($t\sim 0$)

$K(t,x,x)\sim a_1(x)+a_2(x)t+O(t^2)$

por otra parte, si la curvatura escalar no es cero, se tiene que la expansión del kernel es

$K(t,x,x)\sim a_0(x)t^{-1}+a_1(x)+a_2(x)t+O(t^2)$

cuyo término predominante a pequeños tiempos es $a_0$, el cual hace que la propagación del calor sea más rápida, del orden de $t^{-1}$.

Una consecuencia curiosa de este análisis es el hecho que el hecho de que una superficie sea plana o no depende de la rapidez del flujo de calor, en otras palabras, el que una superficie sea plana, no es solamente una propiedad de las dimensiones espaciales de dicho objeto, sino que también de la dimensión temporal en la que está inmerso.

Este hecho da indicios de una relación más intima entre las dimensiones espaciales y temporales, y que al final de cuentas, no están tan desligadas unas de otras.







Saturday, May 22, 2010

Polygons and vertex orbits


Last Christmas, I went with my family to a road trip. I drove from Waco to New Orleans, a 8 hrs drive more or less, and when we reached there, I was a little tired. I laid down in the bed and stared at the roof of our room, and then, I started imaging a rubber ball bouncing all over a vertical cross section of our room, like a billiards ball, and then I wondered which kind of orbits could be ball have, depending of the incident angle of the first bounce.

After thinking a little, one can realize that for a rectangular cross section (my room's) this problem is not really hard, and the possible answers are quite few, depending on the ratio of the lengths of the rectangle. Then I though that a more interesting question would be when the cross section its a circle.


Basically two thing can happen, one is that the incident angle is such that the ball bounces only in finitely many places, and hence, the bouncing points make a periodic sequence on the circumference, and the other is that the bouncing points are dense in the circumference.

For instance, if the initial angle happens to be $\pi/2$, we are going to have only 2 bouncing points. Suppose that we have an initial angle $a$ and we are working with a unit circle, so that the arc length is the same as the angle value. If we look look up for periodic points, we require that $na=m\pi$, for some $n,m\in\mathbb{Z}^+$. That means that $a= \frac{m}{n}\pi$, and with out loss of generality, we can require $m/n \leq 1$. Then, one can draw the path of the ball as follows:
  • Step 1: Start drawing the path at vertex $k=1$
  • Step 2: Draw a line from the vertex $k$ to the vertex $k+m$ (sums are taken modulo $n$)
  • Step 3: Go to step 2 until you hit vertex 1
For instance, in the case $n=5$, we will have two different patterns

The orange path is obtained for $m=1$ and $m=4$, and the black one, for $m=2$ and $m=3$. In general, $m$ and $n-m$ will lead to the same orbit, but made in different directions (clockwise and counterclockwise).

So in the remaining case, when $a$ is not a rational multiple of $\pi$, we have that the bouncing points are dense in the circumference.


This result is not surprising, as this picture is related with the problem of wrapping a line around a torus, and it is well know that this wrapping is dense if it has an irrational slope, and periodic otherwise.

When glazed in this perspective, it turns out that the original problem, with the rectangle, and the one with the circle are exactly the same, since a torus is just the complex plane modulo a rectangle ( a lattice ), so at the end, my more interesting problem turned out to be as simple as the original one. It is quite interesting how apparently different problems became just two perspectives of the same phenomenon, one could seem totally boring and the other one, completely attractive and challenging. Some would say, beauty is in the eye of the beholder, but sometimes what happens is that differences are in the eye of the beholder.

Sunday, April 18, 2010

Representación integral de la función máximo entero

Hace un par de semanas fui a un congreso/seminario sobre aplicaciones de la matemática en la industria y el impacto de minorias en estados unidos en la ciencia. Principalmente se habló sobre oportunidades de trabajo y aplicaciones de distintas áreas de la matemática en problemas actuales, como control en cambio climático, modelación de epidemias, etc. La verdad, no fue muy matemático que digamos puesto que fue más orientado a opciones de comenzar una carrera en la industria y no en la academia, sin embargo, hubo una charla muy interesante sobre funciones zeta, teoría de la representación y matrices aleatorias que capturó mi atención.

Durante su charla, el expositor tocó brevemente el tema de la hipótesis de Riemann, y para darnos la idea de la dificultad del problema, ofreció un premio de $100 si alguien era capaz de demostrar que el primer cero de la función zeta de Riemann tenía parte real igual a 1/2.

Como todo buen estudiante de postgrado y en permanente carecia de fondos, me llamó la atención el intentar este problema. El tiempo era limitado, puesto que al día siguiente se terminaba el congreso, así que durante el resto de las charlas me dedique a tratar de resolver el problema.

En la tarde, fuí a hablarle al conferencista para mostrarle mis avances y las ideas que llevaba, a lo cual no prestó mucha atención en el momento, así que decidí seguir intentando un poco mas en la noche. Al día siguiente fui a consultarle nuevamente, y esta vez me dijo que iba en buen camino, pero que no se recordaba muy bien de como iba la prueba, él mismo lo habia intentado hacía unos 15 años. Al final de cuentas, no logré probarlo, para alivió economico de él y frustración mia, sin embargo, me llevó a descurbir un par de cosas interesantes.

Estaba jugando un poco con representaciones integrales de la función zeta de Riemann, y se me ocurrió probar el viejo truco de utilizar el argumento principal de Cauchy. Definí una función $F$ que me permitía, por medio de una integral de contorno, contar el número de ceros de la función zeta en un rectángulo de altura variable $\sigma$, y puesto que la gráfica $F$ es una gráfica en escalera, intenté hacer algo similar con la función máximo entero.

La idea es trabajar con una función que se anule en todos los enteros, y un buen ejemplo de eso es $f(s)=\frac{1}{\pi}\cot(\pi s)$.

Además, recordando que el argumento principal de Cauchy establece que

$\frac{1}{2\pi i}\int_\gamma F(s)ds=\sum_z Res (F(s))_{s=z}$

donde la suma corre sobre los polos de $F$ encerrados dentro de la curva $\gamma$.

Con estas dos cosas, tenemos que

$\frac{1}{2i}\int_\gamma \frac{1}{\cot (\pi s)}ds=\sum_z Res(F(s))_{s=z}$


si hacemos una curva que contenga a todos los enteros positivos, tenemos una representación para la función maximo entero, así que podemos definir $\gamma$ como el rectángulo con vértices opuestos $(\sigma, \epsilon)$ y $(1/2, -\epsilon)$, donde el contorno se toma en la dirección antihoraria.

Por lo tanto, podemos definir

$M(\sigma)=\frac{1}{2i}\int_{\gamma_\sigma}\frac{1}{\cot(\pi s)}ds$

Esta función suma los residuos de la funcion $F(s)=\frac{\pi}{\cot(\pi s)}$ en cada entero entre 1/2 y $\sigma$. No es dificil de probar que el residuo de $F(s)$ en $s=n\in\mathbb{Z}^+$ es 1, así que

$M(\sigma)=\sum_{n=1}^{[\sigma]} 1=[\sigma]$

Siguiendo esta idea, tambien es posible hallar una representación integral para la suma de los primeros $[\sigma]$ positivos

$\frac{1}{2i}\int_{\gamma_\sigma}\frac{s}{\cot(\pi s)}ds=\sum_z Res\left(\frac{\pi s}{\cot(\pi s)}\right)_{s=z}$

$=\sum_{n=1}^{[\sigma]}n=\frac{[\sigma]([\sigma]+1)}{2}$

En forma general, la representación integral de la suma de las primeras $[\sigma]$ $k$-potencias de positivos está dada por

$\sum_{n=1}^{[\sigma]} n^k=\frac{1}{2i}\int_{\gamma_{\sigma}}\frac{s^k}{\cot(\pi s)}ds$

para toda $\sigma>1/2$ y todo $k\in\mathbb{C}$.

Esta es una bonita conección entre funciones número teóricas y análisis, muchas veces el contar con una representación analítica resulta muy conveniente al estudiar matemáticas discretas.



Monday, March 29, 2010

The game of life

A couple of weeks ago, I was reading some lecture notes on game theory and I came across a really neat game.

After discussing the very basics of game theory and decision making theory, the author of the lectures gives an exercise which I found really interesting and enjoyable, at the point that I went ahead and gave it as a quiz to my business calculus class.

To my surprise, most of my class got the right answer, which was truly a grateful feeling. The game is really simple so anybody can understand it, but in my opinion, it represents many aspects of real life.

It is as follows:

Every student is to write down a real $x_i$ number in between 0 and 10 inclusively. After doing so, one computes the mean $\bar{x}$ of all of the students' bets and each student's grade is given by

$10-\left|x_i-\frac{2}{3}\bar{x}\right|$

This might look a really simple task, and by no means a game at all, but it is a game of strategy and common sense.

Our desire as a students is to maximize our grade, but that depends on the average choice of the class, which might complicate a bit the analysis of a best strategy to pick our $x_i$.

It is not hard to see that a global best strategy is to pick $x_i=0$, as if everybody is a good and logical player, having all bets equal to $0$ would give each student's grade to be $10$, which is the best possible.

So, our personal best strategy should be to pick $0$, but in real life, not all players are good thinkers or really logical, so at the end of the day, our best strategy won't give us the best out come possible.

In a sense, we can think of this game as rewarding you if you somehow think average, and most of the times, the average thinking is not precisely the most wise and logical.

By the way the game was set up, we can see that it neither rewards the average thinking as much as someone that was 2/3 away from it. If you are 2/3 away from the average, you'll get full credit, and this is somehow what happens in real life. Usually not the average people get the best outcome nor the people that plays the best, but people that are in between.

This gives a really good example that in most occasions, your outcome does not depend only on your own strategy, but also in someone else's strategy, and that making the best decisions and taking the best choices does not guarantee your success.



Sunday, March 21, 2010

La traza como optimizador de volumenes

La semana pasada durante el descanzo de inicio de primavera, pase una semana en guate y gracias a la invitación de un par de amigos, tuve la oportunidad de hablar un poco de las locuras que intento hacer en mi investigación.

Hablé sobre funciones zeta y pistones semitransparentes y mientras preparaba el contenido de lo que iba a decir, estuve buscando un poco sobre interpretaciones más naturales de las funciones zeta. Es bien sabida la interpretación de las funciones zeta como traza de operadores de kernel de calor, así que me surgió la curiosidad de buscar alguna interpretación geometrica de la traza de un operador.

En el caso finito dimensional, los operadores con los que trabajamos son matrices hermitianas, aunque este punto de vista es valido para cualquier tipo de matriz.

Para esto, consideremos el grupo de matrices $GL(n)$ de determinante no nulo de $n\times n$. Sea $P\in GL(n)$, hay varias formas de definir la función exponencial en $GL(n)$, una de ellas es por medio de la serie usual

$\exp(P)=\sum_{k=0}^\infty \frac{1}{k!}P^k$

la cual converge para toda $P$.

Una forma indirecta de definirla, es por medio de ver a la matriz $P$ en forma canonica diagonal, $P=SDS^{-1}$ donde $D$ está dada por

$D=\begin{pmatrix}\lambda_1 & & &\\ &\lambda_2 & &\\ & & \ddots& \\& & &\lambda_n\end{pmatrix}$

donde $\lambda_i$ son los valores propios de $P$. Entonces

$\exp(P)=S\begin{pmatrix}e^{\lambda_1} & & &\\ &e^{\lambda_2} & &\\ & & \ddots& \\& & &e^{\lambda_n}\end{pmatrix}S^{-1}$

Utilizando estas definiciones, no es dificil ver que la función exponencial cumple con

$det(\exp(P))=\exp(Tr(P))$

Por otra parte, se puede ver a $GL(n)$ como un subconjunto abierto de $\mathbb{C}^{n^2}$, y por lo tanto se puede realizar calculo en dicho grupo. La noción de $dP$ puede interpretarse como un diferencial total en $\mathbb{C}^{n^2}$. Así, es posible hablar de cálculo diferencial e integral en $GL(n)$. Esto no es más que cálculo en la variedad diferencial $GL(n)$.

Sea $P_0\in GL(n)$ una matriz cerca de $P$, y defínase

$\log(P)=\int_{P_0}^P P^{-1}dP$

donde la integral puede definirse por medio de una integral de linea, parametrizando un camino en $GL(n)$ desde $P_0$ hasta $P$.

Sea $Q=\exp(P)$, y sea $Q_t:[t_0,T]\to GL(n)$ la parametrización de una curva desde $Q_0=\exp(P_0)$ hasta $Q=\exp(P)$. Por lo tanto,

$det(Q)=\exp(Tr(\log(Q)))$,
$\log(det(Q))=Tr\left(\int_{t_0}^TQ_t^{-1}\frac{dQ_t}{dt}dt\right)$
y tenemos que
$\int_{t_0}^T det(Q_t)^{-1}\frac{d\, det(Q_t)}{dt}dt=\int_{t_0}^T Tr\left(Q_t^{-1}\frac{dQ_t}{dt}dt\right)$
por lo que las 1-formas son iguales
$det(Q)^{-1}d\, det(Q)=Tr\left(Q^{-1}dQ\right)$

en otras palabras, tenemos que
$d\, det(Q)=det(Q) Tr\left(Q^{-1}dQ\right)$

Esta identidad resulta ser muy útil y encierra mucha información geometrica sobre las matrices. Como es conocido, la interpretación del determinante de una matriz de $n\times n$ es el volumen (con signo) del paralelepípedo en $n$ dimensiones generado por los $n$ vectores columna de la matriz, así que por medio de la ecuación anterior, podemos decir que la traza de una matriz de aluna forma nos está dando la razón de cambio del volumen generado por los vectores columna.

Este resultado me pareció de gran interés, puesto que en el caso finito dimensional, relaciona funciones matriciales un tanto extrañas en naturaleza, pero comunmente utilizadas, con nociones geométricas muy fácilmente comprensibles.

Como todo en la vida, creo que esta conección a nivel de dimensión finita, tiene una contrapartida en el caso general, sin embargo aún estoy pensando como formalizar este concepto, pero creo que la idea general es tratar de establecer una relación entre la variación de la curvatura de un espacio y el determinante y traza de cierto tipo de operadores lineales. En cierto modo, esto tiene relación con flujos de Ricci y como evoluciona el volumen de una variedad através del tiempo. La conección natural parece ser, de nuevo, el teorema espectral para operadores lineales autoadjuntos y posiblemente compactos.




Tuesday, February 16, 2010

Orbit-Stabilizer and Covering Maps

Last week, in our quantum Mechanics class, we were going over symplectic spaces and symplectic transformations. A symplectic space is just a manifold together with a skew-symmetric non-degenerate bilinear form $J$ defined on it, and a symplectic transformation $S$ is a transformation of the manifold into itself such that it preserves $J$. One of the most common examples is when we take our manifold to be $M=\mathbb{F}^{2n}$ and the symplectic form

$J=\begin{pmatrix}0&I_n\\-I_n&0\end{pmatrix}$

where $F$ is a field and $I_n$ is the identity matrix. This is a symplectic manifold, and the set of symplectic transformations is know as $Sp(n,F)$. This is a well known Lie Group acting by multiplication on $M$, and one of its goodness is that this action is transitive, that is, for any non-zero $x,y\in M$, there is $S\in Sp(n,F)$ such that $y=Sx$.

This statement was actually part of our homework, to prove that the action is transitive, and I wanted to find a nicer way to prove it and not to do a proof that I had seen before in my previous courses, so I started thinking a bit of many different ways of saying that this action was transitive.

One way of seen this is by turning around the problem saying what would happen if we let $S$ to run over $Sp(n,F)$ and look at $Sx$ for $x$ fixed? Well, that is saying something like the orbit of $x$ is $M/\{0\}$ and that started to sound a bit familiar.

I was trying then to use some kind of orbit-stabilizer theorem and then use some cardinality argument and kill the problem. Although, I only did remember the finite version of this powerful theorem, which obviously, wouldn't help me at all, but in essence, that was what I was looking for. A cardinality argument would not help me in this situation, because I could have some proper subspace of the same cardinality of $M$ and this wouldn't lead me to the conclusion I was going after. Instead, a dimensionality argument was needed.

While searching for this and thinking what actually was going on behind the scenes in this group action, I saw how helpful is the notion of representation for understanding a strange object.

If $G$ is a Lie Group, we call a representation of it, a vector space $V$ in which $G$ acts on. We can think as $G$ be some sort of subgroup of $Gl(V)$, the set of linear transformations of $V$ into itself. For an element $x$ of $V$, we can talk about the $G$ orbit through $x$, $O_x$ as the set of all $g.x$ for $g\in G$. In some sense, $O_x$ is a copy of the shape of $G$. Also, from the geometrical point of view, a Lie Group is a manifold, endowed with superpowers (group structure) and hence, we can think of these orbits into $V$ as coordinate maps of $G$ given by $\phi(g)=g.x$, so really $O_x$ is how $G$ looks locally.

For example, take $O(2)$, which is the group of all $2\times 2$ matrices $O$ such that $OO^T=I$. This group is quite odd to picture, since it is a 1 dimensional manifold living in a 4 dimensional space, but by means of orbits, one can have a pretty good idea of how this group looks like. By picking a nonzero vector $x$ and looking at its orbit in $\mathbb{R}^2$, one can find that $O(2)$ looks locally like a circle.



In the general case, one can think as $G$ being a covering for $O_x$ and the degree of the cover is the number of connected components of $G$, for instance, in the above case, $O(2)$ has 2 connected components, the set of matrices with determinant equal to 1 and those of determinant equal to -1, and that fact is reflected in $O_x$ as the vector $g.x$ rotates counter clockwise for $O(2)_e$ (the identity component) and rotates clockwise in the other component, so each circle is drawn twice, and that means that $O(2)$ is a 2-fold cover for each $O_x$.

In this language, we can say that the stabilizer $G_X$ of an element $x$, is the fiber $\phi^{-1}(x)$ whose cardinality gives us the degree of the covering map.

Actually, from this point of view, $\phi$ defines a quotient map, which is very suitable for an orbit-stabilizer type argument. Since the stabilizer $G_x$ is a normal subgroup, one can think of $G$ as a principal $G_x$-bundle as $G/G_x\times G_x$ and making the identification $G/G_x\sim O_x$ and $G_x\sim \phi^{-1}(x)$ we have that $G\sim O_x\times\phi^{-1}(x)$.

Going away from counting arguments and going more into dimensionality, I found the so called Orbit-Stabilizer Theorem for Lie Groups which have the same feeling as the covering map approach. It states that

$dim(G)=dim(O_x)+dim(G_s)$

where $dim$ is regarded as manifolds.

In the $O(2)$ case, we have that $dim(G)=1$, $dim(O_x)=1$ and $dim(G_x)=0$ as any of the other cases when $G_x$ is a finite group, and hence, we have that $\phi$ is a quotient map and $dim(G)=dim(O_x)$ as expected from a covering map.

At the end, I didn't use any of these arguments for my proof, but I found quite enjoyable doing this diversion from my first thought.


Sunday, February 7, 2010

Tempo Musical y Espacios de Hilbert

Hoy durante el recital de piano de mi amigo Alfredo notaba algo extraño que desde mucho tiempo me ha acosado pero nunca habia puesto tiempo en analizar detenidamente, y es la increible capacidad que tiene el cerebro humano de comprender la música.

Notaba como de forma natural, lograba identificar el tempo en el que mi amigo interpretaba el piano, es decir, llevar el tiempo de la canción con mi pié, o como decimos coloquialmente, llevaba el ritmo.

Esto puede sonar una tarea muy sencilla de identificar, puesto que una forma tentadora de hacerlo es simplemente seguir el tiempo de las notas consecutivas, sin embargo, de esta forma se tendría un tempo errático, no regular en el tiempo. Parecería entonces que es cuestión de hallar un máximo común divisor entre estas separaciones de notas, pero de nuevo, esto no resuelve el problema de manera eficaz, pues en la mayoría de casos, se obtienen valores muy altos de bpm (beats per minute). Un valor típico de tempo esta cerca de los 120 bpm o 2 notas por segundo.

Luego de estos pequeños inconvenientes, me puse a pensar un poco en otro que es un poco mas sutíl, y es que si una canción está en un tempo $\tau$, matemáticamente es correcto tambien clasificarla con un tempo de $2^n\tau$, con $n\in\mathbb{Z}$, sin embargo, solamente una de estas opciones suena acorde en el cerebro.

Una cosa interesante es el factor de una potencia de 2 en los tempos equivalentes, aunque resulte muy natural dividir en 2 o duplicar el tempo, ¿porqué 2 y no otro número? ¿digamos 3?, ¿5?, ¿$\pi$? La respuesta quizás ya la haya abordado anteriormente, solo que en otra escala de tiempo. Si una nota suena igual una octava abajo o una octava arriba, naturalmente un tempo sonará bien si se duplica o se divide por la mitad. Ahora la pregunta es ¿cómo sabe nuestro oído cual es el factor correcto?

Una idea para abordar esta incógnita es representar una canción $\phi(t)$ por un vector en el espacio $M=\otimes_{\alpha\in\mathbb{R}}\mathbb{R}v_\alpha$, donde $v_\alpha$ es un vector de la base. Es importane notar que por definición diremos que los $v_\alpha$ son linealmente independientes, sin embargo podemos interpretar a $v_\alpha$ como $e^{\alpha t}$, es decir, los $v_\alpha$ viven en diferentes espacios de factores. Con esto tenemos que

$\phi(t)=\sum_{\alpha\in\mathbb{R}} c_\alpha(t)v_\alpha$

donde la suma es una serie formal y los $c_\alpha(t)$ no son otra cosa que los coeficientes de fourier de $\phi(t)$.

Como el tempo lo determina la cantidad de notas que se ejecuten, podríamos decir que está relacionado con las variaciones en la amplitud de los sonidos (prescencia o ausencia), en otras palabras, se podría analizar el comportamiento de $d\phi(t)$ en $M$, es decir

$d\phi (t)=\sum_{\alpha\in\mathbb{R}} d c_\alpha (t) v_{\alpha}$

esta fue la razón por la que resulta conveniente tomar los $v_\alpha$ como objetos abstractos, así al tomar la derivada no tenemos factores proporcionales a la frecuencia de cada armónica.

Ahora bien, la magnitud de este vector derivada puede darnos una idea de cuanto cambia el vector inicial $\phi$, por lo tanto podemos analizar en un intervalo de tiempo

$|d\phi(t)|^2=\int_a^b\int_{-\infty}^\infty|dc_\alpha(t)|d\alpha dt$

y tratar de relacionarlo de alguna manera con algo que nos mida el tempo en este intervalo. La integral interior converge puesto que dado que los coeficientes $c_\alpha$ son coeficientes de fourier, tenemos que $\phi$ es una función de potencia finita, es decir, una función en $L^2$ y por lo tanto $d\phi$ tambien sera de potencia finita.

El motivo de analizar el comportamiento de la señal en un intervalo es que el tempo de una canción es una cantidad que puede o no ser constante a lo largo de toda la canción, es muy frecuente que dependiendo del género musical, el tempo en efecto no sea un parámetro constante a lo largo de la canción, como es el caso del progresivo. Por lo tanto, podemos considerar el tempo como una propiedad semilocal y no una propiedad global, es decir, una propiedad que esta ligada a la longitud del intervalo sobre el cual se está analizando la canción. Para esto podemos analizar la senñal en un intervalo $[a,b]$, donde $(b-a)>>1/f_b$ donde $f_b$ es frecuencia de corte de bandabase de la canción, la cual está alrededor de los $8KHz$.


Una interpretación que podemos dar al tempo como el período de un tren de pulsos tal que al muestrear la canción original, es posible aún percibir el contenido de la canción. Con esto no me refiero a recuperar la señal original como en el caso del teorema de Nyquist, sino que a lograr identificar la melodia o el contenido musical de la canción.

Si denotamos por $\Delta_{\tau}(t)$ un tren de implusos unitarios con período $\tau$, la señal muestreada está dada por

$\Delta_{\tau}(t)*|d\phi(t)|^2.$

Podemos interpretar que el tempo es el valor ${\tau}$ que resuelve un problema de optimización actuando sobre la función anterior. El cerebro es un especialista en resolver problemas de optimización, como la visión bifocal de los ojos, que maximiza la cantidad de información obtenida por ambos ojos a la vez, o el sistema retroalimentado boca-oídos-ojos que minimiza el volumen de la voz necesario para transmitir un mensaje a otra persona. Por esta razón, suena a que este es otro problema en donde una optimización es llevada acabo.


Ahora bien, debido a la propia esctructura interna del oído, resulta más natural analizar esta función en el dominio de la frecuencia, ya que nuestros oídos son receptivos a los cambios en frecuencia y no a los cambios en el tiempo. Puesto que $|\phi'(t)|^2\in L^2(\mathbb{R})$, podemos estudiar su transformada de Fourier

$T(f)=\left( \sum_{n=-\infty}^{\infty} e^{-2\pi i n f \tau}\right)\widehat{|d\phi(t)|^2}$

Esta función es una función en $L^2$, por lo que podemos calcular su norma, la cual daría la cantidad de energía que posee, así que como lo establecimos antes, nuestro problema a minimizar puede ser el de encontrar $\tau_0\neq 0$ tal que

$\left. \frac{d ||T||_2}{d\tau}\right|_{\tau_0}=0$

en donde $\tau_0$ es un candidato al tempo de la canción. En la prática este problema de minimización puede ser resuelto solo mediante métodos numéricos, debido a los factores $e^\tau$ que se hallan en la función $\tau$. La verdad, no soy muy numero-analítico, asi que pequé de conformista y dejé el análisis hasta aca, pero sería una buena idea el tratar de implementar el algoritmo y analizar resultados experimentales.

Monday, January 25, 2010

Exponential Series

This semester we started a course in Time Scales, which is an interesting generalization of the classic differential analysis. The idea of time scales is to provide a connection between the study of differential equations made on $\mathbb{R}$ and the study of difference equations on $\mathbb{Z}$.

This connection is made by taking a closed subset of $\mathbb{R}$ and start defining on it notions of a right and left derivatives, which are called the $\Delta$ and $\nabla$ derivatives.

On last week's class, one of my friends was talking about this definitions and also how would one define an integral using this time scales approach. As an example, he state the following integral

$\int_0^\infty e^{-\tau^2}\Delta \tau$

On the time scale $\mathbb{T}=\overline{\{q^\mathbb{Z}\}}$ for some $q>1$. This is just the closure of the set of all integer powers of $q$.

After dealing with the boring algebra involved, the previous integral has a value of

$(q-1)\sum_{n=1}^\infty (q^n+q^{-n})e^{-n^2}$

Finding the actual value of this expression boils down to calculate the value of

$\sum_{n=1}^\infty e^{an-n^2}$

This can be done by using the Jacobi Theta Function, which is given by

$\vartheta(z,w)=\sum_{n=-\infty}^\infty \exp(2\pi i nz+\pi i n^2 w)$

for $z\in\mathbb{C}$ and $w\in\mathbb{H}$. Thus letting $z=\frac{-ai}{2\pi}$ and $w=\frac{i}{\pi}$ gives the value that we are looking for. In this case, we have that

$\int_0^\infty e^{-\tau^2}\Delta \tau$
$=\frac{(q-1)}{2}(\vartheta(-ai/2\pi,i/\pi) +\vartheta(ai/2\pi,i/\pi) -2)$

This is a really simple problem at first sight, but it caught my attention the fact that it all relies on determining the value for an expression that looks like

$\sum_{n=1}^\infty e^{p(n)}$

where $p(n)$ was a quadratic polynomial with a negative leading coefficient. A natural question came then to my mind, what would happen if we would have any polynomial instead?

My first idea was to study the case when $p(n)=-n^m$ for a fixed power $m$. The cases when $m=1,2$ are contained in the previous approach using the Jacobi Theta Function. I first try to calculate the series for some values of $m$, and I found that the above expression, as a function of $m$, converged really fast as $m$ was getting bigger.

Actually, it is not difficult to find out that this limit exists and has the value of

$\lim_{m\to\infty} \sum_{n=1}^\infty e^{-n^m}=\frac{1}{e}$

Following the same line, one can show that for $p(n)=-an^m$, with $a$ a constant, we have that

$\lim_{m\to\infty} \sum_{n=1}^\infty e^{-an^m}=\frac{1}{e^a}$

Thus, one could say that for a polynomial $p(n)=-an^m+O(n^{m-1})$ a good approximation its given by

$\sum_{n=1}^\infty e^{p(n)} \approx\frac{1}{e^a}$

Looking for a different approach towards a more precise answer, one can define a function given by $f(t)=\sum_{n=1}^\infty e^{p(n) t}$ and this function can be viewed as the heat kernel of a differential operator $P$ whose spectrum is given by $\sigma(P)=\{\lambda_n\}$, where $\lambda_n=p(n)$.

This could suggest the difficulty of such a closed form for $f(1)$, for instance, in the case of $p(n)=-n^m$, this would be related to the existence of an operator $P$ with eigenvalues $\{1/n\}$, which is one of the consequences of the Riemann Hypothesis.




Monday, January 11, 2010

Hausdorffización de un Espacio?

El año pasado después de una plática sobre topología en la universidad, como cosa rara en un ambiente topologico, surgió una pequeña plática sobre espacios de Hausdorff. De dicha discusión, sirgió en mi la inquietud si de alguna forma pudiera medirse cuán Hausdorff es un espacio.

Un espacio topológico se dice Hausdorff si es posible separar puntos, es decir, si dados dos puntos distintos, se pueden hallar vecindades de cada punto disjuntas entre sí. Una definición más formal sería que dados dos puntos distintos $x,y$ de un espacio topológico $X$, existen abiertos $U,V\in \mathcal{T}$ tales que $x\in U$, $y\in V$ y $U\cap V=\emptyset$.

De cierto modo, dos puntos que fallan en cumplir esta propiedad están unidos, en el sentido que cualquier vecindad de uno intersecta a todas las vecindades del otro.

Siguiendo esta conceptualización, si tenemos que la propiedad de separación falla en dos puntos $x,y$, hablando de una manera informal podríamos decir que los puntos no pueden tener vecindades arbitrariamente pequeñas. Con esto en mente, se me ocurrió definir una función $\mathcal{W}:X\to \mathcal{P}(X)$ por $x\mapsto \bigcap_{V\in\mathcal{T}} U$.

La idea es hallar la menor vecindad alrededor de cada punto. Sin embargo, nótese que $\mathcal{W}_x$ no será necesariamente un conjunto abierto, de hecho, en el caso que se trate de un espacio Hausdorff, no es muy difícil de probar que dicha función $\mathcal{W}$ es simplemente $\mathcal{W}_x=\{x\}$ y por lo tanto, si el espacio es $T_1$, se tiene que $\mathcal{W}_x$ es cerrado.

Posiblemente, esta función pueda ayudar a medir en cierto modo que tan Hausdorff es un espacio. Si un espacio es Hausdorff, se tiene que $\mathcal{W}_x=\{x\}$ y sería natural preguntar si esta condición es suficiente para ser Hausdorff, es decir, un espacio $X$ es Hausdorff si y solo sí $\forall x\in X$, $\mathcal{W}_x=\{x\}$.

Supongamos que $X$ es un espacio tal que $\mathcal{W}_x=\{x\}$ para todo $x\in X$ y $X$ no es Hausdorff. Sean $x,y$ dos puntos distintos de $X$ tales que cualquier vecindad de $x$ intersecta a todas las vecindades de $y$.

Sea $\mathcal{B}_x$ una base local en $x$ y $\mathcal{B}_y$ una base local en $y$. Puesto que $U\cap V=\emptyset$ para todo $U\in\mathcal{B}_x$ y todo $V\in\mathcal{B}_y$, sea $l_{UV}\in U\cap V$. Utilizando el axioma de elección, defínase $L$ el conjunto de dichos $l_{UV}$. Por definición, se tiene que $x$ es un punto límite de $L$.

Supongamos que $X$ es segundo contable, de esta manera, es posible encontrar una sucesión $\{l_n\}$ en $L$ que converja a $x$. Por definición, para todo $n$, existe una vecindad $V$ de $y$ tal que $l_n\in V$, por lo tanto $l_n\in\overline{V}$ y entonces $x\in \cap_{y\in V\in \mathcal{T}} \overline{V}$ $=\overline{\cap_{y\in V\in \mathcal{T}} V}$ $=\overline{\{y\}}$. Si se supone además que $X$ es $T_1$, entonces $\overline{\{y\}}=\{y\}$, por lo que $x\in \{y\}$ y entonces $x=y$.

Al parecer, esta equivalencia es válida en el ámbito de $X$ ser $T_1$ y segundo contable, no se si puede ser generalizada esta noción, pero me pareció una forma interesante de traducir el concepto de Hausdorff en términos de la menor vecindad que contiene a un punto.






Monday, January 4, 2010

Line orbits on a circle




After a little break time, I decided that a good way to start the year is by posting something that I was thinking on few days ago.

At the beginning of the Winter break, one of my friends back home post me a question about determining the foci a hyperbola just with compass and straightedge constructions. Thinking a little about it, I was trying to find some basic property of the foci of a hyperbola, and it came to my mind that they must have the same property no matter what kind of conic we are looking at, since all conics are equivalent under the $PSL(2,\mathbb{R})$ group.

So I tried to find some kind of property that the foci of all conics share, and one of them can be regarded as some kind of reflection property.

If you have a set of lines that passes through one of the foci of a conic and you take the reflection of these lines on the conic, the resulting set of lines passes through the other focus.

In the case of a circle, the two foci coincide in the center of the circle, so the condition holds, but this made me think of analyzing the orbit of a line in a circle. By this, what I mean is the following: start with a line that intersects the circle, then at the intersection points, reflect the line through the circle and keep with this process. Call the resulting intersection points on the circle, the orbit of the line. Now, a very natural question would be for which kind of lines does this orbit is finite? has a limit point? is dense in the circumference?
At the beginning, the answer seems really straightforward, one could say that the lines that lead to finite orbits are the ones that belong to sides of a regular polygon, which means that the lines leading to finite orbits are the ones whose distance to the center of the circle equals the apothem of some regular polygon inscribed in the circle.

However, this condition is quite weak, since there are more such lines. To look at these, we can take a different approach. One easy way is to look this is by taking the arc length instead. If we take the length of the circumference to be 1, then if the arc lengths of the pieces into which is divided the circle by the line are rationals, we have that the orbit is finite. Moreover, if the arc length is $q/p$, the orbit has length $p$.

This is equivalent to studying the circle regarded as $\mathbb{R}/\mathbb{Z}$, and here the orbit for a value $x$ is the set $\{[nx]: n\in\mathbb{Z}\}$ from where we have that it is finite iff $x\in\mathbb{Q}$ and it is dense in the circle otherwise.


Another interesting question would be to find sufficient conditions for finite orbits on a general conic, and this might be studied using the group structure of the circle $S^1$ and the projective properties of $PSL(2,\mathbb{R})$.