Capítulo 3. Funciones y estructuras de control

La potencia de un lenguaje de programación se encuentra a la hora de implementar algoritmos medianamente complejos, que impliquen algo más que una secuencia lineal de operaciones. A poco que aumente la complejidad de un programa, se hace necesario utilizar ciertas estructuras de código entre las que podemos destacar:

  • Funciones que encapsulen "trozos" de código con el fin de reutilizarlos o simplificar el código fuente.
  • Estructuras de control para definir flujos condicionales e iterativos en la ejecución del código.

En los capítulos anteriores ya hemos visto ejemplos de funciones y estructuras de control, que se han presentado sin apenas comentarios. En este capítulo vamos a dar las explicaciones básicas para entenderlas y utilizarlas, ya que son una parte fundamental de cualquier lenguaje de programación, aunque sin entrar en ciertos detalles avanzados que se dejan para capítulos específicos más adelante.

Siguiendo el esquema habitual, comenzamos con un ejemplo más que nos servirá como guía para las explicaciones posteriores.

Ejemplo: "hoja de calendario"

Vamos a crear un programa que toma como entrada los números de un mes y un año, y escribe un código HTML para representar el calendario del mes correspondiente. Los pasos a seguir por este programa son los siguientes:

  1. Calcular el primer día de la semana de ese mes.
  2. Calcular el número de días que tiene el mes.
  3. Calcular el número de semanas que abarca del mes.
  4. Crear una tabla vacía con la estructura del calendario
  5. Rellenar la tabla con números correlativos, fila por fila, comenzando con el 1 en día de la semana que corresponde de la primera fila, y finalizando con el último día del mes.
  6. Convertir la tabla a código HTML, añadiéndole el encabezado con los nombres de los días de la semana.

A continuación desarrollamos las operaciones que hay que llevar a cabo en cada uno de estos pasos, que implementaremos en distintas funciones.

Paso 1. Primer día de la semana

El primer paso lo podemos resolver con la función gauss_diasemana que se presentó en el capítulo 1. Pero esa función devuelve el día de la semana en forma de texto, y necesitamos convertirlo en un número para saber en qué columna de la tabla comenzar a escribir los días. En lenguaje natural, definiríamos la siguiente regla:

  • Si el primer día es "lunes", el número es 1,
  • en caso contrario, si el primer día es "martes", el número es 2,
  • (etc., hasta el sábado, que corresponde al número 6),
  • y si el primer día no es ninguno de los anteriores, el número es 7.

La función numero_primer_dia que se presenta a continuación implementa literalmente estas instrucciones, devolviendo el número que corresponde al mes y el año que se introduzcan (como las variables m e y, respectivamente):

funcion numero_primer_dia(m, y)
    primerdia = gauss_diasemana(1, m, y)
    if primerdia == "lunes"
        return 1
    elseif primerdia == "martes"
        return 2
    elseif primerdia == "miércoles"
        return 3
    elseif primerdia == "jueves"
        return 4
    elseif primerdia == "viernes"
        return 5
    elseif primerdia == "sábado"
        return 6
    else
        return 7
    end
end

Este es un código muy fácil de seguir (al menos si se piensa en inglés), pero bastante repetitivo, y se intuye que tiene que haber una forma de simplificarlo. La descripción que se ha hecho antes de la rutina en lenguaje natural –en particular el punto comentado "etc."– nos da la pista de que lo que se hace en el fondo es recorrer una lista de días, y devolver el número de la posición en la que se encuentra la coincidencia con el resultado de gauss_diasemana. Esa lista la podemos definir del siguiente modo:

listadias = ["lunes","martes","miércoles","jueves","viernes","sábado", "domingo"]

Y la siguiente definición alterntiva de numero_primer_dia devuelve el resultado deseado, en base a la rutina "resumida":

function numero_primer_dia(m, y)
    primerdia = gauss_diasemana(1, m, y)
    for d = 1:7
        if primerdia == listadias[d]
            return d
        end
    end
end

Probamos con el mes de agosto de 2018, que comenzó en miércoles (tercer día):

julia> numero_primer_dia(8, 2018)
3

Paso 2. Número de días del mes

La cuenta de los días del mes es trivial para todos los meses excepto para febrero, que depende de que el año sea bisiesto o no. Para resolver este problema definimos la función es_bisiesto, que compara si un supuesto 29 de febrero caería en el mismo día de la semana que el 1 de marzo, y devuelve el valor "verdadero" (true) si los días no coinciden (el año es bisiesto), o "falso" (false) en caso contrario:

es_bisiesto(y) = (gauss_diasemana(29,2,y) != gauss_diasemana(1,3,y))

Con esto, podríamos definir la siguiente función para calcular el número de días del mes:

function numero_dias(m, y)
    if m in [1, 3, 5, 7, 8, 10, 12] # enero, marzo, etc.
        return 31
    elseif m == 2 # febrero
        return (es_bisiesto(y) ? 29 : 28)
    else # el resto de meses
        return 30
    end
end

Probando de nuevo con agosto de 2018, obtenemos:

julia> numero_dias(8, 2018)
31

Pasos 3 y 4. Calendario vacío

La cuenta de semanas comprendidas en el mes la podemos hacer mediante una división entre 7 del número de días del mes (sumándole los del mes anterior que entran en la primera semana). Si el resto de la división es cero (el mes acaba en domingo), el número de semanas es el cociente de la división; en caso contrario, hay que sumar una semana al resultado. En el capítulo 1 vimos como usar las funciones div y rem para calcular el cociente y el resto de una división entera, respectivamente. Aquí usaremos la función divrem, que devuelve ambos resultados en un solo paso.

Este cálculo lo haremos junto a la creación de la tabla vacía, mediante la función fill, que toma como argumentos el contenido a poner en las celdas (en este caso la cadena vacía ""), y el número de filas (número de semanas) y columnas (7 días por semana) a rellenar.

function calendario_vacio(primerdia, ndias)
    (semanas, resto) = divrem(ndias + primerdia - 1, 7)
    if resto == 0
        return tabla = fill("", semanas, 7)
    else
        return tabla = fill("", semanas + 1, 7)
    end
end

Agosto de 2018 fue un mes de cinco semanas. Partiendo de los resultados de numero_primer_dia (3) y numero_dias (31), podemos obtener la tabla vacía sobre la que trabajaremos en el siguiente paso:

julia> calendario_vacio(3, 31)
5×7 Matrix{String}:
 ""  ""  ""  ""  ""  ""  ""
 ""  ""  ""  ""  ""  ""  ""
 ""  ""  ""  ""  ""  ""  ""
 ""  ""  ""  ""  ""  ""  ""
 ""  ""  ""  ""  ""  ""  ""

Paso 5. Rellenar la tabla

La operación para rellenar la tabla se podría hacer de distintas maneras. Lo que haremos en la función rellenar_calendario! que se presenta a continuación, es recorrer las distintas columnas de la tabla, fila por fila, a la vez que vamos haciendo avanzar un "contador de días" cada vez que cambiamos de celda. Este contador empezará por 1 si el primer día de la semana es lunes, 0 si es martes, -1 si es miércoles, etc. En los días en que este contador esté entre 1 y el máximo número de días del mes, se escribirá el número correspondiente del día en la celda; en los demás casos se escribirá una celda en blanco. Esta rutina se detendrá cuando se haya completado la semana en la que se llega al último día del mes:

function rellenar_calendario!(tabla, primerdia, ndias)
    # Contador de días (1 si `primerdia` es 1, 0 si es 2, etc.)
    dia_mes = 2 - primerdia
    # Rellenar filas del calendario, hasta que no queden días del mes
    fila = 1
    while dia_mes ≤ ndias
        for columna = 1:7
            if 1 ≤ dia_mes ≤ ndias # Celdas con número dentro del mes
                tabla[fila, columna] = string(dia_mes)
            end
            dia_mes += 1
        end
        fila += 1
    end
end

Esta función no devuelve ningún resultado, pero modifica los contenidos de la tabla que se le pasa como primer argumento. (Este es el motivo por el que hemos añadido la exclamación en el nombre de la función, como se suele hacer en Julia.)

julia> calendario = calendario_vacio(3, 31);

julia> rellenar_calendario!(calendario, 3, 31)

julia> calendario # vemos el calendario modificado
5×7 Matrix{String}:
 ""    ""    "1"   "2"   "3"   "4"   "5"
 "6"   "7"   "8"   "9"   "10"  "11"  "12"
 "13"  "14"  "15"  "16"  "17"  "18"  "19"
 "20"  "21"  "22"  "23"  "24"  "25"  "26"
 "27"  "28"  "29"  "30"  "31"  ""    ""

Paso 6. Conversión a HTML

La conversión de la tabla a HTML la haremos con la función tabla_html que se define a continuación. Esta función construye el código HTML incrementalmente, concatenando cadenas de texto que contienen el código HTML correspondiente a cada elemento de la tabla.

function tabla_html(tabla, encabezado)
    html = "<table>"
    # Primera fila con nombres de los días
    html *= "<tr>"
    for celda = encabezado
        html *= "<td>$celda</td>"
    end
    html *= "</tr>\n"
    # Siguientes filas
    dims = size(tabla)
    for fila = 1:dims[1]
        html *= "<tr>"
        for columna = 1:dims[2]
            celda = tabla[fila, columna]
            html *= "<td>$celda</td>"
        end
        html *= "</tr>"
    end
    html *= "</table>"
    HTML(html)
end

Esta función puede resultar algo más críptica a primera vista, por los elementos de código HTML incorporados.[1] Para mayor claridad, la secuencia de operaciones que realiza es la siguiente:

  1. Crea el comienzo del código HTML, en una cadena de texto que se asigna a la variable html. Inicialmente, este texto contiene solo la etiqueta de apertura <table>, que marca el inicio de la tabla. Esta variable se va ampliando en los siguientes pasos concatenándola con nuevos fragmentos de texto, mediante la operación html *= nuevotexto, que es una forma resumida de escribir html = html * nuevotexto.
  2. A continuación le añade la fila del encabezado (enmarcada entre las etiquetas <tr> y </tr>), con celdas que contienen cada uno de los elementos pasados en el argumento encabezado, enmarcada entre <td> y </td>. Este argumento debería ser una lista con los nombres de los días, como la variable listadias que hemos definido al comienzo, pero podría sustituirse por otra (por ejemplo los nombres de los días en otro idioma).
  3. Después se añaden, una a una, las distintas filas con el "cuerpo" del calendario. Igual que en el caso del encabezado, cada fila se enmcarca entre <tr> y </tr>, y cada celda entre <td> y </td>. El número de filas y de columnas se obtiene con la función size.
  4. Cuando se ha completado la última fila, se finaliza el código HTML con la etiqueta de cierre </table>.
  5. La cadena de texto con el código completo se convierte al final de la función en un bloque HTML, con la función HTML.

Resultado final

Para finalizar, la función calendario_html realiza la secuencia de pasos completa para crear el calendario en formato HTML a partir de los números del mes y el año, utilizando las funciones que se han definido anteriormente:

"""
    calendario_html(m, y[, nombresdias])

Crea el código HTML para el calendario del mes `m`
(un número del 1 al 12) del año `y`, con un encabezado
que contiene los nombres de los días contenidos en `nombresdias`
(se asume que los días van de lunes a domingo).

El tercer argumento es opcional; si no se le pasa ningún valor,
el encabezado contiene los nombres de los días en minúsculas.
"""
function calendario_html(m, y, nombresdias=listadias)
    primerdia = numero_primer_dia(m, y)
    ndias = numero_dias(m, y)
    calendario = calendario_vacio(primerdia, ndias)
    rellenar_calendario!(calendario, primerdia, ndias)
    tabla_html(calendario, nombresdias)
end

Con esto podemos generar el calendario del mes de agosto de 2018, pasando como encabezado los nombres de los días en mayúsculas. Para esto tomamos el vector listadias, y le aplicamos a todos sus elementos la función uppercase –mediante broadcasting, añadiendo un punto tras el nombre de la función, como se explicó en el capítulo anterior–:

calendario_html(8, 2018, uppercase.(listadias))
LUNESMARTESMIÉRCOLESJUEVESVIERNESSÁBADODOMINGO
12345
6789101112
13141516171819
20212223242526
2728293031

El tercer argumento de la función calendario_html está definido de tal manera que por defecto se le asigna el valor de listadias. Esto significa que a esta función se le puede llamar con los tres argumentos, como se ha hecho arriba, o con solo los dos primeros, si se quiere usar la lista de días por defecto (con los nombres en minúsculas):

calendario_html(8, 2018)

Con este ejercicio hemos visto varios ejemplos prácticos de cómo definir y usar funciones. En el siguiente apartado vamos a ver las funciones desde una perspectiva más teórica, apoyándonos en estos ejemplos, aunque sin entrar en detalles más avanzados que se han dejado para el capítulo 8.

Después de las funciones, hablaremos de los bloques condicionales y los bucles, las estructuras de control que forman la mayor parte de las rutinas que hemos empleado para construir el calendario.

Funciones

Las funciones son bloques de código que encapsulan un conjunto de instrucciones para crear o transformar una o más variables, a partir de unos datos de entrada. En el ejemplo anterior hemos creado varias funciones, que sirven de muestra para ver distintas formas de definirlas.

Una de las principales utilidades de las funciones es evitar la repetición de código, lo que reduce el riesgo de errores a la hora de reescribirlo, y hace los programas más legibles. Una ventaja adicional en el caso de Julia es que, si las características del código lo permiten, las funciones se compilan la primera vez que se ejecutan, y esto puede hacer que los programas vayan mucho más rápidos.

Como se ha visto en los ejemplos, el código para definir una función es el siguiente:

"""
DOCSTRING
"""
function NOMBRE(ENTRADAS)
    # CÓDIGO
    return SALIDAS
end

Las palabras en mayúsculas representan los elementos que son propios de cada función (normalmente no se escriben en mayúsculas, pero se usan aquí para distinguirlos):

  • DOCSTRING es un texto de documentación de la función. Se trata de un elemento opcional, que en el ejemplo anterior solo hemos usado para la función principal (calendario_html).
  • NOMBRE es el nombre de la función, como calendario_html, numero_primer_dia, etc. Cualquier nombre válido para una variable es válido también para funciones. En el caso de las funciones que modifican los contenidos de sus argumentos, es costumbre darles un nombre acabado en una exclamación, como se ha hecho con rellenar_calendario!. Pero esto es una convención opcional más que un requisito, y el símbolo de exclamación no tiene en sí ningún efecto.
  • ENTRADAS es la lista de variables de entrada a la función (véanse los detalles más abajo). Pueden definirse funciones que no requieran ningún argumento, en cuyo caso los paréntesis después del nombre de la función se dejan vacíos.
  • CÓDIGO es el cuerpo con el código que se ha de ejecutar en la función, utilizando los argumentos de ENTRADA y cualesquiera otras variables que se definan dentro de la función. El código se suele escribir indentado respecto al encabezado de la función
  • SALIDAS es la lista de variables de salida de la función (véanse los detalles más abajo). La función finaliza inmediatamente cuando se ejecuta la línea que contiene la palabra return, aunque haya más código escrito después. Si no se pone ninguna línea con la palabra return, se devuelve por defecto el valor de la última línea de código de la función, como HTML(tablahtml) en la función tabla_html.

Cuando el cuerpo de la función es tan sencillo que se puede reducir a una sola línea, también se puede simplificar la forma de definirla, eliminando la clave function y el finalizador end. Este es el caso, por ejemplo, de la función es_bisiesto. Por poner otro ejemplo, las siguientes declaraciones definen la misma función para calcular la suma aritmética 1+2+ ... + n

function suma_aritmetica(n)
    return n * (n + 1) / 2
end

function suma_aritmetica(n)
    n * (n + 1) / 2
end

suma_aritmetica(n) = n * (n + 1) / 2

A continuación se presentan brevemente cada uno de los elementos empleados en la definición de una función.

Docstring

El llamado "docstring" es un texto para documentar la función, de tal manera que si se consulta en la ayuda, se presentará ese texto en pantalla. Se trata de un elemento opcional (si no se proporciona ningún docstring, al consultar la ayuda de la función se presentará un texto estándar declarando que se trata de una función no documentada).

Cualquier cadena de texto entrecomillada, escrita justo antes de declarar la función, sirve de docstring, pero el estilo habitual es el empleado en el ejemplo de calendario_html (y de gauss_diasemana del primer capítulo):

  • El texto se escribe entre dos líneas con tres comillas """, que sirven para delimitar una cadena de texto que ocupa varias líneas (y en las que se pueden escribir palabras entre comillas sin tener que utilizar secuencias de escape).
  • Se puede utilizar el formato Markdown para escribir el texto de ayuda con formato (líneas de título, formato de texto, bloques de código, hiperenlaces, etc).
  • En la primera línea se escribe la forma (o formas) de llamar a la función, con el texto indentado para que al consultar la ayuda aparezca escrito como un bloque código.
  • Después de una línea de separación se describe lo que hace la función, ejemplos de uso y otros detalles de interés.

Argumentos de entrada

Las funciones pueden tener uno, varios o ningún argumento de entrada. Los argumentos de la función se declaran como una lista de variables separadas por comas, encerrados entre paréntesis después del nombre de la función. Por ejemplo, numero_primer_dia toma los argumentos m (número del mes) e y (año), por lo que su declaración es:

function numero_primer_dia(m, y)

A la hora de llamar a una función, se le pueden pasar valores directos, p.ej. numero_primer_dia(8, 2018), o variables que contengan los valores deseados, como cuando se le llama dentro de la función calendario_html. En este último caso, por claridad se le han pasado variables que tienen el mismo nombre que en la declaración (m e y, respectivamente), pero podrían tener cualquier otro nombre. Por ejemplo, la función rellenar_calendario! está declarada como:

function rellenar_calendario!(tabla, primerdia, ndias)    

Sin embargo, cuando se le llama dentro de la función calendario_html se le pasa un primer argumento que lleva otro nombre:

rellenar_calendario!(calendario, primerdia, ndias)

Argumentos con valores por defecto

Es posible hacer que algunos argumentos tengan valores por defecto, de modo que sea opcional introducirlos. El valor por defecto se define en la declaración de la función, escribiéndolo junto al nombre del argumento separado por el signo =. Esto es lo que ocurre, por ejemplo, en la función calendario_html, cuya declaración es:

function calendario_html(m, y, nombresdias=listadias)

En este ejemplo solo se da un argumento por defecto, pero las funciones se pueden definir con más argumentos opcionales –incluso podrían serlo todos–. En ese caso los argumentos omitidos se evalúan con sus valores por defecto desde el último al primero. Por ejemplo, supongamos una función definida de este modo:

function f(a=1, b=2, c=3)
  • Si se ejecutase f(x, y, z), cada uno de los tres argumentos recibiría el valor introducido (a=x, b=y, y c=z).
  • Si se ejecutase f(x, y), se aplicaría el valor por defecto c=3, manteniéndose a=x y b=y.
  • Si se ejecutase f(x), se aplicarían los valores por defecto c=3 y b=2, realizándose solo la asignación a=x.
  • Si se ejecutase f() todos los argumentos recibirían sus valores por defecto.

Naturalmente, los argumentos con valores por defecto han de estar después de los argumentos obligatorios, para que no exista ambigüedad a la hora de llamar a la función con un conjunto reducido de argumentos.

Agrupaciones de argumentos

Puede ocurrir que los datos a pasar a la función estén recogidos en una misma variable, por ejemplo dentro de un vector. Para esos casos, Julia dispone de una forma especial de introducir series de datos en la llamada a la función, "descomponiéndolas" como si fueran variables individuales.

Supongamos, por ejemplo, que el mes a evaluar está en la cadena de texto 08-2018. Con la función split podemos extraer las partes correspondientes al mes y el año:

julia> fecha = "08-2018"
"08-2018"

julia> numeros = split(fecha, "-")
2-element Vector{SubString{String}}:
 "08"
 "2018"

Luego usamos la función parse para interpretar los textos como números enteros (Int); se llama a la función mediante la sintaxis "con punto" para aplicarla a los dos elementos del vector a la vez:

julia> numeros = parse.(Int, numeros)
2-element Vector{Int64}:
    8
 2018

Este vector de dos números se puede pasar a la función calendario_html como si fueran dos números separados, añadiéndole unos puntos suspensivos que hacen de operador de "descomposición" (lo que en inglés llaman splatting of variables):

julia> calendario_html(numeros...)

Este operador tiene también un uso simétrico. Al declarar los argumentos de entrada en una función, el último de ellos puede escribirse con puntos suspensivos. Esto significa que a partir de su posición puede ponerse un número variable de argumentos (incluso ninguno), de tal manera que todos ellos se recogerán en una sola variable.

Este doble uso de las agrupaciones de argumentos se puede comprobar en la siguiente función, que admite cualquier número de argumentos a partir de dos, y tiene un comportamiento recursivo a partir del tercero. Copia el código y prueba con cualquier conjunto de dos o más argumentos para ver su comportamiento. (Vale cualquier tipo de argumento, ya que lo único que hace es llamar a la función println, que muestra en pantalla el contenido de las variables.)

function cuenta_hasta_tres(a, b, c...)
    println("Primero: ", a)
    println("Segundo: ", b)
    n = length(c)
    if n > 1
        println("Me he perdido, empiezo de nuevo:")
        cuenta_hasta_tres(c...)
    elseif n == 1
        println("Y tercero: ", c[1])
    end
end

A la hora de definir los argumentos de una función, el conjunto de argumentos variables ha de ir al final, como ocurre con los opcionales. Lo que no se permite es combinar ambos tipos de argumentos (opcionales con valores por defecto, junto con agrupaciones variables), porque su uso conjunto podría resultar ambiguo.

Argumentos "con nombre"

Algunas funciones también admiten argumentos identificados por su nombre, en lugar de por su posición (lo que en inglés se llaman keyword arguments). En el capítulo anterior hemos visto algunos ejemplos, como los argumentos skipstart y header de la función readdlm, o delim, ignorerepeated, missingstring, etc. de CSV.File.

Los argumentos "con nombre" se introducen siempre después de los argumentos posicionales, y a la hora de llamar a la función es habitual (aunque no obligatorio en general) separar ambos conjuntos de argumentos por un punto y coma, en lugar de una coma. Una propiedad interesante de estos argumentos es que se pueden pasar en cualquier orden, ya que el nombre es suficiente para distinguirlos.

Estos argumentos también pueden declararse con valores por defecto (en cuyo caso son opcionales) o sin ellos (lo que los hace obligatorios), aunque lo más habitual es que sean opcionales. También es posible declarar un conjunto indefinido de argumentos con nombre utilizando los puntos suspensivos, igual que en el caso de los argumentos posicionales, e incluso combinar todas estas opciones. Así pues, una función podría declararse con un conjunto de argumentos de entrada como el siguiente:

function foo(x, y, z...; a=1, b, c...)
    # [...]
end
Note

En el código que define la función es obligatorio utilizar el punto y coma para separar la lista de argumentos posicionales y los argumentos con nombre –al contrario que cuando se llama la función, donde el punto y coma es opcional–. Si una función solo tuviera argumentos con nombre, la lista de argumentos debería empezar con un punto y coma –e.g. foo(; a...).

Una forma (algo exótica, pero válida) de llamar a esta función foo podría ser:

foo(1.0, ["pim", "pam", "pum"]..., bang=0, b=10)

Los valores asignados a las variables de la función con esta llamada serían los siguientes:

  • x = 1.0 (primer argumento)
  • y = "pim" (segundo argumento, desagrupado de ["pim", "pam", "pum"])
  • z: una colección de dos datos, con z[1] = "pam", y z[2] = "pum"
  • a = 1 (valor por defecto, pues no se ha introducido ninguno con ese nombre)
  • b = 10
  • c: una coleccion de datos nombrados, con c[:bang] = 0

La flexibilidad que proporcionan los argumentos con nombre los hace una opción atractiva para facilitar el uso de las funciones, pero es recomendable usarlos con mesura. El abuso de este tipo de argumentos es una causa frecuente de código poco eficiente, que impide a Julia utilizar todas sus herramientas para optimizar los programas.

Argumentos de salida

El valor que las funciones devuelven por defecto es el resultado de la última línea de su código. Además, si alguna línea de la función contiene la palabra return, al ejecutarse esta línea la función devuelve el resultado que sigue y se interrumpe su ejecución. Esto permite que la función pueda terminar en varios puntos, como ocurre con numero_dias, que tiene distintas líneas con la orden return. A menudo, como en los ejemplos mostrados, también se pone la palabra return en la última línea del código de la función para que el funcionamiento quede más claro, aunque no es estrictamente necesario.

Si por alguna razón conviene que la función no devuelva ningún valor, se puede añadir una línea que diga return nothing. Esto hace que el resultado devuelto por la función sea el objeto de tipo Nothing, que en la práctica es como si no devolviese nada.

Las funciones también pueden actuar como su devolviesen más de un resultado. Este el el caso de la función divrem utilizada en calendario_vacio, que devuelve tanto el cociente como el resto de la división entera.

Para que una función devuelva dos o más variables basta con poner la lista de resultados seapradas por comas, como en la siguiente función que devuelve la media y la diferencia de dos números:

function mediaydiferencia(a, b)
    media = (a + b) / 2
    diferencia = b - a
    return (media, diferencia)
end

En realidad lo que ocurre al hacer esto es que la función devuelve una "tupla" de valores. Una tupla es una colección de datos, parecida a un vector, pero que no es mutable (sus valores no se pueden modificar). Al poner dos variables de salida en la llamada a la función, lo que se hace es descomponer esta tupla, de forma parecida a cuando se utilizan los puntos suspensivos en los argumentos de entrada. Si los resultados de este tipo se asignan a una sola variable, los valores individuales se pueden extraer posteriormente, como se hace en tabla_html al extraer el número de filas y columnas de la tabla, mediante la función size:

dims = size(tabla)

La variable dims resultante es una tupla, que luego se analiza para extraer el número de filas de la tabla (dims[1]), y el número de columnas (dims[2]).

Note

Los paréntesis en torno a la tupla de resultados, tanto en el cuerpo de la función como en la llamada a la misma, pueden ayudar a hacer el código más legible, pero como se ha visto en este ejemplo no son obligatorios.

Cuerpo de la función: variables locales y globales

El cuerpo de una función es el bloque de código que se ejecuta al llamarla. Hay tres grupos de variables que se pueden usar dentro de una función:

En primer lugar están las variables introducidas como argumentos. Estas variables reciben valores externos, pero son internas a la función, lo que se conoce como "variables locales". Eso significa que se les puede reasignar otros valores dentro de la función sin que eso afecte al objeto original. Por ejemplo:

julia> function duplicar(x)
           # Cambiamos el valor del argumento `x`...
           x = 2x
           return x
       end
duplicar (generic function with 1 method)

julia> x = 1
1

julia> duplicar(x)
2

julia> x # ... pero el valor original permanece inalterado
1

Luego están las variables que se definen dentro de las funciones, como primerdia, ndias en el caso de calendario_html, etc. Esas también son variables locales, que se destruyen al término de la función, y por lo tanto no se puede acceder a ellas desde fuera (al margen de que sus valores sí se puedan devolver como resultado de la función). Al igual que ocurre con los argumentos, esas variables locales pueden tomar nombres idénticos a los de variables definidas fuera de la función –o en otras funciones–, sin que haya conflico o confusión entre ellas.

Finalmente, dentro de una función también se pueden usar variables definidas en otra parte del código que contiene la función. Eso es lo que ocurre, por ejemplo, con la variable listadias, que hemos definido como una variable "global", externa a las funciones, pero es usada directamente por numero_primer_dia, sin haberla asignado a ninguna variable local. Lo que no puede hacerse con las variables globales es asignarles nuevos valores, ya que la operación de reasignación se confundiría con la definición de una variable local.

Esta capacidad de las funciones para reconocer objetos globales, definidos fuera de su contexto local, no solo es útil para poder reutilizar variables, sino que es crucial para que las funciones puedan llamarse entre ellas –ya que las funciones son objetos al igual que otras variables–.

¡Cuidado con los objetos mutables!

Aunque una variable global normalmente no pueda redefinirse dentro de una función, lo que sí puede ocurrir con un objeto global mutable (como el vector listadias), es que su contenido se modifique sin redefinir las variables. Lo mismo ocurre si se pasa un objeto mutable como argumento: aunque se asigne a una variable local, las modificaciones que se hagan a su contenido (sin haber reasignado otro valor a la variable) se reflejarán en la variable externa original. Esto es lo que pasa con el primer argumento de rellenar_calendario!, y por eso su nombre se escribe con la exclamación al final, a modo de advertencia.

Bloques condicionales

Como dice su propio nombre, los bloques condicionales son fragmentos de código que solo se ejecutan si se cumple cierta condición. En el ejemplo del calendario tenemos varias de estas estructuras. De hecho, todo el código de la función numero_dias se reduce a una estructura de este tipo:

if m in [1, 3, 5, 7, 8, 10, 12] # enero, marzo, etc.
    return 31
elseif m == 2 # febrero
    return (es_bisiesto(y) ? 29 : 28)
else # el resto de meses
    return 30
end

Este código significa que si se cumple la condición que hay tras la palabra if, se ejecutará el bloque que sigue (reducido a la línea return 31), y se ignorará el resto hasta la palabra end. De no cumplirse, se evaluará la condición señalada por elseif, que condiciona la ejecución del siguiente bloque. Se podría añadir un número indefinido de elseifs, que se evaluarían secuencialmente hasta que alguno de ellos se cumpliera, como se hacía en la versión "larga" de numero_primer_dia. Si ninguna de las condiciones señaladas por if o elseif se cumple, entonces se ejecuta el bloque de código que sigue a la palabra else.

Los bloques elseif y else son opcionales. Las estructuras condicionales pueden tener un solo bloque delimitado entre if y end, de tal manera que no se ejecute ningún código si la condición no se cumple.

Finalmente, se puede señalar una forma abreviada de escribir estructuras condicionales en una sola línea, especialmente adecuada para casos en los que el código a ejecutar es muy breve. Se trata del "operador ternario", que está presente en el segundo bloque del ejemplo anterior (el código que se ejecuta para el mes de febrero):

return (es_bisiesto(y) ? 29 : 28)

Este código significa: "si se cumple es_bisiesto(y), entonces devuelve 29; en caso contrario devuelve 28". Una forma alternativa de escribirlo más elaborada, pero equivalente, sería:

if es_bisiesto(y)
    dias = 29
else
    dias = 28
end
return dias

Expresiones lógicas

La condición asociada a los bloques if o elseif, así como al operador ternario, ha de expresarse como una variable lógica, de tipo Bool, que no es otra cosa que un número binario cuyos valores posibles son true (verdadero) o false (falso). Estos valores lógicos se pueden obtener de múltiples maneras. Una forma muy habitual cuando se trabaja con números es a partir de comparaciones, por ejemplo:

  • a == b (devolver true si a es igual a b)
  • a != b (true si a es distinto de b)
  • a < b (true si a es menor que b)
  • a > b (true si a es mayor que b)
  • a <= b (true si a es menor o igual que b)
  • a >= b (true si a es mayor o igual que b)

Algunos de estos operadores de comparación pueden escribirse de forma más "elegante", usando los símbolos matemáticos correspondientes. Como dichos símbolos no suelen estar disponibles en los teclados, las principales interfaces para Julia permiten escribirlos a partir de "secuencias de escape". Los símbolos matemáticos correspondientes a los operadores anteriores son:

operadorsímbolosec. de escape
!=\ne
<=\le
>=\ge

En la documentación oficial de Julia se puede encontrar una lista completa de las secuencias de escape disponibles para caracteres Unicode.

Tip

Los cálculos realizados pueden introducen imprecisiones numéricas, por lo que comparaciones como sqrt(5)^2 == 5 dan como resultado false, cuando teóricamente debería ser true. Para evitar estos problemas se puede usar la función isapprox o el operador de comparación (con la secuencia de escape \approx), así como su variante negativa (\napprox). Por ejemplo en sqrt(5)^2 ≈ 5, que da el resultado esperado.

También es habitual hacer comprobaciones relativas a valores singulares, perdidos, etc.:

  • isnan(x) devuelve true si x es un "not-a-number" (NaN), por ejemplo el resultado de 0/0.
  • isinf(x) devuelve true si x es un valor infinito (sea positivo o negativo), por ejemplo el resultado de 1/0.
  • isfinite(x) es devuelve el valor opuesto a isinf(x).
  • ismissing(x) devuelve true si x es un "valor perdido" (missing).

Cuando se trabaja con conjuntos de datos (arrays, etc.), se pueden hacer comprobaciones como las siguientes:

  • a in x devuelve true si el elemento a está entre los valores de x.
  • isempty(x) devuelve true si x está "vacío" (no tiene ningún elemento).
  • all(x) devuelve true si todos los elementos de x son true.
  • any(x) devuelve true si cualquier elemento de x es true.

Las funciones all y any solo funcionan sobre conjuntos de elementos de tipo Bool. A menudo estos conjuntos proceden de operaciones lógicas (p.ej. comparaciones) realizadas sobre todos los elementos de otro conjunto de datos. Esto se puede hacer, como cualquier otra operación, utilizando la "notación con punto" sobre funciones y operadores como los que se han visto antes. Por ejemplo, para verificar que ningún número del vector x es negativo:

julia> x = [1, 2, 3, 4];

julia> b = x .> 0
4-element BitVector:
 1
 1
 1
 1

julia> all(b)
true

julia> x[1] = -1;

julia> b = x .> 0
4-element BitVector:
 0
 1
 1
 1

julia> all(b)
false

Composición de expresiones lógicas

A menudo se generan expresiones lógicas complejas, que son el resultado de combinar varias expresiones más sencillas. Para algunas operaciones de comparación esta combinación se reduce a concatenarlas, como cuando comprobamos si el número de un día está dentro del rango válido para un mes:

1 ≤ dia_mes ≤ ndias

Sin embargo lo más frecuente es usar conectores lógicos, como los siguientes:

  • Negación (!): Si a es true, entonces !a es false, y viceversa.
  • Conjunción lógica o and (&): a & b es true solo si tanto a como b son true a su vez.
  • Disyunción lógica o or (|): a | b es true si cualquiera de a o b son true.

Las operaciones and y or se suelen hacer más a menudo mediante los "operadores de cortocircuito", escritos con el símbolo duplicado (&& y || respectivamente). Reciben este nombre porque las expresiones combinadas se van evaluando de izquierda a derecha, pero la evaluación se interrumpe tan pronto como se llega a un resultado inequívoco. Concretamente:

  • En a && b, la expresión b solo se evalúa si a es true. En caso contrario se devuelve false sin evaluar b.
  • En a || b, la expresión b solo se evalúa si a es false. En caso contrario se devuelve true sin evaluar b.

Este comportamiento es útil cuando una de las condiciones a comprobar solo tiene sentido en función de que se cumpla la otra o no. Por ejemplo, supongamos que llegados a un punto de un programa, tenemos un array x de tamaño indeterminado, que incluso podría estar vacío, y queremos comprobar si el primer elemento –en caso de que exista– es cero. Esta condición se podría formular del siguiente modo:

!isempty(x) && (x[1] > 0)

Si no se cumpliese la primera condición (!isempty(x), es decir que x no esté vacío), evaluar la segunda (x[1] > 0) generaría un error, ya que no se podría acceder al elemento x[1]. Pero el "cortocircuito" del operador && evita llegar a ese punto.

Este comportamiento es equivalente al de un bloque if simple, del mismo modo que el operador ternario es equivalente a un if-else. Por este motivo, a veces se pueden encontrar programas que utilizan && para abreviar bloques condicionales con expresiones muy sencillas, por ejemplo, si una función hubiera de interrumpirse si la variable x adopta el valor 0, esto podría escribirse como:

x == 0 && return

Bucles

Los bucles son fragmentos de código que se han de ejecutar repetidamente un número determinado de veces o hasta que se cumpla cierta condición. Junto con las funciones, son una de las herramientas principales para simplificar y reducir el código de un programa.

Usa los bucles con plena libertad

En algunos lenguajes de programación como Matlab/Octave, Python (con Numpy) y R, se recomienda "vectorizar" las operaciones para evitar los bucles si es posible. Esto significa realizar todas las operaciones con una sola instrucción usando vectores o matrices, en lugar de repetir múltiples veces una misma operación sobre números escalares o vectores pequeños. Esto se debe a que cada línea de código que se ejecuta cuesta un tiempo de "interpretación", además del coste que tiene ejecutar la operación en sí, y en los bucles este coste se multiplica por el número de iteraciones. En Julia este coste extra se concentra en la primera vez que se realiza el cálculo, por lo que no hace falta evitar los bucles. De hecho, repetir operaciones sencillas con variables pequeñas suele ser más eficiente que realizar una operación compleja con grandes matrices de datos.

Bucles for

En el ejemplo del calendario tenemos varios bucles. Algunos son del tipo for, como el que se se emplea para rellenar la fila de cabecera del calendario:

for celda = encabezado
    html *= "<td>$celda</td>"
end

Este bloque significa: "asigna a la variable celda los valores contenidos en encabezado, uno a uno, y con cada uno de esos valores de celda ejecuta el código que sigue hasta el end".

`=` vs. `in` en los bucles `for`

En las líneas que encabezan el bucle for, el símbolo = es intercambiable por in. Es decir, en el ejemplo anterior podría haberse escrito for celda in encabezado. Utilizar = o in en este caso es una mera cuestión de estilo.

A menudo se desea repetir un bloque de código un número determinado de veces independiente de otras variables (por ejemplo, repetirlo 100 veces). En estos casos se suele utilizar un rango que sirve de contador de las iteraciones:

for i = 1:100
    # Código a repetir
end

O si el número que sirve de contador en estos casos no se va a utilizar en el bucle, se puede utilizar el guión bajo (_) para asignar el contador a una "variable de descarte":

for _ = 1:100
    # Código a repetir
end

Los valores asignados a la variable de descarte _ no quedan guardados, por lo que no se pueden utilizar posteriormente. Este truco se utiliza cuando por alguna razón es necesario hacer una asignación (como ocurre con los bucles for), pero realmente no interesa utilizar el valor asignado.

Por otro lado, a veces se quiere iterar sobre los contenidos de una variable, pero a la vez tener un contador. Esto, puede conseguirse con la función enumerate. Por ejemplo, la búsqueda de la posición del primer día de la semana en la función numero_primer_dia podría haberse escrito así:

for (d, nombredia) = enumerate(listadias)
    if primerdia == nombredia
        return d
    end
end

Bucles while

Si el número de veces que se tiene que repetir el bucle no está predeterminado por un número o la longitud de una variable, se pueden utilizar los bucles de tipo while, como el utilizado para rellenar las filas con números del calendario:

while dia_mes ≤ ndias
    for columna = 1:7
        if 1 ≤ dia_mes ≤ ndias # Celdas con número dentro del mes
            tabla[fila, columna] = string(dia_mes)
        end
        dia_mes += 1
    end
    fila += 1
end

En este bucle (que asimismo contiene el bucle for que rellena las columnas de cada fila), se comprueba si el número dia_mes ha llegado al último valor válido (dia_mes ≤ ndias). Si es así, se crea una nueva fila, y en caso contrario se da el bucle por finalizado.

En los bucles while se necesita utilizar alguna variable definida anteriormente para definir la condición de finalización. En la mayoría de casos el código que se ejecuta en el bucle será, directa o indirectamente, el que modifique esa variable para que se cumpla la condición y el bucle termine.

Variables locales de los bucles

Es importante tener en cuenta que, tal como ocurre en las funciones, las variables creadas dentro de bucles for o while son variables locales al bucle, y que estas se "olvidan" al finalizar cada iteración. Es decir, que no pueden ser empleadas fuera del bucle, y ni siquiera en siguientes iteraciones, antes de volver a definirlas. Por ejemplo, el siguiente código daría lugar a un error:

for i = 1:10
    if i == 1
        x = 1
    else
        x = x + i
    end
end
ERROR: UndefVarError: x not defined

En la primera iteración se ejecutaría la línea x = 1, y en la segunda intentaría ejecutarse x = x + i; pero al tratarse de una iteración nueva, el valor de x no estaría definido de antemano y esa línea no se podría ejecutar.

Para hacer algo así, sería necesario definir primero la variable x antes del bucle. Esto es lo que se hace, por ejemplo, con la variable html, que se redefine dentro de varios bucles en el ejemplo del calendario.

Hay algunas excepciones y matices que comentar en relación con el contexto de las variables en funciones, bucles y otras estructuras, que se comentan más detalladamente en la sección sobre Variables globales y locales en el capítulo 8.

Interrupción de bucles

El flujo habitual de los bucles se puede alterar de varias maneras. Por ejemplo, en la función numero_primer_dia el bucle se interrumpe en el momento en el que cumple la condición y se ejecuta la orden return. Por otra parte, también se pueden utilizar los comandos break y continue, que suelen ir en un if dentro del bucle.

El comando break interrumpe el bucle en el punto en que se encuentre, y devuelve el control al punto del código desde el que se lanzó el bucle, como si este hubiera terminado. Por otro lado, continue solo interrumpe una iteración, y salta al comienzo de la siguiente. Veamos un ejemplo práctico, en una función para calcular números primos mediante una implementación literal de la "criba de Eratóstenes":

Se forma una tabla con todos los números naturales comprendidos entre 2 y n, y se van tachando los números que no son primos de la siguiente manera: Comenzando por el 2, se tachan todos sus múltiplos; comenzando de nuevo, cuando se encuentra un número entero que no ha sido tachado, ese número es declarado primo, y se procede a tachar todos sus múltiplos, así sucesivamente. El proceso termina cuando el cuadrado del mayor número confirmado como primo es mayor que n.

"""
    primos_eratostenes(n)

Devuelve un vector con los números primos entre 2 y n,
utilizando el método de la criba de Eratóstenes.
"""
function primos_eratostenes(n)
    # Utilizamos como "criba" un vector lógico,
    # con todos los valores inicialmente definidos como `false`
    eliminados = falses(n)
    # Comenzando por 2...
    for m = 2:n
      # Si el número (m) ha sido eliminado, pasar al siguiente
      if eliminados[m]
        continue
      end
      # Eliminar los múltiplos 2m, 3m ... menores que n
      k = 2
      while (mxk = m*k) ≤ n
        eliminados[mxk] = true
        k += 1
      end
      # Terminar si el cuadrado de m es mayor que n
      if m^2 > n
        break
      end
    end
    # Extraer las posiciones no eliminadas de la criba
    return findall(.!eliminados)
end

En este ejemplo, el bucle se interrumpe con continue si el número m ya ha sido eliminado en alguna de las iteraciones anteriores, y se finaliza con break antes de que m llegue a n, si el cuadrado de un número identificado como primo supera el valor de n.

try ... catch ... finally

Para finalizar vamos a comentar brevemente una estructura de control que resulta de utilidad para gestionar posibles errores en la ejecución de un programa. Esta estructura tiene la siguiente forma:

try
    # Código que puede dar error
catch
    # Código a ejecutar si ha habido un error
finally
    # Operaciones de "limpieza"
end

En general, si alguna de las operaciones del bloque try da lugar a un error, este error no terminará la ejecución del programa ni se mostrará en pantalla, como suele ocurrir. En lugar de eso, se interrumpirá solo ese bloque y continuará ejecutándose el resto del programa. Los sub-bloques catch y finally son opcionales. El catch se ejecuta solo si ha habido algún error dentro del try, mientras que el finally se ejecuta siempre después de los dos bloques anteriores, tanto si ha habido un error como si no. El bloque finally se suele utilizar para operaciones de "limpieza" necesarias debido a posibles interrupciones del código anterior, como cerrar archivos que hayan quedado abiertos, etc.

Sin embargo, es importante tener en cuenta que el código del finally debe ser ejecutable independientemente de si el try ha fallado –y de en qué punto ha fallado–, por lo que no puede depender de las variables definidas dentro del try (ni del catch, si este existe). Para que esto sea así, cada uno de los sub-bloques try, catch y finally introduce su propio contexto local para variables, que se olvidan al finalizar el sub-bloque y no están disponibles en el resto del programa.

Así pues, no es conveniente abusar de los bloques try-catch como una herramienta para hacer programas "tolerantes a fallos". Esta estructura está pensada más bien para circunstancias en las que la terminación del programa debida a un error pueda suponer un problema más o menos grave, y el código incluido en estos bloques debería limitarse al necesario para prevenir esos problemas.

Cuando los errores sean previsibles, es mejor comprobar las condiciones que pueden dar lugar a esos errores con bloques condicionales (if-else, etc.). Por ejemplo, la función isfile sirve para comprobar si una cadena de texto corresponde a la ruta de un archivo existente, isa puede servir para comprobar que una variable es de tipo compatible con las operaciones a realizar (p.ej. x isa Int para comprobar que x es un número entero), etc.

Por otro lado, en el caso de los errores imprevisibles a menudo es mejor dejar que ocurran, porque suelen venir acompañados de información útil para mejorar el programa.

Sumario del capítulo

En este capítulo hemos visto el uso de funciones y estructuras de control (bloques condicionales y bucles), centrándonos en:

  • La definición de docstrings para documentar las funciones.
  • Los distintos tipos de argumentos de entrada: posicionales y con nombre, requeridos o con valores por defecto.
  • Cómo agrupar y desagrupar argumentos con los puntos suspensivos (splatting).
  • Cómo obtener varias salidas de una función.
  • Los contextos global y local de las variables, y el uso de la palabra global para poder redefinir variables globales en entornos locales.
  • Las distintas formas de definir bloques condicionales (if, else, elseif y el operador ternario).
  • Bucles de tipo for y de tipo while.
  • El uso de enumerate para crear un contador de iteraciones en los bucles for.
  • La interrupción de bucles con break y while.
  • Las estructuras try-catch-finally para gestionar errores fortuitos.

También hemos visto algunas operaciones y funciones que son de utilidad para trabajar con funciones, condiciones y bucles, aunque tienen un uso más general:

  • Los operadores lógicos and (&) y or (|), sus alternativas "con cortocircuito" (&&, ||), y el operador not (!).
  • Operaciones de comparación, y funciones con resultado lógico como isnan, isinf, isfinite o ismissing (para números), así como in, issempty, all o any (para conjuntos de valores).
  • La "variable de descarte" _ para la asignación de valores que no requieren usarse.
  • El uso de la variable nothing como salida nula de una función.

Finalmente, en los distintos ejemplos también hemos visto otras operaciones y funciones nuevas, como:

  • La función divrem para calcular a la vez el cociente y el resto de una división entera.
  • La función fill para crear una matriz con el mismo valor en todas las celdas.
  • La función size para obtener el número de filas y columnas de una matriz.
  • La concatenación de textos con el operador *.
  • La función uppercase para convertir textos a mayúsculas.
  • La función joinpath para crear rutas de archivos.
  • La función split para descomponer cadenas de texto separadas por un delimitador.
  • La función parse para convertir texto en números.
  • La función HTML para convertir un texto en código HTML.
  • La función isfile para comprobar si existe un archivo con una ruta determinada.
  • La función isa para comprobar que una variable es de un tipo determinado.
  • El objeto nothing (de tipo Nothing), usada para representar resultados "inexistentes".