3.4.-Est.Datos: Conjuntos

3.4. Conjuntos¶

Los conjuntos se han convertido en una estructura de datos muy utilizada en Python. En esta unidad vamos a ver qué es un conjunto, cómo se crea, cómo se añaden y eliminan elementos, cómo se accede a los elementos, cómo se realizan operaciones con conjuntos, etc.

1. Qué es el tipo set en Python¶

Los conjuntos son una estructura de datos que permite almacenar elementos de forma desordenada y únicos, es decir, sin repetición. En Python, los conjuntos, tipo set, se representan con llaves {} y los elementos se separan por comas. Los conjuntos son mutables, es decir, se pueden modificar después de su creación,

1.1. Características de los conjuntos en Python¶

La principal característica de este tipo de datos es que es una colección cuyos elementos no guardan ningún orden y que además son únicos.

Estas características hacen que los principales usos de esta clase sean conocer si un elemento pertenece o no a una colección y eliminar duplicados de un tipo secuencial (list, tuple o str).

Además, esta clase también implementa las típicas operaciones matemáticas sobre conjuntos: unión , intersección , diferencia , …

Los princpales uso de los conjuntos son:

Eliminar duplicados de una lista. Ej: set([1, 2, 3, 1, 2]) devuelve {1, 2, 3}.
Comprobar si un elemento está en una colección. Ej: 3 in {1, 2, 3} devuelve True.
Realizar operaciones de conjuntos. Ej: {1, 2, 3} & {2, 3, 4} devuelve {2, 3}.
Implementar algoritmos de búsqueda y optimización. Ej: set([1, 2, 3]) - set([2, 3, 4]) devuelve {1}.

2. Trabajar con conjuntos¶

A continuación se muestra cómo trabajar con conjuntos en Python. Se verá cómo crear conjuntos, añadir y eliminar elementos, acceder a los elementos.

2.1. Creación de conjuntos en Python¶

Para crear un conjunto, basta con encerrar una serie de elementos entre llaves {}, o bien usar el constructor de la clase set() y pasarle como argumento un objeto iterable (como una lista , una tupla , una cadena …).

# Crea un conjunto con una serie de elementos entre llaves
# Los elementos repetidos se eliminan
>>> c = {1, 3, 2, 9, 3, 1}
>>> c
{1, 2, 3, 9}

# Crea un conjunto a partir de un string
# Los caracteres repetidos se eliminan
>>> a = set('Hola Pythonista')
>>> a
{'a', 'H', 'h', 'y', 'n', 's', 'P', 't', ' ', 'i', 'l', 'o'}

# Crea un conjunto a partir de una lista
# Los elementos repetidos de la lista se eliminan
>>> unicos = set([3, 5, 6, 1, 5])
>>> unicos
{1, 3, 5, 6}

Para crear un conjunto vacío, simplemente llama al constructor set() sin parámetros.

❗️ **IMPORTANTE: ** {} NO crea un conjunto vacío, sino un diccionario vacío. Usa set() si quieres crear un conjunto sin elementos.

🎯 NOTA: Los elementos que se pueden añadir a un conjunto deben ser de tipo hashable. Un objeto es hashable si tiene un valor de hash que no cambia durante todo su ciclo de vida. En principio, los objetos que son instancias de clases definidas por el usuario son hashables. También lo son la mayoría de tipos inmutables definidos por Python.

2.1.1. set vs frozenset¶

En realidad, en Python podemos crear dos clases de conjuntos: set y frozenset. La principal diferencia es que set es mutable, por lo que después de ser creado, se pueden añadir y/o eliminar elementos del conjunto, como veremos en secciones posteriores. Por su parte, frozenset es inmutable y su contenido no puede ser modificado una vez que ha sido inicializado.

Para crear un conjunto de tipo frozenset, se usa el constructor de la clase frozenset():

>>> f = frozenset([3, 5, 6, 1, 5])
>>> f
frozenset({1, 3, 5, 6})

🎯 NOTA: El único modo en Python de tener un conjunto de conjuntos es utilizando objetos de tipo frozenset como elementos del propio conjunto.

2.2. Cómo acceder a los elementos de un conjunto en Python¶

Dado que los conjuntos son colecciones desordenadas, en ellos no se guarda la posición en la que son insertados los elementos como ocurre en los tipos list o tuple. Es por ello que no se puede acceder a los elementos a través de un índice.

Sin embargo, sí se puede acceder y/o recorrer todos los elementos de un conjunto usando un bucle for:

>>> mi_conjunto = {1, 3, 2, 9, 3, 1}
>>> for e in mi_conjunto:
...     print(e)
...     
1
2
3
9

2.3. Añadir elementos a un conjunto (set) en Python¶

Para añadir un elemento a un conjunto se utiliza el método add(). También existe el método update(), que puede tomar como argumento una lista, tupla, string, conjunto o cualquier objeto de tipo iterable.

>>> mi_conjunto = {1, 3, 2, 9, 3, 1}
>>> mi_conjunto
{1, 2, 3, 9}

# Añade el elemento 7 al conjunto
>>> mi_conjunto.add(7)
>>> mi_conjunto
{1, 2, 3, 7, 9}

# Añade los elementos 5, 3, 4 y 6 al conjunto
# Los elementos repetidos no se añaden al conjunto
>>> mi_conjunto.update([5, 3, 4, 6])
>>> mi_conjunto
{1, 2, 3, 4, 5, 6, 7, 9}

🎯 NOTA: add() y update() no añaden elementos que ya existen al conjunto.

2.4. Eliminar un elemento de un conjunto en Python¶

La clase set ofrece cuatro métodos para eliminar elementos de un conjunto. Son: discard(), remove(), pop() y clear(). A continuación se explica qué hace cada uno de ellos.

discard(elemento) y remove(elemento) eliminan elemento del conjunto. La única diferencia es que si elemento no existe, discard() no hace nada mientras que remove() lanza la excepción KeyError.
pop() es un tanto peculiar. Este método devuelve un elemento aleatorio del conjunto y lo elimina del mismo. Si el conjunto está vacío, lanza la excepción KeyError.
clear() elimina todos los elementos contenidos en el conjunto.

>>> mi_conjunto = {1, 3, 2, 9, 3, 1, 6, 4, 5}
>>> mi_conjunto
{1, 2, 3, 4, 5, 6, 9}

# Elimina el elemento 1 con remove()
>>> mi_conjunto.remove(1)
>>> mi_conjunto
{2, 3, 4, 5, 6, 9}

# Elimina el elemento 4 con discard()
>>> mi_conjunto.discard(4)
>>> mi_conjunto
{2, 3, 5, 6, 9}

# Trata de eliminar el elemento 7 (no existe) con remove()
# Lanza la excepción KeyError
>>> mi_conjunto.remove(7)
Traceback (most recent call last):
  File "<input>", line 1, in <module>
KeyError: 7

# Trata de eliminar el elemento 7 (no existe) con discard()
# No hace nada
>>> mi_conjunto.discard(7)
>>> mi_conjunto
{2, 3, 5, 6, 9}

# Obtiene y elimina un elemento aleatorio con pop()
>>> mi_conjunto.pop()
2
>>> mi_conjunto
{3, 5, 6, 9}

# Elimina todos los elementos del conjunto
>>> mi_conjunto.clear()
>>> mi_conjunto
set()

3. Patrones de uso de conjuntos en Python¶

Veamos algunos ejemplos de uso de conjuntos en Python.

3.1. Número de elementos (len) de un conjunto¶

Como con cualquier otra colección, puedes usar la función len() para obtener el número de elementos contenidos en un conjunto:

>>> mi_conjunto = set([1, 2, 5, 3, 1, 5])
>>> len(mi_conjunto)
4

3.2. Cómo saber si un elemento está en un conjunto¶

Con los conjuntos también se puede usar el operador de pertenencia in para comprobar si un elemento está contenido, o no, en un conjunto:

>>> mi_conjunto = set([1, 2, 5, 3, 1, 5])
>>> print(1 in mi_conjunto)
True

>>> print(6 in mi_conjunto)
False

>>> print(2 not in mi_conjunto)
False

3.3. Operaciones sobre conjuntos en Python (set operations)¶

Uno de los principales usos del tipo set es utilizarlo en operaciones del álgebra de conjuntos: unión, intersección, diferencia, diferencia simétrica, …

A continuación veremos cómo llevar a cabo estas operaciones en Python.

3.3.1. Unión de conjuntos en Python¶

La unión de dos conjuntos A y B es el conjunto A ∪ B que contiene todos los elementos de A y de B.

En Python se utiliza el operador | para realizar la unión de dos o más conjuntos.

>>> a = {1, 2, 3, 4}
>>> b = {2, 4, 6, 8}
>>> a | b
{1, 2, 3, 4, 6, 8}

3.3.2. Intersección de conjuntos en Python¶

La intersección de dos conjuntos A y B es el conjuntoA ∩ B que contiene todos los elementos comunes de A y de B.

En Python se utiliza el operador & para realizar la intersección de dos o más conjuntos.

>>> a = {1, 2, 3, 4}
>>> b = {2, 4, 6, 8}
>>> a & b
{2, 4}

3.3.3. Diferencia de conjuntos en Python¶

La diferencia entre dos conjuntos A y B es el conjunto A \ B que contiene todos los elementos de A que no pertenecen a B.

En Python se utiliza el operador - para realizar la diferencia de dos o más conjuntos.

>>> a = {1, 2, 3, 4}
>>> b = {2, 4, 6, 8}
>>> a - b
{1, 3}

3.3.4. Diferencia simétrica de conjuntos en Python¶

La diferencia simétrica entre dos conjuntos A y B es el conjunto que contiene los elementos de A y B que no son comunes.

En Python se utiliza el operador ^ para realizar la diferencia simétrica de dos o más conjuntos.

>>> a = {1, 2, 3, 4}
>>> b = {2, 4, 6, 8}
a ^ b
{1, 3, 6, 8}

3.3.4. Inclusión de conjuntos en Python¶

Dado un conjunto A, subcolección del conjunto B o igual a este, sus elementos son un subconjunto de B. Es decir, A es un subconjunto de B y B es un superconjunto de A.

En Python se utiliza el operador <= para comprobar si un conjunto A es subconjunto de B y el operador >= para comprobar si un conjunto A es superconjunto de B.

>>> a = {1, 2}
>>> b = {1, 2, 3, 4}
>>> a <= b
True

>>> a >= b
False

>>> b >= a
True

>>> a = {1, 2}
>>> b = {1, 2}
>>> a < b  # Ojo al operador < sin el =
False

>>> a <= b
True

3.3.5. Conjuntos disjuntos en Python¶

Dos conjuntos A y B son disjuntos si no tienen elementos en común, es decir, la intersección de A y B es el conjunto vacío.

En Python se utiliza el método isdisjoint() de la clase set para comprobar si un conjunto es disjunto de otro.

>>> a = {1, 2}
>>> b = {1, 2, 3, 4}
>>> a.isdisjoint(b)
False

>>> a = {1, 2}
>>> b = {3, 4}
>>> a.isdisjoint(b)
True

3.3.6. Igualdad de conjuntos en Python¶

En Python dos conjuntos son iguales si y solo si todos los elementos de un conjunto están contenidos en el otro. Esto quiere decir que cada uno es un subconjunto del otro.

>>> a = {1, 2}
>>> b = {1, 2}
>>> id(a)
4475070656
>>> id(b)
4475072096
>>> a == b
True

4. Métodos de la clase set en Python¶

Se finaliza, listando los métodos principales de la clase set en Python:

Método	Descripción
`add(e)`	Añade un elemento al conjunto.
`clear()`	Elimina todos los elementos del conjunto.
`copy()`	Devuelve una copia superficial del conjunto.
`difference(iterable)`	Devuelve la diferencia del conjunto con el`iterable` como un conjunto nuevo.
`difference_update(iterable)`	Actualiza el conjunto tras realizar la diferencia con el`iterable`.
`discard(e)`	Elimina, si existe, el elemento del conjunto.
`intersection(iterable)`	Devuelve la intersección del conjunto con el`iterable` como un conjunto nuevo.
`intersection_update(iterable)`	Actualiza el conjunto tras realizar la intersección con el`iterable`.
`isdisjoint(iterable)`	Devuelve`True` si dos conjuntos son disjuntos.
`issubset(iterable)`	Devuelve`True` si el conjunto es subconjunto del `iterable`.
`issuperset(iterable)`	Devuelve`True` si el conjunto es superconjunto del `iterable`.
`pop()`	Obtiene y elimina un elemento de forma aleatoria del conjunto.
`remove(e)`	Elimina el elemento del conjunto. Si no existe lanza un error.
`symmetric_difference(iterable)`	Devuelve la diferencia simétrica del conjunto con el`iterable` como un conjunto nuevo.
`symmetric_difference_update(iterable)`	Actualiza el conjunto tras realizar la diferencia simétrica con el`iterable`.
`union(iterable)`	Devuelve la unión del conjunto con el`iterable` como un conjunto nuevo.
`update(iterable)`	Actualiza el conjunto tras realizar la unión con el`iterable`.

❗️ NOTA: Los operadores |, &, … toman siempre como operandos objetos de tipo set. Sin embargo, sus respectivas versiones como métodos union(), intersection(), … toman como argumentos un iterable (lista, tupla, conjunto, etc.).