¿Qué es un sistema distribuido?

¿Cómo puede una red de computadoras distribuidas por todo el mundo trabajar juntas de manera tan eficiente y segura que desafíe incluso a las instituciones financieras tradicionales? Para ello deberemos responder al la pregunta de qué es un sistema distribuido. En el año 2008, un documento técnico publicado por un autor anónimo, fue base fundacional de una idea que cambiaría el mundo de la tecnología y las finanzas. Quédate hasta el final y descubre por qué los sistemas distribuidos son una pieza clave para esta tecnología.

Un sistema distribuido consiste en un conjunto de computadoras interconectadas que trabajan juntas como una sola entidad. Estas computadoras, conocidas como nodos, colaboran para realizar tareas complejas, compartiendo recursos y procesando información simultáneamente. A pesar de estar físicamente separadas, actúan de manera coordinada y transparente para los usuarios. Este enfoque mejora la eficiencia, la disponibilidad y la resistencia frente a fallos, al distribuir la carga y los datos entre múltiples nodos, eliminando así los puntos únicos de fallo.

Para entender la blockchain necesitamos saber qué es un sistema distribuido

Entender los sistemas distribuidos es esencial para comprender la tecnología blockchain. Una blockchain es un libro mayor distribuido que puede ser centralizado o descentralizado, aunque está diseñado y generalmente se utiliza como una plataforma descentralizada. Se puede entender como un sistema que tiene propiedades de los paradigmas tanto descentralizado como distribuido, es decir, es un sistema descentralizado-distribuido.

¿Qué es un sistema distribuido?

Un sistema distribuido es un conjunto de programas informáticos que aprovechan los recursos computacionales de diferentes nodos para lograr un objetivo compartido. Estos sistemas, también conocidos como computación distribuida o bases de datos distribuidas, utilizan nodos diferentes para comunicarse y sincronizarse a través de una red común. Los nodos pueden representar dispositivos físicos, procesos de software o sistemas encapsulados recursivos. El propósito de los sistemas distribuidos es eliminar los puntos de error centrales y los cuellos de botella de un sistema.

Las características de los sistemas de computación distribuida incluyen el uso compartido de recursos, el procesamiento simultáneo de varias máquinas y la escalabilidad de la capacidad computacional y de procesamiento al agregar máquinas adicionales.

¿Que es un nodo?

Definiremos como nodo a cada un de los elementos individual que constituyen un sistema distribuido. Todos los nodos pueden enviar y recibir mensajes entre sí. Los nodos clasificarse según su comportamiento. De esta manera, pueden ser honestos, defectuosos o malintencionados. Además, disponen de memoria y un procesador.

Un nodo que muestra un comportamiento irracional también se conoce como un nodo bizantino, en referencia al problema de los generales bizantinos que veremos más adelante.

Sistemas centralizados, descentralizados y distribuidos

Sistemas centralizados

Los sistemas centralizados son sistemas convencionales (cliente-servidor) en los que hay una única autoridad que controla el sistema y que está a cargo de todas las operaciones en el sistema. Todos los usuarios de un sistema centralizado dependen de una sola fuente de servicio (aunque esté consituidad por múltiples equipos trabajando en paralelo). La mayoría de los proveedores de servicios online tales como Google, Amazon, eBay, etc., utilizan este modelo convencional para ofrecer servicios.

Sistemas descentralizados

Un sistema descentralizado es un tipo de red en la que los nodos no dependen de un nodo maestro único; en cambio, el control se distribuye entre muchos nodos. Esto es similar a un modelo en el que cada departamento en una organización está a cargo de su propio servidor de base de datos, quitando el poder del servidor central y distribuyéndolo a los subdepartamentos, que administran sus propias bases de datos.

Sistema distribuido

En un sistema distribuido, los datos y el procesamiento se distribuyen en múltiples nodos del sistema. La computación puede no ocurrir en paralelo y los datos se replican en múltiples nodos que los usuarios ven como un sistema único y coherente.

La diferencia crítica entre un sistema descentralizado y un sistema distribuido es que, en un sistema distribuido todavía hay una autoridad central que gobierna todo el sistema, mientras que en un sistema descentralizado no existe tal autoridad.

Componentes del sistema de computación distribuida

Nodos

Los nodos son las unidades fundamentales en un sistema distribuido. Representan dispositivos individuales como computadoras o servidores, cada uno realizando una parte del procesamiento y almacenando una porción de los datos del sistema.

Red de comunicaciones

Esta red conecta los nodos y es crucial para el funcionamiento del sistema distribuido. Puede variar desde una red local hasta una amplia red global como Internet, facilitando la transferencia de datos y comunicaciones entre nodos.

Software de sistema distribuido

Este software incluye tanto los sistemas operativos en los nodos como las aplicaciones específicas del sistema distribuido. Su rol es coordinar las actividades entre los nodos y gestionar los recursos del sistema.

Protocolos de comunicación

Los protocolos definen las reglas para el intercambio de datos entre nodos. Son esenciales para asegurar una comunicación efectiva y eficiente, y son fundamentales para el manejo de errores y pérdidas de datos.

Middleware

El middleware actúa como un intermediario entre el sistema operativo y las aplicaciones. Proporciona servicios comunes y facilita la comunicación y colaboración entre aplicaciones en diferentes nodos.

Mecanismos de sincronización y coordinación

Estos mecanismos son clave para garantizar que las operaciones en diferentes nodos se realicen de manera ordenada y coherente, utilizando técnicas como bloqueos y semáforos para coordinar el acceso a recursos compartidos.

Protocolos de consenso y replicación

Los algoritmos de consenso son vitales para lograr un acuerdo entre los nodos en decisiones clave, mientras que la replicación de datos asegura la redundancia y disponibilidad de la información en el sistema.

Balanceadores de Carga

Los balanceadores de carga distribuyen eficientemente las solicitudes y las cargas de trabajo entre los nodos del sistema. Su función es prevenir la sobrecarga de cualquier nodo y facilitar la escalabilidad del sistema.

El problema de los generales del ejército bizantino

Este problema fue planteado por Leslie Lamport y otros investigadores en 1982. En este problema, un grupo de generales del ejército bizantino que lideran diferentes partes del mismo, planean atacar o retirarse de una ciudad. La única forma de comunicarse entre ellos es mediante un mensajero. Necesitan acordar atacar al mismo tiempo para ganar.

El problema radica en que uno o más generales pueden ser traidores que envíen un mensaje engañoso. Por lo tanto, se necesita un mecanismo viable que permita el acuerdo entre los generales, incluso en presencia de los traidores, para que el ataque pueda tener lugar al mismo tiempo. Como analogía para sistemas distribuidos, los generales pueden considerarse nodos honestos, los traidores como nodos defectuosos o malintencionados, y el mensajero como un canal de comunicación entre los nodos.

Resolución del problema de fallos bizantinos

Este problema fue resuelto en 1999 por Castro y Liskov, quienes presentaron el algoritmo de Tolerancia a Fallos Bizantinos Práctico (PBFT), el cual resuelve el problema de consenso en presencia de fallas bizantinas en redes asíncronas mediante el uso del protocolo de replicación de máquinas de estado. PBFT pasa por varias rondas para finalmente llegar a un acuerdo entre los nodos sobre el valor propuesto.

El principal desafío del diseño de sistemas distribuidos es la coordinación entre nodos y la tolerancia a fallos. Para ello es necesario que exista algún tipo de algoritmo de consenso que defina un número mínimo de nodos necesario para tomar una decisión válida. Aunque algunos nodos presenten comportamientos anómalos o fallen las conexiones de red entre ellos, el sistema distribuido debe ser capaz de tolerarlo y continuar trabajando para lograr el resultado deseado. Este problema ha sido un área activa de investigación en el diseño de sistemas distribuidos durante muchos años, y se han propuesto varios algoritmos y mecanismos para superar estos problemasc

Protocolos de consenso

Los algoritmos de consenso son un componente fundamental en los sistemas distribuidos, ya que permiten a los nodos de una red llegar a un acuerdo común sobre un estado particular o una decisión, a pesar de la presencia de fallos o de nodos no confiables. Son esenciales para mantener la consistencia y la integridad en sistemas donde múltiples entidades participan en un proceso de toma de decisiones.

Función Principal

El objetivo principal de un algoritmo de consenso es asegurar que todos los nodos en un sistema distribuido puedan llegar a un acuerdo sobre un único valor o estado, incluso en situaciones donde algunos nodos pueden fallar o actuar de manera maliciosa. Esto es crucial en operaciones como la actualización de una base de datos distribuida, la realización de una transacción en una blockchain, o la coordinación de procesos en sistemas de computación distribuida.

Características clave

Tolerancia a fallos: Los protocolos de consenso deben ser capaces de manejar fallos en algunos nodos sin comprometer el acuerdo general del sistema.
Resistencia a ataques: En un entorno con posibles nodos malintencionados, el algoritmo debe garantizar que estos no puedan impedir que el sistema alcance un consenso.
Convergencia: Todos los nodos no fallidos deben eventualmente llegar al mismo acuerdo.
Eficiencia: El proceso de consenso debe realizarse en un tiempo razonable y con un uso eficiente de recursos.

Tipos comunes de protocolos de consenso

Proof of Work (PoW): Utilizado en muchas criptomonedas, como Bitcoin. Requiere que los nodos resuelvan un problema computacional difícil, lo que asegura la validez de las nuevas transacciones.
Proof of Stake (PoS): Propone que los nodos con mayor inversión en la red (por ejemplo, una cantidad mayor de criptomoneda) tienen más probabilidades de validar transacciones y crear nuevos bloques.
Practical Byzantine Fault Tolerance (PBFT): Diseñado para sistemas en los que los nodos pueden actuar de manera maliciosa. PBFT reduce la cantidad de nodos requeridos para alcanzar un consenso y puede manejar hasta un tercio de nodos defectuosos.

Teorema CAP: Consistencia, disponibilidad y tolerancia a particiones

El teorema CAP establece que un sistema distribuido no puede tener las propiedades de consistencia, disponibilidad y tolerancia a particiones simultáneamente. Esto se debe a la necesidad de tomar decisiones sobre la consistencia y disponibilidad de los datos cuando ocurre una partición de la red y parte de los nodos quedan aislados. Por lo tanto, se debe establecer una relación de compromiso a fin de obtener el balance deseado.

La consistencia es una propiedad que asegura que todos los nodos en un sistema distribuido tengan una copia única, actual e idéntica de los datos. Para lograr la consistencia, se utilizan algoritmos de consenso para garantizar que todos los nodos tengan la misma copia de los datos. Esto también se llama replicación de máquinas de estado. La cadena de bloques es un medio para lograr la replicación de máquinas de estado.

La disponibilidad significa que los nodos del sistema están activos, accesibles para su uso y aceptando solicitudes entrantes y respondiendo con datos sin fallas y cuando se requiere. En otras palabras, los datos están disponibles en cada nodo y los nodos responden a las solicitudes.

La tolerancia a particiones asegura que si un grupo de nodos no puede comunicarse con otros nodos debido a fallas en la red, el sistema distribuido continúa operando correctamente. Esto puede ocurrir debido a fallas en la red y en los nodos.

Ventajas, inconvenientes y riesgos de los sistemas distribuidos

Los sistemas distribuidos ofrecen una mayor fiabilidad y rendimiento al eliminar los puntos de error centrales y ofrecer redundancia. La escalabilidad también se mejora gracias a la capacidad de añadir nodos adicionales para gestionar una carga extensiva y aumentar la capacidad de un nodo concreto para manejarla.

No obstante, uno de los inconvenientes de estos sistemas es la complejidad que pueden presentar. La expansión del desarrollo puede hacer que los sistemas sean difíciles de mantener y mejorar. La comprensión de la relación entre los distintos componentes y quién posee un componente de software puede complicar la organización y gestión de los equipos. Además, cuando se tienen varios repositorios, puede ser necesario utilizar herramientas especializadas para gestionar y organizar el código del sistema.

Ejemplos de sistemas distribuidos

Veamos tres ejemplos de sistemas distribuidos que son ampliamente reconocidos y utilizados.

Redes de Entrega de Contenido (CDN, por sus siglas en inglés)

Las Redes de Entrega de Contenido como Akamai, Cloudflare y Amazon CloudFront son sistemas distribuidos diseñados para entregar contenido web y de medios de manera rápida y confiable. Estos sistemas utilizan una red de servidores distribuidos geográficamente para almacenar y entregar copias de contenido web, como videos, imágenes y páginas web, a los usuarios desde la ubicación más cercana, reduciendo la latencia y mejorando la velocidad de acceso.

Sistemas de Archivos Distribuidos (como Google File System o GFS)

El Google File System (GFS) es un sistema de archivos distribuido diseñado para proporcionar un almacenamiento de datos eficiente y confiable para aplicaciones de procesamiento de datos a gran escala. GFS gestiona el almacenamiento de datos a través de múltiples servidores, lo que permite una alta disponibilidad y escalabilidad, características cruciales para aplicaciones como el motor de búsqueda de Google y otros servicios de datos de gran tamaño.

Plataformas de Computación en la Nube (como AWS, Azure, Google Cloud)

Plataformas de computación en la nube como Amazon Web Services (AWS), Microsoft Azure y Google Cloud Platform son ejemplos de sistemas distribuidos a gran escala. Estas plataformas proporcionan una amplia gama de servicios, incluyendo almacenamiento de datos, poder de procesamiento y aplicaciones de software, a través de una red distribuida de servidores en centros de datos alrededor del mundo. Los usuarios pueden acceder a estos recursos según demanda, lo que permite una gran flexibilidad y escalabilidad

5 claves sobre qué es un sistema distribuido

La comprensión de los sistemas distribuidos es fundamental para entender la tecnología blockchain. Una blockchain es un libro mayor distribuido, que puede ser centralizado o descentralizado, utilizado como plataforma descentralizada.
Un sistema distribuido utiliza múltiples nodos para lograr un objetivo común, compartiendo recursos y eliminando puntos de error centrales.
Los sistemas centralizados tienen una autoridad única, mientras que los descentralizados distribuyen el control entre varios nodos.
La consistencia, disponibilidad y tolerancia a particiones son conceptos clave en sistemas distribuidos.
La blockchain utiliza la replicación de máquinas de estado para lograr consistencia. Los sistemas distribuidos ofrecen fiabilidad, rendimiento y escalabilidad, pero pueden ser complejos de gestionar.

¿Qué es y sistema distribuido y porque es esencial en Bitcoin?

A lo largo de este artículo, hemos explorado diversas facetas de los sistemas distribuidos, su funcionamiento, y su impacto en el mundo tecnológico y más allá. Pero, ¿cómo se relaciona todo esto con el misterioso proyecto de Bitcoin, presentado por Satoshi Nakamoto?

La respuesta yace en la implementación magistral de un sistema distribuido que constituye la esencia de Bitcoin: la blockchain. Esta red de nodos interconectados no solo permite a Bitcoin operar de manera segura y eficiente, sino que también ejemplifica el poder transformador de los sistemas distribuidos.

En un sistema distribuido como la blockchain, cada nodo trabaja en conjunto, pero de forma independiente, para validar y registrar transacciones. Esta descentralización elimina la necesidad de una autoridad central, reduce el riesgo de fallos y ataques centralizados y aumenta la eficiencia y la transparencia.

Así, el proyecto de Bitcoin no solo introdujo una nueva era en las finanzas digitales, sino que también proporcionó un caso práctico y exitoso de cómo los sistemas distribuidos pueden remodelar procesos y estructuras establecidas.