Aquí estamos en el Día 2 del blog diario #100daysofAWS!

Esperamos que algunos de ustedes sigan aquí!

S3 es uno de los servicios más populares y versátiles de AWS, y es algo que todos los interesados en AWS deberían conocer en profundidad. Así que empecemos!

¿Qué es el S3?

S3 (Simple Storage Service) es la solución de almacenamiento a nivel de objeto propiedad de AWS, que puede almacenar un número casi ilimitado de objetos para cualquier caso de uso imaginable. Es un servicio extremadamente escalable, duradero y fiable que puede utilizar para gestionar su infraestructura de AWS, y S3 tiene muchos casos de uso diferentes, desde la gestión de datos de registro, la gestión de análisis de big data hasta el alojamiento de un sitio web estático.

Las unidades básicas de S3 son los buckets y los objetos, que son básicamente carpetas y archivos. Esta configuración, junto con la integración con una serie de otros servicios de S3, puede permitir el acceso de grano fino a sus recursos de S3, y le permite construir soluciones complejas y altamente escalables en la nube de AWS.

Diferentes clases de almacenamiento en S3.

Hay muchas formas diferentes de almacenar los datos en S3, cada una con casos de uso particulares, aspectos positivos e inconvenientes. Son las siguientes:

Norma S3
Estándar IA
S3 One-Zone IA
S3 Nivelación inteligente
Almacenamiento de Redundancia Reducida S3 • S3 En los puestos de avanzada
S3 Glacier / Glacier Deep Archive

Hablaremos de la Durabilidad y la Disponibilidad de cada una de las clases, que deben ser entendidas si se quiere llegar a dominar el S3. Pueden ser definidos por los siguientes criterios:

Durabilidad = La probabilidad de que los datos se pierdan debido a un fallo del hardware.

Disponibilidad = Los datos están ahí para ser recuperados cuando usted los solicite. Empecemos con la clase S3 Standard.

** Norma S3 **

S3 Standard es la clase a la que se subirán los datos automáticamente cuando se suba un objeto por primera vez. También es la clase más cara, pero tiene ciertas propiedades que la hacen adecuada para ciertos casos de uso.

S3 tiene una disponibilidad del 99,9% para un año determinado, y la durabilidad es mucho más impresionante. Esto se conoce como los famosos "11 nueves" de durabilidad (99,999999999%). Esto significa que si se almacenan 10.000.000 de objetos en S3 Standard, se puede esperar una media de pérdida de un solo objeto una vez cada 10.000 años, lo cual es francamente sorprendente. Esto se consigue gracias a que S3 suele albergar hasta 6 copias de tus datos en cualquier momento.

Los casos de uso son los siguientes:

Aplicaciones en la nube
Distribución de contenidos
Aplicaciones para móviles y juegos
Análisis de grandes datos.

Como ya he dicho, S3 Standard es la clase de almacenamiento a la que se suben tus datos de forma automática, y te proporciona un gran nivel de durabilidad y disponibilidad, ya que tus datos están disponibles inmediatamente cuando los solicitas. El único inconveniente de esta clase es el coste, así que ahora nos sumergiremos en algunas clases más baratas e interesantes de S3.

**S3 Estándar IA **

Standard IA (Infrequent Access) es muy similar a la clase Standard Storage, con el mismo nivel de disponibilidad y durabilidad y el mismo alto rendimiento y baja latencia que S3 Standard, pero con algunas advertencias añadidas. Los datos están disponibles inmediatamente cuando se solicitan, pero hay que pagar una pequeña cuota de recuperación, lo que la hace perfecta para los datos a los que se accede con poca frecuencia pero que se necesitan inmediatamente cuando se solicitan. Hay algunos casos de uso que son ideales para la IA estándar:

• Almacenamiento a largo plazo que se requiere rápidamente cuando se solicita. • Copias de seguridad y • Almacén de datos para archivos de recuperación de desastres.

A continuación hablaremos de la **IA S3 One-Zone. **

La IA de una zona es muy similar a la IA estándar, ya que obviamente también está orientada a almacenar datos de forma reducida, pero con una recuperación inmediata en caso de necesidad. Sin embargo, la diferencia está en la "One-Zone" a la que hace referencia en su nombre.

One-Zone se refiere simplemente al hecho de que los datos se almacenan en una sola zona de disponibilidad, a diferencia de las múltiples zonas de disponibilidad del estándar S3. Esta reducción a una sola zona de disponibilidad tiene, obviamente, sus inconvenientes en cuanto a la durabilidad de los datos, por lo que hay que tener en cuenta que si se va a utilizar One-Zone IA, ¡se pueden perder los datos si toda una AZ se cae!

Sin embargo, la razón por la que algunos clientes se sienten atraídos por esta opción es que pueden almacenar datos a los que se accede con poca frecuencia dentro de una única zona de disponibilidad a un coste un 20% inferior al de S3 Standard IA, sin dejar de tener datos fácilmente accesibles.

A continuación, ** Intelligent Tiering **

Intelligent Tiering es una de las últimas incorporaciones a la gama de clases de almacenamiento de S3, y está diseñada para ofrecerle el equilibrio perfecto entre disponibilidad, durabilidad y optimización de costes.

La clasificación inteligente por niveles deduce a qué clase deben pertenecer sus datos en función de cómo cambian los patrones de acceso a lo largo del tiempo. Muy bonito, ¿verdad?

La clasificación inteligente por niveles funciona haciendo que los datos se distribuyan en dos (opcionalmente cuatro) niveles. Los dos primeros son niveles de acceso de baja latencia optimizados para el acceso frecuente y poco frecuente, y los dos niveles opcionales se utilizan para fines de archivo.

Los datos se colocan automáticamente en el nivel de acceso frecuente en cuanto se carga el objeto. Si no se accede al objeto en 30 días, pasará al nivel de acceso infrecuente. Si se opta por los niveles de archivo, los datos pasarán al primer nivel de archivo después de 90 días sin recuperarse, y a 180 días, respectivamente, para la segunda clase de archivo profundo.

La reducción de la carga operativa y la gestión de niveles que ofrece esta clase hacen que este nivel sea ideal para su uso:

Datos con patrones de acceso desconocidos, por ejemplo, nuevas aplicaciones, lagos de datos, etc.

A continuación hablaremos de un servicio poco común - conocido como **S3 Reduced Redundancy Storage. **

La Redundancia Reducida (o RRS) es un servicio que puede ayudar a algunos clientes a resolver sus necesidades particulares. En comparación con los gigantescos 11 nueves de durabilidad de S3 Standard, RRS presume de un modesto 99,99%, que resulta ser más que suficiente para la mayoría de los casos de uso. Sus datos se siguen almacenando en varios dispositivos y en varias ubicaciones, pero no tienen la misma durabilidad que S3 Standard. Algunos usos son los siguientes:

Miniaturas
Medios transcodificados
Datos menos críticos

Una clase de almacenamiento bastante diferente e interesante, conocida como S3 On Outposts, es la que trataremos a continuación.

S3 On Outposts es una extensión de S3 en su propio centro de datos. Lo hace mediante la entrega de almacenamiento de objetos a su solución preexistente de Outposts. (Outposts es simplemente una extensión de los servicios de AWS en su centro de datos).

S3 On Outposts utiliza la API de S3 para facilitar el almacenamiento, la seguridad, el etiquetado, la recuperación, la elaboración de informes y el control del acceso a los datos de su Outpost, haciendo que su solución de nube híbrida funcione a la perfección.

Algunas organizaciones tienen requisitos legislativos para mantener los datos a la vista, pero aún así quieren aprovechar la flexibilidad y la facilidad de uso que ofrece S3, mientras que otros clientes aprovechan el hecho de que los datos se almacenan físicamente mucho más cerca de su otro hardware, creando conexiones de menor latencia dentro de su entorno híbrido.

Puede añadir 26 TB, 48 TB o 96 TB de capacidad de almacenamiento S3 a sus puestos de avanzada y puede crear hasta 100 cubos. También es (como S3) un servicio totalmente gestionado que puede ayudar a tu organización a centrarse más en las necesidades del negocio.

Finalmente, los dos últimos servicios son las clases de archivo en S3, a saber, S3 Glacier y **S3 Glacier Deep Archive. **

Glacier se utiliza ampliamente como una opción segura y altamente duradera para almacenar datos de archivo a largo plazo de una manera extremadamente rentable en Glacier Vaults. Sin embargo, la desventaja de esta solución de archivo barata es que, por lo general, la recuperación de los datos almacenados puede tardar entre minutos y horas, dependiendo de la opción de recuperación seleccionada. Son las siguientes:

La recuperación estándar puede tardar entre 3 y 5 horas.
Recuperaciones masivas: son una opción de recuperación a escala de petabytes que recupera los datos en un plazo de entre 5 y 12 horas.
La recuperación acelerada puede permitirle acceder rápidamente a sus datos si los necesita, y normalmente se recuperan en un plazo de 1 a 5 minutos.

Glacier se utiliza ampliamente para almacenar datos que deben conservarse por razones de cumplimiento, a los que rara vez, o nunca, es necesario acceder, al tiempo que se garantiza que están ahí si los necesita.

Glacier Deep Archive lo lleva de nuevo a otro nivel con un almacenamiento aún más barato, con el inconveniente añadido de que se tarda mucho más en recuperar los datos. Glacier Deep Archive permite la conservación digital y la retención a largo plazo de datos a los que se accede muy raramente. Lo utilizan quienes trabajan en sectores muy regulados y necesitan conservar conjuntos de datos durante largos periodos de tiempo (¡a veces entre 7 y 10 años!) El tiempo de recuperación de Deep Archive es de 12 horas.

En esta entrada del blog sólo nos hemos centrado en las áreas clave de cómo funciona S3, y sus implementaciones básicas, pero hay muchas más áreas que mencionar, por ejemplo, cómo funciona la seguridad en S3, cómo alojar un sitio web estático en S3, entre muchos otros temas. S3 es un servicio muy importante después de todo!

Hemos enlazado la documentación de AWS relativa a las clases de almacenamiento de S3 aquí para una mayor lectura.

Espero que hayan disfrutado del post de hoy!

Saludos cordiales, y ¡sigue construyendo!

Post Original Jack Lavelle

#100DíasdeAWS | Día 2 | Clases de almacenamiento S3

¿Qué es el S3?

Comments

100 Días de AWS

#100díasdeAWS | Día 1 | EC2

More from this blog

#244: Inteligencia Artificial Generativa sobre Amazon EKS

#243: Certificaciones de IA/ML de AWS

#242: Opciones costo-eficientes para aplicaciones de IA Generativa

#241: IA Generativa - Comienza tu aprendizaje

#240: Hablemos de AWS Step Functions

Command Palette

**¿Qué es el S3? **

Comments

100 Días de AWS

#100díasdeAWS | Día 1 | EC2

More from this blog

¿Qué es el S3?