티스토리 뷰

목차



    "테크씬 - 핵심 요약 후 시작합니다."

     

    • Snowflake는 기업이 데이터를 빠르고 유연하며 안전하게 저장/관리/분석할 수 있는 방법을 제공하는 Cloud-based(클라우드 기반) 데이터 웨어하우징 솔루션임
    • Cloud Storage Service 조합에 기반하여 효율적인 데이터 저장/정제/저장/처리를 수행. 특히, In-memory 처리 및 쿼리 최적화 기술을 사용한 효율적인 데이터 처리와 강력한 보안이 압권임.
    • 또한, 가상 데이터베이스 기능을 통해 여러 팀과 이해관계자 간 데이터 공유 및 협업이 용이하기에, 경쟁 제품인 Amazon Redshift, Google Bigquery 등과 비교했을 때 보다 큰 인기를 얻고 있음.

     


     

    안녕하세요, 오늘도 테크씬입니다! Snowflake는 기업이 데이터를 빠르고 유연하게, 동시에 안전하게 저장/관리/분석할 수 있는 방법을 제공하는 Cloud-based 데이터 웨어하우징 솔루션입니다. DX 및 IT 실무를 보고 계신다면, 최근 들어 Snowflake라는 용어를 엄청나게 많이 들어보셨을 겁니다. (아.. 물론 비싸다는 것도 들어보셨을...)

    눈송이 사진
    눈송이 치고는 상당히 비싼 것 같습니다.. 쿨럭..

    Snowflake는 2014년에 처음 소개되어 시장에서 가장 인기 있는 데이터 웨어하우징 솔루션 중 하나로 빠르게 자리 잡았습니다. 그러나 아직 많은 분들이 이게 뭔지 잘 모르시는 것 같아요! 이번 포스팅에서는 Snowflake의 특징과 주요 경쟁 솔루션과 비교하여 자세히 살펴보겠습니다.

     

     

     

     

    Snowflake의 작동원리 및 특징

    Snowflake의 유연성과 확장성을 보여주는 도식 (출처:https://www.snowflake.com/en/data-cloud/platform/)

    1. 데이터 스토리지:

    Snowflake는 Amazon Web Service, Microsoft Azure 또는 Google Cloud Storage와 같은 클라우드 스토리지 서비스 조합을 사용하여 Cloud에 데이터를 효율적으로 저장하죠. 데이터는 row-wise 형식이 아니라 column-wise 형식으로 저장되므로 압축률이 상당히 높고, 동시에 빠른 쿼리를 위해 최적화되어 있죠!

    2. 데이터 처리:

    Snowflake는 '데이터 저장'과 '데이터 처리'를 분리하여, Storage와 독립적으로 컴퓨팅(즉, 요청한 계산 작업을 위한) 리소스를 확장할 수 있습니다. 이로써 User는 스토리지 용량에 대한 걱정 없이, 빠르게 증가하는 빅데이터를 처리하기 위해 추가적인 컴퓨팅 리소스를 빠르게 공급하는 것이 가능합니다.

    3. 쿼리(Query) 처리:

    Snowflake는 In-memory 처리와 Advanced Query 최적화 기술의 조합을 반영한 툴이죠. 이로써 빠르고 효율적인 쿼리 성능을 보장합니다. 또한, 인덱싱 및 상세 정보 제공에 있어 Snowflake의 특화된 접근 방식을 사용하여 쿼리 속도를 더욱 높인다고 하네요.

    4. 보안 및 컴플라이언스:

    Snowflake는 미사용 데이터 혹은 전송 중인 데이터의 암호화, 다단계 인증, Access 제어 등 강력한 보안 및 컴플라이언스 제어 기능을 갖췄습니다. 

    5. 데이터 공유 및 협업:

    Snowflake는 User가 여러 팀에 속한 다수의 이해관계자와 공유할 수 있는 가상 DB(데이터베이스)를 생성할 수 있게 하죠. 이로써, 여러 이해관계자와 데이터를 쉽게 공유할 수 있다는 장점이 있답니다. 이를 통해 팀이 더 쉽게 협업하고 인사이트와 데이터를 더 효과적으로 공유할 수 있습니다.

     

     

     

     

    주요 경쟁사와의 비교

    Cloud 기반 데이터 웨어하우징 분야에서 Snowflake의 주요 대항마는 아래와 같아요:

    클라우드 기반 데이터 웨어하우스 사진
    이제 클라우드 기반 서비스는 더 이상 선택이 아닙니다. 필수인 것 같아요.

    a) Amazon Redshift:

    Amazon Redshift는 Amazon Web Services(AWS) 생태계의 중요한 구성 요소예요. 이는 Snowflake 이외에 정말 많이 쓰이는 인기 솔루션입니다. Snowflake와 유사한 데이터 웨어하우징 기능을 제공하지만, 유연성이 떨어지고 보안이 취약합니다. 또한, Redshift는 상당한 양의 매뉴얼 Configuration 및 유지/관리가 필요하기 때문에 이러한 역량이 내재화되지 않은 기업에는 적합하지 않습니다.

    b) Google BigQuery:

    Google BigQuery는 Google Cloud Platform(GCP) 생태계의 웨어하우징 대표 주자이죠. 이는 Snowflake와 마찬가지로 빠르고 유연한 데이터 웨어하우징 기능을 제공한다는 것으로 정평이 나 있습니다. 다만, Snowflake보다 보안성이 떨어지고, 여러 팀 간 협업을 위한 데이터 공유 기능이 제한적이라는 점 기억하세요!

    c) Microsoft Azure Synapse Analytics:

    Microsoft Azure 시냅스 분석은 Microsoft Azure 클라우드 플랫폼의 구성원이죠. 제 개인적인 경험으로는, 우리나라 대기업에서 MS의 데이터 웨어하우징 솔루션인 Microsoft Azure 시냅스 분석을 도입해서 활용한다는 사례는 아직은 들어보지 못했네요.(제 경험이 미천해서 그럴 수도 있으니 댓글로 여러 제보 주시면 감사하겠습니다^^). 해당 솔루션은  Snowflake와 유사한 데이터 웨어하우징 기능을 제공하지만 유연성이 떨어지고 Cost 측면에서도 효율성이 떨어진다는 것이 정설입니다.

     

     

     

    글로벌 기업의 사례

    많은 글로벌 기업에서 Snowflake를 도입하여 성공 사례를 만들어 가고 있고, 우리나라에서도 대기업 위주로 상당히 비싼 이 툴을 도입하여 활용하는 추세입니다. 몇몇 글로벌 사례를 볼까요?

    a) Salesforce:

    세계적인 고객 관계 관리(CRM)  및 영업 관리 회사인 Salesforce는 Snowflake를 사용하여 대량의 고객 데이터를 저장/분석합니다. 이를 통해 고객을 더 깊이 이해하고 Big Data 기반 효율적 의사 결정을 내릴 수 있죠.

    b) 넷플릭스:

    세계 최고의 스트리밍 서비스인 Netflix는 Snowflake를 사용하여 고객의 시청 Pattern에 대한 방대한 양의 데이터를 저장/분석합니다. 이를 통해 구독자에게 더욱 개인화된 시청 경험을 제공할 수 있다고 해요. 정말 어마무시한 사이즈의 데이터를 Processing해야 하니 Snowflake가 필요했겠죠.

    c) DocuSign:

    전자 서명 기술의 leading 기업인 DocuSign 또한 전 세계 고객 기반의 데이터를 저장/분석하는 데 Snowflake를 사용합니다. 이를 통해 고객의 요구 사항을 더 잘 이해하고 제품과 서비스를 개선하는 데 도움이 됩니다.

     

     

     

     

    정리하며....

    Snowflake는 Cloud-based 데이터 웨어하우징을 위한 빠르고 유연하며 안전한 솔루션을 제공합니다. 여러 특장점을 가진 Snowflake의 경쟁자로 Amazon Redshift, Google BigQuery, Microsoft Azure Synapse Analytics 등이 존재하죠. 그러나 이들과 비교했을 때, Snowflake는 가장 유연하고 안전하며 Cost-effective 한 솔루션으로 입지를 다져가고 있습니다.

     

    Snowflake는 현재까지는 Cloud-based 데이터 웨어하우징의 미래라고 칭할 수 있겠습니다(물론 지금처럼 꾸준히 잘해 나간다는 전제하에 그렇겠죠^^) 저희 회사에서도 이렇게 '좋으나 비싼' Snowflake 도입을 검토하고 있습니다. 여러분의 기업 혹은 조직에서도 Snowflake를 도입하셨다면, 그 활용 경험을 댓글로 많이 남겨주시기 바라겠습니다. 큰 도움이 될 것 같아요. 오늘도 테크씬이었습니다!

     

     

    [관련 포스팅]

    2023.02.01 - [데이터] - 데이터 저장 및 처리: Database(DB), Data Warehouse(DW), BW 및 Data Lake(데이터 레이크) 안내서

     

    데이터 저장 및 처리: Database(DB), Data Warehouse(DW), BW 및 Data Lake(데이터 레이크) 안내서

    데이터는 현대 조직과 기업의 쌀이고 황금입니다. 전 세계 기업들은 그 어느 때보다 많은 데이터를 수집하고 있으며, 이를 저장, 처리 및 분석하여 통찰력을 얻고 정보에 입각한 의사 결정을 내

    techscene.tistory.com

    2023.02.02 - [데이터] - 클라우드 컴퓨팅의 미스터리를 풀다: SaaS, IaaS 및 PaaS 완벽 정리

     

    클라우드 컴퓨팅의 미스터리를 풀다: SaaS, IaaS 및 PaaS 완벽 정리

    오늘날 빠르게 변화하는 Digital World에서 클라우드 컴퓨팅은 모든 규모의 기업에 필수적인 도구가 되었습니다. 클라우드는 기업이 운영을 개선하고 효율성을 높이며 비용을 절감하는 데 도움이

    techscene.tistory.com

    2023.02.07 - [데이터] - SQL 종류 총정리: MYSQL, MSSQL, PostgreSQL, PLSQL 등

     

    SQL 종류 총정리: MYSQL, MSSQL, PostgreSQL, PLSQL 등

    오늘은 많은 분들이 이미 들어보신 SQL(Structured Query Language)에 대한 포스팅입니다! SQL은 관계형 데이터베이스의 데이터를 관리하고 조작하는 데 사용되는 표준 언어입니다. 다양한 산업에서 널리

    techscene.tistory.com

     

    반응형