Blogi

Mis on Snowflake andmeait?

Snowflake on spetsiaalselt andmeaitade ja analüütiliste lahenduste jaoks loodud pilvepõhine SQL andmebaasi platvorm. Tegemist on kõige moodsama ja innovatiivsema andmebaasiteenusega (SaaS), mis võimaldab sekunditega andmebaasi skaleerida. Snowflake andmeait ei vaja ei optimeerimist ega ka põhjalikku haldamist. Teenuse hind kujuneb vastavalt baasi andmemahule ning päringutes kasutatavale võimsusele sekundi täpsusega. Tänaseks on Snowflake-l maailmas üle 3400 kliendi ning on hinnatud nii Gartneri kui Forresteri poolt andmelao platvormi kategoorias liidrite hulka. Näiteks Soomes on tänaseks juba ligi 100 Snowflake klienti ja Eestis ka ligi 10.

Snowflake arhitektuur

Snowflake on loodud algusest peale kui pilve andmebaas ehk ei ole kasutatud mõnda vanema arhitektuuriga admebaasimootorit, mis on pilve ümber tõstetud. Arhitektuuriks on veerupõhine (columnar) salvestusmeetod. Lisaks on eraldatud andmesalvestus (storage) ning päringumootor (compute), mis võimaldab veebikeskkonnas paari hiireklikiga skaleerida päringumootori võimsust nii vertikaalselt (millise võimsusega serveriklaster töötab) kui horisontaalselt (mitu serverite klastrit korraga töötab). Tänu sellele puudub vajadus ise servereid planeerida ja hallata ning andmebaasi administraatori ja optimeerimise oskusteabe järele. Lisaks on arhitektuuris teenuste kiht, mis hoolitseb selle eest, et andmebaas töötaks turvaliselt, terviklikult ja optimaalselt.

Snowflake arhitektuur
Snowflake arhitektuur

Snowflake andmeait on hinnastatud baasi andmemahu ja sekundi täpsusega kasutusel oleva päringumootori võimsuse põhjal. Samuti sõltub hind mõningal määral kasutatavast teenuse versioonist ja pilve platvormist. Kallimad versioonid on vajalikud siiski vaid väga spetsiifiliste ja keeruliste andmelao lahenduste korral. Andmemahu ühiku hind on sarnane tavapärase pilveteenuse salvestushinnaga (näiteks Amazon S3). Päringumootori(te) hind kujuneb vastavalt valitud klastri võimsusele (XS, S, M, L, XL, 2XL jne) ning arvestatakse vaid siis kui see töötab. Kui päringuid määratud ajavahemiku jooksul ei toimu pannakse mootor kinni ning käivitatakse uute päringute korral taas automaatselt. Snowflake teenuse hinnastamisest loe täpsemalt siit artiklist.

Eelnevad arhitektuuripõhimõtted annavad suurepärased võimalused juhtida Snowflake andmebaasi jõudlust. Näiteks saab luua eraldi päringumootorid sobivate võimsustega erinevatele kasutajagruppidele (juhtkond, müügiosakond, tootmine, andmeteadlased jne) ja/või andmelaadimistele ning tööriistadele. Kõik loodud päringumootorid töötavad seejärel üksteisest sõltumatult ning kunagi ei teki olukord, kus üks kasutajagrupp takistab teiste tööd, kuna kasutatakse alati erinevaid ressursse.

Snowflake andmeait on võimalik võtta kasutusele Amazon AWS, Microsoft Azure ning ka Google Cloud keskkondades. Samuti on Snowflake väga turvaline kuna kõik andmed on alati krüpteeritud nii pilves kui transpordi ajal. Lisaks on vajadusel võimalik juurde tellida täiendavaid turva- ja kasutajatuvastuse funktsioone. Innovatiivse lahendusena pakub Snowflake andmete jagamise võimalust (data sharing). Kolmandatele osapooltele ei pea enam andmeid välja võtma, et nemad saaks need oma andmebaasi salvestada vaid piisab kui jagada vajalikud tabelid välja ning need ilmuvad Snowflake baasis tarbijatele kohe nähtavale ja on kasutatavad partnerite või klientide poolt.

Kuigi Snowflake andmebaasiteenus on kasutatav innovatiivsel moel pilveteenusena, on tegemist kasutamise vaatenurgast siiski traditsioonilise SQL andmebaasiga, mis vastab ANSI SQL standardile. See tähendab, et Snowflake-ga saab kasutada kõiki olemasolevaid ja juba tuttavaid BI (Tableau, Qlik, PowerBI, jm) ning ETL tööriistu (Pentaho, Talend, jt) ja andmebaasi klienditarkvarasid (DBVizualiser, DBeaver). Samuti ei pea õppima uut päringute kirjutamise keelt, kui SQL juba selge. Lisaks struktureeritud andmetele toetab Snowflake ka pool-struktureeritud andmeformaatide salvestamist ning pärimist nagu näiteks JSON, XML, Avro, Parquet jne. Andmeid on võimalik ka striimida allikatest kasutades oma Snowpipe teenust või näiteks Kafkat.

Snowflake andmeaida kasutamine

Snowflake ettevõttena on kasvanud ning arenenud väga kiiresti. Näiteks Forbes on nimetanud Snowflake 2019 aastal oma The Cloud 100 edetabelis teisele kohale. Snowflake on olnud ka väga edukas investorite hulgas, nt 2020 aasta veebruaris teatas strateegilisest partnerlusest Salesforce.

Eesti kontekstis võimaldab Snowflake andmebaasiteenus kasutada kõige moodsamat ja kiiremat analüütika ja andmeaida lahenduste jaoks mõeldud SQL andmebaasi optimaalsete kuludega ning keskenduda rohkem töö sisule – andmetest väärtuse loomisele.

Alati on oma silm kuningas ning enne uue platvormi kasutusele võtmist on vaja seda ka proovida. Seetõttu pakub Snowflake huvilisetele 30 päevast prooviperioodi, mis sisaldab 400$ väärtuses krediiti teenuse katsetamiseks. Lisaks on veebikeskkonnas kontot tehes kohe olemas näiteandmestikud, mida kasutada.

Wizon OÜ on Snowflake ametlik partner Eestis ning aitame huvilistel läbi viia Snowflake testimist (Proof of Concept) kui ka juurutust. Võta meiega ühendust, kui soovid rohkem infot Snowflake kohta ning planeerida koos prooviperioodi jooksul testimise läbiviimist ja andmeaida juurutust.