Ведайце пра асноўную схему: зорка супраць сняжынкі

Шматмерная схема прызначана для пабудовы мадэлі сістэмы сховішча даных.

Асноўная мэта гэтых схем – задаволіць патрэбы вялікіх баз дадзеных, створаных для аналітычных мэтаў (OLAP).

Гэты метад выкарыстоўваецца для ўпарадкавання даных у базе з добрым размяшчэннем змесціва ў базе. Схема дазваляе кліентам задаваць пытанні, звязаныя з бізнесам або рынкавымі тэндэнцыямі.

Акрамя таго, шматмерная схема прадстаўляе даныя ў выглядзе кубаў даных, якія дазваляюць праглядаць і мадэляваць даныя з розных пунктаў гледжання і вымярэнняў.

Ён бывае трох відаў, але многія блытаюць зорку і сняжынку. Такім чынам, ім становіцца цяжка выбраць пераважную мадэль.

Калі вы адзін з іх, давайце абмяркуем адрозненні паміж схемамі зоркі і сняжынкі, пачынаючы з вызначэння і разумення іх пераваг, праблем, схемы і характарыстык.

Што такое шматмерная схема?

Схема адносіцца да лагічнага апісання поўнай базы дадзеных і вітрын даных. Ён уключае назву запісаў і іх апісанне, уключаючы агрэгаты і звязаныя з імі элементы даных.

База дадзеных звычайна выкарыстоўвае рэляцыйную мадэль для апісання, у той час як сістэма сховішча дадзеных выкарыстоўвае мадэль схемы.

Шматмерную схему можна вызначыць з дапамогай мовы запытаў інтэлектуальнага аналізу дадзеных (DMQL).

Каб вызначыць вітрыны і сховішчы даных, ён выкарыстоўвае два прымітывы – вызначэнне вымярэння і вызначэнне куба.

Шматмерная схема выкарыстоўвае розныя тыпы мадэляў схем. Яны:

  • Зорная схема
  • Схему сняжынкі
  • Схема галактыкі

Давайце абмяркуем, што такое схемы зоркі і сняжынкі.

Зорка супраць Сняжынкі: якія яны?

Што такое зорная схема?

Зорная схема – гэта мадэль архітэктурнага сховішча даных і бізнес-аналітыкі, якая патрабуе адзінай табліцы фактаў для захоўвання вымераных і транзакцыйных даных. Ён таксама выкарыстоўвае розныя табліцы з меншымі памерамі для захоўвання атрыбутаў бізнес-дадзеных.

Ён названы ў адпаведнасці з яго структурай. Як зорка, табліца фактаў займае сваё месца ў цэнтры дыяграмы, а невялікія памерныя табліцы размешчаны як галінкі да цэнтральнага стала, утвараючы структуру, падобную да зоркі.

Кожная зоркавая схема складаецца з адной табліцы фактаў і некалькіх табліц невялікіх памераў. Табліцы фактаў уключаюць канкрэтныя вымерныя даныя, якія неабходна прааналізаваць, напрыклад, зарэгістраваныя паказчыкі, фінансавыя даныя або запісы аб продажах. Гэта можа быць здымка гістарычных даных за адзін раз або транзакцыя.

Больш за тое, схема Star з’яўляецца самай простай і фундаментальнай сярод сховішчаў дадзеных і схем вітрын дадзеных. Ён эфектыўны пры апрацоўцы асноўных запытаў. Зорная схема звычайна падтрымлівае бізнес-аналітыку, спецыяльныя запыты, аналітычныя прыкладанні і кубы онлайн-аналітычнай апрацоўкі.

Зорная схема таксама падтрымлівае падлік, сярэдняе значэнне, суму і іншыя агрэгацыі многіх запісаў. Карыстальнікі могуць лёгка фільтраваць і групаваць агрэгацыі па памерах. Напрыклад, карыстальнікі ствараюць запыты накшталт «знайсці ўсе запісы аб продажах у чэрвені» або «прааналізаваць агульны даход ад офіса XYZ у 2022 годзе».

Праверце гэта:  Як ачысціць і прадэзінфікаваць усе вашы гаджэты

Што такое схема сняжынкі?

Схема сняжынкі – гэта шматмерная мадэль даных, якую таксама можна назваць пашырэннем схемы зоркі. Гэта таму, што табліцы памераў у схеме сняжынкі разбіваюцца на падпамеры.

Схема з’яўляецца сняжынкай, калі адна або некалькі табліц вымярэнняў не звязаны непасрэдна з табліцай фактаў, а злучаюцца праз іншыя табліцы вымярэнняў.

Сняжынка – гэта з’ява, якая нармалізуе табліцы памераў у схеме зоркі. Калі вы нармалізуеце ўсе табліцы вымярэнняў, атрыманая структура нагадвае сняжынку, якая змяшчае табліцу фактаў у сярэдзіне структуры.

Кажучы простымі словамі, схема сняжынкі складаецца з адной табліцы фактаў у сярэдзіне мадэлі, якая злучана з табліцамі памераў, якія таксама звязаны з іншымі табліцамі памераў. Гэтая схема выкарыстоўваецца для павышэння прадукцыйнасці запытаў.

Мадэль створана для хуткага, гнуткага запыту па складаных сувязях і вымярэннях. Гэта карысна для сувязей “адзін да многіх” і “ад многіх да многіх” паміж рознымі ўзроўнямі вымярэнняў.

Дзякуючы больш жорсткаму захаванню большай колькасці стандартаў нармалізацыі, вы атрымаеце большую эфектыўнасць захоўвання. Але надмернасць даных нязначная, а прадукцыйнасць нізкая ў параўнанні з дэнармалізаванымі мадэлямі даных, такімі як зорная схема.

Зорка супраць Сняжынкі: як яны працуюць?

Як працуе зорная схема?

Табліца фактаў у сярэдзіне зоркавай мадэлі захоўвае два тыпы інфармацыі – лікавыя значэнні атрыбутаў і атрыбутаў памераў. Давайце разбярэмся ў іх на прыкладзе базы дадзеных продажаў.

  • Лікавыя значэнні ўнікальныя для кожнага радка і кропкі даных. Гэта не карэлюе і не мае дачынення да даных, якія захоўваюцца ў іншым радку. Гэта факты аб дадзенай транзакцыі, такія як агульная сума, колькасць замовы, дакладны час, чысты прыбытак, ідэнтыфікатар замовы і г.д.
  • Значэнні атрыбутаў размернасці не захоўваюць ніякіх даных непасрэдна, а захоўваюць значэнні знешніх ключоў для радка ў табліцы памераў. Розныя радкі ў цэнтральнай табліцы будуць спасылацца на гэтую інфармацыю, напрыклад, значэнне даных, ідэнтыфікатар гандлёвага супрацоўніка, ідэнтыфікатар філіяла, ідэнтыфікатар прадукту і г.д.

Табліцы памераў заўсёды захоўваюць дапаможную інфармацыю з табліцы фактаў. Кожная памерная табліца звязана са слупком табліцы фактаў разам са значэннем памернасці і захоўвае дадатковыя даныя аб гэтым значэнні.

Прыклад: табліца памераў супрацоўніка выкарыстоўвае ідэнтыфікатар супрацоўніка ў якасці ключавога значэння, а таксама змяшчае такую ​​інфармацыю, як імя, пол, адрас і нумар тэлефона. Падобным чынам табліца памераў прадукту захоўвае інфармацыю, у тым ліку назву прадукту, колер, дату выхаду на рынак, кошт вытворчасці і г.д.

Як працуе схема сняжынкі?

Падумайце аб дызайне сняжынкі з цэнтральнай скрынкай і рознымі злучэннямі праз гэтую скрынку з рознымі кропкамі. Каб падтрымліваць вітрыны даных і сховішчы даных, у карціну ўваходзіць дызайн схемы сняжынкі.

Яна падобная на зорную схему, але з невялікімі зменамі. У адрозненне ад схемы зоркі, схема сняжынкі пашырае свае табліцы падпамераў, якія звязаны з табліцамі памераў.

Асноўная мэта гэтай мадэлі – нармалізацыя дэнармалізаванай інфармацыі зорнай мадэлі. Такім чынам можна вырашыць агульныя праблемы, звязаныя са схемай зоркі.

У аснове схемы вы знойдзеце табліцу фактаў, якая звязана з інфармацыяй, якая змяшчаецца ў табліцах памераў. Гэтыя табліцы зноў ідуць вонкі да табліц падпамераў, якія маюць падрабязную інфармацыю, якая апісвае інфармацыю табліцы вымярэнняў.

Прыклад: схема сняжынкі змяшчае табліцу фактаў продажаў і табліцы размяшчэння крамы, лініі, сямейства, прадукту і часу. Памеры рынку складаюцца з дзвюх табліц вымярэнняў, у якіх крама з’яўляецца асноўнай табліцай вымярэнняў, а месцазнаходжанне крамы – табліцай падпамераў. Вымярэнне прадукту мае тры табліцы падпамераў, у якіх згадваецца табліца падпамераў прадукту, лінейкі і сямейства.

Праверце гэта:  Забыліся пароль галасавой пошты? Вось як скінуць пароль

Зорка супраць Сняжынкі: Характарыстыка

Характарыстыкі зорнай схемы

  • Зорная схема можа фільтраваць даныя з нармалізаваных даных, каб задаволіць патрэбы сховішча даных. Унікальны ключ генеруецца з звязанай інфармацыі для кожнай табліцы фактаў для ідэнтыфікацыі кожнага радка.
  • Ён забяспечвае хуткія разлікі і агрэгацыі, такія як даход ад атрыманага даходу і агульная колькасць прададзеных тавараў у канцы кожнага месяца. Гэтыя дэталі можна адфільтраваць у адпаведнасці з патрэбамі шляхам стварэння адпаведных запытаў.
  • Гэта вымярэнне падзей, якое ўключае канечныя лікавыя значэнні, якія складаюцца з знешняга ключа. Гэтыя ключы звязаны з памернымі табліцамі. Існуюць розныя тыпы табліц фактаў, якія аформлены значэннямі на атамарным узроўні.
  • Табліца фактаў транзакцый змяшчае даныя аб пэўных падзеях, такіх як распродажы і святы.
  • Факты запісу ўключаюць зададзеныя перыяды, напрыклад інфармацыю аб рахунку ў канцы года або кожны квартал.
  • Табліца памераў дае падрабязныя даныя аб атрыбутах або запісах, знойдзеных у цэнтральнай табліцы.
  • Карыстальнік можа самастойна распрацаваць стол у адпаведнасці з патрэбамі.
  • Вы можаце выкарыстоўваць зорную схему для назапашвання табліц здымкаў.

Характарыстыкі схемы сняжынкі

  • Схема сняжынкі патрабуе невялікай прасторы на дыску.
  • Дадзеная мадэль простая ў рэалізацыі за кошт асобных і асноўных табліц памераў.
  • Табліцы вымярэнняў утрымліваюць па меншай меры два атрыбуты для вызначэння інфармацыі ў некалькіх зернях.
  • З-за некалькіх табліц прадукцыйнасць нізкая ў параўнанні са схемай зоркі.
  • Схема сняжынкі мае самы высокі ўзровень цэласнасці даных і нізкі ўзровень празмернасці дзякуючы нармалізацыі.

Зорка супраць Сняжынкі: перавагі

Перавагі Star Schema

  • Зорная схема – гэта самы просты спосаб сярод схем вітрын дадзеных.
  • Ён мае простую логіку справаздачнасці. Гэтая логіка маецца на ўвазе дынамічна.
  • Ён распрацаваны з выкарыстаннем кубікаў падачы, якія прымяняюцца праз працэс онлайн-транзакцый, каб кубікі працавалі эфектыўна і эфектыўна.
  • Зорная схема фарміруецца з дапамогай простай логікі і запытаў, якія лёгка атрымаць з транзакцыйнага працэсу.
  • Ён прапануе павышаную прадукцыйнасць для прыкладанняў для справаздач.
  • Ён разгортваецца для кантролю хуткага аднаўлення даных.
  • Адфільтраваную і адабраную інфармацыю можна лёгка прымяніць у розных выпадках.

Перавагі схемы Snowflake

  • Зорная схема выкарыстоўваецца для павышэння прадукцыйнасці запытаў з-за меншых патрабаванняў да памяці на дыску.
  • Ён прапануе вялікую маштабаванасць у адносінах паміж кампанентамі і ўзроўнямі памераў.
  • Гэта прасцей у абслугоўванні.
  • Зорная схема прапануе хуткі пошук даных.
  • Гэта звычайная і простая схема даных для сховішча даных.
  • Гэта дапамагае палепшыць якасць даных.
  • Структураваныя даныя памяншаюць праблему цэласнасці даных.

Зорка супраць Сняжынкі: абмежаванні

Абмежаванні зорнай схемы

Ён мае высокі дэнармалізаваны стан і стан цэласнасці. Увесь працэс згорнецца, калі карыстальнік не зможа абнавіць дадзеныя. Бяспека і абарона таксама абмежаваныя. Акрамя таго, зорная схема не такая гнуткая, як аналітычная мадэль. Ён не забяспечвае эфектыўнай падтрымкі розных адносін.

Абмежаванні схемы сняжынкі

Галоўнае абмежаванне, якое вы знойдзеце ў Snowflake, – гэта дадатковыя намаганні па абслугоўванні з-за павелічэння колькасці табліц малых памераў. Многія складаныя запыты робяць пошук неабходных даных складаным. Акрамя таго, час выканання пытання вялікі з-за больш высокіх табліц. Гэтая мадэль таксама жорсткая і патрабуе большых выдаткаў на абслугоўванне.

Праверце гэта:  7 лепшых інструментаў Quiz Builder для большага прыцягнення вашай аўдыторыі

Зорка супраць Сняжынкі: адрозненні

Зорка і Сняжынка – гэта тыпы шматмерных схем, але яны маюць розныя структуры і ўласцівасці. Першы падобны да зоркі, а другі нагадвае сняжынку, што вызначае іх назвы.

У зоркавай схеме толькі адно злучэнне стварае сувязь паміж цэнтральнай табліцай фактаў і бакавымі табліцамі вымярэнняў. З іншага боку, у схеме сняжынкі некалькі злучэнняў неабходныя для сувязі з табліцамі памераў.

Схема «зорка» звычайна выкарыстоўваецца, калі ў табліцы памераў меншая колькасць радкоў, а схема «сняжынка» выкарыстоўваецца, калі табліца памераў адносна вялікая.

На дыяграме ніжэй адрозніваюцца дзве мадэлі і тое, як табліцы вымярэнняў і табліца фактаў звязаны ў розных схемах.

Параметры Star SchemaSnowflake SchemaDisk spaceStar схема выкарыстоўвае больш дыскавай прасторы. Схема Snowflake выкарыстоўвае менш дыскавай прасторы. Надмернасць даных. Яна мае высокую надмернасць даных. Мае нізкую надмернасць даных. Нармалізацыя. Табліцы памераў дэнармалізаваны, што азначае паўтарэнне аднаго і таго ж значэння ў табліцы. Табліцы памераў цалкам нармалізавана. Прадукцыйнасць запыту. Для выканання запытаў патрабуецца мінімум часу, што прыводзіць да лепшай прадукцыйнасці. Для выканання запыту патрабуецца больш часу, чым схема “зорка”, што робіць яго менш прадукцыйным, чым схема “зорка”. Складанасць запыту. Складанасць запыту нізкая. Складанасць запыту вышэй, чым схема “зорка”. Абслугоўванне. З-за высокай надмернасці даных падтрымліваць схему “зорка” крыху складана. З-за нізкай надмернасці даных лёгка падтрымліваць і змяняць схему “сняжынка”. Цэласнасць даных Цэласнасць даных высокая, таму што даныя захоўваюцца празмерна, дзе некалькі копіі існуюць у табліцах вымярэнняў. Цэласнасць даных нізкая, паколькі гэта цалкам нармалізуе табліцы вымярэнняў. Іерархіі Іерархіі для табліц вымярэнняў у зоркавай схеме захоўваюцца ў табліцы вымярэнняў. Іерархіі падзелены на асобныя табліцы вымярэнняў. Дызайн БД. Ён мае просты дызайн БД. Ён мае вельмі складаны дызайн БД. Табліца фактаў. Табліцу фактаў атачаюць некалькі табліц вымярэнняў. Табліца фактаў акружана табліцамі вымярэнняў, якія таксама акружаны табліцамі падвымярэнняў. Схему Set upStar лёгка распрацаваць і наладзіць у адпаведнасці з прамымі адносінамі. З іншага боку, схема сняжынкі трохі складаная ў наладжванні. Апрацоўка куба Апрацоўка куба хутчэй. З-за складанага аб’яднання апрацоўка куба крыху павольная. Знешнія ключы Ён мае мінімальную колькасць знешніх ключоў. Ён мае максімальную колькасць знешніх ключоў.

Заключэнне

Схемы зоркі і сняжынкі карысныя ў розных сектарах. Такім чынам, вырашаць, хто з іх лепш, грунтуецца на іх патрабаваннях.

Схема сняжынкі з’яўляецца пашырэннем схемы зоркі, дзе яна нармалізуе табліцы памераў у схеме зоркі.

Схема зоркі простая па канструкцыі, выконвае запыты хутчэй, а налада простая. З іншага боку, схема сняжынкі прасцей у абслугоўванні, займае менш дыскавай прасторы і менш схільная праблемам цэласнасці даных.

Такім чынам, зоркавая схема можа быць лепшым варыянтам, калі вам патрэбны просты дызайн, менш знешніх ключоў і больш хуткая апрацоўка куба. Але, калі вам патрэбна менш месца на дыску, нізкая цэласнасць даных і нізкія эксплуатацыйныя выдаткі, схема сняжынкі можа быць больш прыдатнай.

Вы таксама можаце вывучыць некаторыя лепшыя рашэнні для графічных баз дадзеных.