11 лепшых рэсурсаў для навукі аб даных і машыннага навучання

Data – гэта новая нафта. І машыннае навучанне – гэта агонь. Той, хто будзе кантраляваць гэтых дваіх, будзе кіраваць светам.

Не, сказанае вышэй не нейкая пампезная фраза, узятая з антыўтапічнага рамана.

Гэта рэальнасць.

Новы сусветны парадак заключаецца ў зборы велізарных аб’ёмаў адпаведных даных і апрацоўцы іх у дзейную інфармацыю – тое, што чалавецтва не магло зрабіць у гісторыі. Гэта тая тэхналогія, якая дазваляе краіне апярэджваць іншыя і, у рэшце рэшт, кіраваць светам.

У выніку прагрэсіўныя краіны свету ўспрымаюць гэта вельмі і вельмі сур’ёзна.

Выгадны выбар кар’еры

Акрамя міжнародных інтрыг, навука аб даных і машыннае навучанне – гэта новая гарачая сфера з неверагоднымі магчымасцямі. Попыт (мякка кажучы) зашкальвае, а спецыялістаў па апрацоўцы дадзеных не хапае. Нават не пасрэдныя.

Быццам бы мы раптам адкрылі шмат новых прыдатных для жыцця планет, і не хапае людзей, каб іх перанесці. Я мог бы працягваць і працягваць і гучаць як сапсаваная кружэлка, але я думаю, што гэтая інфаграфіка робіць працу значна лепш:

Крыніца: insidebigdata.com

Такім чынам, мы бачым, што заробкі пачынаюцца ад 50 000 долараў і больш, а для менеджэраў могуць перавышаць 250 000 долараў.

І не толькі гэта, сярэдні чалавек на гэтай планеце будзе генераваць 1,7 МБ даных у секунду. Гэта больш за 3500 ТБ даных за ўвесь тэрмін службы — больш даных, чым мы ўмеем апрацоўваць на дадзены момант, не кажучы ўжо пра выкарыстанне для аналізу. Сказаць, што будучыня светлая, было б аказаць мядзведжую паслугу гэтай цудоўнай новай пашы.

Ці складаныя навука аб дадзеных і машыннае навучанне?

Добрае пытанне!

З майго вопыту адказ адначасова і «так», і «не».

Штучны інтэлект (і, як следства, машыннае навучанне) – гэта цяжэй за ўсё, калі вы схільныя займацца даследаваннямі і пашыраць канверты. За такую ​​працу нават кандыдат навук. па інфарматыцы і матэматыцы не хапае. Але ў звычайнага чалавека няма ні амбіцый, ні часу для такога занятку.

З іншага боку – гэта тое, што я б назваў прыкладной навукай аб даных і машынным навучаннем.

Гэта значыць, вы бераце існуючыя інструменты, метады і алгарытмы і ўжываеце іх для вырашэння некаторых рэальных праблем. Гэтая частка патрабуе самааддачы, успрымання і творчага мыслення (і веды некаторых простых матэматычных паняццяў, якія хутка засвойваюцца), але што тычыцца сапраўдных «тэхнічных» ведаў, гэта значна больш мякка, чым тое, што называецца працай інжынера-праграміста.

Іншымі словамі, гэта не простая прагулка, але, зыходзячы з суадносін узнагароды і высілкаў, гэта адна з лепшых інвестыцый.

Цяпер, калі вы ўмацавалі сваю рашучасць стаць навукоўцам па дадзеных і інжынерам машыннага навучання, давайце пачнем вывучаць лепшыя варыянты.

Праверце гэта:  Як атрымаць шматфункцыянальны прагляд малюнкаў у Chrome

Машыннае навучанне (Google)

Мала хто ведае, але Google мае шырокую, вельмі практычную і бясплатны курс машыннага навучання. Па словах кампаніі, гэта з’яўляецца часткай іх прыхільнасці да прасоўвання тэхналогій штучнага інтэлекту / мл і захавання ведаў у адкрытым доступе.

Самае лепшае ў гэтым курсе тое, што няма ніякіх перадумоў, але рыхтуйцеся выдаткаваць дадатковы час на самастойнае вывучэнне паняццяў статыстыкі.

Я маю на ўвазе, што гэта не трэба, але калі ў вас няма ведаў у прасунутай статыстыцы, тлумачэнняў у гэтым курсе можа быць недастаткова. Яшчэ адна загваздка ў тым, што гэты курс прадстаўляе машыннае навучанне праз TensorFlow, якая з’яўляецца рэалізацыяй ML, распрацаванай Google. Такім чынам, у пэўным сэнсе Google імкнецца прасоўваць свае API для машыннага навучання, але, улічваючы каштоўнасць гэтага курса, я не бачу, чаму гэта можа стаць каменем перапоны.

Ва ўсякім выпадку, TensorFlow з’яўляецца адным з простых спосабаў увайсці ў ML і карыстаецца шалёнай папулярнасцю (для параўнання фреймворкаў AI, глядзіце гэта).

Навука аб дадзеных

Назва Гарвард выклікае трапятанне, як і гэты курс.

Перш за ўсё: гэта не курс “давайце хутка выпацкацца”, дзе вы на дыбачках абыдзеце машыннае навучанне, напісаўшы тут фрагмент або сцэнарый. Гэты курс – сур’ёзнае баявое хрышчэнне, якое патрабуе цяжкай працы і значных выдаткаў часу.

Курс пастаўляецца з бясплатнымі відэа, кодам (размешчаным на GitHub) і рашэннямі для лабараторных практыкаванняў, таму практычна нічога не стрымлівае, калі вы захочаце гэта прыняць.

Ідэальная аўдыторыя?

Вы… Я не жартую.

Я б сказаў, што працуюць прафесіяналы з годнай матэматычнай адукацыяй, нават калі яны, магчыма, больш не займаюцца матэматыкай (звычкі рабіць высновы і доказы – гэта самае неабходнае). Але яшчэ раз папярэджваю: вы можаце падумаць, што ў вас усё добра, але на гэтым курсе вы будзеце адчуваць сябе так, як на сняданак зацвярдзелі пазногці – практычныя задачы досыць складаныя, каб прымусіць вас плакаць, але ў такім выпадку, гэта можа быць тое, што вы паўторна шукаеце!

Машыннае навучанне

Зайдзіце ў бар, напоўнены навукоўцамі па апрацоўцы дадзеных, і спытайцеся, хто такі Эндру Нг, і вы атрымаеце пабоі.

У колах навукі аб даных і машыннага навучання Эндру Нг дасягнуў боскага статусу дзякуючы свайму выключнаму курсу на Coursera – Машыннае навучанне.

І калі вы сумняваецеся ў паўнамоцтвах Эндру Нга, я дазволю гэтаму гаварыць само за сябе:

Гэта платны курс, паколькі ён з’яўляецца часткай плана цэнаўтварэння Coursera, але фінансавыя абавязацельствы і рашучасць – не адзіная перадумова. Гэта доўгі курс, паколькі Эндру паглыбляецца ў матэматыку, якая стаіць за ўсім, што звязана з ML, і разбірае папулярныя алгарытмы. Але, на шчасце, гэта поўны курс, і вас крок за крокам правядуць у самыя цёмныя глыбіні і вернуць назад.

Я настойліва рэкамендую, галоўным чынам таму, што выстаўляць напаказ сертыфікат аб заканчэнні гэтага курса сёння стала з’явай!

Прыкладная навука аб дадзеных

Спецыялізацыі на Coursera складаюцца з серыі курсаў, мэта якіх – перавесці вас ад нуля да дасканаласці ў пэўнай канцэпцыі. Калі вы шукаеце поўны, сур’ёзны, але прыязны курс па навуцы дадзеных і машыннаму навучанню з Python, я не магу рэкамендаваць гэты спецыялізацыя дастаткова.

Праверце гэта:  Як уключыць камеру ў Omegle

У канцы курса вы атрымліваеце сертыфікат.

DataCamp

DataCamp прапануе мноства курсаў па навуцы дадзеных, якія таксама ўключаюць некалькі навыкаў і кар’ерных трэкаў. Ад маніпулявання дадзенымі да машыннага навучання, вы атрымаеце кар’ерныя навыкі навукоўца дадзеных у Python і R, якія дапамогуць вам дасягнуць поспеху ў галіне навукі аб дадзеных.

З байтавым змесцівам DataCamp вы можаце вучыцца ў сваім уласным тэмпе. Гэтыя курсы даюць вам практычны вопыт, дзякуючы якому вы будзеце развіваць свае навыкі навукі аб дадзеных.

Вы можаце пачаць з бясплатнай версіі і ацаніць курс, гледзячы на ​​першую главу.

edX

Вучыцеся ў MITx, Harvardx, IBM, RICEx, UCSanDiegox і GTx на платформа edX.

Усе яны маюць поўную праграму навучання, якая дапаможа вам валодаць навыкамі навукоўцаў па дадзеных. Гэтыя праграмы лепш за ўсё падыходзяць для тых, хто валодае статыстыкай або інфарматыкай.

Калі вы не шукаеце праграму, вы можаце выбраць аля-карт. На edX вы знойдзеце больш за 200 курсаў, звязаных з навукай аб дадзеных, якія ахопліваюць Python, R, Excel, верагоднасць, статыстыку, машыннае навучанне, візуалізацыю даных і многае іншае.

Codecademy

Codecademy – гэта яшчэ адна платформа, якая з’яўляецца адной з лепшых сістэм, якая дапамагае вам навучыцца праграмаваць. Яны вераць у прынцып «Вучыся на практыцы» і маюць на сваёй платформе мноства практычных праектаў і тэстаў.

The курс навукі аб дадзеных Прапанаваныя Codecademy ўключаюць SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn і многія іншыя бібліятэкі.

Увесь кар’ерны шлях утрымлівае 26 курсаў, якіх больш чым дастаткова, каб дапамагчы вам стаць паспяховым навукоўцам дадзеных.

Гэты курс дадзеных:

  • Дае вам глыбокія веды навукі аб даных
  • Дае дарожную карту, якую лёгка прытрымлівацца
  • Робіць вас гатовымі да працы, дапамагаючы атрымаць дастатковы практычны вопыт

Удэмы

Udemy не мае патрэбы ў прадстаўленні.

Навучальны лагер Python для навукі аб даных і машыннага навучання на Udemy – адзін з самых папулярных курсаў з больш чым 85K+ рэйтынгам 4,6, які прайшлі 370K+ студэнтаў па ўсім свеце.

Ніжэй прыведзены тэмы, якія разглядаюцца ў гэтым курсе:

Ніжэй прыведзены асаблівасці / вынікі гэтага курса:

  • 25 гадзін відэа па запыце
  • Поўны пажыццёвы доступ
  • 13 артыкулаў і пяць рэсурсаў для загрузкі
  • Доступ на мабільным тэлефоне і ТБ
  • Сертыфікат аб заканчэнні
  • 30-дзённая гарантыя вяртання грошай

Такім чынам, калі вы аддаеце перавагу бюджэтны курс, гэта лепш за ўсё падыходзіць для вас, каб пачаць.

Google AI

Вам было б цікава навучыцца машыннаму навучанню ў экспертаў ML з Google?

Ну, тады вам трэба праверыць курсы на Google AI.

На гэтай платформе ёсць курсы машыннага навучання і навукі аб даных, а таксама кантэнт для студэнтаў, інжынераў-праграмістаў, навукоўцаў па апрацоўцы дадзеных і нават даследчыкаў. Гэтыя курсы бясплатныя.

Праверце гэта:  Як кіраваць падсветкай Philips Hue з вашага Mac

Каб пачаць з, Паскораны курс машыннага навучання у Google AI павінен быць вашым курсам. Гэта хуткі курс з практычным увядзеннем з выкарыстаннем API TensorFlow. Ніжэй прыведзены падрабязнасці гэтага курса:

На гэтай платформе таксама ёсць спецыяльныя курсы па важных тэмах машыннага навучання, напрыклад кластарызацыя, рэкамендацыйныя сістэмы, тэставанне і адладка ў машынным навучанні, падзел даных і распрацоўка функцый у машынным навучанні. Калі вы ўжо ведаеце асновы машыннага навучання, гэтыя курсы будуць карыснымі.

Udacity

Udacity таксама з’яўляецца вельмі папулярнай платформай электроннага навучання, якая мае мноства курсаў па папулярных тэхналогіях. Ён мае некалькі вядучых у галіны праграм, створаных і прызнаных вядучымі кампаніямі па ўсім свеце, такімі як AT&T, AWS, Google, IBM.

Адна з праграм Udacity прызначана для Data Science – Школа навукі аб дадзеных. Гэтая праграма дапаможа вам працаваць аналітыкам дадзеных, навукоўцам дадзеных, інжынерам дадзеных і бізнес-аналітыкам. Курс Data Scientist у гэтай праграме з’яўляецца найважнейшым, які ахоплівае паняцці машыннага навучання, глыбокага навучання і праграмнай інжынерыі. Вам трэба мець базавыя веды машыннага навучання, каб выбраць гэты курс.

Калі вы ведаеце праграмаванне на Python, але пачатковец у машынным навучанні, ёсць іншая праграма на Udacity – Школа ІІ. У гэтай праграме ёсць курсы, пачынаючы з асноў машыннага навучання.

Глыбокае навучанне

Гэты курс гэта шчасце і мая самая любімая рэкамендацыя ў гэтым спісе, калі вы праграміст.

Я б сказаў яшчэ раз: калі вы кодэр.

Гэта таму, што гэты курс не марнуе час на навучанне асновам праграмавання. У апісанні курса вельмі ясна сказана (акцэнт арыгінальны):

Мы мяркуем, што кожны, хто праходзіць гэты курс, мае як мінімум адзін год вопыту кадавання. У якасці мовы навучання ў курсе выкарыстоўваецца Python, таму, калі вы яшчэ не ведаеце Python, мы мяркуем, што вы выдаткуеце час на вывучэнне — для дасведчанага кодэра вы павінны пераканацца, што Python даволі простая для вывучэння.

Такім чынам, калі вы ўжо ведаеце Python (калі не вучыцца тут), ці можа хутка асвоіцца, гэта ідэальны курс для прагматыкаў, якія жадаюць будаваць рэальныя, прыдатныя да выкарыстання сістэмы, не клапоцячыся занадта аб тэарэтычных асновах алгарытмаў.

Я нават магу сказаць, што гэта для нецярплівых майстрых (як я!), якія ненавідзяць цырымоніі і аднастайнасць.

І о, я ўжо казаў, што гэта на 100% бясплатна і мае выдатную суполку?!

Заключэнне

Фу!

Скласці гэты спіс было складана. Не таму, што не было дастаткова добрых крыніц, а таму, што іх было занадта шмат!

Машыннае навучанне – гэта дамен, які літаральна выбухнуў і вельмі элегантна вырашае цяжкія праблемы, і таму ў Інтэрнэце існуюць сотні курсаў, бясплатных і платных, большасць з іх сапраўды добрыя. Але гэта таксама можа быць крыніцай блытаніны, таму я паспрабаваў скараціць яго да адзінаццаці для розных тыпаў навучэнцаў у адпаведнасці з узроўнем іх вопыту.

Спадзяюся, гэта дапамагло!