Kako do prve zaposlitve na področju Data Science?

Kako lahko nekdo zaposli prvo zaposlitev kot znanstvenik podatkov ali analitik podatkov? Če se pomikate po forumih za podatkovno znanost, boste našli veliko vprašanj v tej temi. Bralci mojega spletnega znanstvenega bloga (data36.com) me občasno sprašujejo isto. In to vam lahko rečem popolnoma veljaven problem!

Odločila sem se, da bom povzela svoje odgovore na vsa večja vprašanja!

NOVO! Ustvaril sem obsežen (brezplačen) spletni video tečaj, ki vam bo pomagal začeti z Data Science. Kliknite tukaj za več informacij: Kako postati znanstvenik s podatki.

PRIJAVITE SE TUKAJ (BREZPLAČNO): https://data36.com/how-to-become-a-data-scientist/

# 1: Katere so najpomembnejše spretnosti in orodja, ki jih imajo ti podatki? In kako jih lahko dobite?

Dobre novice - slabe novice.

Začel bom s slabim. V 90% primerov spretnosti, ki vas jih poučujejo na univerzah, v resnici niso koristni pri projektih s področja podatkov o resničnem življenju. Kot sem že večkrat pisal, so v resničnih projektih potrebne te 4 veščine kodiranja podatkov:

  • bash / ukazna vrstica
  • Python
  • SQL
  • R
  • (in včasih Java)
vir: KDnuggets

Katera 2 ali 3 se vam bosta zdeli najbolj koristni, je v resnici odvisna od podjetja… Če pa se boste enega naučili, se boste drugega lažje naučili.

Torej prvo veliko vprašanje je: kako lahko dobite ta orodja? Prihaja dobra novica! Vsa ta orodja so brezplačna! Pomeni, da jih lahko prenesete, namestite in uporabljate, ne da bi za njih plačali peni. Lahko vadite, gradite projekt podatkovnega hobija ali karkoli drugega!

Pred kratkim sem napisal članek po korakih o tem, kako namestiti ta orodja v računalnik. Poglejte tukaj.

# 2: Kako se učiti?

Obstajata dva glavna načina za enostavno in stroškovno učinkovito učenje podatkov.

1.: Knjige.

Nekako staro šolo, vendar še vedno dober način učenja. Iz knjig lahko dobite zelo osredotočeno, zelo podrobno znanje o spletni analizi podatkov, statistiki, kodiranju podatkov itd ... Tu sem izpostavil 7 knjig, ki jih priporočam v prejšnjem članku.

Najboljših 7 podatkovnih knjig, ki jih priporočam

2.: Spletni vebinari in video tečaji.

Spletni tečaji za podatkovno znanost prihajajo po poštenih cenah (od 10 do 500 USD) in zajemajo različne teme, od kodiranja podatkov do poslovne inteligence. Če na začetku ne želite porabiti denarja za to, sem v tej objavi navedel brezplačne tečaje in učna gradiva.

(3. tretji tečaj: Prvi mesec tečaja Junior Data Scientist. Ustvaril sem 6-tedenski spletni tečaj o podatkih, s katerim si prizadevam, da bi znanstvenik s podatki lahko vadil in reševal resnične naloge na podlagi podatkov o resničnem življenju: Prvi mesec Junior Data Scientist .)

# 3: Kako vaditi in kako pridobiti resnične življenjske izkušnje

To je zapleteno, kajne? Vsako podjetje želi imeti ljudi z vsaj malo resnične življenjske izkušnje ... Toda kako pridobiti resnične življenjske izkušnje, če potrebuješ resnične življenjske izkušnje, da dobiš prvo zaposlitev? Klasični catch-22. In odgovor je: projekti za hišne ljubljenčke.

"Projekt hišnih ljubljenčkov" pomeni, da se vam zdi ideja o podatkovnem projektu, ki vas navdušuje. Nato preprosto začnete graditi. O tem lahko razmišljate kot o majhnem zagonu, vendar se prepričajte, da se še naprej osredotočate na del podatkovnega dela projekta in lahko preprosto prezrete poslovni del. Da bi vam dal nekaj idej, tukaj je nekaj mojih hišnih projektov iz zadnjih nekaj let:

  • Zgradil sem scenarij, ki je spremljal spletno mesto z nepremičninami in mi po e-pošti poslal najboljše ponudbe v realnem času - tako da sem lahko dobil te posle pred vsemi drugimi.
  • Zgradil sem scenarij, ki je povlekel vse članke iz ABC, BBC in CNN, in na podlagi uporabljenih besed povezal članke, ki so bili približno iste teme, na treh različnih portalih z novicami.
  • V Pythonu sem zgradil samoučni klepet. (Ni preveč pametno - saj tega še nisem treniral.)

Bodi ustvarjalen! Poiščite projekt za hišne ljubljenčke, povezane z znanostjo podatkov, in začnite kodirati! Če ste naleteli na steno s problemom kodiranja - kar se lahko zgodi enostavno, ko se začnete učiti novega podatkovnega jezika - preprosto uporabite google in / ali stackoverflow. En kratek primer mojega - kako učinkovit je stackoverflow:

leva stran: moje vprašanje - desna stran: odgovor (v 7 minutah)

Opazite časovni žig! Poslal sem nekakšno zapleteno vprašanje in odgovor sem dobil v 7 minutah. Edino, kar sem moral storiti, je bilo, da kopiram in prilepim kodo v svojo proizvodno kodo in začnem, ravnokar je delovalo!

(Opomba: Cross Validated je še en odličen forum za vprašanja, povezana s podatki o znanosti).

Predlog +1:

Tudi če je nekoliko težavno, poskusite dobiti mentorja. Če imate dovolj sreče, boste našli nekoga, ki deluje v vlogi Data Scientist v prijetni družbi in ki lahko z vami preživi eno uro tedensko ali dva tedna in razpravlja o stvareh ali jih uči.

# 4: Kam in kako pošljete svojo prvo prošnjo za zaposlitev?

Če vam ni uspelo najti mentorja, ga lahko v prvem podjetju še vedno najdete. To bo vaše prvo delovno nalogo, povezano z znanostjo podatkov, zato predlagam, da se ne osredotočate na velik denar ali super zagonetno zagonsko vzdušje. Osredotočite se na iskanje okolja, v katerem se lahko učite in izboljšate.

Če se svoje prvo raziskovalno službo v večnacionalnih podjetjih zaposlite v večnacionalnem podjetju, se morda ne bo uskladil s to idejo, saj so tamkajšnji ljudje običajno preveč zasedeni s svojimi stvarmi, zato ne bodo imeli časa ali / in motivacije, da bi vam pomagali izboljšati se (seveda vedno obstajajo izjeme).

Tudi v vašem primeru začeti z majhenim zagonom kot prva oseba, ki se ukvarja s podatki, ni dobra ideja, saj ta podjetja nimajo starejših fantov, na katerih bi se lahko učili.

Svetujem vam, da se osredotočite na 50–500 velika podjetja. To je zlata sredina. Starejši znanstveniki s podatki so na krovu, vendar niso preveč zaposleni, da bi vam pomagali in vas učili.

Ok, našli ste nekaj dobrih podjetij ... Kako se prijaviti? Nekatera načela za vaš življenjepis: poudarite svoje spretnosti in projekte, ne pa svojih izkušenj (saj še nimate preveč let, da bi jih postavili na papir). Naštejte ustrezne kodne jezike (SQL in Python), ki jih uporabljate in povežite nekatere svoje povezane github repos, da lahko pokažete, da ste res uporabljali ta jezik.

Tudi podjetja v večini primerov zaprosijo za spremno pismo. To je seveda dobra priložnost, da izrazite svoje navdušenje, lahko pa dodate še nekaj praktičnih podrobnosti, na primer, kaj bi počeli v svojih prvih nekaj tednih, če bi bili najeti. (Npr. "Če pogledam vaš registracijski tok, mislim, da ima ____ spletna stran pomembno vlogo. V prvih nekaj tednih bi izvedel ___, ___ in ___ (posebne analize), da bi to hipotezo dokazal in jo globlje razumel. Lahko bi podjetju pomagalo izboljšati _____ in sčasoma spodbudi _____ KPI. ")

Upajmo, da bi vam to uspelo za razgovor za službo, kjer boste lahko malo poklepetali o svojih hišnih projektih, predlogih za spremno pismo, predvsem pa bo šlo za preverjanje osebnosti in najverjetneje nekaj osnovnega preizkusa sposobnosti. Če ste dovolj vadili, boste to prestavili… če pa ste živčni tip in želite več vaditi, lahko to storite na spletnem mestu hackerrank.com.

Zaključek

No, to je to. Vem, da se sliši lažje, ko je napisano, toda če si resnično odločen, da boš znanstvenik podatkov, ne bo težav, da se to zgodi! Vso srečo s tem!

Če se želite preizkusiti, kako je biti mladinski podatkovni znanstvenik ob zagonu resničnih življenj, si oglejte moj 6-tedenski tečaj za spletno znanost o podatkih: Prvi mesec znanstvenega znanstvenika za podatke!

Če želite izvedeti več o podatkovni znanosti, preverite moj blog (data36.com) in / ali se naročite na moje Newsletter! In ne zamudite moje nove serije kodiranja: SQL za analizo podatkov!

Hvala za branje!

Ste uživali v članku? Prosim, obvestite me s klikom na spodnji gumb. Tudi drugim ljudem pomaga videti zgodbo!

Tomi Mester avtor podatkov36.com Twitter: @ data36_com