Pag-antos sa Tubig - Usa ka Analogy sa Analytics nga Usa ka Bridge nga Layo kaayo

pagtulo analytics

Ang datos, sama sa tubig, adunay lainlaing mga porma. Ang hunahuna sa tawo nagbag-o aron ma-filter ang kadaghanan sa mga datos nga moabut sa amon tungod kay yano ra ang bahin niini.

Kung imong buksan ang imong mga mata ug dalunggan, ang datos bisan diin. Ang kolor sa dingding, ang tunog sa aircon ug ang baho sa kape sa imong silingan gitagad sama sa kaumog. Ang tubig kanunay nga naa sa hangin apan dili kini mapuslanon nga hatagan kini pag-ayo.

Kung ang tubig mobag-o sa gabon, gipugos ka niini nga makita kini ug labi ka lisud ang pagsabut sa kalibutan sa imong palibut. Ang dili kompleto nga mga dataset, nadaut nga datos, dili maayo nga syensya, sayup nga konklusyon ug bias sa panghunahuna tanan nga nawala sa imong agianan.

Ang datos nahulog sama sa ulan. Kung adunay gamay ra, kini dili gyud matagbaw– igo ra aron mahimo’g hugaw ang imong awto ug maglibog ang panagsulti. Nakit-an nimo ang imong kaugalingon nga nagpahid sa lugar sa imong mga baso samtang adunay usa nga nag-spout sa pipila ka mga random data point, nakuha gikan sa pipila ka dili tinago nga gigikanan.

  • Basi nga tubig sa usa ka mabaw nga lim-aw peligro. Ang datos, nga nakolekta gikan sa usa ka dili kasaligan nga suplay, ni gilimpyohan o na-normalize ug gibiyaan nga nagtubo nga stagnant, dali nga mahimong hinungdan sa mga sayup nga konklusyon.
  • A makanunayon nga pag-agas sa tubig mahimo nga igoigo aron mapuno ang usa ka canteen o mapadayon ang usa ka ekosistema sa kakahoyan. Tulo ra nga mga puntos sa datos (ang gidaghanon sa mga gipadala nga email, kumpara sa giablihan, kumpara sa pag-klik) ang makalahutay sa usa ka programa sa pamaligya.
  • A labi ka himsog nga agos sa datos sa porma sa usa ka gamay nga sapa mahimong magamit alang sa pagkaligo. Ang usa ka padayon nga pagdagayday sa datos nagtugot sa benchmarking ug makasaysayanon nga pagtandi. Ang pag-optimize sa landing page mahimo nga matuman sa makanunayong datos sa pagkakabig.
    A kasarangan nga sapa Makahatag gahum sa usa ka galingan nga makakita kahoy o magagaling trigo. Kinahanglan ra sa usa ka rekomendasyon nga makina ang kasaligan nga kontribusyon gikan sa daghang mga tributaries aron makahatag usbaw sa kantidad sa mga shopping cart.
  • A busay sa mahimong magduso sa usa ka dako nga waterwheel ug usa ka igo nga pagdagsang sa kasayuran mahimo magdala sa usa ka tinuod nga oras, dinamikong sistema sa sulud.
  • A suba kana ang gilapdon ug igo nga giladmon nga makasuporta sa tibuuk nga industriya sa transportasyon. Ang igo nga datos mahimong makalutaw sa mga lantsa ug mga barko sa kargamento nga porma sa usa ka koleksyon sa mga cookies gikan sa mga network sa advertising, mga data aggregator sa programa sa loyalty card, ug mga data broker.

Kung moabut ang datos sa gipaabot nga kantidad sa gipaabut nga mga oras, mahimo kini nga makuha, ipalusot ug magamit. Ang mga sistema sa irigasyon, mga dam ug mga reservoir naghatag og pamati sa pagkontrol ug gitugotan ang pagtukod sa usa ka kanunay nga nagkalapad nga imprastraktura nga adunay mga kanal, kandado ug mga dam. Gitukod ang mga bodega sa datos sa dili kaayo kasaligan nga mga agos.

Ang Kalimpyo Sunod sa Pagkadiosnon

Hinlo ang tubig hinungdanon sa kalampusan sa kinabuhi, irigasyon, nagdagan nga mga planta sa kuryente, ug uban pa Ang kahulugan sa 'limpyo' mahimo’g magbag-o alang sa katuyoan; OK ra kung adunay mga lumot sa tubig nga nagpabugnaw sa usa ka planta sa kuryente ug dili kini madawat kung adunay labaw sa 10 nga mga bahin matag bilyon nga arsenic sa inuming tubig.

Parehas ang datos. Sa usa ka direkta nga aplikasyon sa mail, kung adunay ka titulo sa usa ka tawo (Mr., Mrs., Ms.) wala’y hinungdan ... gawas kung magpadala ka sa mga doktor. Apan ang hugaw nga datos mobiya kanimo matag oras.

Ingon Pangulo sa Siyensya sa Data sa US, DJ Patil, ibutang kini sa usa ka First Round CTO Summit, “Kung wala nimo gihunahuna kung giunsa nimo huptan nga limpyo ang imong datos sa sinugdanan pa lang, f ^ ¢ & ed ka na. Ginagarantiyahan ko kini. Ang pagsulay nga limpyohan kini pagkahuman sa kamatuuran molanat og labing gamay nga mga bulan. ”

Kung gipainit nimo ang tubig hangtod sa nagbukal nga punto, mahimo kini pagpaandar sa usa ka tibuuk nga Rebolusyon sa industriya. Ang datos ingon nagbuhat sa parehas nga butang. Gikan sa oras nga mahimo magtipig ang mga kompyuter ingon man usab makalkulo, ang datos nakolekta sa labing ka dali sa paghimo sa mga kagamitan sa pagtipig aron mahimo kini.

Ang Data Lake

Samtang ang datos gikan sa kini nga mga tributaries nag-agas agi sa mga makina sa galingan, ang tanan nahuman sa lanaw, sa likud sa dam. Ingon nga gipagawas ang datos sa usa ka kontrolado nga uso, gipalihok niini ang mga turbina sa industriya sa datos; kanang mga higanteng makina sa pagproseso sa datos nga adunay mga ngalan sama sa Google ug Facebook. Wala’y hulaw dinhi.

Ug, sa katapusan, adunay usa ka lawom nga tubig, nga naghulat alang sa analisista nga mosalom. Scuba gear ug sibat nga gun sa kamut, giimbestigahan sa tigtuki ang kailadman, pagmapa sa bag-ong yuta ug nakit-an ang bag-ong mga species. Kini usa ka makalipay nga oras aron mahimong usa ka data explorer.

Mao nga daghan sa kanila ang nagpakita alang sa eMetrics Summit gikan kaniadtong 2002. Ang sunod nga higayon naa sa Boston, Septiyembre 27 hangtod Oktubre 1, 2015.

eMetrics Summit Pagrehistro

Usa ka Malayo nga Tulay

Ug unsa ang gahum sa datos sa pagkulit sa sunod nga Grand Canyon? Komosta ang bahin sa glacial melting sa mga istraktura nga datos? Giunsa naton pagtratar ang basura nga tubig sa usa ka kalibutan nga labi ka nahibal-an sa pagkapribado?

Kana ang mga pangutana alang sa laing oras ug tubig sa ilawom sa tulay.

Unsay imong hunahuna?

Kini nga site naggamit sa Akismet sa pagpakunhod sa spam. Hibal-i kon giunsa ang pagproseso sa datos sa imong komento.