Home » Teknologi » Hur du omvandlar big data till stora resultat

Hur du omvandlar big data till stora resultat

Tech Page One

Se bortom hajpen: Big data ger verkliga fördelar

Breda analysmöjligheter med databassystem

 

IT-världen hittar ständigt på nya häftiga uttryck, som oftast skapas av marknadsföringsteam och får IT-avdelningar att undra om det finns någon substans bakom terminologin.

Big data är ett sådant uttryck: Det låter nästan trösterikt och mysigt, som en stor filt, men att uttrycket låter tröstande är missvisande – det handlar om tuffa affärsmässiga överväganden i sin mest otyglade form.

För att det ska finnas verkliga affärsmässiga fördelar måste företagen övertygas om att big data är mer än bara en hajp. Processen har inte varit den snabbaste – i de tidiga stadierna fanns det tecken på att organisationerna inte investerade i tekniken, men det har ändrats helt.

Investeringar i big data

Enligt Frank Buytendijk på Gartner (i en rapport publicerad i oktober 2015), maskerar hajpen i själva verket det som faktiskt håller på att hända. ”Samtidigt som alla pratar om big data införs det helt enkelt inom alla branscher och inom alla företagsfunktioner. Enligt en undersökning som Gartner genomfört nyligen investerar redan 64 procent av de svarande i big data eller har planer på att göra det inom de närmaste 12 till 24 månaderna.”

Med tanke på att två tredjedelar av företagen planerar att gå den vägen finns det verklig anledning att tro att tekniken är här för att stanna. Det är dock fortfarande oklart exakt vad big data egentligen betyder – det är ett uttryck som fortfarande får en del av skaka på huvudet.

Big data lider av samma handikapp som molntjänster gjorde i de tidiga utvecklingsstadierna: avsaknaden av en standarddefinition av tekniken. Man skulle lätt kunna tänka på det som ett annat namn för en stor uppsättning data, men som helhet är det för luddigt. En mer realistisk definition skulle vara insamling och analys av en blandad uppsättning data, strukturerad och ostrukturerad, i syfte att utveckla en sammanhängande affärsstrategi.  Det är en blandning av försäljningssiffror, inlägg på sociala medier och YouTube-klipp – allt i kombination för att ge mer precisa resultat.

De tre V:na

De som uttalar sig om big data använder frasen ”de tre V:na” för att beskriva hur det fungerar. ”V” står för hastighet (velocity), variation och volym – med andra ord med vilken hastighet man kan komma åt och söka i data, de olika typerna av data som undersöks och storleken på databasen. Vissa lägger till ett fjärde V, sanningsenlighet (veracity), men man bör ta för givet att dina data är korrekta, för den som hanterar felaktiga siffror är illa ute oavsett vad dessa data innehåller.

För företagen ser vi fördelarna när Sakernas internet läggs till i ekvationen. Det ökande antalet uppkopplade enheter kommer att producera en överväldigande mängd data, en blandning av strukturerade och ostrukturerade. Det här är inte bara ett problem för särskilda branscher, även om vissa kommer att påverkas mer än andra, utan kommer att vara ett problem som drabbar alla organisationer som måste hantera stora volymer data.  Det behöver inte nödvändigtvis vara från kunder: lokala myndigheter samlar exempelvis in allt mer data om sina medborgare för att kunna tillhandahålla bättre lokal service.

Arbete med hälsovårdsanalys

Effektivt med structured dataFör att ta ett exempel på hur världen håller på att förändras kan vi titta på hälsovårdssektorn och det sätt som uppkopplade enheter har förändrat verksamheten – och konsekvenserna för hanteringen av data.

Ett av de största problemen som läkare har haft är att patienterna inte är sanningsenliga när de får frågor om ämnen som alkoholkonsumtion eller motion – principen har alltid varit att fördubbla mängden alkohol som patienten anger att han eller hon konsumerar. De mobila enheternas intåg har förändrat det: Nu kan läkarna övervaka hur mycket patienten dricker, hur många steg som har tagits och så vidare.

Och inte bara det. Enheterna kan användas för att följa upp medicinska tillstånd som inte är självorsakade – exempelvis hjärtfrekvens- och diabetesmätare.  Det finns också mätare som kan ange om en patient har tagit sin medicin eller inte, och allt detta är livsviktig information.

Den verkliga effekten uppnås när informationen från dessa olika typer av övervakningsutrustning kombineras med alla de medicinska tester som har gjorts som en del av de regelbundna kontrollerna. Röntgen och blodprov till exempel.  Alla dessa uppgifter kan kombineras för att bygga upp en användbar helhetsbild av en persons hälsa.

Det finns dock ett problem med den här informationen: många av uppgifterna som har samlats in finns hos läkarna och det finns inget enkelt sätt att dela informationen.  Det är skolboksexemplet på hur big data kan hjälpa: Man kan få tillgång till data från många olika enheter i varierande form som kan ge flera fingervisningar för sjukvårdspersonalen, både i forskningssyfte och för att ge sjukvården vägledning i vart man ska fokusera de individuella tjänsterna.

En av de branscher som redan använder big data i stor utsträckning är detaljhandeln. Alla stora livsmedelskedjor skulle gärna vilja veta vad deras kunder köper och i ännu högre grad vad de planerar att köpa.  Besluten fattas återigen inte enbart med utgångspunkt i försäljningssiffror, utan genom att titta på sociala medier och till och med genom att använda videokameror för att observera hur kunderna tittar på varor.  Genom att få fler uppgifter från kunderna kan aktörer inom detaljhandeln fatta mer välgrundade beslut när det gäller försäljningen, utplaceringen och marknadsföringen av varor. Enligt McKinsey är organisationer som fattar beslut med utgångspunkt i data fem procent mer produktiva och sex procent mer lönsamma än konkurrenter som inte gör det”.

Men big data är mer än bara ett sätt att förbättra beslutsfattandet inom organisationer.  Enligt Buytendijk på Gartner är det mindre än hälften av big data-projekten som fokuserar på beslutsfattande utan istället på att hjälpa företaget att titta på nya processer: de innefattar arbete inom

  • marknadsföring och försäljningstillväxt
  • förbättrat driftsresultat och ekonomiskt resultat
  • riskhantering och regelefterlevnad
  • innovationer inom produkter och tjänster
  • direkt/indirekt data monetization

Så det finns flera fördelar med att slå in på den vägen och använda big data. Den största frågan är då hur företaget förbereder sig på det.

Utgångspunkten är alltid datacentret. Det första beslutet är om du ska välja någon sorts molnbaserad lösning. Tänk på att du kommer att behöva hantera allt större datavolymer, så ditt system måste kunna hantera det. En offentlig molnlösning är mer skalbar och kan hantera topparna bättre, men om det råder osäkerhet kring säkerheten i ett offentligt moln är det förmodligen bättre att välja en hybridlösning.

Det kommer med största säkerhet att vara nödvändigt att öka lagringsutrymmet, eftersom datavolymerna kommer att öka.  Cisco uppskattar att mängden data som skapas av IoE-enheter kommer att vara 269 gånger större än mängden data som överförs till datacenter från slutanvändares enheter och 49 gånger större än den totala trafiken i datacentren 2019. Företaget förutspår också att dessa enheter kommer att öka till 507,5 zetabit fram till 2019 från 134,5 ZB per år 2014.

Därför måste du hantera infrastrukturen först: Du måste öka arbets-, lagrings- och nätverkskapaciteten inom organisationen. Men det är bara en del av förberedelserna inför användningen av big data. Det krävs också att du uppgraderar din programvara för att hantera förändringen.

Du måste titta på tre huvudsakliga områden: avancerade analysverktyg, dataintegration och datahantering.

Avancerade analysverktyg

Det är centralt för att börja använda big data. Genom att använda avancerade analysprogram kan du identifiera kundernas preferenser och förutse deras beteende. Det finns också säkerhetsaspekter att tänka på, eftersom du kommer att kunna använda programvaran för att spåra transaktionsmönster som kan tyda på bedrägeri.

Dataintegration

Det är här du tittar på hur du ska hantera de många olika typerna av datakällor och sammanföra dem. Hälsovårdsföretaget som sammanför läkarnas anteckningar med data från uppkopplade enheter, varuhuset som integrerar försäljningsdata med diskussioner i sociala medier och videofilmer – allt detta räknas med i de data som ska undersökas. I denna integration bör man också ta med i beräkningen att data kan hämtas från lokalt installerade enheter och molntjänster. Inte nog med att man behöver hantera data från många olika källor, hanteringen måste ske snabbt – kom ihåg att hastighet är ett av ledorden i hanteringen av big data. Ju snabbare informationen levereras till företaget desto snabbare kan företaget reagera på den.

Datahantering

Per definition producerar big data-system stora mängder data och man måste ha stabila system för att lagra, säkerhetskopiera och säkra alla data som produceras av våra system. Detta måste göras på ett kostnadseffektivt sätt, eftersom man inte vill att kostnaden för administreringen överstiger de ekonomiska fördelarna.

Datalager – tekniken är fortfarande vid liv

Det finns en föreställning om att uppkomsten av big data betyder att företagen inte längre behöver upprätthålla några datalager.  Det är missledande. Det är mer effektivt att utgå från de egna datalagren snarare än att förlora investeringen i befintlig teknik.  Dell och Microsoft har exempelvis samarbetat i byggandet av en Fast Track-lösning för datalager som gör det lättare för företag att dra nytta av sina befintliga investeringar på området.

Det finns alltså massor av olika sätt för företagen att introducera analysverktyg som använder big data, men den stora frågan är huruvida det är lönsamt med en sådan investering?

Kundens perspektiv

Användning av big data kan bokstavligen handla om liv och död.  University of Iowa Hospitals and Clinics använder tekniken för att göra prognoser i realtid över sannolikheten för att en patient ska utveckla en infektion vid operation. Genom väl underbyggda bedömningar av vem som är mottaglig för sådana infektioner har kirurgerna kunnat minska infektionsförekomsten med 58 procent.

Infektioner vid operation kan låta som en tillbakagång till 1800-talet, men det är ett allvarligt problem som leder till långa sjukhusvistelser och ibland tragiskt nog till dödsfall.

Chefen för avdelningen för gastrointestinal minimalinvasiv och bariatrisk kirurgi, Dr. John Cromwell, såg att en stor procentandel av infektionerna vid operation kunde förebyggas genom prediktiv analys.

Det har den dubbla effekten att det inte bara räddar liv utan även minskar kostnaderna – enligt sjukhusets beräkningar kostade postoperativa infektioner redan hälsovårdssektorn 10 miljarder US-dollar per år.  Tack vare införandet av prediktiv analys i realtid har kostnaderna minskat betydligt.

”Genom att använda dessa verktyg andra metoder har vi kunnat minska infektionerna vid operation med omkring 58 procent,” säger Cromwell. ”Det är ett revolutionerande koncept inom gastrointestinal kirurgi.”

För att uppnå detta har vårdteamet behövt ändra inställning och titta närmare på data som normalt inte skulle betraktas som en del av återhämtningsprocessen. ”Vi kan hämta information från elektroniska patientjournaler (electronic medical records, EMR) och andra källor inom organisationen, bland annat realtidsdata från operationssalen, för att avgöra om det är sannolikt att patienten kommer att få en infektion på operationsbordet,” tillägger Cromwell.”  Det gör att vi kan ändra och anpassa vården i operationssalen efter varje individ.”

Detta fokusskifte har lett till en förändring av den underliggande infrastrukturen. Vårdteamet kommer att behöva större bearbetningskapacitet liksom en ny uppsättning analysverktyg.   Jose Maria Monestina, ansvarig programutvecklare på UI Hospitals and Clinics, fick ansvaret för att införa tekniken.

Det var ingen enkel uppgift, för de dokumenterade uppgifterna låg i en rad olika system och i olika databaser, så Monestina var tvungen att samla alla uppgifter i en gemensam datauppsättning med inbyggda analysverktyg. ”Denna process har gjort det möjligt för oss att göra prediktiva analyser i realtid och därmed förbättra vården och minska kostnaderna,” säger Monestina.

Problemet med metoden var att sjukhusets befintliga infrastruktur inte klarade av de ökade datavolymerna som vårdteamet nu hanterade, både när det gällde lagring och att leverera uppgifterna till vårdpersonal.  Därför måste sjukhuset uppgradera till ett mer kraftfullt system, utan att förlora möjligheten att arbeta med den befintliga IT-arkitekturen.

Dell har hjälpt dem med det och förändrat vårdteamets sätt att arbeta. De använder numera en analysplattform som samlar ihop alla data, förbereder dem för modellering och därefter tillämpar modellen. ”Det är allt i ett och samma paket,” förklarar Monestina. ”Man kan spara datamodellen på en server och sedan återanvända den. Man kan dela datamodellerna mellan olika personer inom forskargruppen.” En viktig del är mobiliteten. Man är inte bunden av en viss dator eller server. Man kan använda modellerna via en mobilapp eller webbläsare och komma åt resultaten direkt.”

Nu har allting förändrats. Operationsteamet kan nu göra mer än bara analysera separata data (journaler, register och data med återkoppling från kunderna) utan även sammanföra dem med patientdata direkt från operationssalen för att fatta beslut om individuell behandling baserat på data.

”Big data och prediktiv analys förbättrar resultaten i så gott som alla delar av patientvården,” säger Cromwell. ”Vi ser så många andra områden där man skulle ha nytta av det här, som exempelvis läkemedelstillförsel, folkhälsa, hantering av patientflöden och alla andra aspekter inom medicin som gör att vi kan ge vård av hög kvalitet.”

Om du vill veta mer om potentialen i big data, klicka här.

 

Maxwell Cooter

Maxwell Cooter

Max är frilansjournalist och har ägnat sig åt en stor mängd olika IT-relaterade ämnen. Han var grundande redaktör för Cloud Pro, en av de första specifika publikationerna om molnet. Han grundade och var redaktör för IDG:s Techworld, och innan dess var han redaktör för Network Week. Som frilansare har han bidragit till IDG Direct, SC Magazine, Computer Weekly, Computer Reseller News, Internet magazine, PC Business World och många fler. Han har även varit talare vid många konferenser och har varit kommentator för BBC, ITN och den datarelaterade tv-kanalen CNBC.

Senaste inlägg:

 

Taggar: Teknologi