08.03.2019Blogg

Data kan berätta om ditt fredagsmys blir populärt på sociala medier

Data kan berätta hur din organisation, affär eller ditt flöde på Instagram ”mår”. För mig är det som kallas data storytelling en process som börjar med att förstå vilken data du har tillgång till. Därefter görs datan om till information som stödjer den idé, möjlighet eller det problem som du vill presentera, driva igenom eller lösa. Informationen används sedan för att skapa kunskap som kan presenteras muntligt, visuellt eller både och, anpassat efter mottagaren.

Ta som exempel mitt eget mål att få till ett bättre visuellt flöde på Instagram.

I fredags firade jag och familjen in helgen med en pizzakväll. Detta fick mig att fundera över hur bilder med hashtaggen #fredagspizza på Instagram generellt ser ut. Vilka komponenter eller element innehåller bilderna? Pizza, dryck, dukning, ljus, vänner? I min lilla värld av nörderi tänkte jag att det vore intressant att göra en bildanalys av detta. Jag ville även se närmare på vilka andra taggar som används, vilken ålder personerna i bilderna verkar ha, samt vilken stämning och vilket humör som förmedlas. Finns det något samband mellan olika komponenter i en bild och hur många likes den får?

Jag började genom att bygga upp en miljö i AWS med hjälp av tjänsterna S3, Lambda, AWS Batch, Amazon Rekognition och Elastisearch. För att få in bilderna i S3 använde jag min dator som mellansteg, för att spara tid. Jag sökte på Google efter script i Python som lät mig genomföra ”scraping” av bilder med hashtaggen #fredagspizza. (Sökningen på hashtaggar kändes som ett rimligare alternativ än att gå igenom alla relevanta bilder på Instagram.) Sammanlagt sparade jag lokalt ner 1553 bilder, för att sedan ladda upp dem i S3.

Med bilderna på plats i S3 lät jag Amazon Rekognition avgöra vilka av bilderna som faktiskt innehöll en pizza. Det visade sig vara 92 procent av det totala antalet bilder – 1428 stycken. Nu kunde jag gå vidare med rekognition av ”objects and scene”, för att få fram vilka ”labels” (som AWS kallar det) som fanns i bilderna. På så sätt kunde jag sedan återföra respektive tagg till bilden med hjälp av Elastisearch. Sedan genomförde jag även en ”facial analysis” för att ta reda på ålder, kön och känsla (glad respektive ledsen) hos personerna på bilden. Det finns många fler ”labels”, men jag valde dessa tre för enkelhetens skull.

Så vad avslöjade bilderna om sambandet mellan komponenter (bildelement) och antalet likes? Jo, bilder med pizzor, glada ansikten och marmor (!) fick störst uppskattning på Instagram.

Vad var nyttan med det här lilla experimentet? Jag ville på ett lekfullt sätt testa att utvinna insikter från data. Och för den som vore intresserad av att bygga en affär kring att sälja mer pizza, eller kring att få folk att börja köpa pizzor på fredagar, skulle insikterna jag nådde i högsta grad kunna vara relevanta.

Experimentet gick att genomföra på bara några dagar av någon som inte ens är expert (jag), varken på att programmera eller på att göra bildanalyser. Dessutom skedde det i en miljö som användaren endast betalar för när den används. Jämför detta med att som många företag beställa en eller förmodligen flera servrar, för att sedan installera, konfigurera och administrera ett nätverk som är öppet på rätt portar och så vidare. Allt detta skulle ta ca 5-8 veckor, kräva mer än en person och – det säger sig självt – kosta betydligt mycket mer. Vi skulle kunna jämföra detta med en pizzeria där pizzabagaren endast betalar för ingredienserna och den tid som pizzan gräddas i ugnen. När pizzan väl är klar upphör också utgifterna.

Tänk dig vad du skulle kunna åstadkomma med din egen data, i kombination med relativt små medel, för att nå konkreta insikter som skulle kunna användas för att åstadkomma verklig förändring och en djupare förståelse av din process eller affär.

Data storytelling är något av en mångfacetterad konstform som bygger på en vilja att berätta, förklara och förmedla kunskap till en specifik målgrupp.

Här är ytterligare några exempel på vad som går att göra med hjälp av bildanalys:

  • Hitta sin företagslogotyp eller sitt företagsnamn i bilder (där företaget inte är omnämnt i anslutning till bilden), för att hitta så kallad ”dold marknadsföring”
  • Mäta försäljning/kännedom/respons baserat på bilder som innehåller ett varumärke
  • Göra bildanalyser på försäkringsfall, exempelvis bilskador, för att upptäcka dubbletter
  • Göra analyser kring hur kundunderlag ser ut i fysiska butiker; exempelvis kön, ålder, eller rörelsemönster
  • Göra ”potthålsanalys” på trafikerade vägar, med hjälp av drönare
  • Genomföra kontroller av vingar på kraftverk
  • Genomföra kontroller av färgtjocklek på målade produkter

Saker att ta hänsyn till:

  • Etik och moral – görs min dataanalys på ett etiskt sätt? Enligt Instagrams användarvillkor får en användare ”not cache or store any Instagram user photos other than for reasonable periods in order to provide the service you are providing to Instagram users.” Eftersom jag i fallet med mitt experiment var ute efter att ta reda på vad som ligger bakom en framgångsrik bild på en eller flera pizzor en fredagskväll, för att sedan kunna ge feedback till användare på Instagram i form av mina nyvunna insikter, anser jag mig ha följt användarvillkoren.

Mer att läsa:
Min resa från rapportutveckling till AI-utveckling
You can’t build AI without moral choices
A data catalog can be the foundation for your data democracy

Källor:
https://aws.amazon.com/blogs/machine-learning/classify-a-large-number-of-images-with-amazon-rekognition-and-aws-batch/
https://www.promptcloud.com/blog/how-to-scrape-instagram-data-using-python