Miten Meltwater käyttää tekoälyä?


Giorgio Orsi

May 30, 2023

Tämän artikkelin on kirjoittanut Giorgio Orsi, Meltwaterin Data Science Innovation -yksikön Senior Director.

Meltwaterilla suhtaudumme big dataan, tekoälyyn ja koneoppimiseen erittäin vakavasti, sillä ne ovat olleet yrityksemme toiminnan ytimessä sen alusta lähtien.

Ensimmäiset koneoppimisen mallit sentimenttianalyysiä ja kokonaisuuksien tunnistamista varten otettiin käyttöön jo vuonna 2005, kauan ennen kuin sosiaalinen media oli valtavirtaa. Nykyään käsittelemme päivittäin yli 1,3 miljardia uutta sosiaalisen median julkaisua, uutisartikkelia ja blogikirjoitusta. Käsittelemme yli 20 miljardia sitoutumistapahtumaa reaaliajassa kaikissa sosiaalisen median kanavissa ja teemme yli 15 miljardia johtopäätöstä tekoälymallien avulla.

Tässä blogikirjoituksessa käymme läpi kaikki Meltwaterin tekoäly- ja datatiimiemme painopisteet ja selitämme, miten käytämme tekoälyä tuotteissamme yhtenäisen Fairhair.AI-alustan avulla.

Tekoälyn osa-alueet luokitellaan usein kahteen päätyyppiin:  

  • Symbolinen (esim. logiikkasäännöt ja muut muodolliset menetelmät). 
  • Sub-symbolinen (eli tilastollinen) tekoäly, johon kuuluvat koneoppiminen, syväoppiminen ja neuroverkot.

Symbolisessa tekoälyssä tieto ja säännöt ohjelmoidaan tarkasti tietyllä tavalla järjestelmään niin, että järjestelmällä on ennalta määritellyt säännöt, joita se noudattaa. Niiden etuna on, että ne käsittelevät dataa ja tietoa läpinäkyvällä ja helposti ymmärrettävällä tavalla. Symbolisen tekoälyn säännöt voivat kuitenkin olla rajallisia epävarmoissa tilanteissa tai silloin, kun etsitään havaintoja datasta.

Koneoppiminen puolestaan käsittelee dataa tilastollisten mallien ja algoritmien avulla. Se edellyttää usein mallien kouluttamista suurilla tietokokonaisuuksilla, jotta voidaan oppia trendejä ja tehdä ennusteita datan perusteella. Koneoppiminen on hyvä käsittelemään erittäin monimutkaisen datan välisiä suhteita sekä tekemään päätelmiä ennennäkemättömistä skenaarioista.

Tekoälyn tulevaisuus on hyvin todennäköisesti näiden kahden lähestymistavan yhdistelmä, jossa oppiminen ja päättely toimivat yhdessä datasta oppimalla sekä tottelemalla sääntöjä, sillä monissa sovelluksissa on tiettyjä pakollisia turvallisuus-, sääntely- ja oikeudenmukaisuusvaatimuksia.

 

Luonnollisen kielen käsittely ja LLM

Luonnollisen kielen prosessointi (NLP) on ollut Meltwaterin toiminnan ytimessä jo yli 20 vuoden ajan. NLP on tekoälyn osa-alue, joka käsittelee tietokoneiden ja ihmisen kielen välistä vuorovaikutusta. 

Meltwaterilla NLP-tekniikoita käytetään uutisten, blogien, sosiaalisen median alustojen ja ensikäden datan keräämiseen, jäsentämiseen ja analysointiin, jotta saadaan tietoa siitä, miten yleisö suhtautuu brändeihin, miten ja missä keskusteluja käydään ja miten ne leviävät. Näin voimme johtaa malleja kuluttajien käyttäytymisestä, ymmärtää nousevia trendejä ja antaa suosituksia PR:n ja markkinoinnin ammattilaisille.

Nämä ovat joitakin Meltwaterin työkalujen käyttämiä NLP-tehtäviä:

  • Sentimenttianalyysi ja tunnetilojen havaitseminen: viestin, artikkelin tai kokonaisten keskustelujen sävyn (positiivinen, negatiivinen, neutraali) ja tunteiden (esim. viha, ilo, yllätys) ymmärtäminen. Mallimme perustuvat suuriin kielimalleihin (Large Language Models, LLM), joiden avulla ennustetaan sekä keskustelun sävyä että tunnetiloja. Tuemme yli 200 kieltä >90 prosentin tarkkuudella, ja lisää kieliä on tulossa. Sentimenttianalyysimallimme toimivat kaikkien tuotepakettiemme sentimenttinalytiikan voimanlähteenä.
Sentiment and Emotion Detection
  • Kokonaisuuksien ja avainsanojen poiminta ja linkittäminen: asiaankuuluvien entiteettien ja avainsanojen ja -termien tunnistaminen tekstistä. Tässä toiminnossa käytetään koneoppimistekniikoita ja Meltwaterin tietojen pohjalta kehitetyn kaavion tehoa brändien, henkilöiden, tuotteiden, paikkojen ja yleisten termien (virtajohto, näytönsuoja) tunnistamiseen ja yhdistämiseen yli 90 kielellä. Kokonaisuuksien ja avainsanojen louhinta-algoritmit toimivat tuotteissamme olevien kokonaisuuden analysointiin tarkoitettujen widgettien, Exploren entiteettihakutoimintojen ja Smart Alerts -ilmoitusten voimanlähteenä. Se parantaa myös sentimenttianalyysia mahdollistamalla sentimenttianalyysin kokonaisuuksien tasolla (ELS).
Entity and Keyphrase Extraction
  • Aihealueluokittelu: Tekstin luokittelu eri kategorioihin, esim. urheilu, talous, liiketoiminta. Aihealueluokittelu on ratkaisevan tärkeää, jotta voidaan erottaa olennainen ja keskittää analyysi merkityksellisiin ja vaikuttaviin lähteisiin. Meltwater käyttää suuria kielimalleja myös aihepiiriluokitteluun, ja se pystyy luokittelemaan sisältöä yli 30 kielellä käyttäen tuhansien eri luokkien järjestelmää. Koska yksi ratkaisu ei sovi kaikille, tuemme myös mukautettuja kategorioita, joiden avulla asiakkaat voivat tarkentaa hakujaan ja saada entistä relevantimpia tuloksia.
Topic Classification
  • Käyttäjäprofiilien määritys: Vaikka tämä ei ole varsinaisesti NLP-toiminto, se perustuu moniin NLP:n rakennuspalikoihin. Meltwaterilla sosiaalisen median julkaisujen kirjoittajat profiloidaan seuraavien ominaisuuksien perusteella: ikä, sukupuoli, ammatti, parisuhdetilanne, puhuttu kieli, julkaisuissa mainitut paikat ja aiheet, joista puhutaan tai joihin suhtaudutaan. Meltwater käyttää suurten kielimallien kanssa samaa teknologiaa luodakseen malleja, jotka pystyvät ennustamaan näitä profiileja miljoonien muiden profiilien perusteella. Demografinen analyysi ja kyky tunnistaa yhteisöjä automaattisesti on ratkaisevan tärkeää kuluttajaymmärryksen ja sosiaalisen median markkinoinnin kannalta, ja se mahdollistaa markkinointikampanjoiden paremman kohdentamisen sekä asiakaspalvelun ja asiakaskokemuksen parantamisen. Käyttäjäprofiilien määritysominaisuuksiemme avulla voidaan käyttää Exploren kirjoittajat-välilehteä ja Yhteisöt-tuotettamme. Tekoälymallimme pystyy myös havaitsemaan, milloin tili kuuluu aidosti ihmiselle eikä automatisoiduille tileille, kuten tuote- tai yrityssivuille. Lisäksi lasketaan auktoriteettipisteet, joiden avulla voidaan tunnistaa keskeiset mielipidevaikuttajat ja yhteisön auktoriteetit.
User Profiling
  • Ryhmittely ja tiivistäminen: Tämä tehtävä tuottaa mielekkään tiivistelmän yhdestä tai useammasta samaan aiheeseen liittyvästä artikkelista ja viestistä. Tämän ominaisuuden avulla PR:n ja markkinoinnin ammattilaiset voivat nopeasti tunnistaa olennaiset aiheet ja niiden taustalla olevat lähteet ilman, että heidän tarvitsee seuloa tuhansia epäolennaisia mainintoja. Luokkansa paras, suurten kielimallien käyttöön perustuva ryhmittelyteknologiamme tunnistaa automaattisesti samaan aiheeseen kuuluvat artikkelit ja viestit sekä muualta kopioidut tekstit tai plagioidut artikkelit. Yhteenvetoteknologiamme käyttää generatiivista tekoälyä tiivistämään aiheet lyhyiksi tiivistelmiksi. Tekoälyteknologiamme voi tiivistää yksittäisiä tai useita artikkeleita ja viestejä yli 50 kielellä. Käsittelemme päivittäin yli 600 000 erillistä aihetta (klusteria), joista jokainen koostuu jopa muutamasta tuhannesta artikkelista.
Topic Clustering
Topic Summarization
  • Tapahtumien havaitseminen: tunnistaa merkitykselliset tapahtumat, kuten tuotelanseeraukset, listautumiset ja avainhenkilöiden nimitykset. Tapahtumien havaitseminen seuraa miljoonia uutisdokumentteja päivittäin ja tukee yli 40 erilaista tapahtumatyyppiä. Tapahtumien havaitsemisessa käytetään kehittynyttä neuroverkkotekniikkaa tapahtumien tunnistamiseen ja keskeisten ominaisuuksien poimimiseen, esim. yrityskaupasta maksettu hinta tai nimitettävien virkamiesten nimet. Tapahtumien tunnistusta tuetaan sekä Smart Alerts- että Explore-työkaluissa. Tapahtumat linkitetään sitten sosiaalisen median julkaisuihin, joissa jaetaan tapahtumaan liittyviä artikkeleita kehittyneen suuria kielimalleja käyttävän ryhmittelyteknologian avulla.
  • Roskapostin havaitseminen: Mediaseuranta- ja sosiaalisen median kuuntelun tuotekokonaisuus ei ole täydellinen ilman kykyä erottaa arvokas tieto kohinasta. Roskapostin tunnistusteknologiamme tukee yli 200 kieltä ja pystyy tunnistamaan kaikenlaisen roskapostisisällön, aina sensuroimattomasta sisällöstä bottien tuottamaan sisältöön ja mainoksiin. Tämä auttaa PR- ja markkinointitiimejä karsimaan pois kohinan, joka voi vaikuttaa heidän tutkimukseensa ja täyttää vaikuttavuus- ja ROI-mittareita ilmalla.

Puheen käsittely

Puheen käsittelyllä tarkoitetaan puhesignaalien analysointia ja käsittelyä, jonka tavoitteena on yleensä hyödyllisen tiedon poimiminen tai muuntaminen tiettyihin tarkoituksiin.

Puheentunnistukseen kuuluu puhuttujen sanojen muuntaminen tekstiksi, ja käytämme sitä Meltwaterilla TVEyesin kaltaisilta yhteistyökumppaneilta saamamme lähetysdatan (radio, TV ja podcastit) käsittelyyn. Kun teksti on poimittu ja analysoitu, sitä voidaan käsitellä kuten mitä tahansa tavallista tekstiä. Puheenkäsittelyllä on tärkeä rooli sosiaalisen median kuuntelun ja brändien seurannan kannalta, sillä lyhyet videot ja podcastit ovat nykyään hyvin suosittuja vaikuttajien keskuudessa. Puheenkäsittelyä tuetaan yli 20 kielellä, ja käsittelemme päivittäin 37 000 tuntia puhetta yli 60 000 asemalta, joka vastaa noin 1500 päivän edestä puhetta joka ikinen päivä!

Speech Processing

Konenäkö - Kuvien ja videoiden analysointi

Kuva kertoo enemmän kuin tuhat sanaa, ja brändien hallinnassa tämä on todella totta. Omat tutkimuksemme osoittavat, että kuvia sisältävät Twitter-viestit saavat 2,6 kertaa enemmän sitoutumista kuin pelkkää tekstiä sisältävät julkaisut.

Vastaavasti sosiaalisessa mediassa käytettävien videoiden on todettu olevan erittäin tehokkaita huomion herättämisessä ja sitoutumisen lisäämisessä, ja Meltwaterin datan mukaan videoita sisältävät twiitit saavat kaksi kertaa enemmän sitoutumista kuin tavalliset julkaisut. Siksi on tärkeää, että sosiaalisen median kuuntelun alustalla on tekoälyteknologia, joka kykenee ymmärtämään kuvia ja videoita sekä saamaan niistä tarvittavaa tietoa.

Olemme Meltwaterilla kehittäneet uusinta konenäköteknologiaa, joka perustuu "Vision Transformereihin" (visuaalisen maailman suurien kielimallien vastine).

Computer vision

Yhtenäinen alustamme tukee tällä hetkellä enemmän konenäkötoimintoja kuin kukaan muu alallamme, mm:

  • Logojen ja julkkisten tunnistaminen: Tunnistetaan tuotemerkkien logot, julkkikset ja muut VIP-henkilöt (esim. yrityksen tunnetut työntekijät) kuvista. Tuemme tällä hetkellä yli 3500 logoa ja 400 julkkista, ja joukko kasvaa päivittäin.
  • Kasvontunnistus (ikä, sukupuoli, tiheys): visuaalinen tekoälymme tunnistaa kuvissa esiintyvien henkilöiden todennäköisen ikäryhmän ja sukupuolen yksittäisten kasvojen tarkkuudella. Tämä täydentää NLP-joukon tarjoamia demografisia ryhmittelyominaisuuksia. Tekoälymme osaa jopa laskea kuvissa esiintyvät ihmiset, joten voimme vastata hakuihin, kuten "hae tuloksia, joissa Niken logo näkyy ihmisjoukossa". Aika siistiä!
  • Tilanteiden ja esineiden tunnistaminen: Tekoälymme tunnistaa yli 700 erilaista esinettä ja yli 120 tilannetta. Tämä mahdollistaa esimerkiksi tuotemerkin logon etsimisen tietyssä yhteydessä, kuten tuotemerkin logo urheilutapahtumassa tai MET-gaalassa.
  • Tunteiden tunnistaminen: Tämä ominaisuus parantaa sävyn ja tunteiden NLP-ominaisuuksia, sillä se pystyy tunnistamaan samantyyppisiä tunteita kuvissa, mikä parantaa analysointia kaikissa mediakanavissa.
  • Meemien havaitseminen: nykypäivän sosiaalisessa mediassa meemit voivat levitä varsin nopeasti, joten mikään sosiaalisen median kuuntelun kokonaisuus ei ole täydellinen ilman meemien seurantaa ja havaitsemista.
  • Kuvatekstien tunnistaminen: kuvien sisällä olevien kirjoitettujen sanojen tunnistaminen. Mikään sosiaalisen median kuuntelun kokonaisuus ei ole täydellinen, ellei se pysty tunnistamaan painettua sisältöä visuaalisten kuvien sisällä. Tämä ominaisuus parantaa Radarlyn ja Exploren haku- ja kuunteluominaisuuksia ja täydentää logojen tunnistusta, jotta brändin maininta ei jäisi koskaan huomaamatta.
  • Kuvien luokittelu: tekoälymme pystyy tunnistamaan kuvien välisiä yhtäläisyyksiä ja luomaan samankaltaisten kuvien ryhmiä, joka mahdollistaa analyysin ennennäkemättömän yksityiskohtaisen tason sosiaalisen median kuuntelun sovelluksissa.
Image Clustering

Visuaalinen tekoälyteknologia on Radarlyn ja Exploren sekä vaikuttajamarkkinoinnin työkalumme kuvahaku- ja analyysitoimintojen taustalla.

Tietokaavio

Tietokaavio (eng. Knowledge Graph) on tietokannan tyyppi, joka on suunniteltu esittämään ja tallentamaan erilaisia yksittäisiä tietolähteitä (eng. nodes), kuten ihmisten, paikkojen, tuotemerkkien ja tuotteiden, ja niiden välisten suhteiden (eng. edges) muodossa. Esimerkiksi John Box on Meltwaterin toimitusjohtaja, iPhonet valmistaa Apple, John Simpson kirjoittaa BBC:lle. 

Tietokaavioita käytetään usein älykkäiden sovellusten, kuten hakukoneiden, tekoälyä käyttävien henkilökohtaisten avustajien ja suosittelujärjestelmien käyttövoimana. Esimerkkejä tietokaavioista ovat Googlen Knowledge Graph, joka toimii sen hakukoneena ja tarjoaa tietoa kokonaisuuksista, kuten ihmisistä, paikoista ja asioista, sekä Facebookin Social Graph, joka kuvaa ihmisten ja heidän kiinnostuksen kohteidensa välisiä suhteita.

Meltwaterin Knowledge Graph sisältää yli 20 miljoonaa yksittäistä tietolähdettä ja 70 miljoonaa suhdetta, ja se sisältää yrityksiä ja niiden toimihenkilöitä yli 300 toimialalta. Tietokaavio toimii Smart Alerts -tuotteemme, Exploren kokonaisuushakujen sekä Mediasuhteet-, Vaikuttajamarkkinointi- ja Sales Intelligence -tuotteidemme taustalla.

Käytämme sitä myös suosittelemaan automaattisesti, keitä kilpailijoita kannattaa seurata tai tarkkailla tekoälyyn perustuvien toimialaluokittelijoidemme avulla, jotka määrittelevät yritykset automaattisesti toimialoilleen ja yhdistelevät kilpailijat toisiinsa.

Knowledge Graph Example
Knowledge Graph Example

Aikasarjojen analyysi ja ennakoiva analytiikka

Aikasarjojen analyysi on prosessi, jossa ymmärretään ilmiöitä, malleja, trendejä, kausivaihteluita ja muita erikoisempia datan välisiä suhteita tietyn ajan kuluessa. Sitä käytetään ennusteiden tekemiseen tulevista arvoista aiempien havaintojen perusteella.

Meltwaterilla ennakoivan analytiikan tiimimme on luonut tekoälymalleja, joiden avulla voidaan ymmärtää sitoutumis- ja mainintatrendejä, asiakkaiden käyttäytymistä, tunnistaa ja selittää poikkeamia (esim. kohokohtia) ja tehdä ennusteita tulevista trendeistä. Näiden algoritmien avulla Smart Alerts -työkalumme ilmoittaa käyttäjille reaaliaikaisesti maininta- ja sitoutumispiikeistä, sentimentin muutoksista, sponsoroitujen Facebook-postausten tunnistamisesta ja virustwiiteistä. Ennustavat analytiikka-algoritmit toimivat myös uuden Discovery-kokonaisuutemme sisällä olevien kohokohtien havaitsemisessa.

Time Series Predictive Analytics

Kielen tunnistus ja maantieteellinen paikantaminen

Kielen havaitseminen ja maantieteellinen paikantaminen ovat käyttäjän kielen ja sijainnin määrittämistä tiettyjen ominaisuuksien perusteella. Joissakin tapauksissa Meltwater saa nämä tiedot suoraan datalähteistä, mutta validoimme kuitenkin aina sijainnin tai päättelemme sen tekoälyteknologian avulla. Tekoälyavusteista kielenmääritystä tuetaan yli 240 kielellä, mutta alustamme tukee hakua kaikilla tunnetuilla ihmiskielillä (yli 7000!). Kieli- ja maantieteellinen paikannus ovat ratkaisevan tärkeitä demografisen analyysin ja asiakassegmentoinnin kannalta sekä tietyn datan sääntöjen noudattamisen kannalta.

Alustasta riippuen tekoälymme pystyy määrittämään käyttäjän sijainnin aina kaupunginosan tarkkuudella postauksesta saatavilla olevien tietojen, kirjoittajan bion ja joskus postauksen julkaisemiseen käytetyn laitteen IP-osoitteen perusteella. Tällä hetkellä kaikki tunnustetut ISO-maat ja -alueet ovat tuettuja kaikissa Meltwaterin tuotteissa.

Tekoälyn tulevaisuus Meltwaterilla

Nyt kun olemme tarkastelleet Meltwaterin tekoälyn menneisyyttä ja nykytilaa, on aika kääntää katseemme sen tulevaisuuteen.

Innovaatiojohtajana ja "AI-first-yrityksenä" Meltwater kaksinkertaistaa investointinsa tekoälyyn ja koneoppimiseen. Tieteellinen neuvontaryhmämme tarjoaa näkemyksiä tekoälyn teknologisen innovaation eturintamassa tapahtuvista muutoksista ja auttaa tunnistamaan uusia ratkaisuja tai teknologioita joihinkin vaikeimpiin tekoälyhaasteisiimme.

Tekoälyteknologialla on valtava potentiaali PR- ja markkinointialoille, ja Meltwater käyttää tekoälyyn tukeutuvaa teknologiaa kaikissa tuotteissaan.

Pysy kuulolla tulevassa tekoälyä käsittelevässä blogisarjassamme, jossa käymme läpi uusia tuoteominaisuuksiamme, mukaan lukien generatiiviset tekoälyominaisuutemme, uraauurtava videoanalyysi, GPT-käyttöiset PR- ja Engage-assistenttimme, tekoälykäyttöiset mukautetut luokittelijat, semanttinen haku, kohokohta-analyysi, suositus- ja ennakoiva analytiikka sekä paljon vinkkejä ja niksejä, joilla voit käyttää tekoälyä hyödyntäviä ominaisuuksia tehokkaasti.