Sentimenttianalyysi - Excel-vinkit

Mielialan analyysi Excelissä! Microsoft Labs tarjoaa ilmaisen lisäosan, jonka avulla voit tehdä mielipiteiden analyysin Excelissä. Entä jos sinun täytyy käydä läpi satoja kyselykommentteja nähdäksesi, mitä ihmiset ajattelevat yrityksestäsi? Excel voi määrittää todennäköisyyden, joka osoittaa, kuinka positiivinen tai negatiivinen kukin kommentti on.

Katso video

  • Tutkimustiedot on helppo kvantifioida, kun ne ovat monivalintakysymyksiä
  • Voit selvittää pivot-taulukon avulla prosenttiosuuden jokaisella vastauksella
  • Mutta entä vapaamuotoiset tekstivastaukset? Näitä on vaikea käsitellä, jos sinulla on satoja tai tuhansia niitä.
  • Sentiment Analysis on konepohjainen menetelmä ennustamaan, onko vastaus positiivinen vai negatiivinen.
  • Microsoft tarjoaa työkalun, joka tekee mielipiteen analyysin Excelissä - Azure Machine Learning.
  • Perinteinen mielipiteiden analyysi edellyttää ihmisen analysoimaan ja luokittelemaan 5% väitteistä.
  • Perinteinen mielipiteiden analyysi ei ole joustavaa - rakennat sanakirjan uudelleen jokaiselle toimialalle.
  • Excel käyttää MPQA-subjektiivisuuden sanastoa (lue siitä osoitteesta http: // bit. Ly / 1SRNevt)
  • Tämä yleinen sanakirja sisältää 5097 negatiivista ja 2533 positiivista sanaa
  • Jokaiselle sanalle on annettu vahva tai heikko napaisuus
  • Tämä toimii hyvin lyhyillä lauseilla, kuten twiitit tai Facebook-viestit
  • Kaksinkertaiset negatiivit voivat pettää sen
  • Asenna siirtymällä Insertiin, Excel Storeen, etsimällä Azure Machine Learning
  • Määritä tuloalue ja kaksi tyhjää saraketta lähtöalueelle.
  • Syöttöalueen otsikon on vastattava skeemaa: tweet_text
  • Kumppaniartikkeli osoitteessa: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Videon transkriptio

Opi Excel Podcastista, Jakso 2062: Sentiment-analyysi Excelissä

Voi hei, se oli kiitospäivä-ilta ja istuimme kurpitsa-piirakan ympärillä, ja ystäväni Jes alkoi puhua mielipiteiden analysoinnista Twitter-tiedoissa. Ja sanoin: "Hei, tiedät, että Excelillä on tapa tehdä mielipiteiden analyysi." Ja tajusin, että minulla ei ollut hyvää videota tästä tai mistään videosta, joten tässä videossa on kyse tunteen analyysistä Excelissä.

Ensimmäinen kysymys on, mikä helvetti on mielipiteiden analyysi? Ja jos teet kyselyn asiakkaistasi ja heillä on monivalintavalinta, jossa he voivat valita 1-5, niin, se on todella, todella helppo analysoida. Voit luoda vain pienen pivot-taulukon: Lisää pivot-taulukko, Olemassa oleva laskentataulukko täällä, napsauta OK. Haluamme tietää kysymyksen tai vastauksen kysymykseen ja sitten kuinka monta vastausta oli kullekin, ja se antaa meille absoluuttisen luvun. Voit jopa tulla tänne ja muuttaa tämän kenttäasetuksista kohtaan Näytä arvot prosentteina sarakkeen kokonaismäärästä.

Selvä, joten näet jokaiselle vastaukselle, kuinka moni ihmisistä saa vastauksen. Selvä, mutta mielipiteiden analyysi on tarkoitettu, kun sinulla on todella pitkä vastaus, jossa sanot: "Hei, okei, tiedätkö, kerro meille, miksi annoit meille vastauksen?" Ja he käyttävät lauseita tai kappaleita. No, jos sinulla on satoja tai tuhansia näitä, jonkun on erittäin vaikea käydä se läpi ja lukea ne kaikki ja selvittää, mitä tapahtuu, okei?

Joten on olemassa kaksi erilaista mielipiteiden analyysia. Tyypillisesti aiemmin käytit ihmisen valvomaa oppimisalgoritmia. Joten jos sinulla on 5000 vastausta, käy läpi, tiedät, 200 niistä ja valitse positiiviset ja negatiiviset sanat ja lauseet. Rakennat lähinnä positiivisten ja negatiivisten sanojen sanakirjaa; mutta tiedät, tämä oli hyvin rajoittavaa. Jos teit tämän paikalle, joka teki autonkorjauksen ja jolla sitten oli toinen asiakas, tiedätkö, kuka teki matonpuhdistuksen, nämä kaksi sanakirjaa ovat täysin erilaiset. Sinun on tehtävä koneoppiminen tai ihmisen valvoma oppiminen yhä uudestaan ​​ja uudestaan. Joten Excel käyttää tätä asiaa nimeltä MPQA Subjektiivisuusleksikko ja voit käyttää Googlea. Siinä on tietoa siitä - 5097 negatiivista sanaa, 2533 positiivista sanaa. Ja niin,se toimii hyvin lyhyillä lauseilla, twiiteillä tai Facebook-viesteillä. Mutta olen huomannut, että jos joku kirjoittaa kaksoisnegatiiveina, en voi sanoa, etten vihaa tätä ominaisuutta. No, koneoppiminen epäonnistuu siellä. Ja hitto, epäonnistun. En voi kertoa, ovatko he onnellisia vai eivät.

Selvä, joten tässä teemme. Siirry Excel 2013: ssa tai Excel 2016: ssä Lisää-välilehdelle, siirry Storeen, kun hakukenttä tulee esiin hakemaan Azure Machine -ohjelmaa ja saat Azure Machine Learning -palvelun siellä. Napsautamme Lisää. Selvä, ja kaksi erilaista työkalua täällä: Titanic Survivor Predictor, mikä on hauskaa; ja Text Sentiment -analyysin Excel-lisäosa. Käytetään sitä. Selvä, tässä on muutama asia, joka vie sinut ylös. Otsikkosi: Selitä vastauksesi kappaleessa. Sen on vastattava kaavaa ja skeema sanoo, että otsikossa on sanottava tweet_text. Joten, täällä: tweet_text, tietysti isot ja pienet kirjaimet, ok. Sulje sitten malli ja ennusta sitten, Syöttö: A1 - 100, Omilla tiedoillani on otsikot, Tulos: DataB1, Sisällytä otsikot. He antavat meille 2 saraketta.Varmista, että sinulla on 2 tyhjää saraketta; muuten se ohittaa tiedot. Sinulla on 2 vaihtoehtoa: Muutama rivi kerrallaan tai Eränä. Tämä on vain sata, joten sillä ei todellakaan ole väliä. Valitsen Ennusta ja BAM! Juuri niin nopeasti.

Selvä nyt, saamme 2 saraketta: saamme Sentimentin ja Pisteet, ok. Joten edustakaamme pisteet tässä prosentteina joukolla desimaaleja. Selvä, siis 47,496, tämä menee 0: sta 100%: iin. Lähellä 100 on erittäin positiivinen, lähellä 0 on erittäin negatiivinen, okei? Joten täällä, meillä on yksi, jossa on pieni ongelma, ajaa minut hulluksi. Ratkaisua ei löydy, joten voit nähdä, miksi se luokitellaan erittäin negatiiviseksi. Katsotaanpa jotain, joka tulee erittäin positiiviseksi. Selvä, joten tiedät, joten meillä on täällä iloisia sanoja: kiitos ja kiitos, huutomerkit ja niin edelleen. Se saattaa vaikuttaa korkeaan pisteeseen. Selvä, niin onko se täydellinen? Ei, mutta se antaa sinulle nopean ja nopean tavan kertoa sinulle, kuinka moni ihminen on erittäin onnellinen tai erittäin negatiivinen näistä vastauksista.

Ja tietenkin, tässä voimme jälleen tehdä tämän pivot-taulukon avulla: Lisää, Pivot-taulukko, siirry olemassa olevaan taulukkoon täällä, napsauta OK ja olemme kiinnostuneita mielipiteestä, ja sitten ehkä keskimääräinen piste on kukin niistä. Joten muutamme tämän kenttäasetusten keskiarvoksi, napsauta OK. Ja niin, tai ehkä jopa kreivi. Luulen, että haluaisimme tietää kreivin, kuinka monta ihmistä. Joten otamme jonkin muun alan, ja niin, tiedämme, kuinka moni ihminen oli negatiivinen. Ooh, kuinka moni ihminen oli neutraali, kuinka moni positiivinen ja mikä oli kunkin keskimääräinen pistemäärä.

Selvä, joten jos sinulla on kyselytietoja ja se on monivalintakysymys, on helppo käyttää pivot-taulukkoa selvittääksesi, kuinka suuri prosenttiosuus jokaisella vastauksella on. Mutta vapaamuotoisissa tekstivastauksissa sitä on vaikea käsitellä. Jos sinulla on satoja tai tuhansia heitä, mielipiteiden analyysi on konepohjainen menetelmä ennustamaan, onko vastaus positiivinen vai negatiivinen. Microsoft tarjoaa ilmaisen työkalun tähän. Toimii Excel 2013: ssa tai Excel 2016: ssa, nimeltään Azure Machine Learning. Yleensä täytyy käydä läpi ja luokitella 5% lauseista manuaalisesti käsin. Se ei ole joustava, sinun on luokiteltava uudelleen jokaiselle uudelle tietojoukolle, mutta Excel käyttää tätä MPQA-subjektiivisuuden sanastoa. Se on yleinen sanakirja. Se toimii lyhyitä lauseita, twiittejä, Facebook-viestejä varten. Voin pettää kaksoisnegatiiveilla. Joten mene vain Excel Storeen,etsi Azure Machine Learning. Määritä tuloalueelle tulo ja kaksi saraketta. Älä unohda muuttaa otsikkoa vastaamaan Schema, tweet_text, tässä nimenomaisessa tapauksessa.

Selvä, joten mennään. Seuraavan kerran, kun sinulla on paljon analysoitavaa dataa, tutustu Azure Machine Learning -ohjelmaan, joka on ilmainen Excel 2013 -lisäosa. Kiitos, että pysähdyit, näemme seuraavan kerran toisen verkkolähetyksen lähettäjältä.

Lataa tiedosto

Lataa esimerkkitiedosto täältä: Podcast2062.xlsm

Mielenkiintoisia artikkeleita...