

Markkinoinnin taito
Semanttinen avainsanaklusterointi voi auttaa viemään avainsanatutkimuksesi uudelle tasolle.
Tässä artikkelissa opit käyttämään Google Colaboratory -taulukkoa, joka on jaettu yksinomaan Search Engine Journalin lukijoille.
Tämä artikkeli opastaa sinua käyttämään Google Colab -taulukkoa, korkeatasoista näkymää konepellin toimivuudesta ja opastaa sinua tarpeidesi mukaisten säätöjen tekemiseen.
Mutta ensin, miksi klusterin avainsanoja ylipäänsä?
Tässä on muutamia käyttötapauksia avainsanojen ryhmittelyyn.
Nopeampi avainsanatutkimus:
Maksulliset hakukampanjat:
Tässä on esimerkki käsikirjoituksesta, joka ryhmittelee samanlaiset kysymykset yhteen, mikä sopii täydellisesti perusteelliseen artikkeliin!
Jos olet seurannut työtäni Twitterissä, tiedät, että olen kokeillut avainsanaklusterointia jo jonkin aikaa.
Tämän käsikirjoituksen aikaisemmat versiot perustuivat erinomaiseen PolyFuzz-kirjasto käyttämällä TF-IDF yhteensopivuus.
Samalla kun se sai työn valmiiksi, siellä oli aina päätä raapivia klustereita, joissa mielestäni alkuperäistä tulosta voisi parantaa.
Sanat, joilla on samanlainen kirjainkuvio, ryhmitettäisiin, vaikka ne eivät liittyisi semanttisesti.
Se ei esimerkiksi pystynyt yhdistämään sanoja, kuten “pyörä” ja “pyörä”.
Käsikirjoituksen aikaisemmissa versioissa oli myös muita ongelmia:
Kelaa neljä kuukautta eteenpäin viimeisimpään julkaisuun, joka on kirjoitettu kokonaan uudelleen hyödyntämään huippuluokan, syvän oppimisen lauseiden upotuksia.
Tutustu joihinkin näistä mahtavista semanttisista klustereista!
Huomaatko, että lämmitetty, lämpö ja lämmin sisältyvät samaan avainsanaryhmään?
Tai entä tukku- ja irtotavaramyynti?
Koira ja mäyräkoira, joulu ja joulu?
Se voi jopa ryhmitellä avainsanoja yli sadalla eri kielellä!
Lisäksi semanttinen avainsana ryhmittely, seuraavat parannukset on lisätty tämän skriptin uusimpaan versioon.
Päästäksesi alkuun, sinun on tehtävä napsauta tätä linkkiäja valitse sitten vaihtoehto Avaa Colabissa alla olevan kuvan mukaisesti.
Muuta suoritusajan tyypiksi GPU valitsemalla Suoritusaika > Muuta suoritusaikatyyppiä.
Valitse Suoritusaika > Juosta kaikki ylhäältä siirtymisestä Google Colaboratoryn kautta (tai paina Ctrl+F9).
Lähetä pyydettäessä .csv-tiedosto, joka sisältää sarakkeen nimeltä “Keyword”.
Klusterin pitäisi olla melko nopeaa, mutta viime kädessä se riippuu avainsanojen määrästä ja käytetystä mallista.
Yleisesti ottaen sinun pitäisi olla hyvä 50 000 avainsanalle.
Jos näet Cuda-muistin lopussa -virheen, yrität ryhmitellä liian monta avainsanaa samanaikaisesti!
(On syytä huomata, että tämä skripti voidaan helposti sovittaa toimimaan paikallisella koneella ilman Google Colaboratoryn rajoituksia.)
Komentosarja suoritetaan ja liittää klusterit alkuperäiseen tiedostoosi uuteen sarakkeeseen nimeltä Cluster Name.
Klusterien nimet määritetään käyttämällä klusterin lyhimmän pituuden avainsanaa.
Esimerkiksi seuraavan avainsanaryhmän klusterin nimeksi on asetettu “alpakkasukat”, koska se on klusterin lyhin avainsana.
Kun klusterointi on valmis, uusi tiedosto tallennetaan automaattisesti, ja klusterit lisätään uuteen sarakkeeseen alkuperäiseen tiedostoon.
Tämä käsikirjoitus perustuu Nopea klusterointialgoritmi ja käyttää malleja, jotka on esikoulutettu mittakaavassa suurille tietomäärille.
Tämä helpottaa avainsanojen välisten semanttisten suhteiden laskemista käyttämällä valmiita malleja.
(Sinun ei tarvitse olla datatieteilijä käyttääkseen sitä!)
Itse asiassa, vaikka olen tehnyt sen muokattavissa niille, jotka haluavat puuhailla ja kokeilla, olen valinnut joitain tasapainotettuja oletusasetuksia, joiden pitäisi olla kohtuullisia useimpien ihmisten käyttötapauksissa.
Eri malleja voidaan vaihtaa skriptiin ja pois skriptistä vaatimusten mukaan (nopeampi klusterointi, parempi monikielinen tuki, parempi semanttinen suorituskyky ja niin edelleen).
Pitkän testauksen jälkeen löysin täydellisen tasapainon nopeuden ja tarkkuuden välillä käyttämällä all-MiniLM-L6-v2-muuntajaa, joka tarjosi loistavan tasapainon nopeuden ja tarkkuuden välillä.
Jos haluat käyttää omaasi, voit vain kokeilla, voit korvata olemassa olevan esikoulutetun mallin millä tahansa luetelluista malleista tässä tai päällä Halaava Face Model Hub.
Mallien vaihtaminen on yhtä helppoa kuin muuttujan korvaaminen haluamasi muuntajan nimellä.
Voit esimerkiksi muuttaa oletusmallin all-miniLM-L6-v2 muotoon all-mpnet-base-v2 muokkaamalla:
muuntaja = ‘all-miniLM-L6-v2’
kohtaan
muuntaja = ‘all-mpnet-base-v2‘
Tässä voit muokata sitä Google Colaboratory -taulukossa.
Yleinen valitus tämän skriptin aikaisemmista iteraatioista on, että se johti suureen määrään klusteroimattomia tuloksia.
Valitettavasti se tulee aina olemaan klusterin tarkkuuden ja klustereiden lukumäärän välinen tasapainotus.
Suurempi klusterin tarkkuusasetus johtaa suurempaan määrään klusteroimattomia tuloksia.
On olemassa kaksi muuttujaa, jotka voivat suoraan vaikuttaa kaikkien klustereiden kokoon ja tarkkuuteen:
min_klusterin_koko
ja
klusterin tarkkuus
Olen asettanut oletusarvoksi 85 (/100) klusterin tarkkuudelle ja klusterin vähimmäiskooksi 2.
Testauksessa huomasin tämän olevan suloinen paikka, mutta kokeile rohkeasti!
Tässä on paikka, jossa nämä muuttujat asetetaan komentosarjassa.
Se siitä! Toivon, että tästä avainsanaklusterointiohjelmasta on hyötyä työssäsi.
Lisää resursseja:
Suositeltu kuva: Graphic Grid/Shutterstock
Error: No feed found.
Please go to the Instagram Feed settings page to create a feed.