Semanttinen avainsanaklusterointi yli 10 000 avainsanalle [With Script]


Semanttinen avainsanaklusterointi voi auttaa viemään avainsanatutkimuksesi uudelle tasolle.

Tässä artikkelissa opit käyttämään Google Colaboratory -taulukkoa, joka on jaettu yksinomaan Search Engine Journalin lukijoille.

Tämä artikkeli opastaa sinua käyttämään Google Colab -taulukkoa, korkeatasoista näkymää konepellin toimivuudesta ja opastaa sinua tarpeidesi mukaisten säätöjen tekemiseen.

Mutta ensin, miksi klusterin avainsanoja ylipäänsä?

Avainsanojen klusteroinnin yleisiä käyttötapauksia

Tässä on muutamia käyttötapauksia avainsanojen ryhmittelyyn.

Nopeampi avainsanatutkimus:

  • Suodattaa brändättyjä avainsanoja tai avainsanoja, joilla ei ole kaupallista arvoa.
  • Ryhmittele aiheeseen liittyvät avainsanat yhteen luodaksesi perusteellisempia artikkeleita.
  • Ryhmittele aiheeseen liittyvät kysymykset ja vastaukset yhteen UKK-luomista varten.

Maksulliset hakukampanjat:

  • Luoda negatiivinen avainsana suuria tietojoukkoja käyttävien mainosten luettelot nopeammin – älä tuhlaa rahaa turhaan avainsanoihin!
  • Ryhmittele samankaltaisia ​​avainsanoja kampanjaideoiksi mainoksia varten.

Tässä on esimerkki käsikirjoituksesta, joka ryhmittelee samanlaiset kysymykset yhteen, mikä sopii täydellisesti perusteelliseen artikkeliin!

avainsanaklusterit ryhmiteltynä Excel-taulukoihinKuvakaappaus Microsoft Excelistä, helmikuu 2022

Tämän työkalun aiempien versioiden ongelmat

Jos olet seurannut työtäni Twitterissä, tiedät, että olen kokeillut avainsanaklusterointia jo jonkin aikaa.

Tämän käsikirjoituksen aikaisemmat versiot perustuivat erinomaiseen PolyFuzz-kirjasto käyttämällä TF-IDF yhteensopivuus.

Samalla kun se sai työn valmiiksi, siellä oli aina päätä raapivia klustereita, joissa mielestäni alkuperäistä tulosta voisi parantaa.

Sanat, joilla on samanlainen kirjainkuvio, ryhmitettäisiin, vaikka ne eivät liittyisi semanttisesti.

Se ei esimerkiksi pystynyt yhdistämään sanoja, kuten “pyörä” ja “pyörä”.

Käsikirjoituksen aikaisemmissa versioissa oli myös muita ongelmia:

  • Se ei toiminut hyvin muilla kielillä kuin englanniksi.
  • Se loi suuren määrän ryhmiä, joita ei voitu ryhmitellä.
  • Klusterien luomiseen ei ollut paljon hallintaa.
  • Käsikirjoitus oli rajoitettu ~10 000 riviin ennen kuin se aikakatkaistiin resurssien puutteen vuoksi.

Semanttinen avainsanojen klusterointi Deep Learning Natural Language Processing (NLP) -käsittelyllä

Kelaa neljä kuukautta eteenpäin viimeisimpään julkaisuun, joka on kirjoitettu kokonaan uudelleen hyödyntämään huippuluokan, syvän oppimisen lauseiden upotuksia.

Tutustu joihinkin näistä mahtavista semanttisista klustereista!

Huomaatko, että lämmitetty, lämpö ja lämmin sisältyvät samaan avainsanaryhmään?

Excel-taulukko, jossa on esimerkki semanttisesta avainsanaklusteristaKuvakaappaus Microsoft Excelistä, helmikuu 2022

Tai entä tukku- ja irtotavaramyynti?

Excel-taulukko, joka näyttää toisen esimerkin semanttisesta avainsanaklusteristaKuvakaappaus Microsoft Excelistä, helmikuu 2022

Koira ja mäyräkoira, joulu ja joulu?

Excel-taulukko, joka näyttää toisen esimerkin semanttisesta avainsanaklusterista.  Osoittaa, että mäyräkoira ja koirat on ryhmitelty yhteen.Kuvakaappaus Microsoft Excelistä, helmikuu 2022

Se voi jopa ryhmitellä avainsanoja yli sadalla eri kielellä!

Excel-taulukko, joka näyttää toisen esimerkin semanttisesta avainsanaklusterista ranskaksiKuvakaappaus Microsoft Excelistä, helmikuu 2022

Uuden skriptin ominaisuudet vs. aikaisemmat iteraatiot

Lisäksi semanttinen avainsana ryhmittely, seuraavat parannukset on lisätty tämän skriptin uusimpaan versioon.

  • Tuki yli 10 000 avainsanan klusterointiin kerralla.
  • Vähennetty ei klusteriryhmiä.
  • Mahdollisuus valita erilaisia ​​esikoulutettuja malleja (vaikka oletusmalli toimii hyvin!).
  • Kyky valita, kuinka läheisesti sukua klusterien tulee olla.
  • Avainsanojen vähimmäismäärän valinta klusteria kohden.
  • Automaattinen merkkikoodauksen ja CSV-erottimien tunnistus.
  • Monikielinen klusterointi.
  • Toimii monien yleisten avainsanojen viennin kanssa. (Search Console Data, AdWords tai kolmannen osapuolen avainsanatyökalut, kuten Ahrefs ja Semrush).
  • Toimii minkä tahansa CSV-tiedoston kanssa, jonka sarake on “Avainsana”.
  • Helppokäyttöinen (Skripti toimii lisäämällä uuden sarakkeen nimeltä Cluster Name mihin tahansa ladattuihin avainsanaluetteloon).

Käsikirjoituksen käyttäminen viidessä vaiheessa (pika aloitus)

Päästäksesi alkuun, sinun on tehtävä napsauta tätä linkkiäja valitse sitten vaihtoehto Avaa Colabissa alla olevan kuvan mukaisesti.

Kuinka avata Google Colab GithubistaKuvakaappaus Google Colaboratoryn helmikuulta 2022

Muuta suoritusajan tyypiksi GPU valitsemalla Suoritusaika > Muuta suoritusaikatyyppiä.

Google Collab, GPU:n käyttöasetusten muuttaminenKuvakaappaus Google Colaboratoryn helmikuulta 2022

Valitse Suoritusaika > Juosta kaikki ylhäältä siirtymisestä Google Colaboratoryn kautta (tai paina Ctrl+F9).

Kuinka käyttää kaikkia soluja Google ColabissaKuvakaappaus Google Colaboratoryn helmikuulta 2022

Lähetä pyydettäessä .csv-tiedosto, joka sisältää sarakkeen nimeltä “Keyword”.

Tiedoston lataaminen Google ColabillaKuvakaappaus Google Colaboratoryn helmikuulta 2022

Klusterin pitäisi olla melko nopeaa, mutta viime kädessä se riippuu avainsanojen määrästä ja käytetystä mallista.

Yleisesti ottaen sinun pitäisi olla hyvä 50 000 avainsanalle.

Jos näet Cuda-muistin lopussa -virheen, yrität ryhmitellä liian monta avainsanaa samanaikaisesti!

(On syytä huomata, että tämä skripti voidaan helposti sovittaa toimimaan paikallisella koneella ilman Google Colaboratoryn rajoituksia.)

Script-tulostus

Komentosarja suoritetaan ja liittää klusterit alkuperäiseen tiedostoosi uuteen sarakkeeseen nimeltä Cluster Name.

Klusterien nimet määritetään käyttämällä klusterin lyhimmän pituuden avainsanaa.

Esimerkiksi seuraavan avainsanaryhmän klusterin nimeksi on asetettu “alpakkasukat”, koska se on klusterin lyhin avainsana.

Alpakkasukat näyttävän skriptin esimerkkitulosteen esittely on ryhmitelty yhteen Kuvakaappaus Microsoft Excelistä, helmikuu 2022

Kun klusterointi on valmis, uusi tiedosto tallennetaan automaattisesti, ja klusterit lisätään uuteen sarakkeeseen alkuperäiseen tiedostoon.

Kuinka Key Clustering Tool toimii

Tämä käsikirjoitus perustuu Nopea klusterointialgoritmi ja käyttää malleja, jotka on esikoulutettu mittakaavassa suurille tietomäärille.

Tämä helpottaa avainsanojen välisten semanttisten suhteiden laskemista käyttämällä valmiita malleja.

(Sinun ei tarvitse olla datatieteilijä käyttääkseen sitä!)

Itse asiassa, vaikka olen tehnyt sen muokattavissa niille, jotka haluavat puuhailla ja kokeilla, olen valinnut joitain tasapainotettuja oletusasetuksia, joiden pitäisi olla kohtuullisia useimpien ihmisten käyttötapauksissa.

Eri malleja voidaan vaihtaa skriptiin ja pois skriptistä vaatimusten mukaan (nopeampi klusterointi, parempi monikielinen tuki, parempi semanttinen suorituskyky ja niin edelleen).

Pitkän testauksen jälkeen löysin täydellisen tasapainon nopeuden ja tarkkuuden välillä käyttämällä all-MiniLM-L6-v2-muuntajaa, joka tarjosi loistavan tasapainon nopeuden ja tarkkuuden välillä.

Jos haluat käyttää omaasi, voit vain kokeilla, voit korvata olemassa olevan esikoulutetun mallin millä tahansa luetelluista malleista tässä tai päällä Halaava Face Model Hub.

Vaihto valmiiksi koulutettuihin malleihin

Mallien vaihtaminen on yhtä helppoa kuin muuttujan korvaaminen haluamasi muuntajan nimellä.

Voit esimerkiksi muuttaa oletusmallin all-miniLM-L6-v2 muotoon all-mpnet-base-v2 muokkaamalla:

muuntaja = ‘all-miniLM-L6-v2’

kohtaan

muuntaja = ‘all-mpnet-base-v2

Tässä voit muokata sitä Google Colaboratory -taulukossa.

Kuinka valita lausemuuntaja avainsanaklusterointiinKuvakaappaus Google Colaboratoryn helmikuulta 2022

Kompromissi klusterin tarkkuuden ja ei klusteriryhmien välillä

Yleinen valitus tämän skriptin aikaisemmista iteraatioista on, että se johti suureen määrään klusteroimattomia tuloksia.

Valitettavasti se tulee aina olemaan klusterin tarkkuuden ja klustereiden lukumäärän välinen tasapainotus.

Suurempi klusterin tarkkuusasetus johtaa suurempaan määrään klusteroimattomia tuloksia.

On olemassa kaksi muuttujaa, jotka voivat suoraan vaikuttaa kaikkien klustereiden kokoon ja tarkkuuteen:

min_klusterin_koko

ja

klusterin tarkkuus

Olen asettanut oletusarvoksi 85 (/100) klusterin tarkkuudelle ja klusterin vähimmäiskooksi 2.

Testauksessa huomasin tämän olevan suloinen paikka, mutta kokeile rohkeasti!

Tässä on paikka, jossa nämä muuttujat asetetaan komentosarjassa.

Vähimmäislausekoon ja avainsanaklusterin tarkkuuden asettaminenKuvakaappaus Google Colaboratoryn helmikuulta 2022

Se siitä! Toivon, että tästä avainsanaklusterointiohjelmasta on hyötyä työssäsi.

Lisää resursseja:


Suositeltu kuva: Graphic Grid/Shutterstock





Source link

About the Author

Leave a Reply

Your email address will not be published. Required fields are marked *

You may also like these

This error message is only visible to WordPress admins

Error: No feed found.

Please go to the Instagram Feed settings page to create a feed.