BigQueryn tehokkuusvinkkejä Search Consolen joukkotietojen vientiin | Google-hakukeskuksen blogi | Google for Developers


Maanantai 5.6.2023

Search Console joukkotietojen vienti on tehokas tapa saada verkkosivustosi hakutehokkuustiedot BigQueryyn tallennus-, analysointi- ja raportointiominaisuuksien lisäämiseksi. Tietojen viennin jälkeen voit esimerkiksi suorittaa kyselyjen ja URL-osoitteiden klusteroinnin, suorittaa analyyseja pitkän tähtäimen hakukyselyille ja yhdistää haun muihin tietolähteisiin. Voit myös säilyttää tiedot niin kauan kuin tarvitset niitä.

Joukkotietojen vientiä käytettäessä on tärkeää tehdä tietoon perustuvia päätöksiä tietojen käsittely- ja tallennuskustannusten hallinnassa. Search Console ei aiheuta kustannuksia tietojen viemisestä. lue kuitenkin BigQuery-hinnoittelu ymmärtääksesi, mistä sinua laskutetaan. Tässä viestissä keskustelemme vinkeistä, joiden avulla voit hyödyntää uusia tietoja ilman merkittäviä kustannuksia.

Jos et ole vielä määrittänyt joukkotietojen vientiä, tarkista vaiheittainen opas
Search Consolen ohjekeskuksessa. Katso yhteenveto viennin kautta saatavilla olevista tiedoista katsomalla tähän upotettu video.

Luo laskutushälytyksiä ja rajoituksia

Kun harkitset kustannuksiasi, voi olla hyödyllistä miettiä, kuinka paljon olet valmis maksamaan. Vastaus tähän kysymykseen on todennäköisesti erilainen tallennuksen, analyysin ja seurannan välillä. Saatat esimerkiksi olla valmis maksamaan tietyn summan varmistaaksesi, että tallennat kaikki tietosi, mutta vähemmän raportointialustan luomisesta. Kun harkitset asiaa, saatat haluta asettaa kuukausibudjetin hakudataan investoimiseksi.

Kun sinulla on budjettisumma mielessä, voit luoda a Google Cloud -budjettivaroitus
välttääksesi yllätyksiä laskussasi. Voit myös asettaa kynnyssääntöjä, jotka käynnistävät sähköposti-ilmoitukset, kun etenee kohti budjettisi summaa.

Lisää suojaa varten voit myös rajoittaa laskutettavien tavujen määrää
kyselyä varten. Jos teet niin, kyselyn lukemien tavujen määrä arvioidaan ennen kyselyn suorittamista. Jos arvioitujen tavujen määrä ylittää rajan, kysely epäonnistuu ilman veloitusta.

Älä rakenna hallintapaneeleja suoraan raakatiedoista

BigQuery on nopea, ja on houkuttelevaa linkittää hallintapaneelisi suoraan Search Consolesta vietyihin taulukoihin. Mutta suurilla sivustoilla tämä tietojoukko on erittäin suuri (etenkin yliajan kyselyillä). Jos rakennat kojelaudan, joka laskee uudelleen yhteenvetotiedot jokaisesta näkymästä ja jaat sen yrityksesi sisällä, tämä nostaa nopeasti suuria kyselykustannuksia.

Näiden kustannusten välttämiseksi harkitse jokaisen päivittäisen laskun tietojen esikoottamista ja yhden tai useamman yhteenvetotaulukon toteuttamista. Kojelautasi voi sitten tehdä kyselyjä paljon pienemmästä aikasarjataulukosta, mikä vähentää käsittelykustannuksia.

Tarkista kyselyiden ajoitus
toimintoja BigQueryssa tai harkitse BI moottori
jos haluat automatisoidumman ratkaisun.

Optimoi tiedon tallennuskustannukset

Kun aloitat joukkotietojen viennin, tiedot säilytetään oletuksena ikuisesti BigQuery-tietojoukossasi. Voit kuitenkin päivittää oletusosion vanhenemisajat
niin, että päivämääräosiot poistetaan automaattisesti vuoden tai 16 kuukauden tai minkä tahansa haluamasi ajan kuluttua.

Viedyt tiedot voivat olla sinulle arvokkaita, mutta ne voivat olla erittäin suuria. Käytä liiketoimintatietoasi ja harkitse sen säilyttämistä riittävän pitkään syvällisiä analyyseja varten, mutta ei liian kauan, jotta siitä tulee taakka. Yksi vaihtoehto on säilyttää näyteversio vanhemmista taulukoista ja säilyttää koko taulukko uusimmista päivämääristä.

Optimoi SQL-kyselysi

Kun teet kyselyjä Search Console -datastasi, varmista, että kyselysi on optimoitu tehokkuuden kannalta. Jos olet uusi BigQueryn käyttäjä, tarkista ohjeita ja esimerkkikyselyitä
ohjekeskuksessa. Sinun tulee kokeilla kolmea tekniikkaa.

1. Rajoita tulon skannausta

Ensinnäkin, välttää käyttöä SELECT *, tämä on kallein tapa tiedustella. BigQuery tarkistaa kaikki taulukon sarakkeet täydellisesti. Hakeminen a LIMIT lauseke tekee ei vaikuttaa luetun tiedon määrään.

Koska viedyt taulukot ovat päivämääräosioita, voit rajoittaa syötteiden skannauksen vain kiinnostaviin päiviin, varsinkin kun testaat ja pelaat tiedoilla. Käytä WHERE lauseke, joka rajoittaa ajanjaksoa päivämääräosioidussa taulukossa, tämä tuo merkittäviä säästöjä kyselykustannuksissa. Voit esimerkiksi tarkastella vain viimeisiä 14 päivää käyttämällä seuraavaa lauseketta:

WHERE data_date between DATE_SUB(CURRENT_DATE(), INTERVAL 14 day)

Jokaisessa tekemässäsi kyselyssä haluat ottaa käyttöön tunnetut suodattimet mahdollisimman pian vähentääksesi syötteen skannausta. Jos esimerkiksi analysoit kyselyitä, haluat todennäköisesti suodattaa ne pois
anonymisoidut kyselyt rivit. Anonymisoitu kysely raportoidaan nollapituisena merkkijonona taulukossa. Voit tehdä tämän lisäämällä seuraavat:

WHERE query != ''

2. Ota näyte tiedoista

BigQuery tarjoaa a taulukon näytteenotto
ominaisuus, jonka avulla voit tehdä kyselyjä satunnaisista datan osajoukoista suurista BigQuery-taulukoista. Otanta palauttaa erilaisia ​​tietueita samalla, kun vältetään koko taulukon skannaukseen ja käsittelyyn liittyvät kustannukset, ja se on erityisen hyödyllinen kyselyitä kehitettäessä tai kun tarkkoja tuloksia ei tarvita.

3. Käytä likimääräisiä funktioita, jos tarkkoja tuloksia ei vaadita

BigQuery tukee useita likimääräiset aggregointifunktiot
jotka tarjoavat arvioituja tuloksia ja ovat paljon halvempia laskea kuin niiden tarkat vastineet. Jos esimerkiksi etsit suosituimpia URL-osoitteita näyttökertojen perusteella jonkin ehdon perusteella, voit käyttää

SELECT APPROX_TOP_SUM(url, impressions, 10) WHERE datadate=...;

Sijasta

SELECT url, SUM(impressions) WHERE datadate=... GROUP BY url ORDER BY 2 DESC LIMIT 10;

Resurssit

Nämä ovat vain muutamia vinkkejä, joiden avulla voit aloittaa kustannusten hallinnan. Saat lisätietoja tarkistamalla
BigQueryn kustannusoptimoinnin parhaat käytännöt.

Ja kuten aina, jos sinulla on kysyttävää tai huolenaiheita, ota meihin yhteyttä osoitteen kautta
Google-hakukeskusyhteisö
tai päällä Viserrys.





Source link

About the Author

Leave a Reply

Your email address will not be published. Required fields are marked *

You may also like these

This error message is only visible to WordPress admins

Error: No feed found.

Please go to the Instagram Feed settings page to create a feed.