Miten Google oikeasti laskee tähtiluokituksesi (se ei ole keskiarvo)
Bayesilainen matematiikka painotettujen arvostelujen, ajallisen heikkenemisen ja sen takana, miksi näytetty luokituksesi lähes varmasti poikkeaa aritmeettisesta keskiarvostasi – selitettynä aidoilla kaavoilla ja laskuesimerkeillä.
Tässä on jotain, minkä useimmat yrittäjät oppivat kantapään kautta: voit kerätä kaksikymmentä peräkkäistä viiden tähden arvostelua ja katsoa, kuinka näytetty luokituksesi tuskin liikkuu. Tai mikä pahempaa – käytät kuusi kuukautta palvelusi parantamiseen, saat vihdoin 50 arvostelua kasaan ja huomaat, että 4.8:n keskiarvosi on jotenkin asettunut 4.3:een Google Mapsissa. Matematiikka ei ole rikki. Se toimii juuri niin kuin on suunniteltu. Sinulle ei vain kerrottu, mikä suunnitelma oli.
Google ei ole koskaan julkaissut luokitusalgoritmiaan. Mutta IMDB:n julkisesti dokumentoiman Bayesilaisen kaavan, Algolian luokitusdokumentaation, arvostelujärjestelmiä koskevan akateemisen tutkimuksen ja vuosien ajan näkyviä luokitusmuutoksia takaisinmallintaneiden ammattilaisten työn ansiosta mekaniikka on hyvin ymmärretty. Tämä artikkeli käy läpi matematiikan – kunnolla, oikeilla numeroilla.
Naiivien keskiarvojen ongelma
// naive_average.failure_modes
Aloitetaan siitä, mikä on naiivi keskiarvo ja miksi se epäonnistuu. Luokitusten joukon aritmeettinen keskiarvo on yksinkertaisesti summa jaettuna lukumäärällä. Kolme arvostelua, 5, 4 ja 5, antaa tulokseksi (5+4+5)/3 = 4.67. Se on matemaattisesti oikein. Se on myös tilastollisesti harhaanjohtavaa, kun tavoitteena on asettaa tuhansia yrityksiä paremmuusjärjestykseen.
Epäonnistumisen tavat kasaantuvat nopeasti suuressa mittakaavassa. Viime viikolla avattu ravintola, jolla on kolme arvostelua innostuneilta ystäviltä, saa korkeammat pisteet kuin vakiintunut kilpailija, jolla on 200 arvostelua keskiarvolla 4.4 – vaikka vakiintunut paikka edustaa dramaattisesti luotettavampaa signaalia. Mikä tahansa sijoitusjärjestelmä, joka sallii tämän, pelataan merkityksettömäksi kuukausissa.
Miten Googlen tähtiluokituksen laskenta toimii käytännössä
Ajattele Bayesilaista luokitusta luottamuspainotettuna keskiarvona. Kun sinulla on hyvin vähän arvosteluja, järjestelmä ei luota otokseesi tarpeeksi näyttääkseen sen sellaisenaan. Sen sijaan se sekoittaa raa'an keskiarvosi prioriin – oletusodotukseen, joka perustuu kaikkiin samankaltaisiin yrityksiin. Mitä enemmän arvosteluja keräät, sitä enemmän järjestelmä luottaa omaan dataasi ja sitä vähemmän priorilla on merkitystä.
IMDB käyttää täsmälleen tätä lähestymistapaa Top 250 -listallaan ja on dokumentoinut kaavan julkisesti: WR = (v/(v+m)) × R + (m/(v+m)) × C. Muuttujat ovat elegantin yksinkertaisia, mutta käyttäytymiseen liittyvien seurausten täydellinen omaksuminen vie hetken. Sama matemaattinen rakenne esiintyy Algolian sijoitusdokumentaatiossa, arvostelujärjestelmiä käsittelevässä akateemisessa kirjallisuudessa ja Googlen paikallisia sijoituksia tutkivien SEO-ammattilaisten tekemässä takaisinmallinnustyössä.
Bayesilaisen keskiarvon kaava selitettynä
// bayesian_average.formula_derivation
Kaava WR = (v/(v+m)) × R + (m/(v+m)) × C on painotettu sekoitus kahdesta suureesta: yrityksesi omasta havaitusta keskiarvosta (R) ja koko kategorian keskiarvosta (C). Painoarvot määräytyvät sen mukaan, kuinka monta arvostelua sinulla on (v) suhteessa vähimmäisuskottavuuskynnykseen (m).
Huomaa, että (v/(v+m)) + (m/(v+m)) on aina yhtä suuri kuin 1.0. Nämä kaksi painoarvoa summautuvat 100 %:iin – olet aina interpoloimassa oman datasi ja priorin välillä. Ainoa kysymys on, kuinka paljon kumpaakin. Kun v on pieni suhteessa m:ään, priori hallitsee. Kun v on suuri suhteessa m:ään, omat arvostelusi hallitsevat.
Kynnysarvo m on parametri, joka koodaa alustan luottamusvaatimukset. IMDB asettaa m:n arvoon noin 25 000 ääntä Top 250 -laskelmassaan. Naapuruston kahvila Googlessa ei kilpaile samassa tilastollisessa universumissa kuin Avatar, joten m on asetettu paljon alemmaksi – ammattilaiset arvioivat m:n yleensä olevan 5–50 Googlen paikallisissa listauksissa, vaihdellen kategorian ja maantieteellisen markkinan mukaan.
Kategorian keskiarvo C on aliarvostetuin muuttuja. Se ei ole kiinteä globaali vakio. Google laskee C:n lähes varmasti dynaamisesti – kategoria-, kaupunki- ja ehkä hakukontekstikohtaisesti. Hammaslääkäriä San Franciscossa verrataan muihin San Franciscon hammaslääkäreihin, ei Montanan maaseudun ravintoloihin. Tämä tarkoittaa, että Bayesilainen pohjasi on kategoriakohtainen.
Miksi painotetun tähtiluokituksen kaavalla on merkitystä SEO:llesi
Käytännön seuraus on, että ensimmäisten 50 arvostelun saaminen on suhteettoman paljon tärkeämpää kuin arvostelujen 51–150 saaminen. Jokaisella uskottavuuskynnyksen m alapuolella olevalla arvostelulla on ylisuuri vaikutus, koska se siirtää (v/(v+m)) -kerrointa merkittävästi. Arvostelumäärän nostaminen v=5:stä v=10:een kaksinkertaistaa luottamuspainosi. Siirtyminen v=150:stä v=155:een on tuskin mitattavissa.
Tämä selittää vastoin intuitiota olevan mallin, jonka ammattilaiset havaitsevat toistuvasti: yrityksen arvostelumäärä nousee 3:sta 30:een ja sen näytetty luokitus putoaa 5.0:sta 4.6:een – vaikka uudetkin arvostelut olisivat positiivisia. Matematiikka on oikein. Varhainen 5.0 oli Bayesilaista fiktiota. 4.6 on ensimmäinen rehellinen arvio.
Laskennan vaiheittainen läpikäynti
// step_by_step.numerical_walkthrough
Kaksi laskuesimerkkiä, joissa käytetään realistista kategorian keskiarvoa C = 4.1 ja minimikynnystä m = 50. Nämä ovat uskottavia arvioita kohtalaisen kilpailtuun paikalliseen palvelukategoriaan (putkimiehet, hammaslääkärit, autokorjaamot). Syötä eri arvoja mallintaaksesi omaa kategoriaasi.
Yritys A:lla on täydellinen raakatulos – jokainen arvostelija antoi 5 tähteä. Mutta vain 3 arvostelulla kaava luottaa sen omaan dataan vain 5,7 %. Jäljelle jäävä 94,3 % sen näytetystä tuloksesta tulee kategorian keskiarvosta 4.1. Tulos: 4.15. Ei se 5.0, jonka se näyttäisi ansaitsevan.
Yritys B:llä on matalampi raakakeskiarvo 4.6 – jotkut arvostelijat antoivat 3 tai 4 tähteä. Mutta 120 arvostelua tarkoittaa, että kaava luottaa sen omaan dataan 70,6 %. Sen näytetty tulos 4.45 on paljon lähempänä todellisuutta, ja Googlen algoritmi sijoittaa sen korkeammalle kuin yritys A:n nimellisen 5.0:n. Volyymi ansaitsee uskottavuutta. Uskottavuus ansaitsee näkyvyyttä.
Simulaatio: Naiivi keskiarvo vs. Bayesilainen painotettu luokitus
// simulation.naive_vs_bayesian_comparison
Alla oleva taulukko soveltaa kaavaa kuuteen skenaarioon, joissa C = 4.1 ja m = 50. Delta-sarake näyttää, kuinka paljon Bayesilainen tulos eroaa naiivista keskiarvosta. Huomaa, kuinka ero pienenee arvostelumäärän kasvaessa – se on priorin vaikutuksen heikkenemistä todisteiden kertyessä.
Mielenkiintoisin rivi on viimeinen: yritys, jolla on vain 5 arvostelua mutta kamala 2.0:n raakakeskiarvo, näyttääkin tuloksen 3.85 – kategorian keskiarvo on vetänyt sitä ylös lähes kaksi täyttä tähteä. Tämä on tarkoituksellista. Järjestelmä kieltäytyy tuomitsemasta yritystä unohdukseen viiden datapisteen perusteella. Se suojaa kohti keskiarvoa, kunnes otos on riittävän suuri oikeuttamaan luottamuksen.
Tämä negatiivisten poikkeamien vaimennusvaikutus on syy, miksi arvostelupommitus – koordinoitu väärennettyjen negatiivisten arvostelujen kampanja – on vähemmän katastrofaalinen kuin miltä se pinnalta näyttää. Algoritmi vastustaa äärimmäisiä tuloksia, kun arvostelumäärä on riittämätön oikeuttamaan ne. Toisaalta Googlen poikkeamien havaitsemisjärjestelmät merkitsevät myös nopean vauhdin arvostelukampanjat molempiin suuntiin.
Googlen lisäkerrokset peruskaavan lisäksi
// google_specific.beyond_bayesian_math
Bayesilainen kaava selittää peruslinjan, mutta Googlen todellinen järjestelmä lisää vähintään kolme kerrosta lisää: ajallinen heikkeneminen, arvostelijan luotettavuuspisteytys ja poikkeamien vaimennus nopeuspiikeille. Mitään näistä ei ole vahvistettu virallisesti. Kaikki on päätelty käyttäytymiseen perustuvista todisteista ja patenttianalyysistä.
Ajattele Bayesilaista peruskaavaa perustana. Kaikki sen päälle rakennettu tekee signaalista vastustuskykyisemmän manipuloinnille ja ajallisesti tarkemman. Tavoite on aina sama: saada näytetty luokitus vastaamaan sitä, mitä asiakas aidosti kokisi, jos hän astuisi sisään tänään.
Ajallinen painotus – miksi viimeiset 90 päivääsi hallitsevat
Google soveltaa ajallista heikkenemistä arvosteluihin, antaen enemmän painoarvoa tuoreelle palautteelle kuin vanhemmille merkinnöille. Mekanismi on yhdenmukainen eksponentiaalisen heikkenemisfunktion kanssa, jossa arvostelun vaikutus vähenee ajan myötä sen sijaan, että se putoaisi nollaan jollakin tiukalla rajapäivämäärällä.[1]
Yhteisön analyysit Googlen luokituskäyttäytymisestä osoittavat jatkuvasti, että yli 12–18 kuukautta sitten julkaistuilla arvosteluilla on noin 30–50 % vähemmän vaikutusta kuin viime viikolla julkaistulla arvostelulla. Kolme vuotta vanha 5 tähden arvostelu lasketaan yhä mukaan – se vain lasketaan pienemmällä painoarvolla. Tämä tarkoittaa, että yritys, joka keräsi 80 arvostelua vuonna 2022 eikä ole saanut sen jälkeen yhtään, elää lainatulla signaalilla.
Arvostelijan luotettavuus – miksi tason 7 Local Guide -oppaan arvostelu iskee kovempaa
Googlen luottamushierarkia arvostelijoille on päätelty sen patenttisalkusta ja havaittavasta käyttäytymisestä. Patentti US8818995B1 kuvaa hakusijoitusjärjestelmää, joka painottaa panoksia niiden tekijän luottamustason mukaan. Sovellettuna arvosteluihin: tason 7 Local Guide, jolla on satoja yksityiskohtaisia arvosteluja useista yrityskategorioista, rekisteröityy korkean luottamuksen solmuksi.[2]
Käytännön vaikutus: tason 7 Local Guide -oppaan 5 tähden arvostelu painotetaan todennäköisesti raskaammin kuin eilen luodun tilin, jolla ei ole arvosteluhistoriaa, 5 tähden arvostelu. Kyse ei ole tähtiarvosta – molemmat lasketaan 5:ksi osoittajassa. Mutta kullekin ennen keskiarvon laskemista sovellettava painoarvo eroaa. Google ei ole koskaan julkisesti määrittänyt tätä eroa.
Poikkeamien vaimennus – mitä tapahtuu, kun 40 arvostelua saapuu viikossa
Nopeuspiikit laukaisevat erillisen tunnistuskerroksen. Jos yritys saa 40 arvostelua 72 tunnissa, kun sen perustaso on 2–3 kuukaudessa, Googlen järjestelmät merkitsevät tämän mallin. Seurauksena ei ole automaattinen poisto – se on karanteeni. Uudet arvostelut lakkaavat näkymästä näytetyssä määrässä ja luokituksessa, kun järjestelmä tutkii asiaa.[3]
Tämä mekanismi selittää, miksi yritykset, jotka ostavat arvostelukampanjoita massoittain, eivät usein näe näkyvää parannusta – tai näkevät profiilinsa luokitusten väliaikaisesti laskevan, kun vanhemmat aidot arvostelut pysyvät näkyvissä, mutta uusi erä on arvostelulimbossa. Algoritmi on erityisesti viritetty epäluottamaan äkillisiä volyymin muutoksia, jotka poikkeavat vakiintuneista perustasoista.
Ennen ja jälkeen: Mitä arvostelumäärä todella muuttaa
// practical_impact.before_and_after_scenarios
Kaksi tosielämän kaltaista skenaariota havainnollistamaan, miten kaava käyttäytyy ajan myötä. Kumpikaan ei ole kuvitteellinen – nämä mallit esiintyvät toistuvasti maineenhallinnan ammattilaisten tapaustutkimuksissa.
Hammaslääkäriskenaario osoittaa Bayesilaisen luokituksen ydinajatuksen: matalampi raakakeskiarvo korkealla luottamuksella voittaa korkeamman raakakeskiarvon matalalla luottamuksella. Näytetty tulos laski (nimellisestä 4.9:stä näytettyyn 4.58:aan), mutta sijoitus parani, koska luottamuspaino on nyt todellinen.
Ravintolan piikkiskenaario havainnollistaa, miksi orgaanisella tahdilla on väliä. Googlen järjestelmät on kalibroitu havaitsemaan luonnotonta nopeutta. Neljäkymmentä arvostelua viikossa, jota seuraa kahden kuukauden hiljaisuus, ei ainoastaan näytä epäilyttävältä – vaimennettu tehollinen määrä tarkoittaa, että käytit rahaa ja sait tuskin mitään. Matematiikka rankaisee siitä kahdesti: poikkeamien havaitseminen vähentää näkyvää määrää, ja ajallinen heikkeneminen tarkoittaa, että piikin aikaiset arvostelut alkavat haalistua välittömästi.
Vaihtoehtoiset lähestymistavat: Wilsonin pisteet ja Dirichlet'n mallit
// related_approaches.wilson_score_dirichlet
Bayesilainen keskiarvoistaminen ei ole ainoa tilastollisesti pätevä lähestymistapa. Evan Millerin vuoden 2009 essee 'How Not to Sort by Average Rating' popularisoi toisen menetelmän: Wilsonin pisteiden luottamusvälin alarajan. Reddit otti sen käyttöön kommenttien sijoittamiseen. Yelp käyttää siitä muunnelmaa.
Wilsonin pisteet kysyvät eri kysymyksen kuin Bayesilainen keskiarvoistaminen. Sen sijaan, että se kysyisi 'sekoita datani prioriin', se kysyy: 'annettujen arvostelujen perusteella, mikä on todennäköisesti huonoin todellinen laatu 95 %:n luottamuksella?' Tämä tuottaa konservatiivisen arvion, joka rankaisee epävarmuudesta jopa aggressiivisemmin kuin Bayesilainen keskiarvoistaminen hyvin pienillä arvostelumäärillä.
Kolmas lähestymistapa – Dirichlet-Multinomimalli – käsittelee kaikkia viittä tähtiarvoa erillisinä kategorioina yhden jatkuvan pistemäärän sijaan. District Data Labs dokumentoi tämän lähestymistavan monitähtijärjestelmille. Se on matemaattisesti oikeampi kuin IMDB:n kaava (joka implisiittisesti käsittelee tähtiä lineaarisena asteikkona), mutta laskennallisesti raskaampi. Käytännön tarkoituksiin käyttäytymisero Bayesilaisen keskiarvoistamisen ja Dirichlet'n mallin välillä muuttuu merkityksettömäksi noin 30 arvostelun yläpuolella.
Mitä tämä tarkoittaa yrityksesi strategialle
// strategic_implications.for_business_owners
Matematiikan ymmärtäminen muuttaa abstraktin neuvon ('hanki lisää arvosteluja') mitattavaksi strategiaksi. Jokainen yritys on jossain v/(v+m) -spektrillä. Tietäen missä olet, tiedät kuinka paljon seuraava arvostelusi todella vaikuttaa.
Jos v = 8 ja m = 50, yksi uusi 5 tähden arvostelu siirtää luottamuspainoasi 8/58 = 0,138:sta 9/59 = 0,153:een. Tämä 1,5 prosenttiyksikön muutos on merkittävä. Jos v = 300 ja m = 50, sama arvostelu siirtää sinut 300/350 = 0,857:stä 301/351 = 0,858:aan – tuskin havaittavissa. Volyymilla varhaisessa ikkunassa on kymmenkertainen matemaattinen vaikutus verrattuna volyymiin suuressa mittakaavassa.
Kuinka laskea painotettu keskimääräinen tähtiluokitus omalle yrityksellesi
Voit suorittaa kaavan itse laskentataulukossa. Ota nykyinen arvostelumääräsi v:ksi. Arvioi kategoriasi m katsomalla, mitä arvostelumääriä Google Maps -kategoriasi top-3-yritykset ylläpitävät – kyseisen jakauman 25. persentiili on kohtuullinen m-arvio. Nykyinen näytetty luokituksesi on todennäköisesti jo WR-tulos; naiivi keskiarvosi on yksinkertainen summa jaettuna määrällä taustajärjestelmässäsi.
Laskelma, josta sinun tulisi välittää, on seuraavien N arvostelun marginaalivaikutus. Mallinna se: lisää v:tä 10:llä, laske WR uudelleen, tarkkaile eroa. Tee tämä useilla v:n arvoilla rakentaaksesi herkkyyskäyrän. Sen käyrän jyrkin osa – jossa jokainen lisäarvostelu tuottaa suurimman WR-parannuksen – on se, mihin sinun tulisi keskittää arvostelujen hankintaponnistelusi.
Miksi ajantasaisuus tarkoittaa, että arvostelunopeus on tärkeämpää kuin kokonaismäärä
Kun ymmärrät ajallisen heikkenemisen, optimointikohde muuttuu. Kyse ei ole vain kokonaisvolyymista – kyse on ajallisesti jaetusta volyymista. Yritys, jolla on 400 arvostelua kerättynä viiden vuoden aikana eikä yhtään viimeisten 18 kuukauden aikana, toimii tehokkaasti pienemmällä otoksella kuin numerot antavat ymmärtää. Heikentyneet arvostelut vaikuttavat vähemmän juoksevaan painotettuun keskiarvoon.
Johdonmukainen arvostelujen tuottaminen – jopa vaatimattomalla tahdilla – kasvaa korkoa korolle ajan myötä tavoilla, joihin rykäisyhankinta ei koskaan pysty. Kahdeksan uutta arvostelua kuukaudessa kahdentoista kuukauden ajan päihittää 96 arvostelua yhdessä kuukaudessa lähes kaikilla relevanteilla mittareilla: Bayesilainen luottamus, poikkeamien havaitsemisen läpäisy, ajallisen heikkenemisen kehityskaari ja kuluttajien uskottavuuskäsitys.
Usein kysytyt kysymykset
// faq.frequently_asked_questions
Tähtiluokitukset eivät ole sitä, miltä ne pinnalta näyttävät. Googlen näyttämä luku on tilastollisen mallin tulos, joka on suunniteltu vastustamaan manipulointia, ottamaan huomioon epävarmuuden ja palkitsemaan johdonmukaisesta laadusta ajan myötä. Matematiikan ymmärtäminen ei vaadi tilastotieteen tutkintoa – se vaatii hyväksymään, että kolme 5 tähden arvostelua eivät ole samanarvoisia kuin 120 aitoa arvostelua keskiarvolla 4.6. Kaava tekee sen selväksi. Se, mitä teet tällä oivalluksella, on strategiaa.
Luokituksesi on matemaattinen ongelma. Voimme auttaa ratkaisemaan sen.
Bayesilainen kaava palkitsee ajan myötä kertyneestä arvostelumäärästä. Jokainen tänään tuottamasi arvostelu siirtää luottamuspainoasi oikeaan suuntaan – ja vaikutus kasvaa korkoa korolle.
Aloita arvostelumäärän kasvattaminen


