🔥 Rajoitetun ajan: 10% ALENNUS kaikista tilauksista — käytä koodia STAR10Lunasta →
Live10,847 arvostelua toimitettu tähän mennessä7 tilausta tehty tänäänSeuraava toimitus ~2 tunnin kuluttua
syväluotaus20. huhtikuuta 2026·blogPost.bayesianStarRatingMath.readTime min read

Miten Google oikeasti laskee tähtiluokituksesi (se ei ole keskiarvo)

Bayesilainen matematiikka painotettujen arvostelujen, ajallisen heikkenemisen ja sen takana, miksi näytetty luokituksesi lähes varmasti poikkeaa aritmeettisesta keskiarvostasi – selitettynä aidoilla kaavoilla ja laskuesimerkeillä.

Abstrakti visualisointi Bayesilaisesta tähtiluokituksen matematiikasta – syaanina ja smaragdinvihreänä hohtavat todennäköisyysjakaumat tummansinisellä taustalla, matemaattisia merkintöjä leijumassa
Q
Quick Answers
Käyttääkö Google yksinkertaista keskiarvoa tähtiluokitusten laskemiseen?
Ei. Google käyttää Bayes-vaikutteista painotettua kaavaa, joka vetää luokituksia kohti kategorian keskiarvoa, kun arvosteluja on vähän. Yritys, jolla on 3 arvostelua arvosanalla 5.0, näyttää tehollisesti matalamman luokituksen kuin yritys, jolla on 120 arvostelua arvosanalla 4.6.
Mikä on Bayesilaisen keskiarvon kaava luokituksille?
WR = (v/(v+m)) × R + (m/(v+m)) × C — jossa v on arvostelujesi määrä, m on minimikynnys, R on raaka keskiarvosi ja C on kategorian keskiarvo. Kun v kasvaa, oma keskiarvosi alkaa hallita.
Kuinka monta Google-arvostelua tarvitaan, ennen kuin luokitus vakiintuu?
Noin 50–100 arvostelua, riippuen kategoriasi keskimääräisestä arvostelumäärästä. Tämän kynnyksen alapuolella Bayesilainen veto kohti yleistä keskiarvoa on tarpeeksi voimakas vaimentaakseen merkittävästi jopa täydellistä tulosta.
Miksi uudemmat arvostelut ovat tärkeämpiä Google-luokitukselleni?
Google käyttää ajallista painotusta – viimeisten 90 päivän aikana julkaistuilla arvosteluilla on huomattavasti enemmän vaikutusta kuin yli 18 kuukautta vanhoilla arvosteluilla. Tämä on riippumaton Bayesilaisesta priorista ja palkitsee yrityksiä, jotka saavat jatkuvasti uusia arvosteluja.

Tässä on jotain, minkä useimmat yrittäjät oppivat kantapään kautta: voit kerätä kaksikymmentä peräkkäistä viiden tähden arvostelua ja katsoa, kuinka näytetty luokituksesi tuskin liikkuu. Tai mikä pahempaa – käytät kuusi kuukautta palvelusi parantamiseen, saat vihdoin 50 arvostelua kasaan ja huomaat, että 4.8:n keskiarvosi on jotenkin asettunut 4.3:een Google Mapsissa. Matematiikka ei ole rikki. Se toimii juuri niin kuin on suunniteltu. Sinulle ei vain kerrottu, mikä suunnitelma oli.

Google ei ole koskaan julkaissut luokitusalgoritmiaan. Mutta IMDB:n julkisesti dokumentoiman Bayesilaisen kaavan, Algolian luokitusdokumentaation, arvostelujärjestelmiä koskevan akateemisen tutkimuksen ja vuosien ajan näkyviä luokitusmuutoksia takaisinmallintaneiden ammattilaisten työn ansiosta mekaniikka on hyvin ymmärretty. Tämä artikkeli käy läpi matematiikan – kunnolla, oikeilla numeroilla.

Naiivien keskiarvojen ongelma

// naive_average.failure_modes

Aloitetaan siitä, mikä on naiivi keskiarvo ja miksi se epäonnistuu. Luokitusten joukon aritmeettinen keskiarvo on yksinkertaisesti summa jaettuna lukumäärällä. Kolme arvostelua, 5, 4 ja 5, antaa tulokseksi (5+4+5)/3 = 4.67. Se on matemaattisesti oikein. Se on myös tilastollisesti harhaanjohtavaa, kun tavoitteena on asettaa tuhansia yrityksiä paremmuusjärjestykseen.

Naiivi keskiarvo – Epäonnistumiset
1 arvostelu arvosanalla 5.0 päihittää 500 arvostelua arvosanalla 4.8 – otoskoko jätetään huomiotta
Uudet yritykset, joilla on istutettuja arvosteluja, hallitsevat uusien tulokkaiden sijoituksia
Luokitus paisuu pienellä volyymilla, tyhjenee negatiivisten arvostelujen kerääntyessä suuressa mittakaavassa
Ei rangaistusta epäilyttävistä arvostelunopeuden piikeistä – suunniteltu pelattavaksi
Bayesilainen painotettu – Korjaukset
Vähän arvosteluja saaneet yritykset vedetään kohti kategorian keskiarvoa – poikkeamat vaimennetaan
Suuri arvostelumäärä ansaitsee luottamusta – pisteet lähenevät todellista laatusignaalia
Ajallinen painotus pitää pisteet ajan tasalla – 18 kuukautta vanhat arvostelut haalistuvat
Arvostelijan luotettavuuspisteytys vähentää epäilyttävien tai vähäaktiivisten tilien painoarvoa

Epäonnistumisen tavat kasaantuvat nopeasti suuressa mittakaavassa. Viime viikolla avattu ravintola, jolla on kolme arvostelua innostuneilta ystäviltä, saa korkeammat pisteet kuin vakiintunut kilpailija, jolla on 200 arvostelua keskiarvolla 4.4 – vaikka vakiintunut paikka edustaa dramaattisesti luotettavampaa signaalia. Mikä tahansa sijoitusjärjestelmä, joka sallii tämän, pelataan merkityksettömäksi kuukausissa.

Miten Googlen tähtiluokituksen laskenta toimii käytännössä

Ajattele Bayesilaista luokitusta luottamuspainotettuna keskiarvona. Kun sinulla on hyvin vähän arvosteluja, järjestelmä ei luota otokseesi tarpeeksi näyttääkseen sen sellaisenaan. Sen sijaan se sekoittaa raa'an keskiarvosi prioriin – oletusodotukseen, joka perustuu kaikkiin samankaltaisiin yrityksiin. Mitä enemmän arvosteluja keräät, sitä enemmän järjestelmä luottaa omaan dataasi ja sitä vähemmän priorilla on merkitystä.

IMDB käyttää täsmälleen tätä lähestymistapaa Top 250 -listallaan ja on dokumentoinut kaavan julkisesti: WR = (v/(v+m)) × R + (m/(v+m)) × C. Muuttujat ovat elegantin yksinkertaisia, mutta käyttäytymiseen liittyvien seurausten täydellinen omaksuminen vie hetken. Sama matemaattinen rakenne esiintyy Algolian sijoitusdokumentaatiossa, arvostelujärjestelmiä käsittelevässä akateemisessa kirjallisuudessa ja Googlen paikallisia sijoituksia tutkivien SEO-ammattilaisten tekemässä takaisinmallinnustyössä.

Todennäköisyysjakaumakäyrät, jotka näyttävät Bayesilaisen prioriuskomuksen muuttuvan arvostelumäärän kasvaessa – matemaattista taidetta laivastonsinisen ja syaanin sävyissä
// kuva_01 — Prioriuskomus (tasainen jakauma, pieni määrä) lähenee posterioria todisteiden kertyessä. Tähtiluokituksiin sovellettu Bayesilainen päättely käyttäytyy identtisesti minkä tahansa muun estimointiongelman kanssa: enemmän dataa = kapeampi luottamusväli = vähemmän regressiota kohti keskiarvoa.

Bayesilaisen keskiarvon kaava selitettynä

// bayesian_average.formula_derivation

Kaava WR = (v/(v+m)) × R + (m/(v+m)) × C on painotettu sekoitus kahdesta suureesta: yrityksesi omasta havaitusta keskiarvosta (R) ja koko kategorian keskiarvosta (C). Painoarvot määräytyvät sen mukaan, kuinka monta arvostelua sinulla on (v) suhteessa vähimmäisuskottavuuskynnykseen (m).

Huomaa, että (v/(v+m)) + (m/(v+m)) on aina yhtä suuri kuin 1.0. Nämä kaksi painoarvoa summautuvat 100 %:iin – olet aina interpoloimassa oman datasi ja priorin välillä. Ainoa kysymys on, kuinka paljon kumpaakin. Kun v on pieni suhteessa m:ään, priori hallitsee. Kun v on suuri suhteessa m:ään, omat arvostelusi hallitsevat.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

Kynnysarvo m on parametri, joka koodaa alustan luottamusvaatimukset. IMDB asettaa m:n arvoon noin 25 000 ääntä Top 250 -laskelmassaan. Naapuruston kahvila Googlessa ei kilpaile samassa tilastollisessa universumissa kuin Avatar, joten m on asetettu paljon alemmaksi – ammattilaiset arvioivat m:n yleensä olevan 5–50 Googlen paikallisissa listauksissa, vaihdellen kategorian ja maantieteellisen markkinan mukaan.

Kategorian keskiarvo C on aliarvostetuin muuttuja. Se ei ole kiinteä globaali vakio. Google laskee C:n lähes varmasti dynaamisesti – kategoria-, kaupunki- ja ehkä hakukontekstikohtaisesti. Hammaslääkäriä San Franciscossa verrataan muihin San Franciscon hammaslääkäreihin, ei Montanan maaseudun ravintoloihin. Tämä tarkoittaa, että Bayesilainen pohjasi on kategoriakohtainen.

Miksi painotetun tähtiluokituksen kaavalla on merkitystä SEO:llesi

Käytännön seuraus on, että ensimmäisten 50 arvostelun saaminen on suhteettoman paljon tärkeämpää kuin arvostelujen 51–150 saaminen. Jokaisella uskottavuuskynnyksen m alapuolella olevalla arvostelulla on ylisuuri vaikutus, koska se siirtää (v/(v+m)) -kerrointa merkittävästi. Arvostelumäärän nostaminen v=5:stä v=10:een kaksinkertaistaa luottamuspainosi. Siirtyminen v=150:stä v=155:een on tuskin mitattavissa.

Tämä selittää vastoin intuitiota olevan mallin, jonka ammattilaiset havaitsevat toistuvasti: yrityksen arvostelumäärä nousee 3:sta 30:een ja sen näytetty luokitus putoaa 5.0:sta 4.6:een – vaikka uudetkin arvostelut olisivat positiivisia. Matematiikka on oikein. Varhainen 5.0 oli Bayesilaista fiktiota. 4.6 on ensimmäinen rehellinen arvio.

Laskennan vaiheittainen läpikäynti

// step_by_step.numerical_walkthrough

Kaksi laskuesimerkkiä, joissa käytetään realistista kategorian keskiarvoa C = 4.1 ja minimikynnystä m = 50. Nämä ovat uskottavia arvioita kohtalaisen kilpailtuun paikalliseen palvelukategoriaan (putkimiehet, hammaslääkärit, autokorjaamot). Syötä eri arvoja mallintaaksesi omaa kategoriaasi.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

Yritys A:lla on täydellinen raakatulos – jokainen arvostelija antoi 5 tähteä. Mutta vain 3 arvostelulla kaava luottaa sen omaan dataan vain 5,7 %. Jäljelle jäävä 94,3 % sen näytetystä tuloksesta tulee kategorian keskiarvosta 4.1. Tulos: 4.15. Ei se 5.0, jonka se näyttäisi ansaitsevan.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

Yritys B:llä on matalampi raakakeskiarvo 4.6 – jotkut arvostelijat antoivat 3 tai 4 tähteä. Mutta 120 arvostelua tarkoittaa, että kaava luottaa sen omaan dataan 70,6 %. Sen näytetty tulos 4.45 on paljon lähempänä todellisuutta, ja Googlen algoritmi sijoittaa sen korkeammalle kuin yritys A:n nimellisen 5.0:n. Volyymi ansaitsee uskottavuutta. Uskottavuus ansaitsee näkyvyyttä.

Simulaatio: Naiivi keskiarvo vs. Bayesilainen painotettu luokitus

// simulation.naive_vs_bayesian_comparison

Alla oleva taulukko soveltaa kaavaa kuuteen skenaarioon, joissa C = 4.1 ja m = 50. Delta-sarake näyttää, kuinka paljon Bayesilainen tulos eroaa naiivista keskiarvosta. Huomaa, kuinka ero pienenee arvostelumäärän kasvaessa – se on priorin vaikutuksen heikkenemistä todisteiden kertyessä.

Bayesilaisen painotetun luokituksen simulaatio
m = 50, C = 4.1 (arvioitu kategorian keskiarvo). Kaikki laskelmat käyttävät kaavaa WR = (v/(v+m))×R + (m/(v+m))×C
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

Mielenkiintoisin rivi on viimeinen: yritys, jolla on vain 5 arvostelua mutta kamala 2.0:n raakakeskiarvo, näyttääkin tuloksen 3.85 – kategorian keskiarvo on vetänyt sitä ylös lähes kaksi täyttä tähteä. Tämä on tarkoituksellista. Järjestelmä kieltäytyy tuomitsemasta yritystä unohdukseen viiden datapisteen perusteella. Se suojaa kohti keskiarvoa, kunnes otos on riittävän suuri oikeuttamaan luottamuksen.

Tämä negatiivisten poikkeamien vaimennusvaikutus on syy, miksi arvostelupommitus – koordinoitu väärennettyjen negatiivisten arvostelujen kampanja – on vähemmän katastrofaalinen kuin miltä se pinnalta näyttää. Algoritmi vastustaa äärimmäisiä tuloksia, kun arvostelumäärä on riittämätön oikeuttamaan ne. Toisaalta Googlen poikkeamien havaitsemisjärjestelmät merkitsevät myös nopean vauhdin arvostelukampanjat molempiin suuntiin.

3D-hajontakaavion visualisointi, joka näyttää arvosteludatapisteiden lähenevän keskiarvoviivaa määrän kasvaessa – Bayesilaisen päättelyn konvergenssi smaragdin ja syaanin väreissä
// kuva_02 — Hajonnan konvergenssi: datan kertyessä arvio lähenee todellista keskiarvoa. Jokainen lisäarvostelu pienentää varianssia. Priorin (vaakasuora katkoviiva) veto heikkenee v/m-suhteen kasvaessa.

Googlen lisäkerrokset peruskaavan lisäksi

// google_specific.beyond_bayesian_math

Bayesilainen kaava selittää peruslinjan, mutta Googlen todellinen järjestelmä lisää vähintään kolme kerrosta lisää: ajallinen heikkeneminen, arvostelijan luotettavuuspisteytys ja poikkeamien vaimennus nopeuspiikeille. Mitään näistä ei ole vahvistettu virallisesti. Kaikki on päätelty käyttäytymiseen perustuvista todisteista ja patenttianalyysistä.

Ajattele Bayesilaista peruskaavaa perustana. Kaikki sen päälle rakennettu tekee signaalista vastustuskykyisemmän manipuloinnille ja ajallisesti tarkemman. Tavoite on aina sama: saada näytetty luokitus vastaamaan sitä, mitä asiakas aidosti kokisi, jos hän astuisi sisään tänään.

Ajallinen painotus – miksi viimeiset 90 päivääsi hallitsevat

Google soveltaa ajallista heikkenemistä arvosteluihin, antaen enemmän painoarvoa tuoreelle palautteelle kuin vanhemmille merkinnöille. Mekanismi on yhdenmukainen eksponentiaalisen heikkenemisfunktion kanssa, jossa arvostelun vaikutus vähenee ajan myötä sen sijaan, että se putoaisi nollaan jollakin tiukalla rajapäivämäärällä.[1]

Yhteisön analyysit Googlen luokituskäyttäytymisestä osoittavat jatkuvasti, että yli 12–18 kuukautta sitten julkaistuilla arvosteluilla on noin 30–50 % vähemmän vaikutusta kuin viime viikolla julkaistulla arvostelulla. Kolme vuotta vanha 5 tähden arvostelu lasketaan yhä mukaan – se vain lasketaan pienemmällä painoarvolla. Tämä tarkoittaa, että yritys, joka keräsi 80 arvostelua vuonna 2022 eikä ole saanut sen jälkeen yhtään, elää lainatulla signaalilla.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Arvostelijan luotettavuus – miksi tason 7 Local Guide -oppaan arvostelu iskee kovempaa

Googlen luottamushierarkia arvostelijoille on päätelty sen patenttisalkusta ja havaittavasta käyttäytymisestä. Patentti US8818995B1 kuvaa hakusijoitusjärjestelmää, joka painottaa panoksia niiden tekijän luottamustason mukaan. Sovellettuna arvosteluihin: tason 7 Local Guide, jolla on satoja yksityiskohtaisia arvosteluja useista yrityskategorioista, rekisteröityy korkean luottamuksen solmuksi.[2]

Käytännön vaikutus: tason 7 Local Guide -oppaan 5 tähden arvostelu painotetaan todennäköisesti raskaammin kuin eilen luodun tilin, jolla ei ole arvosteluhistoriaa, 5 tähden arvostelu. Kyse ei ole tähtiarvosta – molemmat lasketaan 5:ksi osoittajassa. Mutta kullekin ennen keskiarvon laskemista sovellettava painoarvo eroaa. Google ei ole koskaan julkisesti määrittänyt tätä eroa.

Poikkeamien vaimennus – mitä tapahtuu, kun 40 arvostelua saapuu viikossa

Nopeuspiikit laukaisevat erillisen tunnistuskerroksen. Jos yritys saa 40 arvostelua 72 tunnissa, kun sen perustaso on 2–3 kuukaudessa, Googlen järjestelmät merkitsevät tämän mallin. Seurauksena ei ole automaattinen poisto – se on karanteeni. Uudet arvostelut lakkaavat näkymästä näytetyssä määrässä ja luokituksessa, kun järjestelmä tutkii asiaa.[3]

Tämä mekanismi selittää, miksi yritykset, jotka ostavat arvostelukampanjoita massoittain, eivät usein näe näkyvää parannusta – tai näkevät profiilinsa luokitusten väliaikaisesti laskevan, kun vanhemmat aidot arvostelut pysyvät näkyvissä, mutta uusi erä on arvostelulimbossa. Algoritmi on erityisesti viritetty epäluottamaan äkillisiä volyymin muutoksia, jotka poikkeavat vakiintuneista perustasoista.

Ennen ja jälkeen: Mitä arvostelumäärä todella muuttaa

// practical_impact.before_and_after_scenarios

Kaksi tosielämän kaltaista skenaariota havainnollistamaan, miten kaava käyttäytyy ajan myötä. Kumpikaan ei ole kuvitteellinen – nämä mallit esiintyvät toistuvasti maineenhallinnan ammattilaisten tapaustutkimuksissa.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTVastoin intuitiota oleva tulos: luokitus putosi naiivista 4.9:stä näytettyyn 4.58:aan, mutta silti Bayesilainen tulos parani +0,37 pistettä. Näytetty luku on nyt rehellinen. Aiemmin 4.9 oli tilastollista fiktiota, jota tuki 8 datapistettä. Nyt 4.58 on luotettava signaali, johon Google luottaa – ja sijoittaa sen mukaisesti.

Hammaslääkäriskenaario osoittaa Bayesilaisen luokituksen ydinajatuksen: matalampi raakakeskiarvo korkealla luottamuksella voittaa korkeamman raakakeskiarvon matalalla luottamuksella. Näytetty tulos laski (nimellisestä 4.9:stä näytettyyn 4.58:aan), mutta sijoitus parani, koska luottamuspaino on nyt todellinen.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTPoikkeamien havaitseminen vähentää tehollisen näkyvän arvostelumäärän 200:sta noin 160:een. Yhdistettynä ajalliseen heikkenemiseen (piikin aikaiset arvostelut vanhenevat), Bayesilainen tulos laskee, vaikka raakakeskiarvo pysyy samana. Luonnollinen tahti – 10 arvostelua viikossa 20 viikon ajan – tuottaa olennaisesti parempia tuloksia kuin 200 yhdellä rykäisyllä.

Ravintolan piikkiskenaario havainnollistaa, miksi orgaanisella tahdilla on väliä. Googlen järjestelmät on kalibroitu havaitsemaan luonnotonta nopeutta. Neljäkymmentä arvostelua viikossa, jota seuraa kahden kuukauden hiljaisuus, ei ainoastaan näytä epäilyttävältä – vaimennettu tehollinen määrä tarkoittaa, että käytit rahaa ja sait tuskin mitään. Matematiikka rankaisee siitä kahdesti: poikkeamien havaitseminen vähentää näkyvää määrää, ja ajallinen heikkeneminen tarkoittaa, että piikin aikaiset arvostelut alkavat haalistua välittömästi.

Vaihtoehtoiset lähestymistavat: Wilsonin pisteet ja Dirichlet'n mallit

// related_approaches.wilson_score_dirichlet

Bayesilainen keskiarvoistaminen ei ole ainoa tilastollisesti pätevä lähestymistapa. Evan Millerin vuoden 2009 essee 'How Not to Sort by Average Rating' popularisoi toisen menetelmän: Wilsonin pisteiden luottamusvälin alarajan. Reddit otti sen käyttöön kommenttien sijoittamiseen. Yelp käyttää siitä muunnelmaa.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

Wilsonin pisteet kysyvät eri kysymyksen kuin Bayesilainen keskiarvoistaminen. Sen sijaan, että se kysyisi 'sekoita datani prioriin', se kysyy: 'annettujen arvostelujen perusteella, mikä on todennäköisesti huonoin todellinen laatu 95 %:n luottamuksella?' Tämä tuottaa konservatiivisen arvion, joka rankaisee epävarmuudesta jopa aggressiivisemmin kuin Bayesilainen keskiarvoistaminen hyvin pienillä arvostelumäärillä.

Kolmas lähestymistapa – Dirichlet-Multinomimalli – käsittelee kaikkia viittä tähtiarvoa erillisinä kategorioina yhden jatkuvan pistemäärän sijaan. District Data Labs dokumentoi tämän lähestymistavan monitähtijärjestelmille. Se on matemaattisesti oikeampi kuin IMDB:n kaava (joka implisiittisesti käsittelee tähtiä lineaarisena asteikkona), mutta laskennallisesti raskaampi. Käytännön tarkoituksiin käyttäytymisero Bayesilaisen keskiarvoistamisen ja Dirichlet'n mallin välillä muuttuu merkityksettömäksi noin 30 arvostelun yläpuolella.

Matemaattisia merkintöjä ja tilastollisia kaavoja – Wilsonin pisteet ja Bayesilainen priori visualisoituna hohtavina yhtälöinä tummalla taustalla, abstraktia tieteellistä taidetta
// kuva_03 — Wilsonin pisteiden alaraja vs. Bayesilainen keskiarvo identtisillä raakasuhteilla. Kun n=5, Wilson on konservatiivisempi (rankaisee epävarmuudesta kovemmin). Kun n=100, molemmat lähenevät 0,02 pisteen sisällä toisistaan. Menetelmän valinta on tärkeintä kriittisessä varhaisten arvostelujen ikkunassa.

Mitä tämä tarkoittaa yrityksesi strategialle

// strategic_implications.for_business_owners

Matematiikan ymmärtäminen muuttaa abstraktin neuvon ('hanki lisää arvosteluja') mitattavaksi strategiaksi. Jokainen yritys on jossain v/(v+m) -spektrillä. Tietäen missä olet, tiedät kuinka paljon seuraava arvostelusi todella vaikuttaa.

Jos v = 8 ja m = 50, yksi uusi 5 tähden arvostelu siirtää luottamuspainoasi 8/58 = 0,138:sta 9/59 = 0,153:een. Tämä 1,5 prosenttiyksikön muutos on merkittävä. Jos v = 300 ja m = 50, sama arvostelu siirtää sinut 300/350 = 0,857:stä 301/351 = 0,858:aan – tuskin havaittavissa. Volyymilla varhaisessa ikkunassa on kymmenkertainen matemaattinen vaikutus verrattuna volyymiin suuressa mittakaavassa.

Kuinka laskea painotettu keskimääräinen tähtiluokitus omalle yrityksellesi

Voit suorittaa kaavan itse laskentataulukossa. Ota nykyinen arvostelumääräsi v:ksi. Arvioi kategoriasi m katsomalla, mitä arvostelumääriä Google Maps -kategoriasi top-3-yritykset ylläpitävät – kyseisen jakauman 25. persentiili on kohtuullinen m-arvio. Nykyinen näytetty luokituksesi on todennäköisesti jo WR-tulos; naiivi keskiarvosi on yksinkertainen summa jaettuna määrällä taustajärjestelmässäsi.

Laskelma, josta sinun tulisi välittää, on seuraavien N arvostelun marginaalivaikutus. Mallinna se: lisää v:tä 10:llä, laske WR uudelleen, tarkkaile eroa. Tee tämä useilla v:n arvoilla rakentaaksesi herkkyyskäyrän. Sen käyrän jyrkin osa – jossa jokainen lisäarvostelu tuottaa suurimman WR-parannuksen – on se, mihin sinun tulisi keskittää arvostelujen hankintaponnistelusi.

Miksi ajantasaisuus tarkoittaa, että arvostelunopeus on tärkeämpää kuin kokonaismäärä

Kun ymmärrät ajallisen heikkenemisen, optimointikohde muuttuu. Kyse ei ole vain kokonaisvolyymista – kyse on ajallisesti jaetusta volyymista. Yritys, jolla on 400 arvostelua kerättynä viiden vuoden aikana eikä yhtään viimeisten 18 kuukauden aikana, toimii tehokkaasti pienemmällä otoksella kuin numerot antavat ymmärtää. Heikentyneet arvostelut vaikuttavat vähemmän juoksevaan painotettuun keskiarvoon.

Johdonmukainen arvostelujen tuottaminen – jopa vaatimattomalla tahdilla – kasvaa korkoa korolle ajan myötä tavoilla, joihin rykäisyhankinta ei koskaan pysty. Kahdeksan uutta arvostelua kuukaudessa kahdentoista kuukauden ajan päihittää 96 arvostelua yhdessä kuukaudessa lähes kaikilla relevanteilla mittareilla: Bayesilainen luottamus, poikkeamien havaitsemisen läpäisy, ajallisen heikkenemisen kehityskaari ja kuluttajien uskottavuuskäsitys.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Usein kysytyt kysymykset

// faq.frequently_asked_questions

01Miten Googlen tähtiluokitukset lasketaan?

Google käyttää Bayes-vaikutteista painotettua kaavaa yksinkertaisen aritmeettisen keskiarvon sijaan. Korkean luottamuksen arvostelijoiden (Local Guides, tilit joilla on vahvistettu historia) arvosteluilla on enemmän painoarvoa. Tuoreet arvostelut painotetaan ylöspäin ajallisen heikkenemisen kautta. Kaava ankkuroi vähän arvosteluja saaneet yritykset niiden kategorian keskiarvoon, vetäen luokituksia kohti prioria, kunnes riittävästi todisteita on kertynyt.

02Vaikuttaako yksi arvostelu Google-keskiarvoosi enemmän kuin toinen?

Kyllä, kahdella tavalla. Ensinnäkin, pieni arvostelumäärä tarkoittaa, että jokainen uusi arvostelu muuttaa luottamuskerrointa merkittävästi – ensimmäiset 50 arvosteluasi ovat tärkeämpiä arvostelua kohden kuin arvostelut 200–250. Toiseksi, arvostelijan luotettavuuspisteytys tarkoittaa, että tason 7 Local Guide -oppaan, jolla on yli 1000 arvostelua, arvostelulla on todennäköisesti enemmän painoarvoa keskiarvokaavassa kuin upouuden tilin arvostelulla.

03Kuinka monta arvostelua tarvitaan, ennen kuin Google-luokituksesi vakiintuu?

Vakiintuminen Bayesilaisessa mielessä tapahtuu, kun v >> m – karkeasti, kun arvostelumääräsi on 3–5 kertaa minimikynnyksen suuruinen. Useimmissa paikallisissa yrityskategorioissa se on noin 50–150 arvostelua. Sen jälkeen Bayesilainen veto kohti kategorian keskiarvoa on niin heikko, että näytetty tuloksesi seuraa läheisesti todellista keskiarvoasi.

04Mikä on painotettu tähtiluokitus ja miten se toimii?

Painotettu tähtiluokitus säätää kunkin arvostelun vaikutusta kokonaispistemäärään perustuen muihin tekijöihin kuin pelkkään tähtiarvoon: kuinka monta arvostelua on yhteensä (luottamuspainotus), kuinka tuore arvostelu on (ajallinen heikkeneminen) ja kuka sen kirjoitti (arvostelijan luotettavuus). Tuloksena on pistemäärä, joka on vastustuskykyisempi manipuloinnille ja tilastollisesti merkityksellisempi kuin yksinkertainen keskiarvo.

05Miksi Google-luokitukseni on erilainen kuin Yelp- tai TripAdvisor-luokitukseni?

Jokainen alusta käyttää erilaista algoritmia, jossa on erilaiset parametriarvot minimikynnykselle, erilaiset luottamushierarkiat arvostelijoille ja erilaiset ajallisen heikkenemisen asteet. FTC:n ekonomistien tutkimus havaitsi, että Googlen luokitukset ovat keskimäärin noin 1,25 tähteä korkeampia kuin vastaavat BBB-luokitukset. Yelpin algoritmi on huomattavasti tiukempi – se suodattaa enemmän arvosteluja 'suositeltujen' järjestelmänsä kautta, mikä yleensä tuottaa matalampia mutta konservatiivisempia keskiarvoja.

06Miten Google laskee tähtiluokituksen uusille yrityksille, joilla on vähän arvosteluja?

Uusien yritysten, joilla on vähemmän arvosteluja kuin minimikynnys (m), pisteet on vahvasti ankkuroitu kategorian keskiarvoon. Uusi ravintola, jolla on 3 arvostelua keskiarvolla 5.0, saattaa näyttää vain 4.1–4.3, koska Bayesilainen paino sen omalle datalle on vain 5–10 %. Tämä on matemaattisesti oikein – 3 datapistettä ei voi luotettavasti arvioida todellista laatutasoa.

07Vaikuttaako arvostelun pituus tai sisältö siihen, miten Google painottaa arvostelua?

Laadullisesti kyllä – Googlen järjestelmät analysoivat arvostelutekstiä tunnetilan, avainsanasignaalien ja laatuindikaattoreiden varalta. Yksityiskohtainen 200 sanan arvostelu, jossa mainitaan tiettyjä palvelukokemuksia, saa todennäköisesti korkeammat pisteet laatusignaaleista kuin 5 tähden arvostelu ilman tekstiä. Kuitenkaan tarkkaa kvantitatiivista suhdetta arvostelutekstin laadun ja numeerisen painotuskertoimen välillä ei ole julkisesti dokumentoitu.

08Mikä on Bayesilaisen keskiarvon kaava ja milloin minun pitäisi käyttää sitä?

Kaava on WR = (v/(v+m)) × R + (m/(v+m)) × C. Käytä sitä aina, kun sinun tarvitsee asettaa kohteita laadun mukaan paremmuusjärjestykseen, kun niillä on hyvin erilaiset arvostelumäärät. Se on standardilähestymistapa tuotesuositusjärjestelmissä, sisällön sijoituksissa ja yritysten luokitusalustoilla. Tärkein kalibroitava parametri on m – liian matala, eikä se suojaa poikkeamilta; liian korkea, ja lailliset uudet tulokkaat tukahdutetaan pysyvästi.

09Miten Googlen tähtiluokitusalgoritmi käsittelee arvostelupiikkejä ja väärennettyjä arvosteluja?

Googlen poikkeamien havaitseminen toimii itsenäisesti Bayesilaisesta kaavasta. Kun nopeuspiikkejä havaitaan – tyypillisesti 10–20 kertaa yrityksen normaali viikoittainen arvostelumäärä – uudet arvostelut siirtyvät karanteenitilaan, jossa ne ovat näkyvissä yrittäjälle, mutta niitä ei lasketa julkisiin luokituksiin. Tekoälyn ja manuaalisten tarkistusten läpäisevät arvostelut vapautuvat lopulta karanteenista; ne, jotka eivät läpäise, poistetaan ilman ilmoitusta.

10Miten saada Googleen 5 tähden luokitus, joka todella pysyy?

Jatkuvasti korkeat luokitukset vaativat tasaista arvostelunopeutta, eivät kertaluonteista hankintaa. Kaava palkitsee volyymista ajan mittaan: 10 aitoa arvostelua kuukaudessa 12 kuukauden ajan tuottaa vakaamman, korkeamman sijoituksen saavan tuloksen kuin 120 arvostelua yhdessä kuukaudessa. Keskity luonnolliseen arvostelujen tuottamiseen oston jälkeisellä seurannalla, QR-koodeilla palvelupisteessä ja muistutuksilla sähköpostivirroissa – kaikki Googlen käytäntöjen mukaisesti.

Tähtiluokitukset eivät ole sitä, miltä ne pinnalta näyttävät. Googlen näyttämä luku on tilastollisen mallin tulos, joka on suunniteltu vastustamaan manipulointia, ottamaan huomioon epävarmuuden ja palkitsemaan johdonmukaisesta laadusta ajan myötä. Matematiikan ymmärtäminen ei vaadi tilastotieteen tutkintoa – se vaatii hyväksymään, että kolme 5 tähden arvostelua eivät ole samanarvoisia kuin 120 aitoa arvostelua keskiarvolla 4.6. Kaava tekee sen selväksi. Se, mitä teet tällä oivalluksella, on strategiaa.

Miten se toimiiHinnastoUKK
// the_math_favors_volume

Luokituksesi on matemaattinen ongelma. Voimme auttaa ratkaisemaan sen.

Bayesilainen kaava palkitsee ajan myötä kertyneestä arvostelumäärästä. Jokainen tänään tuottamasi arvostelu siirtää luottamuspainoasi oikeaan suuntaan – ja vaikutus kasvaa korkoa korolle.

Aloita arvostelumäärän kasvattaminen