🔥 Begrenset tid: 10% RABATT på alle bestillinger — bruk kode STAR10Benytt →
Live10,847 anmeldelser levert til dags dato7 bestillinger lagt inn i dagNeste levering om ~2 timer
dybdeanalyse20. april 2026·blogPost.bayesianStarRatingMath.readTime min read

Hvordan Google faktisk beregner din stjernerangering (det er ikke et gjennomsnitt)

Den Bayesianske matematikken bak vektede anmeldelser, verditap over tid, og hvorfor din viste rangering nesten helt sikkert avviker fra ditt aritmetiske gjennomsnitt – forklart med ekte formler og utregninger.

Abstrakt visualisering av Bayesiansk stjernerangerings-matematikk – sannsynlighetsfordelinger som lyser i cyan og smaragdgrønt på en mørk marineblå bakgrunn, med flytende matematiske notasjoner
Q
Quick Answers
Bruker Google et enkelt gjennomsnitt for å beregne stjernerangeringer?
Nei. Google bruker en Bayesiansk-inspirert vektet formel som trekker rangeringer mot kategoriens gjennomsnitt når antall anmeldelser er lavt. En bedrift med 3 anmeldelser med 5,0 vil vise en lavere effektiv rangering enn en med 120 anmeldelser med 4,6.
Hva er den Bayesianske gjennomsnittsformelen for rangeringer?
WR = (v/(v+m)) × R + (m/(v+m)) × C — der v er antall anmeldelser, m er en minimumsterskel, R er ditt rå gjennomsnitt, og C er kategoriens gjennomsnitt. Etter hvert som v øker, dominerer ditt eget gjennomsnitt.
Hvor mange Google-anmeldelser trenger du før rangeringen din stabiliseres?
Omtrent 50–100 anmeldelser, avhengig av gjennomsnittlig anmeldelsesvolum i din kategori. Under denne terskelen er den Bayesianske trekkraften mot det globale gjennomsnittet sterk nok til å undertrykke selv en perfekt score.
Hvorfor teller nyere anmeldelser mer for min Google-rangering?
Google bruker nyhetsvekting – anmeldelser publisert de siste 90 dagene har betydelig mer innflytelse enn anmeldelser fra 18+ måneder siden. Dette er uavhengig av den Bayesianske prioren og belønner bedrifter som genererer en jevn strøm av anmeldelser.

Her er noe de fleste bedriftseiere oppdager på den harde måten: du kan samle tjue femstjerners anmeldelser på rad og se at din viste rangering knapt beveger seg. Eller verre – du bruker seks måneder på å forbedre tjenesten din, når endelig 50 anmeldelser, og innser at ditt 4,8-gjennomsnitt på en eller annen måte har landet på 4,3 på Google Maps. Regnestykket er ikke feil. Det fungerer nøyaktig som designet. Du ble bare ikke fortalt hva designet var.

Google har aldri publisert sin rangeringsalgoritme. Men mellom IMDBs offentlig dokumenterte Bayesianske formel, Algolias rangeringsdokumentasjon, akademisk forskning på anmeldelsessystemer og årevis med praksis hvor eksperter har dekonstruert synlige rangeringsendringer, er mekanismene godt forstått. Denne artikkelen går gjennom matematikken – skikkelig, med ekte tall.

Problemet med naive gjennomsnitt

// naive_average.failure_modes

La oss starte med hva et naivt gjennomsnitt er og hvorfor det ikke fungerer. Det aritmetiske gjennomsnittet av et sett med rangeringer er rett og slett summen delt på antallet. Tre anmeldelser med 5, 4 og 5 gir (5+4+5)/3 = 4,67. Det er matematisk korrekt. Det er også statistisk misvisende når målet er å rangere tusenvis av bedrifter mot hverandre.

Naivt gjennomsnitt – Svakheter
1 anmeldelse med 5,0 rangerer høyere enn 500 anmeldelser med 4,8 – utvalgsstørrelsen ignoreres
Nye bedrifter med falske anmeldelser dominerer rangeringer for nykommere
Rangeringen blåses opp ved lavt volum, og faller når negative anmeldelser samles opp i stor skala
Ingen straff for mistenkelige hopp i anmeldelsesfrekvens – designet for å kunne manipuleres
Bayesiansk vekting – Løsninger
Bedrifter med få anmeldelser trekkes mot kategoriens gjennomsnitt – avvik undertrykkes
Høyt anmeldelsesvolum bygger tillit – scoren konvergerer mot et ekte kvalitetssignal
Nyhetsvekting holder scoren aktuell – 18 måneder gamle anmeldelser mister verdi
Tillitsscore for bidragsytere reduserer vekten fra mistenkelige eller lite aktive kontoer

Svakhetene blir raskt tydelige i stor skala. En restaurant som åpnet forrige uke med tre anmeldelser fra entusiastiske venner, vil score høyere enn en etablert konkurrent med 200 anmeldelser og et gjennomsnitt på 4,4 – selv om den etablerte bedriften representerer et dramatisk mer pålitelig signal. Ethvert rangeringssystem som tillater dette, vil bli manipulert til det er irrelevant i løpet av måneder.

Hvordan beregning av Google stjernerangering fungerer i praksis

Tenk på Bayesiansk rangering som et konfidensvektet gjennomsnitt. Når du har veldig få anmeldelser, stoler ikke systemet nok på utvalget ditt til å vise det som det er. I stedet blander det ditt rå gjennomsnitt med en prior – en standardforventning basert på alle lignende bedrifter. Jo flere anmeldelser du samler, jo mer stoler systemet på dine egne data, og jo mindre betyr prioren.

IMDB bruker nøyaktig denne tilnærmingen for sin Topp 250-liste og har dokumentert formelen offentlig: WR = (v/(v+m)) × R + (m/(v+m)) × C. Variablene er elegant enkle, men implikasjonene for atferd tar litt tid å forstå fullt ut. Den samme matematiske strukturen finnes i Algolias rangeringsdokumentasjon, akademisk litteratur om anmeldelsessystemer og i dekonstruksjonsarbeidet utført av SEO-eksperter som studerer Googles lokale rangering.

Sannsynlighetsfordelingskurver som viser hvordan Bayesiansk prior-tro endres når antall anmeldelser øker – matematisk kunst i marineblå og cyan-toner
// fig_01 – Prior-tro (flat fordeling, lavt antall) konvergerer mot posterior etter hvert som bevis akkumuleres. Bayesiansk inferens anvendt på stjernerangeringer oppfører seg identisk med ethvert annet estimeringsproblem: mer data = smalere konfidensintervall = mindre regresjon mot gjennomsnittet.

Den Bayesianske gjennomsnittsformelen, forklart

// bayesian_average.formula_derivation

Formelen WR = (v/(v+m)) × R + (m/(v+m)) × C er en vektet blanding av to størrelser: din bedrifts eget observerte gjennomsnitt (R) og gjennomsnittet for hele kategorien (C). Vekten bestemmes av hvor mange anmeldelser du har (v) i forhold til en minimumsterskel for troverdighet (m).

Legg merke til at (v/(v+m)) + (m/(v+m)) alltid er lik 1,0. Disse to vektene summerer seg til 100 % – du interpolerer alltid mellom dine egne data og prioren. Det eneste spørsmålet er hvor mye av hver. Når v er veldig liten i forhold til m, dominerer prioren. Når v er stor i forhold til m, dominerer dine egne anmeldelser.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

Terskelen m er parameteren som koder for plattformens konfidenskrav. IMDB setter m til omtrent 25 000 stemmer for sin Topp 250-beregning. En nabolagskafé på Google konkurrerer ikke i det samme statistiske universet som Avatar, så m settes mye lavere – eksperter anslår generelt at m ligger i området 5 til 50 for lokale Google-oppføringer, og varierer etter kategori og geografisk marked.

Kategoriens gjennomsnitt C er den mest undervurderte variabelen. Det er ikke en fast global konstant. Google beregner nesten helt sikkert C dynamisk – per kategori, per by, kanskje per søkekontekst. En tannlege i Oslo blir målt mot andre tannleger i Oslo, ikke mot restauranter på landsbygda i Finnmark. Dette betyr at din Bayesianske 'gulvverdi' er kategorispesifikk.

Hvorfor den vektede stjernerangeringsformelen er viktig for din SEO

Den praktiske implikasjonen er at det å få dine første 50 anmeldelser betyr uforholdsmessig mye mer enn å få anmeldelsene fra 51 til 150. Hver anmeldelse under troverdighetsterskelen m har en overdimensjonert effekt fordi den forskyver (v/(v+m))-koeffisienten betydelig. Å gå fra v=5 til v=10 dobler din konfidensvekt. Å gå fra v=150 til v=155 er knapt merkbart.

Dette forklarer et kontraintuitivt mønster som eksperter observerer gjentatte ganger: en bedrift går fra 3 til 30 anmeldelser og ser sin viste rangering falle fra 5,0 til 4,6 – selv når de nye anmeldelsene også er positive. Regnestykket er korrekt. Den tidlige 5,0-scoren var Bayesiansk fiksjon. 4,6 er det første ærlige estimatet.

Trinn-for-trinn gjennomgang av beregningen

// step_by_step.numerical_walkthrough

To regneeksempler, som bruker et realistisk gjennomsnitt for kategorien på C = 4,1 og en minimumsterskel på m = 50. Dette er plausible estimater for en moderat konkurranseutsatt lokal tjenestekategori (rørleggere, tannleger, bilverksteder). Sett inn forskjellige verdier for å modellere din egen kategori.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

Bedrift A har en perfekt rå-score – hver anmelder ga 5 stjerner. Men med bare 3 anmeldelser stoler formelen bare 5,7 % på sine egne data. De resterende 94,3 % av den viste scoren kommer fra kategoriens gjennomsnitt på 4,1. Resultat: 4,15. Ikke 5,0 som den ser ut til å fortjene.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

Bedrift B har et lavere rå-gjennomsnitt på 4,6 – noen anmeldere ga 3 eller 4 stjerner. Men 120 anmeldelser betyr at formelen stoler 70,6 % på sine egne data. Den viste scoren på 4,45 er mye nærmere virkeligheten, og vil bli rangert høyere av Googles algoritme enn Bedrift As nominelle 5,0. Volum gir troverdighet. Troverdighet gir synlighet.

Simulering: Naivt gjennomsnitt vs. Bayesiansk vektet rangering

// simulation.naive_vs_bayesian_comparison

Tabellen nedenfor bruker formelen på tvers av seks scenarier med C = 4,1 og m = 50. Delta-kolonnen viser hvor mye den Bayesianske scoren avviker fra det naive gjennomsnittet. Legg merke til hvordan gapet krymper etter hvert som antall anmeldelser øker – det er prioren som mister innflytelse ettersom bevisene samles.

Simulering av Bayesiansk vektet rangering
m = 50, C = 4,1 (estimert gjennomsnitt for kategorien). Alle beregninger bruker WR = (v/(v+m))×R + (m/(v+m))×C
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

Den mest interessante raden er den siste: en bedrift med bare 5 anmeldelser, men et forferdelig rå-gjennomsnitt på 2,0, viser faktisk 3,85 – trukket opp nesten to hele stjerner av kategoriens gjennomsnitt. Dette er med vilje. Systemet nekter å dømme en bedrift til glemsel basert på fem datapunkter. Det sikrer seg mot gjennomsnittet til utvalget er stort nok til å fortjene tillit.

Denne dempende effekten på negative avvik er grunnen til at 'review bombing' – en koordinert kampanje med falske negative anmeldelser – er mindre katastrofal enn den ser ut på overflaten. Algoritmen motstår ekstreme utfall når antall anmeldelser er utilstrekkelig til å rettferdiggjøre dem. Når det er sagt, flagger Googles systemer for avviksdeteksjon også kampanjer med rask anmeldelsesfrekvens i begge retninger.

3D-punktdiagramvisualisering som viser anmeldelsesdatapunkter som konvergerer mot en gjennomsnittslinje etter hvert som antallet øker – Bayesiansk inferenskonvergens i smaragd og cyan
// fig_02 – Punktsky-konvergens: etter hvert som datapunkter akkumuleres, konvergerer estimatet mot det sanne gjennomsnittet. Hver ekstra anmeldelse reduserer variansen. Trekkraften fra prioren (horisontal stiplet linje) svekkes etter hvert som v/m-forholdet øker.

Googles ekstra lag utover grunnformelen

// google_specific.beyond_bayesian_math

Den Bayesianske formelen forklarer grunnlinjen, men Googles faktiske system legger til minst tre lag til: verditap over tid (recency decay), tillitsscore for bidragsytere, og demping av avvik for frekvenshopp. Ingen av disse er offisielt bekreftet. Alle er utledet fra atferdsbevis og patentanalyse.

Tenk på den grunnleggende Bayesianske formelen som fundamentet. Alt som er bygget på toppen av den, gjør signalet mer motstandsdyktig mot manipulasjon og mer nøyaktig over tid. Målet er alltid det samme: å få den viste rangeringen til å gjenspeile hva en kunde genuint ville oppleve hvis de kom inn i dag.

Nyhetsvekting – hvorfor de siste 90 dagene dominerer

Google bruker et tidsmessig verditap på anmeldelser, og gir mer vekt til nylig feedback enn eldre innlegg. Mekanismen er i tråd med en eksponentiell forfallsfunksjon, der en anmeldelses innflytelse reduseres over tid i stedet for å falle til null på en bestemt dato.[1]

Fellesskapsanalyser av Googles rangeringsatferd finner konsekvent at anmeldelser publisert for mer enn 12–18 måneder siden har omtrent 30–50 % mindre innflytelse enn en anmeldelse publisert forrige uke. En 5-stjerners anmeldelse fra tre år siden telles fortsatt med – den telles bare mindre. Dette betyr at en bedrift som samlet 80 anmeldelser i 2022 og ikke har fått noen siden, lever på et lånt signal.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Bidragsytertillit – hvorfor en anmeldelse fra en Local Guide på nivå 7 treffer hardere

Googles tillitshierarki for anmeldere er utledet fra patentporteføljen og observerbar atferd. Patent US8818995B1 beskriver et søkerangeringssystem som vekter bidrag etter tillitsnivået til enheten som gir dem. Anvendt på anmeldelser: en Local Guide på nivå 7 med hundrevis av detaljerte anmeldelser på tvers av flere bedriftskategorier, registreres som en node med høy tillit.[2]

Den praktiske effekten: en 5-stjerners anmeldelse fra en Local Guide på nivå 7 blir sannsynligvis vektet tyngre enn en 5-stjerners anmeldelse fra en konto opprettet i går uten anmeldelseshistorikk. Dette handler ikke om stjerneverdien – begge teller som 5 i telleren. Men vekten som brukes på hver før gjennomsnittet beregnes, er forskjellig. Google har aldri kvantifisert denne forskjellen offentlig.

Avviksdemping – hva skjer når 40 anmeldelser kommer på en uke

Frekvenshopp utløser et separat deteksjonslag. Hvis en bedrift mottar 40 anmeldelser på 72 timer når normalen er 2–3 per måned, flagger Googles systemer dette mønsteret. Resultatet er ikke automatisk sletting – det er karantene. Nye anmeldelser slutter å vises i det viste antallet og rangeringen mens systemet undersøker.[3]

Denne mekanismen forklarer hvorfor bedrifter som kjøper anmeldelseskampanjer i bulk ofte ikke ser noen synlig forbedring – eller midlertidig ser profilen sin falle i rangering ettersom eldre, autentiske anmeldelser forblir synlige, mens den nye bunken sitter i 'review limbo'. Algoritmen er spesifikt innstilt til å mistro plutselige volumendringer som avviker fra etablerte grunnlinjer.

Før og etter: Hva anmeldelsesvolum faktisk endrer

// practical_impact.before_and_after_scenarios

To realistiske scenarier for å illustrere hvordan formelen oppfører seg over tid. Ingen av dem er fiktive – disse mønstrene dukker opp gjentatte ganger i casestudier fra omdømmeeksperter.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTKontraintuitivt resultat: rangeringen falt fra en naiv 4,9 til en vist 4,58, men den Bayesianske scoren forbedret seg med +0,37 poeng. Det viste tallet er nå ærlig. Før var 4,9 en statistisk fiksjon støttet av 8 datapunkter. Nå er 4,58 et pålitelig signal som Google stoler på – og rangerer deretter.

Tannlege-scenarioet demonstrerer kjerneinnsikten i Bayesiansk rangering: et lavere rå-gjennomsnitt med høy konfidens slår et høyere rå-gjennomsnitt med lav konfidens. Den viste scoren gikk ned (fra en nominell 4,9 til en vist 4,58), men rangeringsposisjonen ble bedre fordi konfidensvekten nå er reell.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTAvviksdeteksjon reduserer det effektive synlige anmeldelsesantallet fra 200 til ~160. Kombinert med verditap over tid (anmeldelser fra 'hoppet' eldes nå), faller den Bayesianske scoren til tross for at rå-gjennomsnittet forblir flatt. Naturlig frekvens – 10 anmeldelser per uke over 20 uker – gir vesentlig bedre resultater enn 200 i ett jafs.

Restaurant-scenarioet illustrerer hvorfor organisk frekvens er viktig. Googles systemer er kalibrert for å oppdage unaturlig hastighet. Førti anmeldelser på en uke, etterfulgt av to måneder med stillhet, ser ikke bare mistenkelig ut – det dempede effektive antallet betyr at du brukte penger og oppnådde nesten ingenting. Matematikken straffer det to ganger: avviksdeteksjonen reduserer det synlige antallet, og verditapet over tid betyr at anmeldelsene fra 'hoppet' begynner å miste verdi umiddelbart.

Alternative tilnærminger: Wilson Score og Dirichlet-modeller

// related_approaches.wilson_score_dirichlet

Bayesiansk gjennomsnittsberegning er ikke den eneste statistisk solide tilnærmingen. Evan Millers essay fra 2009, 'How Not to Sort by Average Rating', populariserte en annen metode: den nedre grensen for Wilson score-konfidensintervallet. Reddit tok det i bruk for kommentarrangering. Yelp bruker en variant av det.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

Wilson score stiller et annet spørsmål enn Bayesiansk gjennomsnittsberegning. I stedet for 'bland mine data med en prior', spør den: 'gitt rangeringene jeg har, hva er den sannsynligvis dårligste sanne kvaliteten med 95 % konfidens?' Dette gir et konservativt estimat som straffer usikkerhet enda mer aggressivt enn Bayesiansk gjennomsnittsberegning for svært lave anmeldelsestall.

En tredje tilnærming – Dirichlet-Multinomial-modellen – behandler alle de fem stjerneverdiene som separate kategorier i stedet for en enkelt kontinuerlig score. District Data Labs dokumenterte denne tilnærmingen for systemer med flere stjerner. Den er matematisk mer korrekt enn IMDB-formelen (som implisitt behandler stjerner som en lineær skala), men er beregningsmessig tyngre. For praktiske formål blir atferdsforskjellen mellom Bayesiansk gjennomsnittsberegning og en Dirichlet-modell ubetydelig over omtrent 30 anmeldelser.

Matematisk notasjon og statistiske formler – Wilson score og Bayesiansk prior visualisert som glødende ligninger på mørk bakgrunn, abstrakt vitenskapelig kunst
// fig_03 – Nedre grense for Wilson score vs. Bayesiansk gjennomsnitt ved identiske rå-proporsjoner. Ved n=5 er Wilson mer konservativ (straffer usikkerhet hardere). Ved n=100 konvergerer begge innenfor 0,02 poeng av hverandre. Valg av metode betyr mest i det kritiske, tidlige anmeldelsesvinduet.

Hva dette betyr for din forretningsstrategi

// strategic_implications.for_business_owners

Å forstå matematikken gjør et abstrakt råd ('få flere anmeldelser') om til en kvantifisert strategi. Hver bedrift befinner seg et sted på v/(v+m)-spekteret. Å vite hvor du er, forteller deg hvor mye din neste anmeldelse faktisk flytter nålen.

Hvis v = 8 og m = 50, flytter en enkelt ny 5-stjerners anmeldelse din konfidensvekt fra 8/58 = 0,138 til 9/59 = 0,153. Denne endringen på 1,5 prosentpoeng er meningsfull. Hvis v = 300 og m = 50, flytter den samme anmeldelsen deg fra 300/350 = 0,857 til 301/351 = 0,858 – knapt merkbart. Volum i det tidlige vinduet har ti ganger den matematiske effekten av volum i stor skala.

Hvordan beregne vektet gjennomsnittlig stjernerangering for din egen bedrift

Du kan kjøre formelen selv i et regneark. Ta ditt nåværende antall anmeldelser som v. Estimer kategoriens m ved å se på hvilket antall anmeldelser de 3 beste bedriftene i din Google Maps-kategori har – 25-persentilen av den fordelingen er et rimelig estimat for m. Din nåværende viste rangering er sannsynligvis allerede WR-resultatet; ditt naive gjennomsnitt er den enkle summen delt på antallet i ditt administrasjonspanel.

Beregningen du bryr deg om, er den marginale effekten av de neste N anmeldelsene. Modeller det: øk v med 10, beregn WR på nytt, og observer deltaet. Gjør dette over en rekke v-verdier for å bygge en følsomhetskurve. Den bratteste delen av kurven – der hver ekstra anmeldelse gir den største WR-forbedringen – er der du bør konsentrere innsatsen for å skaffe anmeldelser.

Hvorfor nyhetsverdi betyr at anmeldelsesfrekvens er viktigere enn totalt antall

Når du forstår verditap over tid, endres optimaliseringsmålet. Det handler ikke bare om totalt volum – det handler om volum fordelt over tid. En bedrift med 400 anmeldelser samlet over fem år og ingenting de siste 18 månedene, opererer i praksis med et mindre effektivt utvalg enn tallene antyder. De gamle anmeldelsene bidrar mindre til det løpende vektede gjennomsnittet.

Jevn generering av anmeldelser – selv i beskjedent tempo – gir en sammensatt effekt over tid på en måte som plutselige anskaffelser aldri gjør. Åtte nye anmeldelser per måned i tolv måneder overgår 96 anmeldelser på en enkelt måned på nesten alle relevante beregninger: Bayesiansk tillit, klarering av avviksdeteksjon, kurven for verditap over tid, og forbrukernes oppfatning av troverdighet.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Ofte stilte spørsmål

// faq.frequently_asked_questions

01Hvordan beregnes Google stjernerangeringer?

Google bruker en Bayesiansk-inspirert vektet formel i stedet for et enkelt aritmetisk gjennomsnitt. Anmeldelser fra bidragsytere med høy tillit (Local Guides, kontoer med verifisert historikk) veier tyngre. Nylige anmeldelser vektes opp via tidsmessig verditap. Formelen forankrer bedrifter med få anmeldelser til gjennomsnittet i sin kategori, og trekker rangeringer mot en prior inntil tilstrekkelig bevis er samlet.

02Påvirker én anmeldelse ditt Google-gjennomsnitt mer enn en annen?

Ja, på to måter. For det første betyr et lavt antall anmeldelser at hver nye anmeldelse endrer konfidenskoeffisienten betydelig – dine første 50 anmeldelser betyr mer per anmeldelse enn anmeldelsene fra 200–250. For det andre betyr tillitsscore for bidragsytere at en anmeldelse fra en Local Guide på nivå 7 med 1000+ anmeldelser sannsynligvis veier tyngre i gjennomsnittsformelen enn en anmeldelse fra en helt ny konto.

03Hvor mange anmeldelser kreves det før Google-rangeringen din stabiliseres?

Stabilisering i Bayesiansk forstand skjer når v >> m – altså når antall anmeldelser er 3–5 ganger minimumsterskelen. For de fleste lokale bedriftskategorier er dette omtrent 50–150 anmeldelser. Utover det punktet er den Bayesianske trekkraften mot kategoriens gjennomsnitt svak nok til at din viste score følger tett ditt faktiske gjennomsnitt.

04Hva er en vektet stjernerangering og hvordan fungerer den?

En vektet stjernerangering justerer hver anmeldelses bidrag til den totale scoren basert på faktorer utover selve stjerneverdien: hvor mange anmeldelser som finnes totalt (konfidensvekting), hvor nylig anmeldelsen er (tidsmessig verditap), og hvem som skrev den (bidragsytertillit). Resultatet er en score som er mer motstandsdyktig mot manipulasjon og mer statistisk meningsfull enn et enkelt gjennomsnitt.

05Hvorfor er min Google-rangering annerledes enn min Yelp- eller TripAdvisor-rangering?

Hver plattform bruker en ulik algoritme med forskjellige parameterverdier for minimumsterskelen, ulike tillitshierarkier for anmeldere, og forskjellige rater for tidsmessig verditap. Forskning fra FTC-økonomer fant at Google-rangeringer i gjennomsnitt er omtrent 1,25 stjerner høyere enn tilsvarende BBB-rangeringer. Yelps algoritme er spesielt streng – den filtrerer ut flere anmeldelser gjennom sitt 'anbefalte'-system, noe som har en tendens til å produsere lavere, men mer konservative gjennomsnittsscorer.

06Hvordan beregner Google stjernerangering for nye bedrifter med få anmeldelser?

Nye bedrifter med færre anmeldelser enn minimumsterskelen (m) får sin score sterkt forankret i kategoriens gjennomsnitt. En ny restaurant med 3 anmeldelser og et gjennomsnitt på 5,0 kan vise bare 4,1–4,3 fordi den Bayesianske vekten på egne data bare er 5–10 %. Dette er matematisk korrekt – 3 datapunkter kan ikke gi et pålitelig estimat av en sann kvalitetsscore.

07Påvirker lengden eller innholdet i en anmeldelse hvordan Google vekter den?

Kvalitativt, ja – Googles systemer analyserer anmeldelsesteksten for sentiment, søkeordssignaler og kvalitetsindikatorer. En detaljert anmeldelse på 200 ord som nevner spesifikke serviceopplevelser, scorer sannsynligvis høyere på kvalitetssignaler enn en 5-stjerners anmeldelse uten tekst. Imidlertid er det nøyaktige kvantitative forholdet mellom kvaliteten på anmeldelsesteksten og den numeriske vektingskoeffisienten ikke offentlig dokumentert.

08Hva er den Bayesianske gjennomsnittsformelen, og når bør jeg bruke den?

Formelen er WR = (v/(v+m)) × R + (m/(v+m)) × C. Bruk den når du trenger å rangere elementer etter kvalitet når disse elementene har vidt forskjellig antall anmeldelser. Det er standardtilnærmingen for produktanbefalingssystemer, innholdsrangering og bedriftsrangeringsplattformer. Nøkkelparameteren å kalibrere er m – for lav, og den gir ingen beskyttelse mot avvik; for høy, og legitime nykommere blir permanent undertrykt.

09Hvordan håndterer Googles stjernerangeringsalgoritme anmeldelseshopp og falske anmeldelser?

Googles avviksdeteksjon kjører uavhengig av den Bayesianske formelen. Når frekvenshopp oppdages – typisk 10–20 ganger en bedrifts normale ukentlige anmeldelsesrate – går nye anmeldelser inn i en karantenetilstand der de er synlige for bedriftseieren, men ikke telles med i offentlige rangeringer. Anmeldelser som passerer AI- og manuelle kontroller, kommer til slutt ut av karantene; de som ikke gjør det, fjernes uten varsel.

10Hvordan får man en 5-stjerners rangering på Google som faktisk varer?

Vedvarende høye rangeringer krever jevn anmeldelsesfrekvens, ikke en engangsinnsats. Formelen belønner volum over tid: 10 autentiske anmeldelser per måned i 12 måneder gir en mer stabil, høyere rangert score enn 120 anmeldelser på en enkelt måned. Fokuser på naturlig generering av anmeldelser gjennom oppfølging etter kjøp, QR-koder ved tjenestestedet og påminnelser i e-postflyt – alt innenfor Googles retningslinjer.

Stjernerangeringer er ikke hva de ser ut til å være på overflaten. Tallet Google viser er resultatet av en statistisk modell designet for å motstå manipulasjon, ta hensyn til usikkerhet og belønne jevn kvalitet over tid. Å forstå matematikken krever ikke en grad i statistikk – det krever at man aksepterer at tre 5-stjerners anmeldelser ikke er verdt det samme som 120 autentiske anmeldelser med et gjennomsnitt på 4,6. Formelen gjør dette eksplisitt. Hva du gjør med denne innsikten, er strategien.

Slik fungerer detPriserFAQ
// the_math_favors_volume

Din rangering er et matteproblem. Vi kan hjelpe deg med å løse det.

Den Bayesianske formelen belønner anmeldelsesvolum som er samlet over tid. Hver anmeldelse du genererer i dag, flytter konfidensvekten din i riktig retning – og effekten forsterkes.

Begynn å bygge anmeldelsesvolum