🔥 Begrænset tid: 10% RABAT på alle ordrer — brug kode STAR10Grib →
Live10,847 anmeldelser leveret til dato7 ordrer afgivet i dagNæste levering om ~2 timer
dybdegående20. april 2026·blogPost.bayesianStarRatingMath.readTime min read

Sådan beregner Google din stjernebedømmelse (det er ikke et gennemsnit)

Den Bayesianske matematik bag vægtede anmeldelser, vægtning af nye anmeldelser, og hvorfor din viste bedømmelse næsten helt sikkert afviger fra dit aritmetiske gennemsnit – forklaret med rigtige formler og udregnede eksempler.

Abstrakt visualisering af Bayesiansk stjernebedømmelsesmatematik — sandsynlighedsfordelinger glødende i cyan og smaragdgrøn på en mørkeblå baggrund, med svævende matematisk notation
Q
Quick Answers
Bruger Google et simpelt gennemsnit til at beregne stjernebedømmelser?
Nej. Google anvender en Bayesiansk-inspireret vægtet formel, der trækker bedømmelser mod kategoriens gennemsnit, når antallet af anmeldelser er lavt. En virksomhed med 3 anmeldelser med 5.0 vil vise en lavere effektiv bedømmelse end en med 120 anmeldelser med 4.6.
Hvad er den Bayesianske gennemsnitsformel for bedømmelser?
WR = (v/(v+m)) × R + (m/(v+m)) × C — hvor v er dit antal anmeldelser, m er en minimumstærskel, R er dit rå gennemsnit, og C er kategoriens gennemsnit. Efterhånden som v vokser, dominerer dit eget gennemsnit.
Hvor mange Google-anmeldelser skal man have, før bedømmelsen stabiliseres?
Cirka 50-100 anmeldelser, afhængigt af din kategoris gennemsnitlige anmeldelsesvolumen. Under den tærskel er det Bayesianske træk mod det globale gennemsnit stærkt nok til meningsfuldt at undertrykke selv en perfekt score.
Hvorfor betyder nyere anmeldelser mere for min Google-bedømmelse?
Google anvender vægtning af nye anmeldelser – anmeldelser fra de sidste 90 dage har betydeligt mere indflydelse end anmeldelser fra 18+ måneder siden. Dette er uafhængigt af den Bayesianske 'prior' og belønner virksomheder, der genererer en jævn strøm af anmeldelser.

Her er noget, de fleste virksomhedsejere opdager på den hårde måde: Du kan indsamle tyve femstjernede anmeldelser i træk og se din viste bedømmelse knap nok rykke sig. Eller endnu værre – du bruger seks måneder på at forbedre din service, når endelig 50 anmeldelser, og opdager, at dit 4.8 gennemsnit på en eller anden måde er endt på 4.3 på Google Maps. Regnestykket er ikke forkert. Det virker præcis som designet. Du fik bare ikke at vide, hvad designet var.

Google har aldrig offentliggjort sin bedømmelsesalgoritme. Men mellem IMDB's offentligt dokumenterede Bayesianske formel, Algolias dokumentation om bedømmelser, akademisk forskning i anmeldelsessystemer og mange års praktisk reverse-engineering af synlige bedømmelsesændringer, er mekanikken velkendt. Denne artikel gennemgår matematikken – grundigt, med rigtige tal.

Problemet med simple gennemsnit

// naive_average.failure_modes

Lad os starte med, hvad et simpelt gennemsnit er, og hvorfor det fejler. Det aritmetiske gennemsnit af et sæt bedømmelser er simpelthen summen divideret med antallet. Tre anmeldelser på 5, 4 og 5 giver (5+4+5)/3 = 4.67. Det er matematisk korrekt. Det er også statistisk vildledende, når målet er at rangordne tusindvis af virksomheder mod hinanden.

Simpelt gennemsnit — Ulemper
1 anmeldelse med 5.0 rangerer højere end 500 anmeldelser med 4.8 — stikprøvestørrelse ignoreres
Nye virksomheder med plantede anmeldelser dominerer ranglister for nye aktører
Bedømmelsen pustes op ved lav volumen, falder når negative anmeldelser akkumuleres i stor skala
Ingen straf for mistænkelige, pludselige stigninger i anmeldelser — designet til at kunne snydes
Bayesiansk vægtet — Løsninger
Virksomheder med få anmeldelser trækkes mod kategoriens gennemsnit — outliers undertrykkes
Høj anmeldelsesvolumen skaber tillid — scoren konvergerer mod det sande kvalitetssignal
Vægtning af nye anmeldelser holder scoren aktuel — 18 måneder gamle anmeldelser fortoner sig
Score for bidragyders troværdighed reducerer vægten fra mistænkelige eller inaktive konti

Fejlscenarierne hober sig hurtigt op i stor skala. En restaurant, der åbnede i sidste uge med tre anmeldelser fra entusiastiske venner, vil score højere end en etableret konkurrent med 200 anmeldelser og et gennemsnit på 4.4 – selvom det etablerede sted repræsenterer et dramatisk mere pålideligt signal. Ethvert rangeringssystem, der tillader dette, vil blive udnyttet til det bliver irrelevant inden for få måneder.

Sådan fungerer Googles beregning af stjernebedømmelse i praksis

Tænk på en Bayesiansk bedømmelse som et tillidsvægtet gennemsnit. Når du har meget få anmeldelser, stoler systemet ikke nok på din stikprøve til at vise den, som den er. I stedet blander det dit rå gennemsnit med en 'prior' — en standardforventning baseret på alle lignende virksomheder. Jo flere anmeldelser du akkumulerer, jo mere stoler systemet på dine egne data, og jo mindre betyder din 'prior'.

IMDB bruger præcis denne tilgang til deres Top 250-liste og har dokumenteret formlen offentligt: WR = (v/(v+m)) × R + (m/(v+m)) × C. Variablerne er elegant simple, men de adfærdsmæssige konsekvenser tager et øjeblik at forstå fuldt ud. Den samme matematiske struktur findes i Algolias rangeringsdokumentation, akademisk litteratur om anmeldelsessystemer og det reverse-engineering-arbejde, som SEO-specialister har udført ved at studere Googles lokale rangering.

Sandsynlighedsfordelingskurver, der viser, hvordan en Bayesiansk 'prior'-overbevisning ændrer sig, efterhånden som antallet af anmeldelser stiger — matematisk kunst i marineblå og cyan toner
// fig_01 — 'Prior'-overbevisning (flad fordeling, lavt antal) konvergerer mod 'posterior' (efterfølgende), efterhånden som beviser akkumuleres. Bayesiansk inferens anvendt på stjernebedømmelser opfører sig identisk med ethvert andet estimationsproblem: mere data = smallere konfidensinterval = mindre regression mod gennemsnittet.

Den Bayesianske gennemsnitsformel forklaret

// bayesian_average.formula_derivation

Formlen WR = (v/(v+m)) × R + (m/(v+m)) × C er en vægtet blanding af to størrelser: din virksomheds eget observerede gennemsnit (R) og det kategoridækkende gennemsnit (C). Vægtene bestemmes af, hvor mange anmeldelser du har (v) i forhold til en minimumstærskel for troværdighed (m).

Bemærk, at (v/(v+m)) + (m/(v+m)) altid er lig med 1.0. Disse to vægte summerer til 100% — du interpolerer altid mellem dine egne data og 'prior'. Det eneste spørgsmål er, hvor meget af hver. Når v er lille i forhold til m, dominerer 'prior'. Når v er stor i forhold til m, dominerer dine egne anmeldelser.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

Tærsklen m er den parameter, der indkoder platformens tillidskrav. IMDB sætter m til cirka 25.000 stemmer for deres Top 250-beregning. En lokal café på Google konkurrerer ikke i det samme statistiske univers som Avatar, så m er sat meget lavere — specialister estimerer generelt, at m ligger i intervallet 5 til 50 for lokale Google-profiler, varierende efter kategori og geografisk marked.

Kategoriens gennemsnit C er den mest undervurderede variabel. Det er ikke en fast global konstant. Google beregner næsten helt sikkert C dynamisk — pr. kategori, pr. by, måske pr. søgekontekst. En tandlæge i København bliver benchmarket mod andre københavnske tandlæger, ikke mod restauranter på landet i Jylland. Det betyder, at din Bayesianske bund er kategorispecifik.

Hvorfor den vægtede stjernebedømmelsesformel er vigtig for din SEO

Den praktiske konsekvens er, at det at få dine første 50 anmeldelser betyder uforholdsmæssigt meget mere end at få anmeldelse nummer 51 til 150. Hver anmeldelse under troværdighedstærsklen m har en overdimensioneret effekt, fordi den flytter (v/(v+m))-koefficienten betydeligt. At gå fra v=5 til v=10 fordobler din tillidsvægt. At gå fra v=150 til v=155 er knap målbart.

Dette forklarer et kontraintuitivt mønster, som specialister ser igen og igen: en virksomhed går fra 3 anmeldelser til 30 anmeldelser og ser sin viste bedømmelse falde fra 5.0 til 4.6 — selvom de nye anmeldelser også er positive. Matematikken er korrekt. Den tidlige 5.0-bedømmelse var en Bayesiansk fiktion. De 4.6 er det første ærlige estimat.

Trin-for-trin gennemgang af beregning

// step_by_step.numerical_walkthrough

To gennemgåede eksempler, der bruger et realistisk gennemsnit for kategorien på C = 4.1 og en minimumstærskel på m = 50. Disse er plausible estimater for en moderat konkurrencepræget lokal servicekategori (VVS-installatører, tandlæger, autoværksteder). Indsæt forskellige værdier for at modellere din egen kategori.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

Virksomhed A har en perfekt rå score — alle anmeldere gav 5 stjerner. Men med kun 3 anmeldelser stoler formlen kun 5.7% på sine egne data. De resterende 94.3% af dens viste score kommer fra kategoriens gennemsnit på 4.1. Resultat: 4.15. Ikke de 5.0, den ser ud til at fortjene.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

Virksomhed B har et lavere råt gennemsnit på 4.6 — nogle anmeldere gav 3 eller 4 stjerner. Men 120 anmeldelser betyder, at formlen stoler 70.6% på sine egne data. Dens viste score på 4.45 er meget tættere på virkeligheden og vil blive rangeret højere af Googles algoritme end Virksomhed A's nominelle 5.0. Volumen skaber troværdighed. Troværdighed skaber synlighed.

Simulering: Simpelt gennemsnit vs. Bayesiansk vægtet bedømmelse

// simulation.naive_vs_bayesian_comparison

Tabellen nedenfor anvender formlen på tværs af seks scenarier med C = 4.1 og m = 50. Delta-kolonnen viser, hvor meget den Bayesianske score adskiller sig fra det simple gennemsnit. Bemærk, hvordan kløften mindskes, efterhånden som antallet af anmeldelser vokser — det er 'prior', der mister indflydelse, som beviserne akkumuleres.

Simulering af Bayesiansk vægtet bedømmelse
m = 50, C = 4.1 (estimeret gennemsnit for kategorien). Alle beregninger bruger WR = (v/(v+m))×R + (m/(v+m))×C
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

Den mest interessante række er den sidste: en virksomhed med kun 5 anmeldelser, men et forfærdeligt råt gennemsnit på 2.0, viser faktisk 3.85 — trukket op med næsten to hele stjerner af kategoriens gennemsnit. Dette er med vilje. Systemet nægter at dømme en virksomhed til glemsel baseret på fem datapunkter. Det garderer sig mod gennemsnittet, indtil stikprøven er stor nok til at berettige tillid.

Denne dæmpende effekt på negative outliers er grunden til, at 'review bombing' — en koordineret kampagne af falske negative anmeldelser — er mindre katastrofal, end den ser ud på overfladen. Algoritmen modstår ekstreme resultater, når antallet af anmeldelser er utilstrækkeligt til at retfærdiggøre dem. Når det er sagt, markerer Googles systemer til anomalidetektion også kampagner med hurtig anmeldelsesfrekvens i begge retninger.

3D scatter plot-visualisering, der viser anmeldelsesdatapunkter, som konvergerer mod en gennemsnitslinje, efterhånden som antallet stiger — Bayesiansk inferenskonvergens i smaragdgrøn og cyan
// fig_02 — Spredningskonvergens: efterhånden som datapunkter akkumuleres, konvergerer estimatet mod det sande gennemsnit. Hver yderligere anmeldelse reducerer variansen. Trækket fra 'prior' (vandret stiplet linje) svækkes, som v/m-forholdet vokser.

Googles ekstra lag ud over grundformlen

// google_specific.beyond_bayesian_math

Den Bayesianske formel forklarer grundlaget, men Googles faktiske system tilføjer mindst tre yderligere lag: vægtning af nye anmeldelser, score for bidragyders troværdighed og dæmpning af anomalier ved pludselige stigninger. Ingen af disse er officielt bekræftet. Alle er udledt af adfærdsmæssige beviser og patentanalyse.

Tænk på den grundlæggende Bayesianske formel som fundamentet. Alt, der er bygget ovenpå, gør signalet mere modstandsdygtigt over for manipulation og mere tidsmæssigt præcist. Målet er altid det samme: at få den viste bedømmelse til at afspejle, hvad en kunde reelt ville opleve, hvis de kom ind i dag.

Vægtning af nye anmeldelser — hvorfor dine sidste 90 dage dominerer

Google anvender et tidsmæssigt henfald på anmeldelser, hvilket giver mere vægt til nylig feedback end til ældre indlæg. Mekanismen er i overensstemmelse med en eksponentiel henfaldsfunktion, hvor en anmeldelses indflydelse aftager over tid i stedet for at falde til nul på en bestemt skæringsdato.[1]

Fællesskabsanalyser af Googles bedømmelsesadfærd finder konsekvent, at anmeldelser, der er offentliggjort for mere end 12-18 måneder siden, har cirka 30-50% mindre indflydelse end en anmeldelse, der blev offentliggjort i sidste uge. En 5-stjernet anmeldelse fra tre år siden tæller stadig med — den tæller bare mindre. Det betyder, at en virksomhed, der indsamlede 80 anmeldelser i 2022 og ikke har fået nogen siden, lever på lånt signal.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Bidragyders troværdighed — hvorfor en anmeldelse fra en Level 7 Local Guide vejer tungere

Googles troværdighedshierarki for anmeldere udledes af dets patentportefølje og observerbar adfærd. Patent US8818995B1 beskriver et søgerangeringssystem, der vægter bidrag efter troværdighedsniveauet for den enhed, der afgiver dem. Anvendt på anmeldelser: en Level 7 Local Guide med hundredvis af detaljerede anmeldelser på tværs af flere forretningskategorier registreres som en node med høj troværdighed.[2]

Den praktiske effekt: en 5-stjernet anmeldelse fra en Local Guide Level 7 vægtes sandsynligvis tungere end en 5-stjernet anmeldelse fra en konto, der blev oprettet i går uden anmeldelseshistorik. Dette handler ikke om stjerneværdien — begge tæller som 5 i tælleren. Men vægten, der anvendes på hver enkelt før gennemsnittet beregnes, er forskellig. Google har aldrig kvantificeret denne forskel offentligt.

Anomalidæmpning — hvad sker der, når 40 anmeldelser ankommer på en uge

Pludselige stigninger i frekvens udløser et separat detektionslag. Hvis en virksomhed modtager 40 anmeldelser på 72 timer, når dens baseline er 2-3 om måneden, markerer Googles systemer dette mønster. Resultatet er ikke automatisk sletning — det er karantæne. Nye anmeldelser holder op med at blive vist i det offentlige antal og bedømmelse, mens systemet undersøger sagen.[3]

Denne mekanisme forklarer, hvorfor virksomheder, der køber anmeldelseskampagner i store mængder, ofte ikke ser nogen synlig forbedring — eller midlertidigt ser deres profilbedømmelser falde, da ældre autentiske anmeldelser forbliver synlige, mens den nye batch sidder i et anmeldelses-limbo. Algoritmen er specifikt indstillet til at mistro pludselige volumenudsving, der afviger fra etablerede baselines.

Før og efter: Hvad anmeldelsesvolumen reelt ændrer

// practical_impact.before_and_after_scenarios

To scenarier i stil med den virkelige verden for at illustrere, hvordan formlen opfører sig over tid. Ingen af dem er fiktive — disse mønstre ses gentagne gange i casestudier fra specialister i omdømmepleje.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTKontraintuitivt resultat: bedømmelsen faldt fra et simpelt gennemsnit på 4.9 til en vist 4.58, men den Bayesianske score blev forbedret med +0.37 point. Det viste tal er nu ærligt. Før var 4.9 en statistisk fiktion understøttet af 8 datapunkter. Nu er 4.58 et pålideligt signal, som Google stoler på — og rangerer derefter.

Tandlægescenariet demonstrerer kerneindsigten i Bayesiansk bedømmelse: et lavere råt gennemsnit med høj tillid slår et højere råt gennemsnit med lav tillid. Den viste score faldt (fra en nominel 4.9 til en vist 4.58), men rangeringspositionen blev forbedret, fordi tillidsvægten nu er reel.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTAnomalidetektion reducerer det effektive synlige anmeldelsesantal fra 200 til ~160. Kombineret med vægtning af nye anmeldelser (anmeldelser fra stigningsperioden er nu aldrende), falder den Bayesianske score, på trods af at det rå gennemsnit forbliver fladt. Naturlig kadence — 10 anmeldelser om ugen over 20 uger — giver materielt bedre resultater end 200 på én gang.

Restaurant-scenariet illustrerer, hvorfor organisk kadence betyder noget. Googles systemer er kalibreret til at opdage unaturlig frekvens. Fyrre anmeldelser på en uge efterfulgt af to måneders stilhed ser ikke kun mistænkeligt ud — det dæmpede effektive antal betyder, at du har brugt penge og næsten intet opnået. Matematikken straffer det dobbelt: anomalidetektionen reducerer det synlige antal, og vægtningen af nye anmeldelser betyder, at anmeldelserne fra stigningsperioden begynder at falme med det samme.

Alternative tilgange: Wilson Score og Dirichlet-modeller

// related_approaches.wilson_score_dirichlet

Bayesiansk gennemsnit er ikke den eneste statistisk sunde tilgang. Evan Millers essay fra 2009 'How Not to Sort by Average Rating' populariserede en anden metode: den nedre grænse af Wilson score konfidensintervallet. Reddit adopterede det til rangering af kommentarer. Yelp bruger en variation af det.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

Wilson score stiller et andet spørgsmål end Bayesiansk gennemsnit. I stedet for 'bland mine data med en prior', spørger den: 'givet de bedømmelser, jeg har, hvad er så det værst tænkelige sande kvalitetsniveau med 95% konfidens?' Dette producerer et konservativt estimat, der straffer usikkerhed endnu mere aggressivt end Bayesiansk gennemsnit for meget lave anmeldelsesantal.

En tredje tilgang — Dirichlet-Multinomial-modellen — behandler alle fem stjerneværdier som separate kategorier snarere end en enkelt kontinuerlig score. District Data Labs dokumenterede denne tilgang for systemer med flere stjerner. Den er matematisk mere korrekt end IMDB-formlen (som implicit behandler stjerner som en lineær skala), men beregningsmæssigt tungere. Til praktiske formål bliver den adfærdsmæssige forskel mellem Bayesiansk gennemsnit og en Dirichlet-model ubetydelig over cirka 30 anmeldelser.

Matematisk notation og statistiske formler — Wilson score og Bayesiansk 'prior' visualiseret som glødende ligninger på mørk baggrund, abstrakt videnskabelig kunst
// fig_03 — Wilson score's nedre grænse vs. Bayesiansk gennemsnit ved identiske rå proportioner. Ved n=5 er Wilson mere konservativ (straffer usikkerhed hårdere). Ved n=100 konvergerer begge inden for 0.02 point af hinanden. Valget af metode betyder mest i det kritiske vindue med få anmeldelser.

Hvad dette betyder for din forretningsstrategi

// strategic_implications.for_business_owners

Forståelse af matematikken omdanner et abstrakt råd ('få flere anmeldelser') til en kvantificeret strategi. Hver virksomhed eksisterer et sted på v/(v+m)-spektret. At vide, hvor du er, fortæller dig, hvor meget din næste anmeldelse reelt flytter nålen.

Hvis v = 8 og m = 50, flytter en enkelt ny 5-stjernet anmeldelse din tillidsvægt fra 8/58 = 0.138 til 9/59 = 0.153. Det skift på 1.5 procentpoint er meningsfuldt. Hvis v = 300 og m = 50, flytter den samme anmeldelse dig fra 300/350 = 0.857 til 301/351 = 0.858 — knap detekterbart. Volumen i det tidlige vindue har ti gange den matematiske effekt af volumen i stor skala.

Sådan beregner du den vægtede gennemsnitlige stjernebedømmelse for din egen virksomhed

Du kan selv køre formlen i et regneark. Tag dit nuværende antal anmeldelser som v. Estimer din kategoris m ved at se på, hvilke anmeldelsesantal de top-3 virksomheder i din Google Maps-kategori har — den 25. percentil af den fordeling er et rimeligt estimat for m. Din nuværende viste bedømmelse er sandsynligvis allerede WR-outputtet; dit simple gennemsnit er den simple sum divideret med antallet i dit backend.

Den beregning, du er interesseret i, er den marginale effekt af de næste N anmeldelser. Modeller det: øg v med 10, genberegn WR, observer deltaet. Gør dette på tværs af en række v-værdier for at bygge en følsomhedskurve. Den stejleste del af den kurve — hvor hver yderligere anmeldelse producerer den største WR-forbedring — er der, du bør koncentrere din indsats for at skaffe anmeldelser.

Hvorfor nyhedsværdi betyder, at anmeldelsesfrekvens er vigtigere end det samlede antal

Når du først forstår vægtningen af nye anmeldelser, skifter optimeringsmålet. Det handler ikke kun om det samlede volumen — det handler om volumen fordelt over tid. En virksomhed med 400 anmeldelser indsamlet over fem år og intet i de sidste 18 måneder opererer reelt på en mindre effektiv stikprøve, end tallene antyder. De henfaldne anmeldelser bidrager mindre til det løbende vægtede gennemsnit.

Konsekvent generering af anmeldelser — selv i beskedne rater — akkumulerer over tid på måder, som pludselige anskaffelser aldrig gør. Otte nye anmeldelser om måneden i tolv måneder overgår 96 anmeldelser på en enkelt måned på næsten alle relevante metrikker: Bayesiansk tillid, godkendelse fra anomalidetektion, bane for vægtning af nye anmeldelser og forbrugernes opfattelse af troværdighed.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Ofte Stillede Spørgsmål

// faq.frequently_asked_questions

01Hvordan beregnes Google stjernebedømmelser?

Google bruger en Bayesiansk-inspireret vægtet formel snarere end et simpelt aritmetisk gennemsnit. Anmeldelser fra bidragydere med høj troværdighed (Local Guides, konti med verificeret historik) vejer tungere. Nylige anmeldelser vægtes højere via tidsmæssigt henfald. Formlen forankrer virksomheder med få anmeldelser til deres kategoris gennemsnit og trækker bedømmelser mod en 'prior', indtil tilstrækkelige beviser er akkumuleret.

02Påvirker én anmeldelse dit Google-gennemsnit mere end en anden?

Ja, på to måder. For det første betyder et lavt antal anmeldelser, at hver ny anmeldelse ændrer tillidskoefficienten betydeligt — dine første 50 anmeldelser betyder mere pr. anmeldelse end anmeldelse nummer 200-250. For det andet betyder score for bidragyders troværdighed, at en anmeldelse fra en Level 7 Local Guide med 1.000+ anmeldelser sandsynligvis vejer tungere i gennemsnitsformlen end en anmeldelse fra en helt ny konto.

03Hvor mange anmeldelser skal der til, før din Google-bedømmelse stabiliseres?

Stabilisering i Bayesiansk forstand opstår, når v >> m — groft sagt, når dit anmeldelsesantal er 3-5 gange minimumstærsklen. For de fleste lokale forretningskategorier er det cirka 50-150 anmeldelser. Ud over det punkt er det Bayesianske træk mod kategoriens gennemsnit svagt nok til, at din viste score følger dit faktiske gennemsnit tæt.

04Hvad er en vægtet stjernebedømmelse, og hvordan virker den?

En vægtet stjernebedømmelse justerer hver anmeldelses bidrag til den samlede score baseret på faktorer ud over selve stjerneværdien: hvor mange samlede anmeldelser der findes (tillidsvægtning), hvor ny anmeldelsen er (tidsmæssigt henfald), og hvem der skrev den (bidragyders troværdighed). Resultatet er en score, der er mere modstandsdygtig over for manipulation og mere statistisk meningsfuld end et simpelt gennemsnit.

05Hvorfor er min Google-bedømmelse anderledes end min Yelp- eller TripAdvisor-bedømmelse?

Hver platform bruger en forskellig algoritme med forskellige parameterværdier for minimumstærsklen, forskellige troværdighedshierarkier for anmeldere og forskellige rater for tidsmæssigt henfald. Forskning fra FTC-økonomer fandt, at Google-bedømmelser i gennemsnit er ca. 1.25 stjerner højere end tilsvarende BBB-bedømmelser. Yelps algoritme er især strengere — den filtrerer flere anmeldelser fra gennem sit 'anbefalede'-system, hvilket har tendens til at producere lavere, men mere konservative gennemsnitsscorer.

06Hvordan beregner Google stjernebedømmelse for nye virksomheder med få anmeldelser?

Nye virksomheder med færre anmeldelser end minimumstærsklen (m) får deres scorer kraftigt forankret til kategoriens gennemsnit. En ny restaurant med 3 anmeldelser og et gennemsnit på 5.0 kan måske kun vise 4.1-4.3, fordi den Bayesianske vægt på dens egne data kun er 5-10%. Dette er matematisk korrekt — 3 datapunkter kan ikke pålideligt estimere en sand kvalitetsscore.

07Påvirker anmeldelsens længde eller indhold, hvordan Google vægter en anmeldelse?

Kvalitativt, ja — Googles systemer analyserer anmeldelsestekst for stemning, søgeordssignaler og kvalitetsindikatorer. En detaljeret anmeldelse på 200 ord, der nævner specifikke serviceoplevelser, scorer sandsynligvis højere på kvalitetssignaler end en 5-stjernet anmeldelse uden tekst. Dog er det præcise kvantitative forhold mellem anmeldelsestekstens kvalitet og den numeriske vægtningskoefficient ikke offentligt dokumenteret.

08Hvad er den Bayesianske gennemsnitsformel, og hvornår skal jeg bruge den?

Formlen er WR = (v/(v+m)) × R + (m/(v+m)) × C. Brug den, når du skal rangordne elementer efter kvalitet, når disse elementer har vidt forskellige antal anmeldelser. Det er standardtilgangen for produktanbefalingssystemer, indholdsrangering og forretningsbedømmelsesplatforme. Den vigtigste parameter at kalibrere er m — for lav, og den yder ingen beskyttelse mod outliers; for høj, og legitime nye aktører undertrykkes permanent.

09Hvordan håndterer Googles stjernebedømmelsesalgoritme pludselige stigninger i anmeldelser og falske anmeldelser?

Googles anomalidetektion kører uafhængigt af den Bayesianske formel. Når der opdages pludselige stigninger i frekvens — typisk 10-20 gange en virksomheds normale ugentlige anmeldelsesrate — går nye anmeldelser i en karantænetilstand, hvor de er synlige for virksomhedsejeren, men ikke tælles med i offentlige bedømmelser. Anmeldelser, der består AI- og manuelle tjek, kommer til sidst ud af karantæne; dem, der ikke gør, fjernes uden varsel.

10Hvordan får man en 5-stjernet bedømmelse på Google, der rent faktisk holder?

Vedvarende høje bedømmelser kræver en konsekvent anmeldelsesfrekvens, ikke en engangsindsats. Formlen belønner volumen over tid: 10 autentiske anmeldelser om måneden i 12 måneder giver en mere stabil, højere rangerende score end 120 anmeldelser på en enkelt måned. Fokuser på naturlig anmeldelsesgenerering gennem opfølgning efter køb, QR-koder på servicestedet og påmindelser i e-mail-flows — alt inden for Googles retningslinjer.

Stjernebedømmelser er ikke, hvad de ser ud til at være på overfladen. Det tal, Google viser, er outputtet fra en statistisk model designet til at modstå manipulation, tage højde for usikkerhed og belønne konsekvent kvalitet over tid. At forstå matematikken kræver ikke en grad i statistik — det kræver, at man accepterer, at tre 5-stjernede anmeldelser ikke er det samme værd som 120 autentiske anmeldelser med et gennemsnit på 4.6. Formlen gør det eksplicit. Hvad du gør med den indsigt, er strategien.

Sådan virker detPriserFAQ
// the_math_favors_volume

Din bedømmelse er et regnestykke. Vi kan hjælpe med at løse det.

Den Bayesianske formel belønner anmeldelsesvolumen akkumuleret over tid. Hver anmeldelse, du genererer i dag, flytter din tillidsvægt i den rigtige retning — og effekten forstærkes.

Begynd at opbygge anmeldelsesvolumen