🔥 Korlátozott ideig: 10% KEDVEZMÉNY minden rendelésre — használd a kódot STAR10Igénylés →
Élő10,847 eddig kézbesített vélemény7 mai napon leadott rendelésKövetkező kézbesítés ~2 óra múlva
mélyelemzés2026. április 20.·blogPost.bayesianStarRatingMath.readTime min read

Hogyan számítja ki valójában a Google a csillagértékelésedet (és miért nem egyszerű átlagolással)

A Bayes-matematika a súlyozott értékelések, az időbeli súlycsökkenés mögött, és hogy a megjelenített értékelésed miért tér el szinte biztosan a számtani átlagtól – valódi képletekkel és kidolgozott számításokkal elmagyarázva.

A Bayes-féle csillagértékelési matematika absztrakt vizualizációja – sötétkék háttéren fénylő cián és smaragd színű valószínűség-eloszlások, lebegő matematikai jelölésekkel
Q
Quick Answers
A Google egyszerű átlagot használ a csillagértékelések kiszámításához?
Nem. A Google egy Bayes-alapú súlyozott képletet alkalmaz, amely alacsony értékelésszám esetén a kategóriaátlag felé húzza az értékeléseket. Egy 3 darab 5.0-s értékeléssel rendelkező vállalkozás effektív értékelése alacsonyabb lesz, mint egy 120 darab 4.6-os értékeléssel rendelkezőé.
Mi a Bayes-féle átlag képlete az értékelésekre?
WR = (v/(v+m)) × R + (m/(v+m)) × C — ahol v az értékeléseid száma, m egy minimális küszöbérték, R a nyers átlagod, C pedig a kategóriaátlag. Ahogy v növekszik, a saját átlagod válik dominánssá.
Hány Google értékelésre van szükség, mielőtt stabilizálódik az értékelésed?
Körülbelül 50–100 értékelésre, a kategóriád átlagos értékelési volumenétől függően. E küszöbérték alatt a globális átlag felé történő Bayes-féle „húzás” elég erős ahhoz, hogy még egy tökéletes pontszámot is érezhetően lejjebb vigyen.
Miért számítanak többet az újabb értékelések a Google értékelésemnél?
A Google időbeli súlyozást alkalmaz – az elmúlt 90 napban közzétett értékelések lényegesen nagyobb befolyással bírnak, mint a 18+ hónappal ezelőttiek. Ez független a Bayes-féle priortól, és azokat a vállalkozásokat jutalmazza, amelyek következetes értékelési sebességet produkálnak.

Van valami, amit a legtöbb cégtulajdonos a saját kárán tanul meg: összegyűjthetsz húsz egymást követő ötcsillagos értékelést, és azt látod, hogy a megjelenített értékelésed alig mozdul. Vagy ami még rosszabb: hat hónapot töltesz a szolgáltatásod fejlesztésével, végre eléred az 50 értékelést, és rájössz, hogy a 4.8-as átlagod valahogy 4.3-ra állt be a Google Térképen. A matematika nem hibás. Pontosan a tervek szerint működik. Csak épp neked nem mondták el, mi volt a terv.

A Google soha nem tette közzé az értékelési algoritmusát. De az IMDB nyilvánosan dokumentált Bayes-képlete, az Algolia értékelési dokumentációja, az értékelési rendszerekkel kapcsolatos tudományos kutatások és a látható értékelésváltozásokat évek óta visszafejtő szakemberek munkája révén a mechanizmus jól ismert. Ez a cikk végigvezeti Önt a matematikán – rendesen, valós számokkal.

A probléma az egyszerű átlagokkal

// naive_average.failure_modes

Kezdjük azzal, mi az egyszerű átlag és miért vall kudarcot. Az értékelések egy halmazának számtani közepe egyszerűen az összegük elosztva a darabszámukkal. Három értékelés (5, 4 és 5) esetén ez (5+4+5)/3 = 4.67. Ez matematikailag helyes. Statisztikailag azonban félrevezető, amikor a cél több ezer vállalkozás egymáshoz viszonyított rangsorolása.

Egyszerű átlag – Hibák
1 db 5.0-s értékelés megelőz 500 db 4.8-as értékelést – a mintaméret figyelmen kívül van hagyva
A megvásárolt értékelésekkel rendelkező új vállalkozások uralják az újonnan belépők rangsorát
Az értékelés alacsony darabszámnál felfúvódik, majd leereszt, ahogy nagy számban gyűlnek a negatív értékelések
Nincs büntetés a gyanús értékelési sebesség-kiugrásokért – eleve kijátszható
Bayes-súlyozás – Javítások
Az alacsony értékelésszámú vállalkozások a kategóriaátlag felé húzódnak – a kiugró értékek elnyomva
A magas értékelésszám bizalmat ébreszt – a pontszám a valós minőségi jel felé konvergál
Az időbeli súlyozás naprakészen tartja a pontszámot – a 18 hónapos értékelések elhalványulnak
A hozzászólói bizalmi pontozás csökkenti a gyanús vagy alacsony aktivitású fiókok súlyát

A hibalehetőségek nagy méretekben gyorsan halmozódnak. Egy múlt héten nyílt étterem, amely három lelkes baráttól kapott értékelést, magasabb pontszámot ér el, mint egy bejáratott versenytárs 200 értékeléssel és 4.4-es átlaggal – pedig a bejáratott hely drámaian megbízhatóbb jelet képvisel. Bármely rangsorolási rendszer, amely ezt megengedi, hónapokon belül kijátszhatóvá és irrelevánssá válik.

Hogyan működik a Google csillagértékelés számítása a gyakorlatban

Gondoljon a Bayes-féle értékelésre mint egy bizalommal súlyozott átlagra. Amikor nagyon kevés értékelése van, a rendszer nem bízik eléggé a mintájában ahhoz, hogy azt névértéken jelenítse meg. Ehelyett a nyers átlagát egy „priorral” – egy alapértelmezett elvárással – keveri, amely az összes hasonló vállalkozáson alapul. Minél több értékelést gyűjt, annál jobban bízik a rendszer a saját adataiban, és annál kevésbé számít a prior.

Az IMDB pontosan ezt a megközelítést használja a Top 250-es listájához, és nyilvánosan dokumentálta a képletet: WR = (v/(v+m)) × R + (m/(v+m)) × C. A változók elegánsan egyszerűek, de a viselkedési következmények teljes megértése időbe telik. Ugyanez a matematikai struktúra jelenik meg az Algolia rangsorolási dokumentációjában, az értékelési rendszerekkel foglalkozó tudományos irodalomban, és a Google helyi rangsorolását tanulmányozó SEO szakemberek visszafejtő munkájában.

Valószínűség-eloszlási görbék, amelyek a Bayes-féle prior hiedelem eltolódását mutatják az értékelések számának növekedésével – matematikai művészet sötétkék és cián tónusokban
// 1. ábra – A prior hiedelem (lapos eloszlás, alacsony darabszám) a bizonyítékok gyűlésével a poszterior felé konvergál. A csillagértékelésekre alkalmazott Bayes-következtetés ugyanúgy viselkedik, mint bármely más becslési probléma: több adat = szűkebb konfidenciaintervallum = kisebb regresszió az átlaghoz.

A Bayes-féle átlagképlet magyarázata

// bayesian_average.formula_derivation

A WR = (v/(v+m)) × R + (m/(v+m)) × C képlet két mennyiség súlyozott keveréke: a vállalkozás saját megfigyelt átlaga (R) és a kategóriaszintű átlag (C). A súlyokat az határozza meg, hogy hány értékelése van (v) egy minimális hitelességi küszöbértékhez (m) képest.

Vegye észre, hogy (v/(v+m)) + (m/(v+m)) mindig 1.0-t ad. Ez a két súly 100%-ot tesz ki – mindig a saját adatai és a prior között interpolál. A kérdés csak az, hogy melyikből mennyit. Amikor v elenyésző m-hez képest, a prior dominál. Amikor v nagy m-hez képest, a saját értékelései dominálnak.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

Az m küszöbérték az a paraméter, amely a platform bizalmi követelményeit kódolja. Az IMDB az m értékét körülbelül 25 000 szavazatban határozza meg a Top 250-es számításához. Egy sarki kávézó a Google-on nem ugyanabban a statisztikai univerzumban versenyez, mint az Avatar, ezért az m értéke sokkal alacsonyabb – a szakemberek általában 5 és 50 közé becsülik az m-et a Google helyi listázásainál, kategóriától és földrajzi piactól függően.

A C kategóriaátlag a leginkább alulértékelt változó. Ez nem egy fix globális állandó. A Google szinte biztosan dinamikusan számítja a C-t – kategóriánként, városonként, talán keresési kontextusonként. Egy San Franciscó-i fogorvost más San Franciscó-i fogorvosokhoz hasonlítanak, nem pedig egy vidéki montanai étteremhez. Ez azt jelenti, hogy a Bayes-féle „alap” kategória-specifikus.

Miért számít a súlyozott csillagértékelési képlet a SEO szempontjából

A gyakorlati következmény az, hogy az első 50 értékelés megszerzése aránytalanul többet számít, mint az 51-től 150-ig terjedő értékeléseké. Minden, az m hitelességi küszöbérték alatti értékelésnek óriási hatása van, mert jelentősen eltolja a (v/(v+m)) együtthatót. Ha v=5-ről v=10-re lép, megduplázza a bizalmi súlyát. Ha v=150-ről v=155-re lép, az alig mérhető.

Ez magyarázza azt az ellentmondásos mintát, amelyet a szakemberek újra és újra megfigyelnek: egy vállalkozás 3 értékelésről 30-ra lép, és azt látja, hogy a megjelenített értékelése 5.0-ról 4.6-ra esik – még akkor is, ha az új értékelések is pozitívak. A matematika helyes. A korai 5.0 egy Bayes-féle fikció volt. A 4.6 az első őszinte becslés.

A számítás lépésről lépésre

// step_by_step.numerical_walkthrough

Két kidolgozott példa, egy reális, C = 4.1 kategóriaátlaggal és egy m = 50 minimális küszöbértékkel. Ezek valószínűsíthető becslések egy közepesen versenyképes helyi szolgáltatási kategóriára (vízvezeték-szerelők, fogorvosok, autószerelők). Helyettesítsen be különböző értékeket a saját kategóriájának modellezéséhez.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

Az 'A' vállalkozásnak tökéletes a nyers pontszáma – minden értékelő 5 csillagot adott. De mindössze 3 értékeléssel a képlet csak 5,7%-ban bízik a saját adataiban. A megjelenített pontszámának fennmaradó 94,3%-a a 4.1-es kategóriaátlagból származik. Eredmény: 4.15. Nem az 5.0, amit látszólag megérdemelne.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

A 'B' vállalkozásnak alacsonyabb, 4.6-os a nyers átlaga – néhány értékelő 3 vagy 4 csillagot adott. De a 120 értékelés azt jelenti, hogy a képlet 70,6%-ban bízik a saját adataiban. A 4.45-ös megjelenített pontszáma sokkal közelebb áll a valósághoz, és a Google algoritmusa magasabbra fogja rangsorolni, mint az 'A' vállalkozás névleges 5.0-s értékelését. A mennyiség hitelességet szül. A hitelesség láthatóságot szül.

Szimuláció: Egyszerű átlag vs. Bayes-súlyozott értékelés

// simulation.naive_vs_bayesian_comparison

Az alábbi táblázat hat forgatókönyvre alkalmazza a képletet, C = 4.1 és m = 50 értékekkel. A Delta oszlop mutatja, mennyire tér el a Bayes-pontszám az egyszerű átlagtól. Figyelje meg, hogyan csökken a különbség az értékelések számának növekedésével – ez az, amikor a prior elveszíti befolyását a bizonyítékok gyűlésével.

Bayes-súlyozott értékelés szimuláció
m = 50, C = 4.1 (becsült kategóriaátlag). Minden számítás a WR = (v/(v+m))×R + (m/(v+m))×C képletet használja
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

A legérdekesebb sor az utolsó: egy vállalkozás mindössze 5 értékeléssel, de borzalmas, 2.0-s nyers átlaggal valójában 3.85-öt jelenít meg – a kategóriaátlag majdnem két teljes csillaggal felhúzta. Ez szándékos. A rendszer nem hajlandó egy vállalkozást a feledés homályába taszítani öt adatpont alapján. Az átlag felé húz, amíg a minta elég nagy nem lesz a bizalomhoz.

Ez a negatív kiugró értékekre gyakorolt tompító hatás az oka annak, hogy az „értékelés-bombázás” – a hamis negatív értékelések összehangolt kampánya – kevésbé katasztrofális, mint amilyennek a felszínen látszik. Az algoritmus ellenáll a szélsőséges eredményeknek, ha az értékelések száma nem elegendő azok igazolásához. Mindazonáltal a Google anomália-észlelő rendszerei a gyors sebességű értékelési kampányokat mindkét irányban megjelölik.

3D-s pontdiagram vizualizáció, amely az értékelési adatpontok konvergálását mutatja egy átlagvonal felé a darabszám növekedésével – Bayes-következtetés konvergencia smaragd és cián színekben
// 2. ábra – Pontdiagram konvergencia: ahogy az adatpontok gyűlnek, a becslés a valódi átlag felé konvergál. Minden további értékelés csökkenti a szórást. A prior (vízszintes szaggatott vonal) húzóereje gyengül, ahogy a v/m arány növekszik.

A Google további rétegei az alapképleten túl

// google_specific.beyond_bayesian_math

A Bayes-képlet megmagyarázza az alapot, de a Google tényleges rendszere legalább három további réteget ad hozzá: az időbeli súlycsökkenést, a hozzászólói bizalmi pontozást és az anomália-csillapítást a sebesség-kiugrásoknál. Ezeket hivatalosan nem erősítették meg. Mindegyikre a viselkedési bizonyítékokból és a szabadalmi elemzésekből következtetnek.

Gondoljon az alap Bayes-képletre mint alapzatra. Minden, ami ráépül, ellenállóbbá teszi a jelet a manipulációval szemben és időben pontosabbá. A cél mindig ugyanaz: a megjelenített értékelés tükrözze azt, amit egy ügyfél valóban tapasztalna, ha ma besétálna.

Időbeli súlyozás – miért dominál az utolsó 90 nap

A Google időbeli súlycsökkenést alkalmaz az értékelésekre, nagyobb súlyt adva a friss visszajelzéseknek, mint a régebbi bejegyzéseknek. A mechanizmus összhangban van egy exponenciális csökkenési függvénnyel, ahol egy értékelés befolyása idővel csökken, ahelyett, hogy egy adott határidőnél nullára esne.[1]

A Google értékelési viselkedésének közösségi elemzése következetesen azt találja, hogy a 12–18 hónapnál régebbi értékelések nagyjából 30–50%-kal kevesebb befolyással bírnak, mint egy múlt héten közzétett értékelés. Egy három évvel ezelőtti 5 csillagos értékelés még mindig számít – csak kevesebbet. Ez azt jelenti, hogy egy vállalkozás, amely 2022-ben 80 értékelést gyűjtött, és azóta egyet sem, kölcsönkapott jelből él.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Hozzászólói bizalom – miért üt nagyobbat egy 7. szintű Helyi idegenvezető értékelése

A Google értékelőkre vonatkozó bizalmi hierarchiájára a szabadalmi portfóliójából és a megfigyelhető viselkedésből következtetnek. Az US8818995B1 számú szabadalom egy olyan keresési rangsorolási rendszert ír le, amely a hozzájárulásokat az azt tevő entitás bizalmi szintje szerint súlyozza. Az értékelésekre alkalmazva: egy 7. szintű Helyi idegenvezető, aki több száz részletes értékeléssel rendelkezik több üzleti kategóriában, magas bizalmi szintű csomópontként regisztrálódik.[2]

A gyakorlati hatás: egy 7. szintű Helyi idegenvezetőtől származó 5 csillagos értékelés valószínűleg nagyobb súllyal bír, mint egy tegnap létrehozott, értékelési előzmények nélküli fiókból származó 5 csillagos értékelés. Ez nem a csillagértékről szól – mindkettő 5-nek számít a számlálóban. De az átlagolás előtt alkalmazott súlyuk eltér. A Google soha nem számszerűsítette ezt a különbséget nyilvánosan.

Anomália-csillapítás – mi történik, ha 40 értékelés érkezik egy hét alatt

A sebesség-kiugrások egy külön észlelési réteget indítanak be. Ha egy vállalkozás 72 óra alatt 40 értékelést kap, miközben az alapvonala havi 2–3, a Google rendszerei megjelölik ezt a mintát. Az eredmény nem automatikus törlés, hanem karantén. Az új értékelések nem jelennek meg a megjelenített darabszámban és értékelésben, amíg a rendszer vizsgálódik.[3]

Ez a mechanizmus magyarázza, hogy a tömegesen értékeléseket vásárló vállalkozások miért nem látnak látható javulást – vagy ideiglenesen miért esik a profiljuk értékelése, miközben a régebbi, hiteles értékelések láthatóak maradnak, de az új adag az értékelési limbóban ül. Az algoritmus kifejezetten úgy van hangolva, hogy ne bízzon a hirtelen volumen-változásokban, amelyek eltérnek a kialakult alapvonalaktól.

Előtte és utána: Mit változtat valójában az értékelések volumene

// practical_impact.before_and_after_scenarios

Két valósághű forgatókönyv, amely bemutatja, hogyan viselkedik a képlet az idő múlásával. Egyik sem fiktív – ezek a minták ismétlődően megjelennek a hírnévkezelési szakemberek esettanulmányaiban.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTEllentmondásos eredmény: az értékelés egy egyszerű 4.9-ről egy megjelenített 4.58-ra esett, mégis a Bayes-pontszám +0.37 ponttal javult. A megjelenített szám most már őszinte. Korábban a 4.9 egy statisztikai fikció volt, amelyet 8 adatpont támasztott alá. Most a 4.58 egy megbízható jel, amiben a Google bízik – és ennek megfelelően rangsorol.

A fogorvosi forgatókönyv a Bayes-féle értékelés alapvető belátását demonstrálja: egy alacsonyabb nyers átlag magas bizalommal legyőzi a magasabb nyers átlagot alacsony bizalommal. A megjelenített pontszám csökkent (egy névleges 4.9-ről egy megjelenített 4.58-ra), de a rangsorolási pozíció javult, mert a bizalmi súly most már valós.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTAz anomália-észlelés a ténylegesen látható értékelések számát 200-ról ~160-ra csökkenti. Az időbeli súlycsökkenéssel kombinálva (a kiugrás-korszak értékelései mostanra öregednek) a Bayes-pontszám esik, annak ellenére, hogy a nyers átlag változatlan marad. A természetes ütem – heti 10 értékelés 20 héten keresztül – lényegesen jobb eredményeket hoz, mint 200 értékelés egyetlen rohammal.

Az éttermi kiugrás forgatókönyve azt szemlélteti, miért számít a szerves ütem. A Google rendszerei a természetellenes sebesség észlelésére vannak kalibrálva. Negyven értékelés egy hét alatt, majd két hónap csend nemcsak gyanúsnak tűnik – a csillapított effektív darabszám azt jelenti, hogy pénzt költöttél és szinte semmit sem nyertél. A matematika kétszer bünteti: az anomália-észlelés csökkenti a látható darabszámot, az időbeli súlycsökkenés pedig azt jelenti, hogy a kiugrás-korszak értékelései azonnal halványulni kezdenek.

Alternatív megközelítések: Wilson-pontszám és Dirichlet-modellek

// related_approaches.wilson_score_dirichlet

A Bayes-féle átlagolás nem az egyetlen statisztikailag megalapozott megközelítés. Evan Miller 2009-es esszéje, a „Hogyan ne rendezzünk átlagos értékelés szerint” egy másik módszert népszerűsített: a Wilson-pontszám konfidenciaintervallumának alsó határát. A Reddit ezt alkalmazta a hozzászólások rangsorolására. A Yelp ennek egy változatát használja.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

A Wilson-pontszám más kérdést tesz fel, mint a Bayes-féle átlagolás. Ahelyett, hogy „keverd az adataimat egy priorral”, azt kérdezi: „a meglévő értékeléseim alapján, mi a legrosszabb valószínűsíthető valódi minőség 95%-os konfidenciával?” Ez egy konzervatív becslést eredményez, amely még agresszívebben bünteti a bizonytalanságot, mint a Bayes-féle átlagolás nagyon alacsony értékelésszám esetén.

Egy harmadik megközelítés – a Dirichlet-multinomiális modell – mind az öt csillagértéket külön kategóriaként kezeli, nem pedig egyetlen folytonos pontszámként. A District Data Labs dokumentálta ezt a megközelítést a többcsillagos rendszerekhez. Matematikailag helyesebb, mint az IMDB-képlet (amely implicit módon lineáris skálaként kezeli a csillagokat), de számításigényesebb. Gyakorlati szempontból a Bayes-féle átlagolás és a Dirichlet-modell közötti viselkedésbeli különbség nagyjából 30 értékelés felett elhanyagolhatóvá válik.

Matematikai jelölések és statisztikai képletek – a Wilson-pontszám és a Bayes-prior fénylő egyenletekként vizualizálva sötét háttéren, absztrakt tudományos művészet
// 3. ábra – A Wilson-pontszám alsó határa vs. Bayes-átlag azonos nyers arányok mellett. n=5 esetén a Wilson konzervatívabb (keményebben bünteti a bizonytalanságot). n=100 esetén mindkettő 0.02 ponton belül konvergál egymáshoz. A módszer megválasztása a kritikus, korai értékelési ablakban számít a legtöbbet.

Mit jelent ez az Ön üzleti stratégiájára nézve

// strategic_implications.for_business_owners

A matematika megértése az elvont tanácsot („szerezzen több értékelést”) számszerűsített stratégiává alakítja. Minden vállalkozás valahol a v/(v+m) spektrumon helyezkedik el. Ha tudja, hol van, az megmondja, mennyit mozdít a következő értékelése a mérlegen.

Ha v = 8 és m = 50, egyetlen új 5 csillagos értékelés a bizalmi súlyát 8/58 = 0.138-ról 9/59 = 0.153-ra tolja el. Ez az 1.5 százalékpontos elmozdulás jelentős. Ha v = 300 és m = 50, ugyanez az értékelés 300/350 = 0.857-ről 301/351 = 0.858-ra mozdítja el – alig érzékelhetően. A korai ablakban szerzett volumen tízszeres matematikai hatással bír, mint a nagy volumenű szakaszban.

Hogyan számolja ki a súlyozott átlagos csillagértékelést a saját vállalkozásához

A képletet Ön is lefuttathatja egy táblázatkezelőben. Vegye a jelenlegi értékeléseinek számát v-nek. Becsülje meg a kategóriája m értékét úgy, hogy megnézi, milyen értékelésszámot tartanak a Google Térkép kategóriájának top 3 vállalkozásai – ennek az eloszlásnak a 25. percentilise egy ésszerű m becslés. A jelenlegi megjelenített értékelése valószínűleg már a WR kimenete; az egyszerű átlaga a háttérrendszerben lévő összeg osztva a darabszámmal.

A számítás, ami Önt érdekli, a következő N értékelés marginális hatása. Modellezze: növelje v-t 10-zel, számolja újra a WR-t, figyelje meg a deltát. Tegye ezt meg egy sor v értékre, hogy felépítsen egy érzékenységi görbét. A görbe legmeredekebb része – ahol minden további értékelés a legnagyobb WR javulást eredményezi – az a pont, ahol az értékelésszerzési erőfeszítéseit koncentrálnia kell.

Miért fontosabb az értékelések sebessége, mint a teljes darabszám az időbeliség miatt

Amint megérti az időbeli súlycsökkenést, az optimalizálási cél eltolódik. Nem csak a teljes volumenről van szó – hanem az időben elosztott volumenről. Egy vállalkozás, amely öt év alatt 400 értékelést gyűjtött, de az elmúlt 18 hónapban semmit, gyakorlatilag egy kisebb effektív mintán működik, mint amit a számok sugallnak. Az elavult értékelések kevesebbel járulnak hozzá a futó súlyozott átlaghoz.

A következetes értékelésgenerálás – még szerény ütemben is – idővel olyan módon halmozódik, ahogy a rohamszerű szerzés soha. Havi nyolc új értékelés tizenkét hónapon keresztül szinte minden releváns mérőszám szerint felülmúlja a 96 értékelést egyetlen hónap alatt: Bayes-bizalom, anomália-észlelési megfelelés, időbeli súlycsökkenési pálya és fogyasztói hitelesség percepciója.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Gyakran Ismételt Kérdések

// faq.frequently_asked_questions

01Hogyan számítják ki a Google csillagértékeléseket?

A Google egy Bayes-alapú súlyozott képletet használ, nem pedig egyszerű számtani átlagot. A magas bizalmi szintű hozzászólóktól (Helyi idegenvezetők, igazolt előzményekkel rendelkező fiókok) származó értékelések nagyobb súllyal bírnak. A friss értékeléseket időbeli súlycsökkenéssel felértékelik. A képlet az alacsony értékelésszámú vállalkozásokat a kategóriaátlaghoz horgonyozza, a prior felé húzva az értékeléseket, amíg elegendő bizonyíték nem gyűlik össze.

02Az egyik értékelés jobban befolyásolja a Google átlagomat, mint a másik?

Igen, kétféleképpen. Először is, az alacsony értékelésszám azt jelenti, hogy minden új értékelés jelentősen megváltoztatja a bizalmi együtthatót – az első 50 értékelésed értékelésenként többet számít, mint a 200–250. közötti értékelések. Másodszor, a hozzászólói bizalmi pontozás azt jelenti, hogy egy 7. szintű Helyi idegenvezetőtől származó, 1000+ értékeléssel rendelkező értékelés valószínűleg nagyobb súllyal bír az átlagolási képletben, mint egy vadonatúj fiókból származó értékelés.

03Hány értékelés kell ahhoz, hogy a Google értékelésed stabilizálódjon?

A stabilizálódás Bayes-értelemben akkor következik be, amikor v >> m – nagyjából akkor, amikor az értékeléseid száma 3–5-szöröse a minimális küszöbértéknek. A legtöbb helyi üzleti kategória esetében ez körülbelül 50–150 értékelést jelent. Ezen a ponton túl a kategóriaátlag felé történő Bayes-féle húzás elég gyenge ahhoz, hogy a megjelenített pontszámod szorosan kövesse a tényleges átlagodat.

04Mi az a súlyozott csillagértékelés és hogyan működik?

A súlyozott csillagértékelés minden egyes értékelés hozzájárulását az összpontszámhoz a csillagértéken túli tényezők alapján módosítja: hány összesített értékelés létezik (bizalmi súlyozás), mennyire friss az értékelés (időbeli súlycsökkenés), és ki írta (hozzászólói bizalom). Az eredmény egy olyan pontszám, amely ellenállóbb a manipulációval szemben és statisztikailag jelentőségteljesebb, mint egy egyszerű átlag.

05Miért különbözik a Google értékelésem a Yelp vagy a TripAdvisor értékelésemtől?

Minden platform más algoritmust használ, különböző paraméterértékekkel a minimális küszöbértékre, különböző bizalmi hierarchiákkal az értékelőkre és különböző időbeli súlycsökkenési rátákkal. Az FTC közgazdászainak kutatása szerint a Google értékelések átlagosan körülbelül 1.25 csillaggal magasabbak, mint az egyenértékű BBB értékelések. A Yelp algoritmusa lényegesen szigorúbb – több értékelést szűr ki az „ajánlott” rendszerén keresztül, ami általában alacsonyabb, de konzervatívabb átlagpontszámokat eredményez.

06Hogyan számítja ki a Google a csillagértékelést az új, kevés értékeléssel rendelkező vállalkozások esetében?

Azoknak az új vállalkozásoknak, amelyeknek kevesebb értékelésük van, mint a minimális küszöbérték (m), a pontszámuk erősen a kategóriaátlaghoz van horgonyozva. Egy új étterem 3 darab, 5.0 átlagú értékeléssel lehet, hogy csak 4.1–4.3-at jelenít meg, mert a saját adataira vonatkozó Bayes-súly csak 5–10%. Ez matematikailag helyes – 3 adatpont nem tud megbízhatóan megbecsülni egy valódi minőségi pontszámot.

07Befolyásolja-e az értékelés hossza vagy tartalma, hogy a Google hogyan súlyozza azt?

Kvalitatívan igen – a Google rendszerei elemzik az értékelések szövegét hangulat, kulcsszójelek és minőségi mutatók szempontjából. Egy részletes, 200 szavas értékelés, amely konkrét szolgáltatási tapasztalatokat említ, valószínűleg magasabb pontszámot kap a minőségi jelekre, mint egy 5 csillagos értékelés szöveg nélkül. Azonban a szöveges értékelés minősége és a numerikus súlyozási együttható közötti pontos kvantitatív kapcsolat nincs nyilvánosan dokumentálva.

08Mi a Bayes-féle átlagképlet és mikor használjam?

A képlet: WR = (v/(v+m)) × R + (m/(v+m)) × C. Használja bármikor, amikor elemeket kell rangsorolnia minőség szerint, ha ezeknek az elemeknek nagyon eltérő az értékelésszámuk. Ez a standard megközelítés termékajánló rendszerek, tartalomrangsorolás és üzleti értékelési platformok esetében. A kulcsfontosságú kalibrálandó paraméter az m – ha túl alacsony, nem nyújt védelmet a kiugró értékek ellen; ha túl magas, a legitim új belépők tartósan elnyomás alá kerülnek.

09Hogyan kezeli a Google csillagértékelési algoritmusa az értékelés-kiugrásokat és a hamis értékeléseket?

A Google anomália-észlelése függetlenül működik a Bayes-képlettől. Amikor sebesség-kiugrásokat észlelnek – általában egy vállalkozás normál heti értékelési rátájának 10–20-szorosát –, az új értékelések karantén állapotba kerülnek, ahol a cégtulajdonos számára láthatóak, de nem számítanak bele a nyilvános értékelésekbe. Azok az értékelések, amelyek átmennek a mesterséges intelligencia és a manuális ellenőrzéseken, végül kikerülnek a karanténból; amelyeket nem, azokat értesítés nélkül eltávolítják.

10Hogyan szerezzek olyan 5 csillagos értékelést a Google-on, ami tartós is marad?

A tartósan magas értékelésekhez következetes értékelési sebességre van szükség, nem egyszeri szerzésre. A képlet az idővel felhalmozott volument jutalmazza: havi 10 hiteles értékelés 12 hónapon keresztül stabilabb, magasabb rangsorolású pontszámot eredményez, mint 120 értékelés egyetlen hónap alatt. Koncentráljon a természetes értékelésgenerálásra a vásárlás utáni követéssel, QR-kódokkal a szolgáltatás helyén, és emlékeztetőkkel az e-mail folyamatokban – mindezt a Google irányelvein belül.

A csillagértékelések nem azok, aminek a felszínen látszanak. A Google által megjelenített szám egy statisztikai modell kimenete, amelyet arra terveztek, hogy ellenálljon a manipulációnak, figyelembe vegye a bizonytalanságot, és jutalmazza a következetes minőséget az idő múlásával. A matematika megértéséhez nem kell statisztikus diplomával rendelkezni – csak el kell fogadni, hogy három 5 csillagos értékelés nem ér annyit, mint 120 hiteles, 4.6-os átlagú értékelés. A képlet ezt teszi egyértelművé. Az, hogy mit kezd ezzel a belátással, már stratégia kérdése.

Hogyan működikÁrakGYIK
// the_math_favors_volume

Az értékelése egy matematikai probléma. Segítünk megoldani.

A Bayes-képlet az idővel felhalmozott értékelési volument jutalmazza. Minden ma megszerzett értékelés a helyes irányba mozdítja a bizalmi súlyát – és a hatás halmozódik.

Kezdje el növelni az értékelések számát