🔥 Sınırlı süreli: %10 İNDİRİM tüm siparişlerde — kodu kullan STAR10Kullan →
Canlı10,847 bugüne kadar teslim edilen yorum7 bugün verilen siparişSonraki teslimat ~2 saat içinde
derinlemesine-inceleme20 Nisan 2026·blogPost.bayesianStarRatingMath.readTime min read

Google Yıldız Puanınızı Gerçekte Nasıl Hesaplıyor (Bu Bir Ortalama Değil)

Ağırlıklı yorumların, güncelliğin ve görüntülenen puanınızın aritmetik ortalamanızdan neredeyse kesin olarak neden farklı olduğunun arkasındaki Bayesyen matematiği — gerçek formüller ve pratik hesaplamalarla açıklıyoruz.

Bayesyen yıldız puanı matematiğinin soyut görselleştirmesi — koyu lacivert arka planda parlayan camgöbeği ve zümrüt rengi olasılık dağılımları, havada süzülen matematiksel notasyon
Q
Quick Answers
Google, yıldız puanlarını hesaplamak için basit bir ortalama mı kullanıyor?
Hayır. Google, yorum sayısı düşük olduğunda puanları kategori ortalamasına çeken, Bayesyen etkili ağırlıklı bir formül uygular. 5.0 puanlı 3 yoruma sahip bir işletme, 4.6 puanlı 120 yoruma sahip bir işletmeden daha düşük bir efektif puan gösterecektir.
Puanlama için Bayesyen ortalama formülü nedir?
WR = (v/(v+m)) × R + (m/(v+m)) × C — burada v yorum sayınız, m minimum eşik, R ham ortalamanız ve C kategori ortalamasıdır. v arttıkça, kendi ortalamanız baskın hale gelir.
Puanınızın istikrar kazanması için kaç Google yorumu gerekir?
Kategorinizin ortalama yorum hacmine bağlı olarak yaklaşık 50–100 yorum. Bu eşiğin altında, genel ortalamaya doğru olan Bayesyen çekim, mükemmel bir puanı bile önemli ölçüde baskılayacak kadar güçlüdür.
Google puanım için neden yeni yorumlar daha önemli?
Google, güncellik ağırlıklandırması uygular — son 90 gün içinde yayınlanan yorumlar, 18+ ay önceki yorumlardan önemli ölçüde daha fazla etkiye sahiptir. Bu, Bayesyen önselden bağımsızdır ve tutarlı bir yorum hızı oluşturan işletmeleri ödüllendirir.

İşte çoğu işletme sahibinin zor yoldan öğrendiği bir şey: art arda yirmi tane beş yıldızlı yorum toplayabilir ve görüntülenen puanınızın zar zor hareket ettiğini görebilirsiniz. Ya da daha kötüsü — hizmetinizi geliştirmek için altı ay harcarsınız, nihayet 50 yoruma ulaşırsınız ve 4.8'lik ortalamanızın Google Maps'te bir şekilde 4.3'e yerleştiğini fark edersiniz. Matematik bozuk değil. Tam olarak tasarlandığı gibi çalışıyor. Sadece size tasarımın ne olduğu söylenmedi.

Google, puanlama algoritmasını hiçbir zaman yayınlamadı. Ancak IMDB'nin halka açık belgelenmiş Bayesyen formülü, Algolia'nın puanlama belgeleri, yorum sistemleri üzerine akademik araştırmalar ve yıllarca uygulayıcıların görünür puan değişikliklerini tersine mühendislikle incelemesi arasında, mekanikler iyi anlaşılmıştır. Bu makale, matematiği — düzgün bir şekilde, gerçek sayılarla — adım adım anlatıyor.

Basit Ortalamaların Sorunu

// naive_average.failure_modes

Basit bir ortalamanın ne olduğu ve neden başarısız olduğuyla başlayalım. Bir dizi puanın aritmetik ortalaması, basitçe toplamın sayıya bölünmesidir. 5, 4 ve 5'lik üç yorum (5+4+5)/3 = 4.67 verir. Bu matematiksel olarak doğrudur. Ancak amaç binlerce işletmeyi birbirine karşı sıralamak olduğunda istatistiksel olarak yanıltıcıdır.

Basit Ortalama — Başarısızlıklar
5.0 puanlı 1 yorum, 4.8 puanlı 500 yorumu geride bırakır — örneklem büyüklüğü göz ardı edilir
Sahte yorumlarla yeni açılan işletmeler, yeni giren sıralamalarında baskın olur
Düşük hacimde puan şişer, ölçekte olumsuz yorumlar biriktikçe söner
Şüpheli yorum hızı artışlarına ceza yok — tasarımsal olarak manipüleye açık
Bayesyen Ağırlıklı — Çözümler
Düşük yorum sayılı işletmeler kategori ortalamasına çekilir — aykırı değerler baskılanır
Yüksek yorum hacmi güven kazandırır — skor gerçek kalite sinyaline yakınsar
Güncellik ağırlıklandırması skoru güncel tutar — 18 aylık yorumların etkisi azalır
Yorumcu güven puanlaması, şüpheli veya düşük aktiviteli hesapların ağırlığını azaltır

Başarısızlık modları ölçekte hızla çoğalır. Geçen hafta hevesli arkadaşlarından aldığı üç yorumla açılan bir restoran, ortalaması 4.4 olan 200 yoruma sahip yerleşik bir rakibinden daha yüksek puan alacaktır — yerleşik yerin çok daha güvenilir bir sinyal temsil etmesine rağmen. Buna izin veren herhangi bir sıralama sistemi, aylar içinde alakasız hale gelecek şekilde manipüle edilecektir.

Google yıldız puanı hesaplaması pratikte nasıl çalışır?

Bayesyen puanlamayı güven ağırlıklı bir ortalama olarak düşünün. Çok az yorumunuz olduğunda, sistem örneğinize olduğu gibi göstermek için yeterince güvenmez. Bunun yerine ham ortalamanızı bir önselle — tüm benzer işletmelere dayalı varsayılan bir beklentiyle — harmanlar. Ne kadar çok yorum biriktirirseniz, sistem kendi verilerinize o kadar çok güvenir ve önsel o kadar az önemli hale gelir.

IMDB, En İyi 250 listesi için tam olarak bu yaklaşımı kullanır ve formülü halka açık olarak belgelemiştir: WR = (v/(v+m)) × R + (m/(v+m)) × C. Değişkenler zarif bir şekilde basittir, ancak davranışsal sonuçları tam olarak özümsemek bir an sürer. Aynı matematiksel yapı, Algolia'nın sıralama belgelerinde, yorum sistemleri üzerine akademik literatürde ve Google'ın yerel sıralamasını inceleyen SEO uygulayıcılarının yaptığı tersine mühendislik çalışmalarında ortaya çıkar.

Yorum sayısı arttıkça Bayesyen önsel inancın değiştiğini gösteren olasılık dağılımı eğrileri — lacivert ve camgöbeği tonlarında matematiksel sanat
// şekil_01 — Önsel inanç (düz dağılım, düşük sayı) kanıt biriktikçe sonsal inanca yakınsar. Yıldız puanlarına uygulanan Bayesyen çıkarım, diğer herhangi bir tahmin problemiyle aynı şekilde davranır: daha fazla veri = daha dar güven aralığı = ortalamaya daha az gerileme.

Bayesyen Ortalama Formülü Açıklaması

// bayesian_average.formula_derivation

WR = (v/(v+m)) × R + (m/(v+m)) × C formülü, iki niceliğin ağırlıklı bir karışımıdır: işletmenizin kendi gözlemlenen ortalaması (R) ve kategori genelindeki ortalama (C). Ağırlıklar, sahip olduğunuz yorum sayısının (v) minimum güvenilirlik eşiğine (m) göre ne kadar olduğuyla belirlenir.

Dikkat ederseniz (v/(v+m)) + (m/(v+m)) her zaman 1.0'a eşittir. Bu iki ağırlığın toplamı %100'dür — her zaman kendi verileriniz ile önsel arasında bir ara değer bulursunuz. Tek soru, her birinden ne kadar olduğudur. v, m'ye göre çok küçük olduğunda, önsel baskın olur. v, m'ye göre büyük olduğunda, kendi yorumlarınız baskın olur.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

m eşiği, platformun güven gereksinimlerini kodlayan parametredir. IMDB, En İyi 250 hesaplaması için m'yi yaklaşık 25.000 oy olarak belirlemiştir. Google'daki bir mahalle kafesi, Avatar ile aynı istatistiksel evrende rekabet etmediği için m çok daha düşük ayarlanmıştır — uygulayıcılar genellikle Google yerel listelemeleri için m'yi kategoriye ve coğrafi pazara göre değişmekle birlikte 5 ila 50 aralığında tahmin etmektedir.

Kategori ortalaması C, en az takdir edilen değişkendir. Sabit bir küresel sabit değildir. Google, C'yi neredeyse kesin olarak dinamik olarak hesaplar — kategori başına, şehir başına, belki de arama bağlamına göre. San Francisco'daki bir diş hekimi, kırsal Montana'daki restoranlarla değil, diğer San Francisco diş hekimleriyle karşılaştırılır. Bu, Bayesyen tabanınızın kategoriye özgü olduğu anlamına gelir.

Ağırlıklı yıldız puanı formülü SEO'nuz için neden önemlidir?

Pratik çıkarım şudur: ilk 50 yorumunuzu almak, 51'den 150'ye kadar olan yorumları almaktan orantısız bir şekilde daha önemlidir. Güvenilirlik eşiği m'nin altındaki her yorumun büyük bir etkisi vardır çünkü (v/(v+m)) katsayısını önemli ölçüde değiştirir. v=5'ten v=10'a gitmek güven ağırlığınızı ikiye katlar. v=150'den v=155'e gitmek ise zar zor ölçülebilir.

Bu, uygulayıcıların tekrar tekrar gözlemlediği sezgilere aykırı bir deseni açıklar: bir işletme 3 yorumdan 30 yoruma çıkar ve yeni yorumlar da olumlu olsa bile görüntülenen puanının 5.0'dan 4.6'ya düştüğünü görür. Matematik doğrudur. İlk baştaki 5.0, Bayesyen bir kurguydu. 4.6 ise ilk dürüst tahmindir.

Adım Adım Hesaplama Örneği

// step_by_step.numerical_walkthrough

Gerçekçi bir kategori ortalaması olan C = 4.1 ve minimum eşik olan m = 50 kullanarak iki pratik örnek. Bunlar, orta derecede rekabetçi bir yerel hizmet kategorisi (tesisatçılar, diş hekimleri, oto tamirhaneleri) için makul tahminlerdir. Kendi kategorinizi modellemek için farklı değerler girin.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

İşletme A'nın mükemmel bir ham puanı var — her yorumcu 5 yıldız vermiş. Ancak sadece 3 yorumla, formül kendi verilerine sadece %5.7 oranında güveniyor. Görüntülenen puanının kalan %94.3'ü ise 4.1 olan kategori ortalamasından geliyor. Sonuç: 4.15. Hak ettiği gibi görünen 5.0 değil.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

İşletme B'nin ham ortalaması 4.6 ile daha düşük — bazı yorumcular 3 veya 4 yıldız vermiş. Ancak 120 yorum, formülün kendi verilerine %70.6 oranında güvendiği anlamına geliyor. Görüntülenen 4.45'lik puanı gerçeğe çok daha yakın ve Google'ın algoritması tarafından İşletme A'nın nominal 5.0'ından daha yüksek sıralanacak. Hacim güvenilirlik kazandırır. Güvenilirlik görünürlük kazandırır.

Simülasyon: Basit Ortalama vs. Bayesyen Ağırlıklı Puan

// simulation.naive_vs_bayesian_comparison

Aşağıdaki tablo, C = 4.1 ve m = 50 ile altı senaryo üzerinden formülü uygular. Delta sütunu, Bayesyen puanın basit ortalamadan ne kadar farklı olduğunu gösterir. Yorum sayısı arttıkça aralığın nasıl daraldığına dikkat edin — bu, kanıt biriktikçe önselin etkisini kaybetmesidir.

Bayesyen Ağırlıklı Puan Simülasyonu
m = 50, C = 4.1 (tahmini kategori ortalaması). Tüm hesaplamalar WR = (v/(v+m))×R + (m/(v+m))×C formülünü kullanır.
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

En ilginç satır sonuncusu: sadece 5 yorumu olan ama korkunç bir 2.0 ham ortalamaya sahip bir işletme aslında 3.85 gösteriyor — kategori ortalaması tarafından neredeyse iki tam yıldız yukarı çekilmiş. Bu kasıtlı bir tasarım. Sistem, bir işletmeyi beş veri noktasına dayanarak yok olmaya mahkum etmeyi reddeder. Örneklem güveni haklı çıkaracak kadar büyük olana kadar ortalamaya doğru kendini korumaya alır.

Olumsuz aykırı değerler üzerindeki bu sönümleme etkisi, yorum bombalamasının — sahte olumsuz yorumlardan oluşan koordineli bir kampanya — yüzeyde göründüğünden daha az felaket olmasının nedenidir. Algoritma, yorum sayısı onları haklı çıkarmak için yetersiz olduğunda aşırı sonuçlara direnir. Bununla birlikte, Google'ın anomali tespit sistemleri, her iki yöndeki hızlı yorum kampanyalarını da işaretler.

Yorum veri noktalarının sayı arttıkça bir ortalama çizgisine yakınsadığını gösteren 3D dağılım grafiği görselleştirmesi — zümrüt ve camgöbeği renklerinde Bayesyen çıkarım yakınsaması
// şekil_02 — Dağılım yakınsaması: veri noktaları biriktikçe, tahmin gerçek ortalamaya yakınsar. Her ek yorum varyansı azaltır. Önselin çekimi (yatay kesikli çizgi) v/m oranı büyüdükçe zayıflar.

Google'ın Temel Formülün Ötesindeki Ek Katmanları

// google_specific.beyond_bayesian_math

Bayesyen formülü temel çizgiyi açıklar, ancak Google'ın gerçek sistemi en az üç katman daha ekler: güncellik etkisinin azalması, yorumcu güven puanlaması ve hız artışları için anomali sönümlemesi. Bunların hiçbiri resmi olarak doğrulanmamıştır. Hepsi davranışsal kanıtlardan ve patent analizinden çıkarılmıştır.

Temel Bayesyen formülünü temel olarak düşünün. Üzerine inşa edilen her şey, sinyali manipülasyona daha dirençli ve zamansal olarak daha doğru hale getirir. Amaç her zaman aynıdır: görüntülenen puanın, bir müşterinin bugün içeri girse gerçekten deneyimleyeceği şeyi yansıtmasını sağlamak.

Güncellik ağırlıklandırması — son 90 gününüz neden daha önemli

Google, yorumlara zamansal bir etki azalması uygular ve eski kayıtlara göre yeni geri bildirimlere daha fazla ağırlık verir. Mekanizma, bir yorumun etkisinin belirli bir kesim tarihinde sıfıra düşmek yerine zamanla azaldığı üstel bir bozulma fonksiyonu ile tutarlıdır.[1]

Google puanlama davranışının topluluk analizi, 12-18 aydan daha önce yayınlanan yorumların, geçen hafta yayınlanan bir yoruma göre kabaca %30-50 daha az etkiye sahip olduğunu sürekli olarak bulmaktadır. Üç yıl önceki 5 yıldızlı bir yorum hala sayılır — sadece daha az sayılır. Bu, 2022'de 80 yorum toplayan ve o zamandan beri hiç yorum almayan bir işletmenin, ödünç alınmış bir sinyalle yaşadığı anlamına gelir.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Yorumcu güvenilirliği — Seviye 7 Yerel Rehber yorumu neden daha etkili

Google'ın yorumcular için güven hiyerarşisi, patent portföyünden ve gözlemlenebilir davranışlardan çıkarılmıştır. US8818995B1 patenti, katkıları yapan varlığın güven düzeyine göre ağırlıklandıran bir arama sıralama sistemini tanımlar. Yorumlara uygulandığında: birden fazla iş kategorisinde yüzlerce ayrıntılı yoruma sahip bir Seviye 7 Yerel Rehber, yüksek güvenilirliğe sahip bir düğüm olarak kaydedilir.[2]

Pratik etki: Seviye 7 bir Yerel Rehber'den gelen 5 yıldızlı bir yorum, muhtemelen dün oluşturulmuş ve hiç yorum geçmişi olmayan bir hesaptan gelen 5 yıldızlı bir yoruma göre daha ağır basar. Bu yıldız değeriyle ilgili değildir — her ikisi de paydada 5 olarak sayılır. Ancak ortalama alınmadan önce her birine uygulanan ağırlık farklıdır. Google bu farkı hiçbir zaman halka açık olarak ölçmemiştir.

Anomali sönümlemesi — bir haftada 40 yorum geldiğinde ne olur

Hız artışları ayrı bir tespit katmanını tetikler. Bir işletme, temel seviyesi ayda 2-3 iken 72 saat içinde 40 yorum alırsa, Google sistemleri bu deseni işaretler. Sonuç otomatik silme değil — karantinadır. Sistem araştırırken yeni yorumlar görüntülenen sayıda ve puanda görünmeyi durdurur.[3]

Bu mekanizma, toplu yorum kampanyaları satın alan işletmelerin neden genellikle gözle görülür bir iyileşme görmediğini — veya eski otantik yorumlar görünür kalırken yeni partinin yorum inceleme belirsizliğinde beklemesiyle profil puanlarının geçici olarak düştüğünü — açıklar. Algoritma, yerleşik temel çizgilerden sapan ani hacim bükülmelerine güvensizlik duyacak şekilde özel olarak ayarlanmıştır.

Öncesi ve Sonrası: Yorum Hacmi Gerçekte Neyi Değiştirir

// practical_impact.before_and_after_scenarios

Formülün zaman içinde nasıl davrandığını göstermek için iki gerçek dünya tarzı senaryo. Hiçbiri kurgusal değil — bu desenler, itibar yönetimi uygulayıcılarının vaka çalışmalarında tekrar tekrar ortaya çıkıyor.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTSezgisel olmayan sonuç: puan basit ortalamada 4.9'dan görüntülenen 4.58'e düştü, ancak Bayesyen skor +0.37 puan arttı. Görüntülenen sayı artık dürüst bir değer. Önceden 4.9, 8 veri noktasıyla desteklenen istatistiksel bir kurguydu. Şimdi ise 4.58, Google'ın güvendiği ve buna göre sıraladığı güvenilir bir sinyal.

Diş hekimi senaryosu, Bayesyen puanlamanın temel içgörüsünü gösterir: yüksek güvene sahip daha düşük bir ham ortalama, düşük güvene sahip daha yüksek bir ham ortalamayı yener. Görüntülenen puan düştü (nominal 4.9'dan görüntülenen 4.58'e), ancak sıralama konumu iyileşti çünkü güven ağırlığı artık gerçek.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTAnomali tespiti, etkili görünür yorum sayısını 200'den ~160'a düşürür. Güncellik etkisinin azalmasıyla (hızlı artış dönemindeki yorumlar artık eskiyor) birleştiğinde, ham ortalama sabit kalmasına rağmen Bayesyen skor düşer. Doğal bir ritim — 20 hafta boyunca haftada 10 yorum — 200 yorumu bir anda almaktan maddi olarak daha iyi sonuçlar üretir.

Restoran artış senaryosu, organik ritmin neden önemli olduğunu gösterir. Google'ın sistemleri, doğal olmayan hızı tespit etmek için kalibre edilmiştir. Bir haftada kırk yorum ve ardından iki aylık sessizlik sadece şüpheli görünmekle kalmaz — sönümlenmiş etkili sayı, para harcadığınız ve neredeyse hiçbir şey kazanmadığınız anlamına gelir. Matematik bunu iki kez cezalandırır: anomali tespiti görünür sayıyı azaltır ve güncellik etkisinin azalması, artış dönemi yorumlarının hemen solmaya başladığı anlamına gelir.

Alternatif Yaklaşımlar: Wilson Skoru ve Dirichlet Modelleri

// related_approaches.wilson_score_dirichlet

Bayesyen ortalama, istatistiksel olarak sağlam tek yaklaşım değildir. Evan Miller'ın 2009 tarihli 'Ortalama Puana Göre Nasıl Sıralama Yapılmaz' makalesi farklı bir yöntemi popülerleştirdi: Wilson skor güven aralığının alt sınırı. Reddit bunu yorum sıralaması için benimsedi. Yelp bunun bir varyasyonunu kullanıyor.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

Wilson skoru, Bayesyen ortalamadan farklı bir soru sorar. 'Verilerimi bir önselle harmanla' demek yerine, 'sahip olduğum puanlara göre, gerçek kalitenin %95 güvenle muhtemelen en kötü ne olabileceği' sorusunu sorar. Bu, çok düşük yorum sayılarında belirsizliği Bayesyen ortalamadan bile daha agresif bir şekilde cezalandıran muhafazakar bir tahmin üretir.

Üçüncü bir yaklaşım — Dirichlet-Multinomial modeli — beş yıldız değerinin tamamını tek bir sürekli skor yerine ayrı kategoriler olarak ele alır. District Data Labs bu yaklaşımı çok yıldızlı sistemler için belgeledi. Matematiksel olarak IMDB formülünden (yıldızları örtük olarak doğrusal bir ölçek olarak ele alır) daha doğrudur, ancak hesaplama açısından daha ağırdır. Pratik amaçlar için, Bayesyen ortalama ile bir Dirichlet modeli arasındaki davranışsal fark, kabaca 30 yorumun üzerinde ihmal edilebilir hale gelir.

Matematiksel notasyon ve istatistiksel formüller — Wilson skoru ve Bayesyen önsel, karanlık arka planda parlayan denklemler olarak görselleştirilmiş, soyut bilimsel sanat
// şekil_03 — Wilson skoru alt sınırı vs. aynı ham oranlarda Bayesyen ortalama. n=5'te, Wilson daha muhafazakardır (belirsizliği daha sert cezalandırır). n=100'de, her ikisi de birbirinin 0.02 puan yakınına yakınsar. Yöntem seçimi en çok kritik erken yorum penceresinde önemlidir.

Bu, İşletme Stratejiniz İçin Ne Anlama Geliyor?

// strategic_implications.for_business_owners

Matematiği anlamak, soyut tavsiyeleri ('daha fazla yorum alın') ölçülebilir bir stratejiye dönüştürür. Her işletme v/(v+m) spektrumunda bir yerdedir. Nerede olduğunuzu bilmek, bir sonraki yorumunuzun ibreyi ne kadar hareket ettirdiğini söyler.

Eğer v = 8 ve m = 50 ise, tek bir yeni 5 yıldızlı yorum güven ağırlığınızı 8/58 = 0.138'den 9/59 = 0.153'e kaydırır. Bu %1.5'lik puanlık değişim anlamlıdır. Eğer v = 300 ve m = 50 ise, aynı yorum sizi 300/350 = 0.857'den 301/351 = 0.858'e kaydırır — zar zor tespit edilebilir. Erken penceredeki hacim, ölçekteki hacmin on katı matematiksel etkiye sahiptir.

Kendi işletmeniz için ağırlıklı ortalama yıldız puanı nasıl hesaplanır?

Formülü bir hesap tablosunda kendiniz çalıştırabilirsiniz. Mevcut yorum sayınızı v olarak alın. Kategorinizin m'sini, Google Maps kategorinizdeki ilk 3 işletmenin hangi yorum sayılarını koruduğuna bakarak tahmin edin — bu dağılımın 25. persentili makul bir m tahminidir. Mevcut görüntülenen puanınız muhtemelen zaten WR çıktısıdır; basit ortalamanız ise arka uçtaki basit toplamın sayıya bölünmesidir.

Önemsemeniz gereken hesaplama, sonraki N yorumun marjinal etkisidir. Modelleyin: v'yi 10 artırın, WR'yi yeniden hesaplayın, farkı gözlemleyin. Bir duyarlılık eğrisi oluşturmak için bunu bir dizi v değeri boyunca yapın. Bu eğrinin en dik kısmı — her ek yorumun en büyük WR iyileştirmesini ürettiği yer — yorum toplama çabanızı yoğunlaştırmanız gereken yerdir.

Güncellik neden yorum hızının toplam sayıdan daha önemli olduğu anlamına gelir

Güncellik etkisinin azalmasını anladığınızda, optimizasyon hedefi değişir. Bu sadece toplam hacimle ilgili değil — zaman içinde dağılmış hacimle ilgilidir. Beş yıl boyunca toplanmış ve son 18 aydır hiç yorum almamış 400 yoruma sahip bir işletme, etkili olarak sayıların gösterdiğinden daha küçük bir örneklem üzerinde çalışıyor demektir. Etkisi azalmış yorumlar, devam eden ağırlıklı ortalamaya daha az katkıda bulunur.

Tutarlı yorum üretimi — mütevazı oranlarda bile — zamanla, ani alımların asla yapamayacağı şekillerde birikir. On iki ay boyunca ayda sekiz yeni yorum, tek bir ayda 96 yorumdan neredeyse her ilgili metrikte daha iyi performans gösterir: Bayesyen güven, anomali tespiti onayı, güncellik azalma yörüngesi ve tüketici güvenilirlik algısı.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Sıkça Sorulan Sorular

// faq.frequently_asked_questions

01Google yıldız puanları nasıl hesaplanır?

Google, basit bir aritmetik ortalama yerine Bayesyen etkili ağırlıklı bir formül kullanır. Yüksek güvenilirliğe sahip katkıda bulunanlardan (Yerel Rehberler, doğrulanmış geçmişe sahip hesaplar) gelen yorumlar daha fazla ağırlık taşır. Son yorumlar, zamansal etki azalması yoluyla daha fazla ağırlıklandırılır. Formül, yeterli kanıt birikene kadar düşük yorum sayılı işletmeleri kategori ortalamasına sabitler ve puanları bir önsele doğru çeker.

02Bir yorumun Google ortalamanıza etkisi diğerinden daha fazla mıdır?

Evet, iki şekilde. Birincisi, düşük yorum sayıları, her yeni yorumun güven katsayısını önemli ölçüde değiştirdiği anlamına gelir — ilk 50 yorumunuz, 200-250 arası yorumlardan yorum başına daha önemlidir. İkincisi, yorumcu güven puanlaması, 1.000+ yoruma sahip bir Seviye 7 Yerel Rehber'den gelen bir yorumun, yepyeni bir hesaptan gelen bir yoruma göre ortalama formülünde muhtemelen daha fazla ağırlık taşıdığı anlamına gelir.

03Google puanınızın istikrar kazanması için kaç yorum gerekir?

Bayesyen anlamda istikrar, v >> m olduğunda — kabaca yorum sayınız minimum eşiğin 3-5 katı olduğunda — gerçekleşir. Çoğu yerel işletme kategorisi için bu yaklaşık 50-150 yorum demektir. Bu noktanın ötesinde, kategori ortalamasına doğru Bayesyen çekim o kadar zayıftır ki, görüntülenen puanınız gerçek ortalamanızla yakından takip eder.

04Ağırlıklı yıldız puanı nedir ve nasıl çalışır?

Ağırlıklı bir yıldız puanı, her bir yorumun genel puana katkısını, yıldız değerinin ötesindeki faktörlere göre ayarlar: toplam kaç yorum olduğu (güven ağırlıklandırması), yorumun ne kadar yeni olduğu (zamansal etki azalması) ve kimin yazdığı (yorumcu güveni). Sonuç, manipülasyona daha dirençli ve basit bir ortalamadan daha istatistiksel olarak anlamlı bir puandır.

05Google puanım neden Yelp veya TripAdvisor puanımdan farklı?

Her platform, minimum eşik için farklı parametre değerleri, yorumcular için farklı güven hiyerarşileri ve farklı güncellik etki azalma oranları ile farklı bir algoritma kullanır. FTC ekonomistlerinin araştırması, Google puanlarının ortalama olarak eşdeğer BBB puanlarından yaklaşık 1.25 yıldız daha yüksek olduğunu bulmuştur. Yelp'in algoritması özellikle daha katıdır — 'önerilen' sistemi aracılığıyla daha fazla yorumu filtreler, bu da daha düşük ancak daha muhafazakar ortalama puanlar üretme eğilimindedir.

06Google, az yoruma sahip yeni işletmeler için yıldız puanını nasıl hesaplar?

Minimum eşikten (m) daha az yoruma sahip yeni işletmelerin puanları, büyük ölçüde kategori ortalamasına sabitlenir. Ortalama 5.0 olan 3 yoruma sahip yeni bir restoran, kendi verilerine olan Bayesyen ağırlığı sadece %5-10 olduğu için yalnızca 4.1-4.3 gösterebilir. Bu matematiksel olarak doğrudur — 3 veri noktası gerçek bir kalite puanını güvenilir bir şekilde tahmin edemez.

07Yorum uzunluğu veya içeriği, Google'ın bir yoruma verdiği ağırlığı etkiler mi?

Niteliksel olarak, evet — Google'ın sistemleri, duygu, anahtar kelime sinyalleri ve kalite göstergeleri için yorum metnini analiz eder. Belirli hizmet deneyimlerinden bahseden ayrıntılı 200 kelimelik bir yorum, muhtemelen metinsiz 5 yıldızlı bir yoruma göre kalite sinyallerinde daha yüksek puan alır. Ancak, yorum metni kalitesi ile sayısal ağırlıklandırma katsayısı arasındaki kesin nicel ilişki halka açık olarak belgelenmemiştir.

08Bayesyen ortalama formülü nedir ve ne zaman kullanmalıyım?

Formül şudur: WR = (v/(v+m)) × R + (m/(v+m)) × C. Bu formülü, öğeleri kaliteye göre sıralamanız gerektiğinde ve bu öğelerin çok farklı yorum sayıları olduğunda kullanın. Ürün öneri sistemleri, içerik sıralaması ve işletme derecelendirme platformları için standart yaklaşımdır. Kalibre edilecek anahtar parametre m'dir — çok düşük olması aykırı değerlere karşı koruma sağlamaz; çok yüksek olması ise meşru yeni girenleri kalıcı olarak bastırır.

09Google yıldız puanı algoritması, yorum artışlarını ve sahte yorumları nasıl ele alır?

Google'ın anomali tespiti, Bayesyen formülünden bağımsız olarak çalışır. Hız artışları tespit edildiğinde — genellikle bir işletmenin normal haftalık yorum oranının 10-20 katı — yeni yorumlar, işletme sahibi tarafından görülebilen ancak halka açık puanlamalarda sayılmayan bir karantina durumuna girer. Yapay zeka ve manuel kontrolleri geçen yorumlar sonunda karantinadan çıkar; geçemeyenler ise bildirim yapılmaksızın kaldırılır.

10Google'da gerçekten kalıcı olan 5 yıldızlı bir puana nasıl ulaşılır?

Sürdürülebilir yüksek puanlar, tek seferlik bir alım değil, tutarlı bir yorum hızı gerektirir. Formül, zaman içindeki hacmi ödüllendirir: 12 ay boyunca ayda 10 otantik yorum, tek bir ayda 120 yorumdan daha istikrarlı, daha yüksek sıralamalı bir puan üretir. Satın alma sonrası takip, hizmet noktasındaki QR kodları ve e-posta akışlarındaki hatırlatıcılar aracılığıyla — tamamı Google'ın politika yönergeleri dahilinde — doğal yorum üretimine odaklanın.

Yıldız puanları, yüzeyde göründükleri gibi değildir. Google'ın görüntülediği sayı, manipülasyona direnmek, belirsizliği hesaba katmak ve zaman içinde tutarlı kaliteyi ödüllendirmek için tasarlanmış istatistiksel bir modelin çıktısıdır. Matematiği anlamak bir istatistik diploması gerektirmez — üç adet 5 yıldızlı yorumun, ortalaması 4.6 olan 120 otantik yorumla aynı değerde olmadığını kabul etmeyi gerektirir. Formül bunu açıkça belirtir. Bu içgörüyle ne yaptığınız ise stratejidir.

Nasıl çalışırFiyatlandırmaSSS
// the_math_favors_volume

Puanınız Bir Matematik Problemi. Çözmenize Yardımcı Olabiliriz.

Bayesyen formülü, zamanla biriken yorum hacmini ödüllendirir. Bugün oluşturduğunuz her yorum, güven ağırlığınızı doğru yönde değiştirir — ve etki katlanarak artar.

Yorum Hacminizi Artırmaya Başlayın