🔥 Обмежена пропозиція: ЗНИЖКА 10% на всі замовлення — використовуйте код STAR10Отримати →
В ефірі10,847 відгуків доставлено на сьогодні7 замовлень зроблено сьогодніНаступна доставка через ~2 години
глибокий аналіз20 квітня 2026·blogPost.bayesianStarRatingMath.readTime min read

Як Google насправді розраховує ваш зірковий рейтинг (це не середнє арифметичне)

Баєсівська математика, що лежить в основі зважених відгуків, врахування давності та чому ваш відображуваний рейтинг майже напевно відрізняється від середнього арифметичного — пояснення з реальними формулами та прикладами розрахунків.

Абстрактна візуалізація баєсівської математики зіркового рейтингу — розподіли ймовірностей, що світяться блакитним та смарагдовим на темно-синьому тлі, плаваючі математичні позначення
Q
Quick Answers
Чи використовує Google просте середнє для розрахунку зіркових рейтингів?
Ні. Google застосовує зважену формулу з елементами баєсівського підходу, яка зміщує рейтинги до середнього значення по категорії, коли кількість відгуків мала. Компанія з 3 відгуками по 5.0 зірок матиме нижчий ефективний рейтинг, ніж компанія зі 120 відгуками та середньою оцінкою 4.6.
Яка формула баєсівського середнього для рейтингів?
WR = (v/(v+m)) × R + (m/(v+m)) × C — де v — кількість ваших відгуків, m — мінімальний поріг, R — ваш «сирий» середній бал, а C — середній бал по категорії. Зі зростанням v ваш власний середній бал починає домінувати.
Скільки відгуків Google потрібно, щоб рейтинг стабілізувався?
Приблизно 50–100 відгуків, залежно від середньої кількості відгуків у вашій категорії. Нижче цього порогу баєсівське зміщення до загального середнього є достатньо сильним, щоб суттєво занизити навіть ідеальну оцінку.
Чому новіші відгуки важливіші для мого рейтингу Google?
Google застосовує зважування за давністю — відгуки, опубліковані за останні 90 днів, мають значно більший вплив, ніж відгуки 18-місячної давності. Це не залежить від баєсівського апріорного розподілу і винагороджує бізнеси, які генерують відгуки стабільно.

Ось те, що більшість власників бізнесу відкривають для себе на власному гіркому досвіді: ви можете зібрати двадцять п'ятизіркових відгуків поспіль і спостерігати, як ваш рейтинг на екрані ледь рухається. Або ще гірше — ви витрачаєте шість місяців на покращення сервісу, нарешті перетинаєте позначку в 50 відгуків і розумієте, що ваш середній бал 4.8 якимось чином перетворився на 4.3 на Google Maps. З математикою все гаразд. Вона працює саме так, як було задумано. Вам просто не сказали, в чому полягав задум.

Google ніколи не публікував свій алгоритм розрахунку рейтингу. Але завдяки публічно задокументованій баєсівській формулі IMDB, документації по рейтингах від Algolia, академічним дослідженням систем відгуків та рокам зворотного інжинірингу видимих змін рейтингу, проведеного практиками, механіка добре зрозуміла. Ця стаття розбирає математику — як слід, з реальними числами.

Проблема з «наївним» середнім значенням

// naive_average.failure_modes

Почнемо з того, що таке «наївне» середнє і чому воно не працює. Середнє арифметичне для набору оцінок — це просто сума, поділена на кількість. Три відгуки з оцінками 5, 4 і 5 дають (5+4+5)/3 = 4.67. Це математично правильно. Але це також статистично оманливо, коли метою є ранжування тисяч компаній одна проти одної.

«Наївне» середнє — недоліки
1 відгук з оцінкою 5.0 випереджає 500 відгуків з оцінкою 4.8 — розмір вибірки ігнорується
Нові компанії із замовними відгуками домінують у рейтингах новачків
Рейтинг завищується при малому обсязі та занижується при накопиченні негативних відгуків у великих масштабах
Немає штрафу за підозрілі сплески активності відгуків — вразливість до маніпуляцій за своєю суттю
Баєсівське зважене — виправлення
Компанії з малою кількістю відгуків зміщуються до середнього по категорії — аномалії пригнічуються
Велика кількість відгуків здобуває довіру — оцінка збігається до справжнього сигналу якості
Зважування за давністю підтримує актуальність оцінки — відгуки 18-місячної давності втрачають вагу
Оцінка довіри до автора зменшує вагу підозрілих акаунтів або акаунтів з низькою активністю

Недоліки швидко накопичуються при масштабуванні. Ресторан, що відкрився минулого тижня з трьома відгуками від захоплених друзів, отримає вищий бал, ніж відомий конкурент з 200 відгуками та середнім балом 4.4 — хоча відомий заклад представляє значно надійніший сигнал. Будь-яка система ранжування, що допускає таке, буде знівельована маніпуляціями за лічені місяці.

Як на практиці працює розрахунок зіркового рейтингу Google

Уявляйте баєсівський рейтинг як середнє, зважене за рівнем довіри. Коли у вас дуже мало відгуків, система не довіряє вашій вибірці настільки, щоб відображати її як є. Натомість вона змішує ваш «сирий» середній бал з апріорним значенням — стандартним очікуванням, заснованим на всіх подібних компаніях. Чим більше відгуків ви накопичуєте, тим більше система довіряє вашим власним даним і тим менше важить апріорне значення.

IMDB використовує саме такий підхід для свого списку Топ-250 і публічно задокументував формулу: WR = (v/(v+m)) × R + (m/(v+m)) × C. Змінні елегантно прості, але поведінкові наслідки потребують часу для повного усвідомлення. Така ж математична структура з'являється в документації по ранжуванню від Algolia, академічній літературі про системи відгуків та в роботах SEO-практиків, що вивчають локальне ранжування Google шляхом зворотного інжинірингу.

Криві розподілу ймовірностей, що показують зміну апріорного припущення зі збільшенням кількості відгуків — математичне мистецтво в темно-синіх і блакитних тонах
// рис. 01 — Апріорне припущення (плаский розподіл, мала кількість) збігається до апостеріорного в міру накопичення доказів. Баєсівський висновок, застосований до зіркових рейтингів, поводиться ідентично до будь-якої іншої задачі оцінки: більше даних = вужчий довірчий інтервал = менша регресія до середнього.

Пояснення формули баєсівського середнього

// bayesian_average.formula_derivation

Формула WR = (v/(v+m)) × R + (m/(v+m)) × C — це зважена суміш двох величин: власного спостережуваного середнього вашої компанії (R) та середнього по категорії (C). Вагові коефіцієнти визначаються тим, скільки у вас відгуків (v) відносно мінімального порогу достовірності (m).

Зверніть увагу, що (v/(v+m)) + (m/(v+m)) завжди дорівнює 1.0. Сума цих двох вагових коефіцієнтів становить 100% — ви завжди інтерполюєте між вашими власними даними та апріорним значенням. Питання лише в тому, яка частка кожного. Коли v дуже мале відносно m, домінує апріорне значення. Коли v велике відносно m, домінують ваші власні відгуки.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

Поріг m — це параметр, який кодує вимоги платформи до довіри. IMDB встановлює m приблизно на рівні 25 000 голосів для розрахунку свого Топ-250. Кав'ярня по сусідству на Google не конкурує в тому ж статистичному всесвіті, що й «Аватар», тому m встановлюється значно нижче — практики зазвичай оцінюють m в діапазоні від 5 до 50 для локальних профілів Google, залежно від категорії та географічного ринку.

Середнє по категорії C — це найбільш недооцінена змінна. Це не фіксована глобальна константа. Google майже напевно розраховує C динамічно — для кожної категорії, кожного міста, можливо, для кожного контексту пошуку. Стоматолог у Сан-Франциско порівнюється з іншими стоматологами Сан-Франциско, а не з ресторанами в сільській місцевості Монтани. Це означає, що ваш баєсівський мінімум залежить від категорії.

Чому формула зваженого зіркового рейтингу важлива для вашого SEO

Практичний наслідок полягає в тому, що отримання перших 50 відгуків має непропорційно більше значення, ніж отримання відгуків з 51-го по 150-й. Кожен відгук нижче порогу достовірності m має надмірний вплив, оскільки він значно змінює коефіцієнт (v/(v+m)). Перехід з v=5 до v=10 подвоює ваш ваговий коефіцієнт довіри. Перехід з v=150 до v=155 ледь помітний.

Це пояснює контрінтуїтивну закономірність, яку практики спостерігають постійно: бізнес переходить від 3 до 30 відгуків і бачить, як його відображуваний рейтинг падає з 5.0 до 4.6 — навіть якщо нові відгуки також позитивні. Математика правильна. Ранній рейтинг 5.0 був баєсівською фікцією. 4.6 — це перша чесна оцінка.

Покроковий розбір розрахунку

// step_by_step.numerical_walkthrough

Два приклади розрахунків з використанням реалістичного середнього по категорії C = 4.1 та мінімального порогу m = 50. Це правдоподібні оцінки для помірно конкурентної категорії місцевих послуг (сантехніки, стоматологи, автомайстерні). Підставте різні значення, щоб змоделювати власну категорію.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

Компанія А має ідеальний «сирий» бал — кожен відгук отримав 5 зірок. Але маючи лише 3 відгуки, формула довіряє власним даним лише на 5.7%. Решта 94.3% її відображуваного рейтингу походять від середнього по категорії 4.1. Результат: 4.15. Не 5.0, на які вона, здавалося б, заслуговує.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

Компанія Б має нижчий «сирий» середній бал 4.6 — деякі рецензенти поставили 3 або 4 зірки. Але 120 відгуків означають, що формула довіряє її власним даним на 70.6%. Її відображуваний рейтинг 4.45 набагато ближчий до реальності, і алгоритм Google ранжуватиме його вище, ніж номінальний 5.0 компанії А. Кількість здобуває довіру. Довіра здобуває видимість.

Симуляція: «Наївне» середнє проти баєсівського зваженого рейтингу

// simulation.naive_vs_bayesian_comparison

У таблиці нижче застосовано формулу до шести сценаріїв з C = 4.1 та m = 50. Стовпець «Різниця» показує, наскільки баєсівський рейтинг відрізняється від «наївного» середнього. Зверніть увагу, як розрив зменшується зі зростанням кількості відгуків — це апріорне значення втрачає вплив у міру накопичення доказів.

Симуляція баєсівського зваженого рейтингу
m = 50, C = 4.1 (оціночне середнє по категорії). Усі розрахунки використовують формулу WR = (v/(v+m))×R + (m/(v+m))×C
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

Найцікавіший рядок — останній: компанія з лише 5 відгуками, але жахливим «сирим» середнім балом 2.0 насправді відображає 3.85 — підтягнутий майже на дві повні зірки середнім значенням по категорії. Це зроблено навмисно. Система відмовляється прирікати бізнес на забуття на основі п'яти точок даних. Вона схиляється до середнього, доки вибірка не стане достатньо великою, щоб викликати довіру.

Цей ефект пом'якшення негативних викидів є причиною того, чому «бомбардування відгуками» — скоординована кампанія фейкових негативних відгуків — є менш катастрофічним, ніж здається на перший погляд. Алгоритм протистоїть екстремальним результатам, коли кількість відгуків недостатня для їх обґрунтування. Проте, системи виявлення аномалій Google також відстежують кампанії з відгуками, що мають швидку динаміку в обох напрямках.

3D-діаграма розсіювання, що показує збіжність точок даних відгуків до середньої лінії зі збільшенням їх кількості — збіжність баєсівського висновку в смарагдових і блакитних тонах
// рис. 02 — Збіжність розкиду: у міру накопичення точок даних оцінка збігається до справжнього середнього. Кожен додатковий відгук зменшує дисперсію. Вплив апріорного значення (горизонтальна пунктирна лінія) слабшає зі зростанням співвідношення v/m.

Додаткові рівні алгоритму Google окрім базової формули

// google_specific.beyond_bayesian_math

Баєсівська формула пояснює основу, але реальна система Google додає щонайменше ще три рівні: зменшення ваги за давністю, оцінка довіри до автора відгуку та приглушення аномалій при сплесках активності. Жоден з них не підтверджений офіційно. Всі вони виведені з поведінкових доказів та аналізу патентів.

Уявляйте базову баєсівську формулу як фундамент. Все, що побудовано на ній, робить сигнал більш стійким до маніпуляцій та більш точним у часі. Мета завжди одна: зробити так, щоб відображуваний рейтинг відображав те, що клієнт справді відчув би, якби зайшов сьогодні.

Зважування за давністю — чому ваші останні 90 днів домінують

Google застосовує зменшення ваги з часом до відгуків, надаючи більшу вагу нещодавнім відгукам, ніж старим. Механізм відповідає функції експоненціального затухання, де вплив відгуку зменшується з часом, а не падає до нуля в якусь конкретну дату.[1]

Аналіз поведінки рейтингів Google, проведений спільнотою, постійно виявляє, що відгуки, опубліковані понад 12–18 місяців тому, мають приблизно на 30–50% менший вплив, ніж відгук, опублікований минулого тижня. 5-зірковий відгук трирічної давності все ще враховується — просто він важить менше. Це означає, що бізнес, який зібрав 80 відгуків у 2022 році і відтоді не отримав жодного, живе за рахунок застарілого сигналу.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Довіра до автора — чому відгук Місцевого експерта 7-го рівня має більшу вагу

Ієрархія довіри Google до авторів відгуків виводиться з його патентного портфоліо та спостережуваної поведінки. Патент US8818995B1 описує систему ранжування пошуку, яка зважує внески за рівнем довіри до суб'єкта, що їх робить. У застосуванні до відгуків: Місцевий експерт 7-го рівня з сотнями детальних відгуків у різних категоріях бізнесу реєструється як вузол з високим рівнем довіри.[2]

Практичний ефект: 5-зірковий відгук від Місцевого експерта 7-го рівня, ймовірно, має більшу вагу, ніж 5-зірковий відгук від акаунта, створеного вчора без історії відгуків. Справа не в зірковому значенні — обидва враховуються як 5 у чисельнику. Але вага, що застосовується до кожного перед усередненням, різна. Google ніколи публічно не кількісно оцінював цю різницю.

Приглушення аномалій — що відбувається, коли за тиждень надходить 40 відгуків

Сплески активності активують окремий рівень виявлення. Якщо бізнес отримує 40 відгуків за 72 години, коли його базовий рівень становить 2–3 на місяць, системи Google позначають цей патерн. Результатом є не автоматичне видалення, а карантин. Нові відгуки перестають з'являтися у відображуваній кількості та рейтингу, поки система проводить розслідування.[3]

Цей механізм пояснює, чому компанії, які масово купують кампанії з відгуками, часто не бачать видимого покращення — або тимчасово бачать падіння рейтингів своїх профілів, оскільки старі автентичні відгуки залишаються видимими, а нова партія перебуває у «підвішеному» стані. Алгоритм спеціально налаштований не довіряти раптовим змінам обсягу, що відхиляються від встановлених базових показників.

До і після: що насправді змінює кількість відгуків

// practical_impact.before_and_after_scenarios

Два сценарії в стилі реального світу, щоб проілюструвати, як формула поводиться з часом. Жоден з них не є вигаданим — ці закономірності неодноразово з'являються в кейсах від фахівців з управління репутацією.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTКонтрінтуїтивний результат: рейтинг впав з «наївних» 4.9 до відображуваних 4.58, проте баєсівський бал покращився на +0.37 бала. Відображуване число тепер чесне. Раніше 4.9 було статистичною фікцією, підкріпленою 8 точками даних. Тепер 4.58 — це надійний сигнал, якому Google довіряє — і ранжує відповідно.

Сценарій зі стоматологом демонструє основну ідею баєсівського рейтингу: нижчий «сирий» середній бал з високою довірою перемагає вищий «сирий» середній бал з низькою довірою. Відображуваний рейтинг знизився (з номінальних 4.9 до відображуваних 4.58), але позиція в ранжуванні покращилася, оскільки ваговий коефіцієнт довіри тепер реальний.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTВиявлення аномалій зменшує ефективну видиму кількість відгуків з 200 до ~160. У поєднанні зі зменшенням ваги за давністю (відгуки періоду сплеску тепер старіють), баєсівський бал падає, незважаючи на те, що «сирий» середній бал залишається незмінним. Природний ритм — 10 відгуків на тиждень протягом 20 тижнів — дає суттєво кращі результати, ніж 200 за один раз.

Сценарій зі сплеском у ресторані ілюструє, чому важливий органічний ритм. Системи Google відкалібровані для виявлення неприродної динаміки. Сорок відгуків за тиждень, за якими слідують два місяці тиші, не просто виглядають підозріло — приглушена ефективна кількість означає, що ви витратили гроші і майже нічого не отримали. Математика карає за це двічі: виявлення аномалій зменшує видиму кількість, а зменшення ваги за давністю означає, що відгуки періоду сплеску починають негайно згасати.

Альтернативні підходи: оцінка Вільсона та модель Діріхле

// related_approaches.wilson_score_dirichlet

Баєсівське усереднення — не єдиний статистично обґрунтований підхід. Есе Евана Міллера 2009 року «Як не варто сортувати за середнім рейтингом» популяризувало інший метод: нижня межа довірчого інтервалу оцінки Вільсона. Reddit застосував його для ранжування коментарів. Yelp використовує його варіацію.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

Оцінка Вільсона ставить інше питання, ніж баєсівське усереднення. Замість «змішай мої дані з апріорним значенням», вона запитує: «враховуючи наявні рейтинги, якою є найгірша ймовірна справжня якість з 95% впевненістю?» Це дає консервативну оцінку, яка ще агресивніше карає за невизначеність при дуже низькій кількості відгуків, ніж баєсівське усереднення.

Третій підхід — модель Діріхле-Мультиноміальна — розглядає всі п'ять значень зірок як окремі категорії, а не як єдину безперервну шкалу. District Data Labs задокументували цей підхід для багатозіркових систем. Він математично більш коректний, ніж формула IMDB (яка неявно розглядає зірки як лінійну шкалу), але обчислювально складніший. Для практичних цілей поведінкова різниця між баєсівським усередненням та моделлю Діріхле стає незначною при кількості відгуків понад 30.

Математичні позначення та статистичні формули — оцінка Вільсона та баєсівське апріорне значення, візуалізовані як сяючі рівняння на темному тлі, абстрактне наукове мистецтво
// рис. 03 — Нижня межа оцінки Вільсона проти баєсівського середнього при однакових «сирих» пропорціях. При n=5 оцінка Вільсона є більш консервативною (сильніше карає за невизначеність). При n=100 обидві збігаються з різницею в 0.02 бала. Вибір методу має найбільше значення в критичний період початкових відгуків.

Що це означає для вашої бізнес-стратегії

// strategic_implications.for_business_owners

Розуміння математики перетворює абстрактну пораду («отримуйте більше відгуків») на кількісно визначену стратегію. Кожен бізнес існує десь на спектрі v/(v+m). Знання того, де ви знаходитесь, говорить вам, наскільки ваш наступний відгук реально впливає на ситуацію.

Якщо v = 8 і m = 50, один новий 5-зірковий відгук зміщує ваш ваговий коефіцієнт довіри з 8/58 = 0.138 до 9/59 = 0.153. Цей зсув на 1.5 процентних пункти є значущим. Якщо v = 300 і m = 50, той самий відгук зміщує вас з 300/350 = 0.857 до 301/351 = 0.858 — ледь помітно. Обсяг на ранньому етапі має вдесятеро більший математичний вплив, ніж обсяг у великих масштабах.

Як розрахувати зважений середній зірковий рейтинг для власного бізнесу

Ви можете самостійно виконати розрахунок у таблиці. Візьміть вашу поточну кількість відгуків як v. Оцініть m для вашої категорії, подивившись, яку кількість відгуків підтримують топ-3 компанії у вашій категорії на Google Maps — 25-й перцентиль цього розподілу є розумною оцінкою m. Ваш поточний відображуваний рейтинг, ймовірно, вже є результатом WR; ваш «наївний» середній — це проста сума, поділена на кількість у вашому бекенді.

Розрахунок, який вас цікавить, — це граничний вплив наступних N відгуків. Змоделюйте це: збільште v на 10, перерахуйте WR, спостерігайте за різницею. Зробіть це для діапазону значень v, щоб побудувати криву чутливості. Найкрутіша частина цієї кривої — де кожен додатковий відгук дає найбільше покращення WR — це те місце, де ви повинні зосередити свої зусилля зі збору відгуків.

Чому давність означає, що швидкість надходження відгуків важливіша за їх загальну кількість

Коли ви розумієте зменшення ваги за давністю, ціль оптимізації зміщується. Справа не лише в загальному обсязі — а в обсязі, розподіленому в часі. Бізнес з 400 відгуками, зібраними за п'ять років, і нічого за останні 18 місяців, фактично працює на меншій ефективній вибірці, ніж свідчать цифри. Відгуки, що втратили вагу, менше впливають на поточне зважене середнє.

Послідовна генерація відгуків — навіть у скромних обсягах — з часом накопичується так, як ніколи не зможе разове масове залучення. Вісім нових відгуків на місяць протягом дванадцяти місяців перевершують 96 відгуків за один місяць майже за всіма релевантними показниками: баєсівська довіра, проходження перевірки на аномалії, траєкторія зменшення ваги за давністю та сприйняття довіри споживачами.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Часті запитання

// faq.frequently_asked_questions

01Як розраховуються зіркові рейтинги Google?

Google використовує зважену формулу з елементами баєсівського підходу, а не просте середнє арифметичне. Відгуки від авторів з високим рівнем довіри (Місцеві експерти, акаунти з підтвердженою історією) мають більшу вагу. Нещодавні відгуки отримують більшу вагу через зменшення ваги з часом. Формула прив'язує компанії з малою кількістю відгуків до середнього значення по їхній категорії, зміщуючи рейтинги до апріорного значення, доки не накопичиться достатньо доказів.

02Чи впливає один відгук на середній бал Google більше, ніж інший?

Так, двома способами. По-перше, при малій кількості відгуків кожен новий відгук значно змінює коефіцієнт довіри — ваші перші 50 відгуків мають більше значення на один відгук, ніж відгуки з 200-го по 250-й. По-друге, оцінка довіри до автора означає, що відгук від Місцевого експерта 7-го рівня з 1000+ відгуками, ймовірно, має більшу вагу у формулі усереднення, ніж відгук від абсолютно нового акаунта.

03Скільки відгуків потрібно, щоб рейтинг Google стабілізувався?

Стабілізація в баєсівському сенсі відбувається, коли v >> m — приблизно коли кількість ваших відгуків у 3–5 разів перевищує мінімальний поріг. Для більшості категорій місцевого бізнесу це приблизно 50–150 відгуків. Після цієї точки баєсівське зміщення до середнього по категорії стає настільки слабким, що ваш відображуваний рейтинг точно відповідає вашому фактичному середньому.

04Що таке зважений зірковий рейтинг і як він працює?

Зважений зірковий рейтинг коригує внесок кожного відгуку в загальну оцінку на основі факторів, що виходять за межі самого зіркового значення: скільки всього існує відгуків (зважування за довірою), наскільки свіжий відгук (зменшення ваги з часом) і хто його написав (довіра до автора). Результатом є оцінка, яка більш стійка до маніпуляцій і статистично більш значуща, ніж просте середнє.

05Чому мій рейтинг Google відрізняється від рейтингу на Yelp або TripAdvisor?

Кожна платформа використовує різний алгоритм з різними значеннями параметрів для мінімального порогу, різними ієрархіями довіри до авторів відгуків та різними коефіцієнтами зменшення ваги за давністю. Дослідження економістів FTC виявило, що рейтинги Google в середньому на 1.25 зірки вищі, ніж еквівалентні рейтинги BBB. Алгоритм Yelp є помітно суворішим — він відфільтровує більше відгуків через свою систему «рекомендованих», що, як правило, призводить до нижчих, але більш консервативних середніх оцінок.

06Як Google розраховує зірковий рейтинг для нових компаній з невеликою кількістю відгуків?

Рейтинги нових компаній, що мають менше відгуків, ніж мінімальний поріг (m), сильно прив'язані до середнього по категорії. Новий ресторан з 3 відгуками та середнім балом 5.0 може відображати лише 4.1–4.3, оскільки баєсівська вага його власних даних становить лише 5–10%. Це математично правильно — 3 точки даних не можуть надійно оцінити справжню якість.

07Чи впливає довжина або зміст відгуку на те, як Google його зважує?

Якісно, так — системи Google аналізують текст відгуку на предмет тональності, ключових слів та індикаторів якості. Детальний відгук на 200 слів, що згадує конкретні аспекти обслуговування, ймовірно, отримає вищу оцінку за якістю, ніж 5-зірковий відгук без тексту. Однак точний кількісний зв'язок між якістю тексту відгуку та числовим ваговим коефіцієнтом публічно не задокументований.

08Що таке формула баєсівського середнього і коли її слід використовувати?

Формула: WR = (v/(v+m)) × R + (m/(v+m)) × C. Використовуйте її щоразу, коли вам потрібно ранжувати елементи за якістю, коли ці елементи мають дуже різну кількість відгуків. Це стандартний підхід для систем рекомендації продуктів, ранжування контенту та платформ для оцінки бізнесу. Ключовий параметр для калібрування — це m: занадто низький, і він не захищає від аномалій; занадто високий, і легітимні нові учасники будуть постійно пригнічуватися.

09Як алгоритм зіркового рейтингу Google обробляє сплески відгуків та фейкові відгуки?

Система виявлення аномалій Google працює незалежно від баєсівської формули. Коли виявляються сплески активності — зазвичай 10–20-кратне перевищення нормальної тижневої кількості відгуків для бізнесу — нові відгуки потрапляють у стан карантину, де вони видимі власнику бізнесу, але не враховуються в публічних рейтингах. Відгуки, що проходять перевірку ШІ та ручну модерацію, з часом виходять з карантину; ті, що не проходять, видаляються без повідомлення.

10Як отримати 5-зірковий рейтинг на Google, який дійсно буде стабільним?

Стабільно високі рейтинги вимагають постійної швидкості отримання відгуків, а не одноразового залучення. Формула винагороджує обсяг, розподілений у часі: 10 автентичних відгуків на місяць протягом 12 місяців створюють більш стабільний, високоранжований рейтинг, ніж 120 відгуків за один місяць. Зосередьтеся на природній генерації відгуків через післяпродажні запити, QR-коди в точках обслуговування та нагадування в email-розсилках — все в межах політики Google.

Зіркові рейтинги — це не те, чим вони здаються на перший погляд. Число, яке відображає Google, є результатом статистичної моделі, розробленої для протистояння маніпуляціям, врахування невизначеності та винагороди за стабільну якість з часом. Розуміння математики не вимагає наукового ступеня зі статистики — воно вимагає прийняття того, що три 5-зіркові відгуки не варті стільки ж, скільки 120 автентичних відгуків із середнім балом 4.6. Формула робить це очевидним. Що ви робите з цим розумінням — це і є стратегія.

Як це працюєЦіниFAQ
// the_math_favors_volume

Ваш рейтинг — це математична задача. Ми можемо допомогти її вирішити.

Баєсівська формула винагороджує за кількість відгуків, накопичену з часом. Кожен новий відгук зміщує ваговий коефіцієнт довіри у правильному напрямку — і ефект накопичується.

Почніть нарощувати кількість відгуків