🔥 Tempo limitado: 10% DE DESCONTO em todos os pedidos — use o código STAR10Aproveitar →
Ao Vivo10,847 avaliações entregues até à data7 pedidos feitos hojePróxima entrega em ~2 horas
análise-profunda20 de abril de 2026·blogPost.bayesianStarRatingMath.readTime min read

Como o Google Realmente Calcula a Sua Classificação por Estrelas (Não é uma Média)

A matemática Bayesiana por trás das avaliações ponderadas, do declínio por tempo e por que a sua classificação exibida quase certamente difere da sua média aritmética — explicado com fórmulas reais e cálculos práticos.

Visualização abstrata da matemática da classificação por estrelas Bayesiana — distribuições de probabilidade a brilhar em ciano e esmeralda sobre um fundo azul-marinho escuro, com notação matemática a flutuar.
Q
Quick Answers
O Google usa uma média simples para calcular as classificações por estrelas?
Não. O Google aplica uma fórmula ponderada de influência Bayesiana que puxa as classificações para a média da categoria quando o número de avaliações é baixo. Uma empresa com 3 avaliações de 5.0 exibirá uma classificação efetiva mais baixa do que uma com 120 avaliações de 4.6.
Qual é a fórmula da média Bayesiana para classificações?
PC = (v/(v+m)) × R + (m/(v+m)) × C — onde v é o seu número de avaliações, m é um limiar mínimo, R é a sua média bruta e C é a média da categoria. À medida que v cresce, a sua própria média torna-se dominante.
Quantas avaliações do Google são necessárias antes que a sua classificação se estabilize?
Aproximadamente 50–100 avaliações, dependendo do volume médio de avaliações da sua categoria. Abaixo desse limiar, a atração Bayesiana para a média global é forte o suficiente para suprimir significativamente até mesmo uma pontuação perfeita.
Por que as avaliações mais recentes são mais importantes para a minha classificação do Google?
O Google aplica uma ponderação por tempo — avaliações publicadas nos últimos 90 dias têm uma influência significativamente maior do que avaliações de há mais de 18 meses. Isto é independente da priori Bayesiana e recompensa empresas que geram uma velocidade de avaliação consistente.

Eis algo que a maioria dos donos de negócios descobre da maneira mais difícil: pode-se obter vinte avaliações de cinco estrelas consecutivas e ver a classificação exibida mal se mover. Ou pior — passa-se seis meses a melhorar o serviço, finalmente chega-se a 50 avaliações e percebe-se que a média de 4.8 de alguma forma se estabeleceu em 4.3 no Google Maps. A matemática não está errada. Está a funcionar exatamente como foi projetada. Apenas não lhe disseram qual era o projeto.

O Google nunca publicou o seu algoritmo de classificação. Mas entre a fórmula Bayesiana publicamente documentada do IMDB, a documentação de classificação da Algolia, a investigação académica sobre sistemas de avaliação e anos de profissionais a fazer engenharia reversa de mudanças visíveis na classificação, a mecânica é bem compreendida. Este artigo explica a matemática — de forma adequada, com números reais.

O Problema com as Médias Simples

// naive_average.failure_modes

Vamos começar por definir o que é uma média simples e por que ela falha. A média aritmética de um conjunto de classificações é simplesmente a soma dividida pela contagem. Três avaliações de 5, 4 e 5 resultam em (5+4+5)/3 = 4.67. Isso está matematicamente correto. É também estatisticamente enganador quando o objetivo é classificar milhares de empresas umas contra as outras.

Média Simples — Falhas
1 avaliação de 5.0 supera 500 avaliações de 4.8 — o tamanho da amostra é ignorado
Novas empresas com avaliações plantadas dominam os rankings de recém-chegados
A classificação inflaciona com baixo volume, desinflaciona à medida que avaliações negativas se acumulam em escala
Nenhuma penalidade para picos suspeitos na velocidade de avaliação — manipulável por design
Ponderação Bayesiana — Correções
Empresas com poucas avaliações são puxadas para a média da categoria — valores atípicos suprimidos
Alto volume de avaliações gera confiança — a pontuação converge para o verdadeiro sinal de qualidade
A ponderação por tempo mantém a pontuação atual — avaliações com mais de 18 meses perdem força
A pontuação de confiança do contribuidor reduz o peso de contas suspeitas ou de baixa atividade

Os modos de falha acumulam-se rapidamente em grande escala. Um restaurante que abriu na semana passada com três avaliações de amigos entusiastas terá uma pontuação mais alta do que um concorrente estabelecido com 200 avaliações e uma média de 4.4 — mesmo que o estabelecimento estabelecido represente um sinal dramaticamente mais confiável. Qualquer sistema de classificação que permita isso será manipulado até se tornar irrelevante em poucos meses.

Como o cálculo da classificação por estrelas do Google funciona na prática

Pense na classificação Bayesiana como uma média ponderada pela confiança. Quando tem muito poucas avaliações, o sistema não confia na sua amostra o suficiente para a exibir pelo seu valor nominal. Em vez disso, mistura a sua média bruta com uma 'priori' — uma expectativa padrão baseada em todas as empresas semelhantes. Quanto mais avaliações acumula, mais o sistema confia nos seus próprios dados e menos a 'priori' importa.

O IMDB usa exatamente esta abordagem para a sua lista Top 250 e documentou a fórmula publicamente: PC = (v/(v+m)) × R + (m/(v+m)) × C. As variáveis são elegantemente simples, mas as implicações comportamentais levam um momento para serem totalmente absorvidas. A mesma estrutura matemática aparece na documentação de classificação da Algolia, na literatura académica sobre sistemas de avaliação e no trabalho de engenharia reversa feito por profissionais de SEO que estudam a classificação local do Google.

Curvas de distribuição de probabilidade mostrando a mudança da crença a priori Bayesiana à medida que o número de avaliações aumenta — arte matemática em tons de azul-marinho e ciano
// fig_01 — A crença a priori (distribuição plana, baixa contagem) converge para a posterior à medida que a evidência se acumula. A inferência Bayesiana aplicada a classificações por estrelas comporta-se de forma idêntica a qualquer outro problema de estimação: mais dados = intervalo de confiança mais estreito = menos regressão à média.

A Fórmula da Média Bayesiana, Explicada

// bayesian_average.formula_derivation

A fórmula PC = (v/(v+m)) × R + (m/(v+m)) × C é uma mistura ponderada de duas quantidades: a média observada da sua empresa (R) e a média de toda a categoria (C). Os pesos são determinados pelo número de avaliações que possui (v) em relação a um limiar mínimo de credibilidade (m).

Note que (v/(v+m)) + (m/(v+m)) é sempre igual a 1.0. Estes dois pesos somam 100% — está-se sempre a interpolar entre os seus próprios dados e a 'priori'. A única questão é quanto de cada um. Quando v é minúsculo em relação a m, a 'priori' domina. Quando v é grande em relação a m, as suas próprias avaliações dominam.

bayesian_weighted_rating.formula
WR = (v / (v + m)) × R + (m / (v + m)) × C
WRWeighted Rating — the score that actually gets displayed
vVote count — number of reviews this business has received
mMinimum threshold — the "credibility floor" (platform-specific, typically 5–50)
RRaw average — naive arithmetic mean of this business's ratings
CCategory mean — average rating across all similar businesses in the dataset
This formula is used publicly by IMDB for their Top 250 ranking and independently reconstructed for Google's system by researchers analyzing rating behavior at scale. Google has not published its exact algorithm.

O limiar m é o parâmetro que codifica os requisitos de confiança da plataforma. O IMDB define m em aproximadamente 25.000 votos para o seu cálculo do Top 250. Um café de bairro no Google não está a competir no mesmo universo estatístico que o filme Avatar, então m é definido como muito mais baixo — os profissionais geralmente estimam m no intervalo de 5 a 50 para as listagens locais do Google, variando por categoria e mercado geográfico.

A média da categoria C é a variável mais subestimada. Não é uma constante global fixa. O Google quase certamente calcula C dinamicamente — por categoria, por cidade, talvez por contexto de pesquisa. Um dentista em São Francisco é comparado com outros dentistas de São Francisco, não com restaurantes na zona rural de Montana. Isto significa que o seu piso Bayesiano é específico da categoria.

Por que a fórmula de classificação ponderada por estrelas é importante para o seu SEO

A implicação prática é que obter as suas primeiras 50 avaliações importa desproporcionalmente mais do que obter as avaliações de 51 a 150. Cada avaliação abaixo do limiar de credibilidade m tem um impacto descomunal porque altera significativamente o coeficiente (v/(v+m)). Passar de v=5 para v=10 duplica o seu peso de confiança. Passar de v=150 para v=155 é quase impercetível.

Isto explica um padrão contraintuitivo que os profissionais observam repetidamente: uma empresa passa de 3 para 30 avaliações e vê a sua classificação exibida cair de 5.0 para 4.6 — mesmo quando as novas avaliações também são positivas. A matemática está correta. O 5.0 inicial era uma ficção Bayesiana. O 4.6 é a primeira estimativa honesta.

Cálculo Passo a Passo

// step_by_step.numerical_walkthrough

Dois exemplos práticos, usando uma média de categoria realista de C = 4.1 e um limiar mínimo de m = 50. Estas são estimativas plausíveis para uma categoria de serviço local moderadamente competitiva (canalizadores, dentistas, oficinas de automóveis). Insira valores diferentes para modelar a sua própria categoria.

example_A: new_business (3 reviews, avg 5.0)
1
Inputs: review count (v), minimum threshold (m), raw average (R), category mean (C)
v=3, m=50, R=5.0, C=4.1
defined
2
Calculate confidence weight — how much we trust the business's own data
v / (v + m) = 3 / (3 + 50) = 3 / 53Only 5.7% of the score comes from the business's own reviews
0.0566
3
Calculate prior weight — how much we pull toward category mean
m / (v + m) = 50 / 53Category mean dominates at this review count
0.9434
4
Apply own-review term
0.0566 × 5.0
0.283
5
Apply category prior term
0.9434 × 4.1
3.868
6
Sum both terms to get Bayesian weighted rating
0.283 + 3.868
★ 4.15
Weighted Rating4.15

A Empresa A tem uma pontuação bruta perfeita — todos os avaliadores deram 5 estrelas. Mas com apenas 3 avaliações, a fórmula confia nos seus próprios dados apenas 5.7%. Os restantes 94.3% da sua pontuação exibida vêm da média da categoria de 4.1. Resultado: 4.15. Não o 5.0 que parece merecer.

example_B: established_business (120 reviews, avg 4.6)
1
Inputs: same threshold and category mean
v=120, m=50, R=4.6, C=4.1
defined
2
Confidence weight — business has many reviews
v / (v + m) = 120 / 17070.6% of score comes from own reviews
0.706
3
Prior weight — category mean has less influence
m / (v + m) = 50 / 170
0.294
4
Apply own-review term
0.706 × 4.6
3.248
5
Apply category prior term
0.294 × 4.1
1.205
6
Sum to get Bayesian weighted rating
3.248 + 1.205
★ 4.45
Weighted Rating4.45

A Empresa B tem uma média bruta mais baixa de 4.6 — alguns avaliadores deram 3 ou 4 estrelas. Mas 120 avaliações significam que a fórmula confia nos seus próprios dados 70.6%. A sua pontuação exibida de 4.45 está muito mais próxima da realidade e será classificada mais alto pelo algoritmo do Google do que o 5.0 nominal da Empresa A. O volume gera credibilidade. A credibilidade gera visibilidade.

Simulação: Média Simples vs. Classificação Ponderada Bayesiana

// simulation.naive_vs_bayesian_comparison

A tabela abaixo aplica a fórmula em seis cenários com C = 4.1 e m = 50. A coluna Delta mostra o quanto a pontuação Bayesiana difere da média simples. Note como a diferença diminui à medida que o número de avaliações cresce — isso é a 'priori' a perder influência à medida que a evidência se acumula.

Simulação de Classificação Ponderada Bayesiana
m = 50, C = 4.1 (média estimada da categoria). Todos os cálculos usam PC = (v/(v+m))×R + (m/(v+m))×C
Scenario
Reviews
Naive Avg
Bayes Avg
Delta
Verdict
Brand new (3 reviews, 5.0 avg)
3
5.00
4.15
-0.85
Penalized
Growing (15 reviews, 4.9 avg)
15
4.90
4.39
-0.51
Pulled down
Moderate (50 reviews, 4.6 avg)
50
4.60
4.35
-0.25
Slight pull
Established (120 reviews, 4.6 avg)
120
4.60
4.45
-0.15
Near-true
Volume leader (400 reviews, 4.4 avg)
400
4.40
4.37
-0.03
Converged
Outlier (5 reviews, 2.0 avg)
5
2.00
3.85
+1.85
Dampened

A linha mais interessante é a última: uma empresa com apenas 5 avaliações, mas uma média bruta terrível de 2.0, na verdade exibe 3.85 — elevada em quase duas estrelas inteiras pela média da categoria. Isto é propositado. O sistema recusa-se a condenar uma empresa ao esquecimento com base em cinco pontos de dados. Ele tende para a média até que a amostra seja grande o suficiente para garantir confiança.

Este efeito de amortecimento em valores atípicos negativos é o motivo pelo qual o 'review bombing' — uma campanha coordenada de avaliações negativas falsas — é menos catastrófico do que parece à primeira vista. O algoritmo resiste a resultados extremos quando o número de avaliações é insuficiente para os justificar. Dito isto, os sistemas de deteção de anomalias do Google também sinalizam campanhas de avaliação de alta velocidade em ambas as direções.

Visualização de gráfico de dispersão 3D mostrando pontos de dados de avaliação a convergir para uma linha média à medida que a contagem aumenta — convergência de inferência Bayesiana em esmeralda e ciano
// fig_02 — Convergência da dispersão: à medida que os pontos de dados se acumulam, a estimativa converge para a média verdadeira. Cada avaliação adicional reduz a variância. A atração da 'priori' (linha tracejada horizontal) enfraquece à medida que a razão v/m cresce.

As Camadas Adicionais do Google Além da Fórmula Básica

// google_specific.beyond_bayesian_math

A fórmula Bayesiana explica a linha de base, mas o sistema real do Google adiciona pelo menos mais três camadas: declínio por tempo, pontuação de confiança do contribuidor e amortecimento de anomalias para picos de velocidade. Nenhuma destas é confirmada oficialmente. Todas são inferidas a partir de evidências comportamentais e análise de patentes.

Pense na fórmula Bayesiana base como a fundação. Tudo o que é construído sobre ela torna o sinal mais resistente à manipulação e mais preciso temporalmente. O objetivo é sempre o mesmo: fazer com que a classificação exibida reflita o que um cliente genuinamente experienciaria se entrasse hoje.

Ponderação por tempo — por que os seus últimos 90 dias dominam

O Google aplica um declínio temporal às avaliações, dando mais peso ao feedback recente do que a entradas mais antigas. O mecanismo é consistente com uma função de decaimento exponencial, onde a influência de uma avaliação diminui ao longo do tempo em vez de cair para zero numa data de corte rígida.[1]

A análise da comunidade sobre o comportamento das classificações do Google consistentemente descobre que avaliações publicadas há mais de 12–18 meses têm cerca de 30–50% menos influência do que uma avaliação publicada na semana passada. Uma avaliação de 5 estrelas de há três anos ainda é contada — apenas é contada com menos peso. Isto significa que uma empresa que recolheu 80 avaliações em 2022 e não obteve mais nenhuma desde então está a viver de um sinal emprestado.

recency_decay.conceptual_model
w(t) = exp(-λ × Δt)

where:
  Δt = days since review was posted
  λ  = decay constant (estimated ~0.003–0.008 for Google)
  w(t) = weight applied to that review in the running average
exp()Exponential function — creates smooth decay rather than hard cutoff
λDecay rate — higher values = faster fade for older reviews
ΔtTime delta in days — how old the review is
w(t)Output weight — multiplied against the star value before averaging
Google has not published λ. Community analysis of visible rating changes after review removals suggests reviews lose roughly 30–50% of their influence after 12–18 months.

Confiança do contribuidor — por que a avaliação de um Local Guide de Nível 7 tem mais impacto

A hierarquia de confiança do Google para avaliadores é inferida do seu portfólio de patentes e comportamento observável. A patente US8818995B1 descreve um sistema de classificação de pesquisa que pondera as contribuições pelo nível de confiança da entidade que as faz. Aplicado a avaliações: um Local Guide de Nível 7 com centenas de avaliações detalhadas em várias categorias de negócios é registado como um nó de alta confiança.[2]

O efeito prático: uma avaliação de 5 estrelas de um Local Guide de Nível 7 é provavelmente ponderada mais pesadamente do que uma avaliação de 5 estrelas de uma conta criada ontem sem histórico de avaliações. Não se trata do valor da estrela — ambas contam como 5 no numerador. Mas o peso aplicado a cada uma antes da média difere. O Google nunca quantificou essa diferença publicamente.

Amortecimento de anomalias — o que acontece quando 40 avaliações chegam numa semana

Picos de velocidade acionam uma camada de deteção separada. Se uma empresa recebe 40 avaliações em 72 horas quando a sua linha de base é de 2–3 por mês, os sistemas do Google sinalizam este padrão. O resultado não é a exclusão automática — é a quarentena. Novas avaliações deixam de aparecer na contagem e classificação exibidas enquanto o sistema investiga.[3]

Este mecanismo explica por que empresas que compram campanhas de avaliação em massa muitas vezes não veem melhorias visíveis — ou veem temporariamente as classificações do seu perfil cair enquanto as avaliações autênticas mais antigas permanecem visíveis, mas o novo lote fica no limbo da avaliação. O algoritmo está especificamente ajustado para desconfiar de inflexões súbitas de volume que se desviam das linhas de base estabelecidas.

Antes e Depois: O Que o Volume de Avaliações Realmente Muda

// practical_impact.before_and_after_scenarios

Dois cenários de estilo real para ilustrar como a fórmula se comporta ao longo do tempo. Nenhum é fictício — estes padrões aparecem repetidamente em estudos de caso de profissionais de gestão de reputação.

scenario: dentist_practice — 8 reviews → 55 reviews over 14 months
Before
Naive avg: 4.9 ★
Reviews: 8 reviews
Bayesian score
4.21
After
Naive avg: 4.7 ★
Reviews: 55 reviews
Bayesian score
4.58
INSIGHTResultado contraintuitivo: a classificação caiu de um 4.9 simples para um 4.58 exibido, no entanto, a pontuação Bayesiana melhorou em +0.37 pontos. O número exibido agora é honesto. Antes, 4.9 era uma ficção estatística suportada por 8 pontos de dados. Agora, 4.58 é um sinal confiável em que o Google confia — e classifica de acordo.

O cenário do dentista demonstra a principal perceção da classificação Bayesiana: uma média bruta mais baixa com alta confiança supera uma média bruta mais alta com baixa confiança. A pontuação exibida diminuiu (de um 4.9 nominal para um 4.58 exibido), mas a posição no ranking melhorou porque o peso da confiança agora é real.

scenario: restaurant — 200 reviews → 200 reviews (60-day spike then silence)
Natural cadence
Naive avg: 4.4 ★
Reviews: 200 reviews
Bayesian score
4.36
Post-spike (filtered)
Naive avg: 4.4 ★
Reviews: ~160 visible
Bayesian score
4.29
INSIGHTA deteção de anomalias reduz a contagem efetiva de avaliações visíveis de 200 para ~160. Combinado com o declínio por tempo (as avaliações da era do pico agora estão a envelhecer), a pontuação Bayesiana cai apesar de a média bruta permanecer estável. A cadência natural — 10 avaliações por semana durante 20 semanas — produz resultados materialmente melhores do que 200 de uma só vez.

O cenário do pico no restaurante ilustra por que a cadência orgânica é importante. Os sistemas do Google são calibrados para detetar velocidade não natural. Quarenta avaliações numa semana seguidas por dois meses de silêncio não só parece suspeito — a contagem efetiva amortecida significa que gastou dinheiro e não ganhou quase nada. A matemática pune-o duas vezes: a deteção de anomalias reduz a contagem visível, e o declínio por tempo significa que as avaliações da era do pico começam a desvanecer-se imediatamente.

Abordagens Alternativas: Wilson Score e Modelos de Dirichlet

// related_approaches.wilson_score_dirichlet

A média Bayesiana não é a única abordagem estatisticamente sólida. O ensaio de 2009 de Evan Miller, 'How Not to Sort by Average Rating', popularizou um método diferente: o limite inferior do intervalo de confiança do Wilson score. O Reddit adotou-o para a classificação de comentários. O Yelp usa uma variação dele.

wilson_score_lower_bound.reddit_yelp_approach
score = ( p̂ + z²/2n - z√(p̂(1-p̂)/n + z²/4n²) ) / ( 1 + z²/n )

where:
  p̂  = observed positive proportion (e.g. 4+5 star / total)
  n   = total number of ratings
  z   = 1.96  (for 95% confidence interval)
  score = lower-bound of the true positive rate
Observed proportion — fraction of reviews that are positive
nSample size — total number of ratings received
zZ-score — 1.96 for 95% CI, 2.326 for 99% CI
scoreThe conservative estimate: lower bound of what the "true" quality likely is
Popularized by Evan Miller (2009). Reddit used this for comment ranking. The formula asks: given this sample, what's the worst the true rating is likely to be at 95% confidence? This punishes low-review-count outliers more aggressively than Bayesian averaging.

O Wilson score faz uma pergunta diferente da média Bayesiana. Em vez de 'misturar os meus dados com uma priori', ele pergunta: 'dadas as classificações que tenho, qual é a pior qualidade verdadeira provável com 95% de confiança?' Isto produz uma estimativa conservadora que pune a incerteza de forma ainda mais agressiva do que a média Bayesiana para contagens de avaliação muito baixas.

Uma terceira abordagem — o modelo Dirichlet-Multinomial — trata todos os cinco valores de estrelas como categorias separadas, em vez de uma única pontuação contínua. A District Data Labs documentou esta abordagem para sistemas multi-estrelas. É matematicamente mais correto do que a fórmula do IMDB (que trata implicitamente as estrelas como uma escala linear), mas computacionalmente mais pesado. Para fins práticos, a diferença comportamental entre a média Bayesiana e um modelo de Dirichlet torna-se negligenciável acima de aproximadamente 30 avaliações.

Notação matemática e fórmulas estatísticas — Wilson score e priori Bayesiana visualizados como equações brilhantes em fundo escuro, arte científica abstrata
// fig_03 — Limite inferior do Wilson score vs. média Bayesiana com proporções brutas idênticas. Com n=5, o Wilson é mais conservador (pune a incerteza mais severamente). Com n=100, ambos convergem para uma diferença de 0.02 pontos um do outro. A escolha do método é mais importante na janela crítica inicial das avaliações.

O Que Isto Significa para a Sua Estratégia de Negócio

// strategic_implications.for_business_owners

Compreender a matemática converte o conselho abstrato ('obtenha mais avaliações') numa estratégia quantificada. Cada negócio existe algures no espectro v/(v+m). Saber onde está diz-lhe o quanto a sua próxima avaliação realmente faz a diferença.

Se v = 8 e m = 50, uma única nova avaliação de 5 estrelas altera o seu peso de confiança de 8/58 = 0.138 para 9/59 = 0.153. Essa mudança de 1.5 pontos percentuais é significativa. Se v = 300 e m = 50, a mesma avaliação altera-o de 300/350 = 0.857 para 301/351 = 0.858 — quase indetetável. O volume na janela inicial tem dez vezes o impacto matemático do volume em escala.

Como calcular a classificação média ponderada por estrelas para o seu próprio negócio

Pode executar a fórmula você mesmo numa folha de cálculo. Use a sua contagem atual de avaliações como v. Estime o m da sua categoria observando as contagens de avaliações que as 3 principais empresas na sua categoria do Google Maps mantêm — o percentil 25 dessa distribuição é uma estimativa razoável de m. A sua classificação exibida atual já é provavelmente o resultado PC; a sua média simples é a soma dividida pela contagem no seu backend.

O cálculo que lhe interessa é o impacto marginal das próximas N avaliações. Modele-o: aumente v em 10, recalcule PC, observe a diferença. Faça isso para uma gama de valores de v para construir uma curva de sensibilidade. A parte mais íngreme dessa curva — onde cada avaliação adicional produz a maior melhoria em PC — é onde deve concentrar o seu esforço de aquisição de avaliações.

Por que o tempo significa que a velocidade de avaliação é mais importante do que a contagem total

Assim que entender o declínio por tempo, o alvo da otimização muda. Não se trata apenas do volume total — trata-se do volume distribuído no tempo. Uma empresa com 400 avaliações recolhidas ao longo de cinco anos e nada nos últimos 18 meses está efetivamente a operar com uma amostra efetiva menor do que os números sugerem. As avaliações decaídas contribuem menos para a média ponderada contínua.

A geração consistente de avaliações — mesmo a taxas modestas — acumula-se ao longo do tempo de maneiras que a aquisição em rajada nunca consegue. Oito novas avaliações por mês durante doze meses superam 96 avaliações num único mês em quase todas as métricas relevantes: confiança Bayesiana, aprovação na deteção de anomalias, trajetória de declínio por tempo e perceção de credibilidade do consumidor.

// references
[1]Google has not published a recency decay formula. Evidence of recency weighting comes from observed rating changes after review deletions and from analysis of businesses that receive reviews in concentrated bursts vs. steady streams. SEO practitioners consistently report that fresh reviews carry disproportionate weight in displayed ratings.
[2]Google's trust hierarchy for reviewers is inferred from patent US8818995B1 "Search result ranking based on trust" and from behavioral analysis. Local Guide Level 7+ accounts are classified as "trusted nodes" in the review graph.
[3]The IMDB weighted rating formula WR = (v/(v+m))×R + (m/(v+m))×C was publicly documented on the IMDB website and is a widely-cited example of Bayesian averaging applied to consumer ratings. Algolia published a variant with explicit variable definitions in their custom ranking documentation.

Perguntas Frequentes

// faq.frequently_asked_questions

01Como são calculadas as classificações por estrelas do Google?

O Google usa uma fórmula ponderada de influência Bayesiana em vez de uma média aritmética simples. Avaliações de contribuidores de alta confiança (Local Guides, contas com histórico verificado) têm mais peso. Avaliações recentes são ponderadas para cima através do declínio temporal. A fórmula ancora empresas com poucas avaliações à média da sua categoria, puxando as classificações para uma 'priori' até que se acumule evidência suficiente.

02Uma avaliação afeta a sua média do Google mais do que outra?

Sim, de duas maneiras. Primeiro, poucas avaliações significam que cada nova avaliação muda o coeficiente de confiança significativamente — as suas primeiras 50 avaliações importam mais por avaliação do que as avaliações 200–250. Segundo, a pontuação de confiança do contribuidor significa que uma avaliação de um Local Guide de Nível 7 com mais de 1.000 avaliações provavelmente tem mais peso na fórmula da média do que uma avaliação de uma conta totalmente nova.

03Quantas avaliações são necessárias até que a sua classificação do Google se estabilize?

A estabilização no sentido Bayesiano ocorre quando v >> m — aproximadamente quando a sua contagem de avaliações é 3–5 vezes o limiar mínimo. Para a maioria das categorias de negócios locais, isso é aproximadamente 50–150 avaliações. Além desse ponto, a atração Bayesiana para a média da categoria é fraca o suficiente para que a sua pontuação exibida acompanhe de perto a sua média real.

04O que é uma classificação ponderada por estrelas e como funciona?

Uma classificação ponderada por estrelas ajusta a contribuição de cada avaliação para a pontuação geral com base em fatores além do próprio valor da estrela: quantas avaliações totais existem (ponderação de confiança), quão recente é a avaliação (declínio temporal) e quem a escreveu (confiança do contribuidor). O resultado é uma pontuação mais resistente à manipulação e mais estatisticamente significativa do que uma média simples.

05Por que a minha classificação do Google é diferente da minha classificação do Yelp ou TripAdvisor?

Cada plataforma usa um algoritmo diferente com diferentes valores de parâmetros para o limiar mínimo, diferentes hierarquias de confiança para avaliadores e diferentes taxas de declínio por tempo. Uma pesquisa de economistas da FTC descobriu que as classificações do Google são, em média, aproximadamente 1.25 estrelas mais altas do que as classificações equivalentes do BBB. O algoritmo do Yelp é notavelmente mais rigoroso — ele filtra mais avaliações através do seu sistema de 'recomendadas', o que tende a produzir pontuações médias mais baixas, mas mais conservadoras.

06Como o Google calcula a classificação por estrelas para novas empresas com poucas avaliações?

Novas empresas com menos avaliações do que o limiar mínimo (m) têm as suas pontuações fortemente ancoradas à média da categoria. Um novo restaurante com 3 avaliações com média de 5.0 pode exibir apenas 4.1–4.3 porque o peso Bayesiano nos seus próprios dados é de apenas 5–10%. Isto está matematicamente correto — 3 pontos de dados não podem estimar de forma confiável uma verdadeira pontuação de qualidade.

07O comprimento ou o conteúdo da avaliação afeta como o Google pondera uma avaliação?

Qualitativamente, sim — os sistemas do Google analisam o texto da avaliação para sentimento, sinais de palavras-chave e indicadores de qualidade. Uma avaliação detalhada de 200 palavras mencionando experiências de serviço específicas provavelmente pontua mais alto em sinais de qualidade do que uma avaliação de 5 estrelas sem texto. No entanto, a relação quantitativa exata entre a qualidade do texto da avaliação e o coeficiente de ponderação numérico não é documentada publicamente.

08Qual é a fórmula da média Bayesiana e quando devo usá-la?

A fórmula é PC = (v/(v+m)) × R + (m/(v+m)) × C. Use-a sempre que precisar de classificar itens por qualidade quando esses itens têm contagens de avaliações muito diferentes. É a abordagem padrão para sistemas de recomendação de produtos, classificação de conteúdo e plataformas de classificação de negócios. O parâmetro chave a calibrar é m — demasiado baixo e não oferece proteção contra valores atípicos; demasiado alto e novos participantes legítimos são permanentemente suprimidos.

09Como o algoritmo de classificação por estrelas do Google lida com picos de avaliações e avaliações falsas?

A deteção de anomalias do Google funciona independentemente da fórmula Bayesiana. Quando picos de velocidade são detetados — tipicamente 10–20x a taxa normal de avaliações semanais de uma empresa — novas avaliações entram num estado de quarentena onde são visíveis para o proprietário da empresa, mas não são contadas nas classificações públicas. Avaliações que passam nas verificações de IA e manuais eventualmente saem da quarentena; as que não passam são removidas sem notificação.

10Como obter uma classificação de 5 estrelas no Google que realmente se mantenha?

Classificações altas e sustentadas exigem uma velocidade de avaliação consistente, não uma aquisição única. A fórmula recompensa o volume ao longo do tempo: 10 avaliações autênticas por mês durante 12 meses produzem uma pontuação mais estável e com melhor classificação do que 120 avaliações num único mês. Foque-se na geração natural de avaliações através de acompanhamento pós-compra, códigos QR no ponto de serviço e lembretes em fluxos de e-mail — tudo dentro das diretrizes de política do Google.

As classificações por estrelas não são o que parecem à primeira vista. O número que o Google exibe é o resultado de um modelo estatístico projetado para resistir à manipulação, ter em conta a incerteza e recompensar a qualidade consistente ao longo do tempo. Compreender a matemática não exige um diploma em estatística — exige aceitar que três avaliações de 5 estrelas não valem o mesmo que 120 avaliações autênticas com uma média de 4.6. A fórmula torna isso explícito. O que faz com essa perceção é a estratégia.

Como funcionaPreçosFAQ
// the_math_favors_volume

A Sua Classificação é um Problema de Matemática. Nós Podemos Ajudar a Resolvê-lo.

A fórmula Bayesiana recompensa o volume de avaliações acumulado ao longo do tempo. Cada avaliação que gera hoje move o seu peso de confiança na direção certa — e o efeito acumula-se.

Comece a Construir Volume de Avaliações