Uma análise dos dados sobre o comprimento das avaliações, a confiança do leitor e a zona exata de contagem de palavras onde a credibilidade atinge o pico — e depois cai a pique.

Existe um número. Não uma sugestão vaga de "seja detalhado" — um número real. Algures por volta das 72 palavras, uma avaliação passa de esquecível a credível. Algures por volta das 148, começa a parecer trabalhoso lê-la. E algures acima das 300, os leitores modernos não param apenas de ler — começam a perguntar-se quem a escreveu. Isto não é intuição. É um padrão que surge repetidamente nos dados de votos úteis da Amazon, na análise do Yelp, no estudo de caso de avaliações do Google da Sterling Sky e em pesquisas académicas recentes sobre a deteção de texto gerado por IA. Os números não são idênticos em todos os estudos, mas a forma é sempre a mesma: uma curva de sino de confiança, com o seu pico situado precisamente no que estamos a chamar de ponto ideal.
Antes de as plataformas começarem a combater as avaliações falsas, o comprimento não era particularmente significativo. Uma avaliação era uma avaliação. Mas por volta de 2015-2018, à medida que as quintas de cliques industrializaram o spam breve de 5 estrelas, tanto as plataformas como os leitores começaram a usar a contagem de palavras como um sinal aproximado de autenticidade. Avaliação curta com cinco estrelas? Suspeito. Narrativa detalhada com observações específicas? Provavelmente real.
A ironia é que esta heurística treinou uma geração de escritores de avaliações — e depois de sistemas de IA — para escreverem mais tempo. O que mudou as regras do jogo. Agora, em 2025, o cenário inverteu-se: uma avaliação que é suspeitamente abrangente, cobre todos os ângulos possíveis e parece um folheto de produto tem mais probabilidade de levantar suspeitas do que uma opinião confiante de dois parágrafos de alguém que visitou uma vez e notou que o estacionamento era mau.
O mercado corrigiu-se. E a correção estabeleceu-se em torno das 100 palavras.
A análise do conjunto de dados públicos do Yelp mostra consistentemente uma correlação positiva entre o comprimento do texto da avaliação e os votos úteis — mas com uma curva, não uma linha. As avaliações na faixa de 75-200 palavras agrupam-se no topo dos rankings de votos úteis, enquanto as avaliações com menos de 20 palavras e mais de 400 palavras têm um desempenho inferior. O comprimento médio recomendado para avaliações no Yelp era de 447 caracteres (aproximadamente 75-85 palavras) no final de 2024 — não é coincidência.
Uma análise multiplataforma de 2020 da ScienceDirect sobre a utilidade das avaliações no Yelp, Amazon e TripAdvisor descobriu que a relação entre o comprimento e a utilidade era positiva, mas curvilínea — o que significa que os retornos diminuem acentuadamente após um limiar. Os dados do estudo sugeriram que esse limiar se situa entre 100 e 200 palavras, dependendo da plataforma e da categoria.
A análise de Max Woolf de 1,2 milhão de avaliações da Amazon (publicada em minimaxir.com) encontrou uma correlação positiva estatisticamente significativa entre o comprimento da avaliação e as classificações de utilidade: r = 0,26. Avaliações mais longas tinham maior probabilidade de receber votos úteis. Mas a principal conclusão escondida nesse conjunto de dados é que a maioria das avaliações que obtêm pontuações altas de utilidade ainda se concentra na faixa de 100-300 palavras. As avaliações mais longas — mais de 500 palavras — também foram altamente classificadas, mas eram casos isolados escritos pelo que Woolf chama de "super-avaliadores": compradores profundamente investidos que fizeram o comprimento parecer justificado.
Para a página de avaliações de uma empresa comum, a epopeia de 500 palavras é rara e provavelmente desnecessária. A avaliação de 100-150 palavras ganha uma confiança comparável com um custo cognitivo muito menor para o leitor.

Nem todos os comprimentos de avaliação são iguais. Eis o que a pesquisa mostra que acontece em cada faixa — e porquê.
Estudos de rastreamento ocular em páginas de avaliações mostram que os leitores ignoram quase totalmente as avaliações de uma única frase durante as primeiras leituras. "Ótimo serviço, voltarei!" regista-se como uma classificação de estrelas com palavras anexadas — não como informação. Estas avaliações contribuem para as pontuações agregadas, mas raramente influenciam decisões individuais. Dados da PowerReviews confirmam que avaliações com menos de 100 caracteres não recebem quase nenhuns votos úteis.
Esta é a zona em que a maioria das avaliações realmente se enquadra. Duas a quatro frases, uma impressão geral, talvez um detalhe específico. Os leitores lerão estas — são suficientemente curtas — mas muitas vezes terminam insatisfeitos. "A comida era boa, o ambiente agradável, recomendo" não oferece nenhum gancho, nenhuma especificidade, nenhuma história. O inquérito de 2025 da BrightLocal descobriu que as 'avaliações longas e detalhadas' viram um aumento homólogo de 7% na importância para o consumidor. As avaliações curtas-mas-vagas estão a perder terreno precisamente porque os leitores aprenderam a ver através delas.
Cinco a doze frases. Espaço para contexto (quando foi, porquê), detalhes específicos (o que pediu, como foi a interação), uma pequena falha reconhecida e uma recomendação direta. Este é o comprimento onde as taxas de leitura completa atingem o pico — aproximadamente 80% dos leitores que começam, terminam. É também onde as taxas de votos úteis são mais altas em todas as plataformas. O mecanismo chave: uma avaliação deste comprimento sinaliza que o autor investiu o suficiente na experiência para escrever mais de duas frases, mas também é suficientemente atencioso com o tempo do leitor para não escrever uma redação.
A pesquisa sobre a leitura de avaliações de consumidores mostra que avaliações com mais de 150 palavras começam a perder leitores a uma taxa de aproximadamente 15-20% por cada 50 palavras adicionais. Uma avaliação de 300 palavras pode conter informações genuinamente úteis, mas a maioria dos leitores não chegará a elas. O sinal de credibilidade enfraquece não porque avaliações mais longas sejam inerentemente menos confiáveis — não são — mas porque, neste comprimento, o leitor começa a perguntar-se: quem tem tanto para dizer sobre um corte de cabelo?
É aqui que 2025 muda tudo. Um estudo de 2025 da ScienceDirect sobre as características das avaliações de IA vs. humanas descobriu que as avaliações falsas geradas por IA tendem a uma cobertura sistematicamente exaustiva e abrangente — tocando em todos os ângulos, todas as características, todas as preocupações possíveis. Esse padrão tende a produzir avaliações acima do limiar de 300 palavras. Os leitores internalizaram isto. A BrightLocal descobriu que 46% dos consumidores consideram as avaliações 'suspeitas' um sinal de alerta — e o perfil do que parece suspeito mudou para uma positividade exaustiva escrita longamente.
Os dados de todas as plataformas convergem numa única forma: a confiança aumenta acentuadamente de 0 para ~100 palavras, estabiliza entre 75 e 200 palavras e depois diminui. Isto não é uma curva de sino suave — é mais como um planalto com quedas acentuadas em ambos os lados.
A queda à esquerda (avaliações muito curtas) reflete a falta de informação. O leitor não tem nada com que trabalhar. A queda à direita (avaliações muito longas) reflete a sobrecarga cognitiva e, cada vez mais, a associação a IA. Ambos os extremos têm um desempenho inferior pela mesma razão subjacente: a avaliação não parece uma transação humana genuína.
A pesquisa é consistente em que, dentro do ponto ideal, a especificidade importa mais do que o comprimento. Uma avaliação de 95 palavras que menciona o nome de um prato, nota o tempo de espera e descreve o ambiente terá um desempenho melhor do que uma avaliação de 140 palavras que repete elogios vagos. O intervalo de contagem de palavras cria as condições para a especificidade — é longo o suficiente para incluir detalhes concretos, mas curto o suficiente para forçar a priorização. Com 72-148 palavras, não se pode desperdiçar espaço com enchimento.
O estudo de caso de avaliações do Google da Sterling Sky descobriu que as avaliações de uma estrela tinham em média 244 palavras, enquanto as de cinco estrelas tinham apenas 74. Isto sugere que o comprimento detalhado muitas vezes se correlaciona com emoções negativas — as pessoas escrevem mais quando estão chateadas. O que significa que avaliações positivas muito longas ocupam um território psicológico invulgar: porque é que um cliente genuinamente feliz escreveria 400 palavras? Essa assimetria é algo que os leitores sentem, mesmo que não consigam articulá-la.
As velocidades médias de leitura rondam as 200-250 palavras por minuto para conteúdo online. Uma avaliação de 100 palavras leva 25-30 segundos a ler. Uma avaliação de 300 palavras leva mais de um minuto. Numa sessão típica de tomada de decisão — onde um consumidor pode analisar 8-15 avaliações — a diferença entre 100 palavras e 300 palavras é se ele lê 3 avaliações ou 8.
Os algoritmos das plataformas entendem isto. O ranking 'Mais Relevantes' do Google considera sinais de envolvimento, incluindo padrões de leitura completa. Avaliações que mantêm os leitores envolvidos por 20-40 segundos tendem a ter um melhor desempenho no ranking de relevância do que avaliações que causam abandono imediato (demasiado curtas) ou abandono a meio da leitura (demasiado longas).

A forma mais concreta de entender o ponto ideal é ler a mesma experiência escrita em cada comprimento. Estes são exemplos construídos, não avaliações reais — mas são escritos para refletir os padrões reais em cada zona.
Pizza muito boa, pessoal simpático. Definitivamente voltarei. A melhor da zona.
Dezassete palavras. Três afirmações, zero provas. Nada para ancorar uma decisão. Esta avaliação aumenta a média de estrelas e nada mais.
Viemos numa sexta-feira à noite por volta das 19h e esperamos cerca de 15 minutos por uma mesa — valeu a pena. Pedimos a margherita e a pizza de cogumelos com trufa; ambas tinham uma crosta fina e devidamente queimada que não ficou mole. A de cogumelos foi genuinamente uma das melhores pizzas que já comi nesta cidade. O serviço foi atencioso sem ser sufocante. Uma pequena queixa: o menu de sobremesas é um pouco triste. Quatro itens, um dos quais estava esgotado. Mas pela pizza em si, isto entra firmemente na categoria de rotação regular para nós.
107 palavras. Hora específica, pratos específicos, uma pequena crítica, uma recomendação direta. Os leitores conseguem projetar-se nesta experiência. É assim que uma avaliação útil se parece.
Quero começar por dizer que encontrar este restaurante foi verdadeiramente uma descoberta pela qual sou grato sempre que visito este maravilhoso estabelecimento. Desde o momento em que se entra, o ambiente cria imediatamente uma atmosfera que é simultaneamente acolhedora e sofisticada. As escolhas de design de interiores são ponderadas e refletem claramente a profunda paixão dos proprietários pelas tradições culinárias italianas. Cada superfície foi cuidadosamente considerada...
Este excerto — já com 68 palavras — não mencionou um único prato específico, preço ou observação concreta. Parece texto promocional. Na palavra 300, a maioria dos leitores já decidiu que algo está errado.

Durante a maior parte da história das avaliações, o comprimento era simplesmente um indicador de esforço. Uma avaliação longa significava que alguém se importava o suficiente para escrever muito. Essa suposição manteve-se desde os primeiros dias da Amazon até aproximadamente 2022. Depois, os modelos de linguagem de grande escala entraram no ecossistema em massa, e a suposição quebrou-se.
As avaliações geradas por IA tendem a ser sistematicamente mais longas do que as escritas por humanos. Nem sempre — a engenharia de prompts pode produzir avaliações curtas de IA — mas o resultado padrão de um LLM solicitado a escrever uma avaliação positiva tende a ser abrangente. Cobre múltiplos aspetos. Usa uma estrutura equilibrada. Evita linguagem excessivamente informal. Tem entre 200 e 400 palavras. E os leitores, que têm absorvido conteúdo escrito por IA há três anos, estão a começar a reconhecer o padrão.
Um estudo em larga escala de 2025 publicado na ScienceDirect, comparando avaliações falsas geradas por IA, avaliações falsas humanas e avaliações autênticas, descobriu que as avaliações de IA exibiam 'mecanicidade significativamente maior e menor empatia' — e tendiam a uma cobertura sistematicamente completa dos atributos do produto. Essa completude sistemática é exatamente o que eleva a contagem de palavras para além de 300.
AI-suspicion rate based on BrightLocal 2025 consumer survey + ScienceDirect (2025) AI vs. human review study. Percentage indicates share of readers who considered length pattern suspicious.
O inquérito ao consumidor de 2025 da BrightLocal descobriu que 46% dos consumidores consideram certos padrões de avaliação suspeitos. O perfil do que parece suspeito evoluiu: em 2023 eram principalmente avaliações apenas com estrelas, sem texto. Em 2025, o padrão de suspeita emergente é a positividade abrangente — uma avaliação que elogia metodicamente todos os aspetos sem uma única aresta por limar, escrita longamente.
O ponto ideal — 72 a 148 palavras — é inerentemente resistente a este padrão. Nesse comprimento, não há espaço para uma cobertura sistemática de todas as características. É preciso priorizar. É preciso deixar coisas de fora. Essa restrição é, paradoxalmente, o que faz a avaliação parecer humana.
A maioria das empresas que pede avaliações não dá qualquer orientação sobre o comprimento. Enviam um pedido, incluem um link e esperam o melhor. O resultado é uma distribuição de avaliações que tende fortemente para a faixa de 10 a 40 palavras — rápidas, positivas, mas esquecíveis.
Uma pequena mudança na forma como enquadra o pedido pode alterar significativamente a distribuição. Pedir a alguém para "partilhar a sua experiência" produz avaliações mais curtas do que pedir para "dizer-nos o que pediu e o que achou". Prompts específicos produzem respostas específicas — e mais longas.
O formato de pedido de avaliação mais eficaz, com base em dados de testes A/B de plataformas de gestão de avaliações, é uma estrutura de três perguntas enviada na mensagem de pedido de avaliação: Para que nos visitou? Qual foi o destaque? Algo que pudéssemos fazer melhor? Três perguntas produzem uma resposta média de 95-120 palavras — bem no ponto ideal — porque responder a três perguntas concretas gera naturalmente a especificidade e o comprimento que as avaliações credíveis exigem.
Criticamente, esta técnica também produz o reconhecimento de uma pequena falha que torna as avaliações autênticas. Quando alguém responde a "algo que pudéssemos fazer melhor?", muitas vezes encontra algo pequeno — estacionamento, tempo de espera, um item específico que não estava disponível. Essa nota honesta é exatamente o que distingue uma avaliação real de uma peça de marketing.
O estudo de caso longitudinal da Sterling Sky descobriu que avaliações mais longas permaneciam nas '10 posições mais visíveis' nos Perfis de Empresa no Google por períodos mais longos. Avaliações com mais de 100 palavras tinham um poder de permanência significativamente maior na secção 'Mais Relevantes' do que avaliações breves, mesmo quando essas avaliações breves eram mais recentes.
Isto é importante para as empresas que querem que as avaliações positivas sejam proeminentes: uma avaliação ponderada de 100 palavras de um cliente feliz provavelmente superará uma avaliação de 15 palavras e cinco estrelas durante meses. O ponto ideal da contagem de palavras não se trata apenas da confiança do leitor — trata-se de visibilidade algorítmica.

Se está a escrever em vez de pedir avaliações, a fórmula é simples o suficiente para seguir sem pensar na contagem de palavras.
Comece com o contexto: quando visitou e porquê. Uma frase. Adicione a sua observação principal: a coisa que mais definiu a experiência. Uma a duas frases. Adicione um detalhe específico — o prato que pediu, a pessoa que o ajudou, a coisa que o surpreendeu. Uma a duas frases. Note uma coisa que poderia ser melhorada. Uma frase. Termine com uma recomendação ou intenção. Uma frase.
Essa estrutura produz de forma fiável 80-130 palavras. Também produz uma avaliação que parece genuína porque está estruturada da forma como as experiências genuínas são realmente processadas: uma impressão geral apoiada por uma memória específica, uma imperfeição reconhecida e uma decisão final.
Uma avaliação no ponto ideal deve passar neste teste informal: Menciona um produto, pessoa, prato ou serviço específico? Inclui uma referência de tempo ("num sábado", "esperei cerca de vinte minutos")? Reconhece pelo menos uma imperfeição? A recomendação é direta em vez de hesitante? Se a resposta a todas as quatro for sim, a avaliação quase certamente terá um registo credível, independentemente da contagem de palavras precisa.
“A contagem de palavras é um indicador de investimento — mas apenas até ao ponto em que começa a parecer calculada.”
— Insight de pesquisa sobre a qualidade das avaliações
A avaliação perfeita não é longa. Não é curta. É apenas longa o suficiente para provar que esteve realmente lá — e curta o suficiente para ser lida antes que a opinião de outra pessoa carregue. A faixa de 72-148 palavras não é mágica; é a zona onde a psicologia do leitor, os algoritmos da plataforma e os sinais de autenticidade se alinham. Escreva dentro dela, e estará a escrever para humanos e máquinas ao mesmo tempo. Isso é o mais próximo que se pode chegar de uma otimização que realmente importa.
Real customers, reviews in the credibility sweet spot, delivered to your Google Business Profile.