Comprar criptomoedas Mercados Spot Futuros Ganhos

O que devemos escolher para a medição de testes A/B? Teste T ou regressão linear? Qual é a diferença e por que uma abordagem tão simples como a regressão linear realmenteO que devemos escolher para a medição de testes A/B? Teste T ou regressão linear? Qual é a diferença e por que uma abordagem tão simples como a regressão linear realmente

Como Construir Conexões para Testes A/B e Regressão Linear: Um Guia Essencial

Fonte: Hackernoon

2026/01/08 05:51

Leu 5 min

B$0.09707-6.11%

T$0.006154+0.68%

Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

Regressão linear ou teste T. Como escolher?

\ Frequentemente ficamos envolvidos no entusiasmo em torno de modelos sofisticados de machine learning e avanços em deep learning, mas não devemos ignorar a humilde regressão linear.

\ ==Num mundo de LLM e arquiteturas de ponta, a regressão linear desempenha silenciosamente um papel crucial, e é hora de destacarmos como ela pode ser benéfica ainda hoje.==

\ Considere um cenário em que uma empresa de comércio eletrónico introduz um novo banner e pretendemos avaliar o impacto dele na duração média da sessão. Para tal, foi realizada uma experiência e foram recolhidos dados para análise. Vamos analisar os resultados.

Teste T

Vamos utilizar uma ferramenta familiar para esta tarefa: o teste t.

Os resultados são bastante promissores:

O aumento na métrica é simplesmente a diferença entre as médias amostrais dos grupos de controlo e de tratamento. No nosso caso, o aumento estimado é de 0,56 minutos, indicando que os utilizadores, em média, passam mais 33 segundos a usar o nosso produto.

Regressão Linear

Agora, vamos utilizar regressão linear com o vetor de tratamento (se o novo banner é mostrado ou não) como variável independente e a duração média da sessão como variável de saída.

Depois imprimimos o resumo do nosso modelo:

\ Notavelmente, o coeficiente para a variável de tratamento alinha-se com a nossa estimativa anterior de aumento de 0,56. Vale a pena notar que o R-quadrado é apenas 0,008, e não explicamos grande parte da variância com este modelo.

Coincidência?

Será coincidência que o aumento obtido do teste t e o coeficiente de tratamento sejam iguais? Vamos explorar a conexão.

\ Vamos pensar no que a variável de tratamento reflete. Quando é igual a 1, indica a duração média da sessão para utilizadores que viram o banner; quando é igual a 0, indica a duração média da sessão para utilizadores que não viram o banner. Significa que a variável de tratamento (ou Inclinação da Regressão Linear em termos de regressão linear) representa a mudança na média entre os grupos de controlo e tratamento.

Qual é a hipótese nula para a variável de tratamento na regressão linear?

Qual é a hipótese nula quando aplicamos o teste T para a experiência? É exatamente a mesma.

Portanto, ao calcular as estatísticas t e o valor p para hipóteses idênticas, os nossos resultados permanecem consistentes e idênticos.

Por que queremos usar regressão linear?

No entanto, qual é a razão por trás do uso da regressão linear? Não queremos apenas complicar as coisas.

\ Primeiro, vamos pensar se apenas o tratamento é responsável pela mudança na nossa métrica principal.

\ Na realidade, isto pode não ser totalmente preciso devido à presença de viés de seleção.

\ O viés de seleção nos testes A/B é um tipo de erro quando há uma diferença sistemática entre os grupos comparados que não se deve ao acaso, por exemplo:

Observamos que utilizadores antigos são expostos a um novo banner com mais frequência do que novos clientes.

\

A alocação aleatória que usamos em testes AB ajuda-nos a mitigá-lo, mas é difícil eliminá-lo completamente.

\ Vamos formular como estimar o efeito verdadeiro.

ATE: efeito médio do tratamento que pretendemos estimar.

\ ATT: efeito médio do tratamento dos tratados. Também podemos chamá-lo ACE: efeito causal médio. Na verdade, podemos calculá-lo. É a diferença entre as médias amostrais dos grupos de controlo e tratamento.

\ SB: viés de seleção que pretendemos minimizar.

\ Como podemos minimizá-lo?

\ A regressão linear permite-nos adicionar covariáveis/variáveis de confusão. Vamos experimentar e adicionar como uma das variáveis de confusão a duração média da sessão para utilizadores antes da experiência.

E imprimir o resumo do modelo:

O nosso R-quadrado disparou! Agora, explicamos 86% da variância.

\ O nosso efeito de tratamento agora é 0,47.

Qual escolher?

Então, temos dois efeitos de tratamento: 0,47 e 0,56; qual está correto?

\ Neste caso, sabemos com certeza o efeito verdadeiro porque simulei dados e o aumento real: 0,5

import numpy as np import pandas as pd from scipy import stats import statsmodels.api as sm np.random.seed(45) n = 500 x = np.random.normal(loc = 10 ,scale = 3, size= 2 * n) y = x + np.random.normal(loc = 2 , scale = 1 ,size = len(x)) # For 50% of users we simulate treatment effect treat = 1 * (np.random.rand(2 * n) <= 0.5) experiment = pd.DataFrame(x, columns=["covariate"]) experiment['metric'] = y experiment['treatment'] = treat experiment['noise'] = np.random.normal(size = len(experiment)) # Add noise and uplift to 'metric' for rows where 'treat' is equal to 1 # The real uplift is 0.5 experiment['metric'] = experiment.apply(lambda row: row['metric'] + 0.5 * row['treatment'] + row['noise'] if row['treatment'] == 1 else row['metric'], axis=1)

Isso significa que 0,47 é melhor em termos de diferença absoluta e está mais próximo de refletir o aumento real.

Conclusão

Usar regressão linear tem as seguintes vantagens:

Proporciona uma compreensão mais profunda dos nossos dados e de quão bem o modelo se alinha com os dados.
Ao usar covariáveis, podemos mitigar o viés de seleção, resultando numa estimativa mais precisa do efeito de tratamento.

\ Podemos usar regressão linear para outros testes, como o teste t de Welch ou o teste Qui-quadrado?

\ A resposta simples é sim. No entanto, temos de fazer alguns ajustes que vamos discutir nos próximos artigos!

Oportunidade de mercado

Cotação B (B)

$0.09707

$0.09707$0.09707

-3.10%

USD

Gráfico de preço em tempo real de B (B)

Don't Miss $200,000 U-Fest

Get mystery boxes, 12% APR & $200 new user gifts!

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

Notícias em alta

Mais

OKX ra mắt phiên giao dịch AI thứ 8, quỹ thưởng 1 triệu USDT

KuCoin ra mắt KuCard tại Australia, tích hợp mạng Mastercard

Nhà sáng lập ACI đề xuất lập quỹ thay vì quyên góp cứu trợ Kelp

Đà tăng Bitcoin chững lại khi thị trường ngừng trả premium cho vị thế long

CEO Bybit: Bybit sẽ ủng hộ đề xuất cho Aave vay của Mantle

Notícias ao vivo 24/7

Mais

Michael Burry aumenta as suas participações em $GME antes da votação sobre a remuneração de Ryan Cohen e de uma potencial grande operação de fusões e aquisições.

Autor: Salvatore Linteum17:29

Os clientes da BlackRock compraram 167,45 milhões de dólares em Bitcoin, o que indica um crescente interesse institucional no mercado de criptomoedas.

Autor: Crypto Aman14:42

PENGU ocupa o primeiro lugar entre as moedas com maior tendência de hoje, indicando um interesse significativo do mercado.

Autor: Nehal14:00

A Metaplanet planeia comprar 50 milhões de dólares em Bitcoin, sinalizando um aumento do interesse institucional nos mercados de criptomoedas.

Autor: Vivek Sen13:20

A Riot Platforms vendeu 500 BTC, depositando 38,95 milhões de dólares na NYDIG, podendo impactar a liquidez de mercado.

Autor: Lookonchain10:30