Comprar cripto Mercados Spot FuturosGOLD Ganhe Centro de eventos

Mais

Este artigo apresenta um estudo de ablação confirmando que a separação de latentes de movimento em metades superior e inferior melhora significativamente a precisão da reconstrução de avatar 3DEste artigo apresenta um estudo de ablação confirmando que a separação de latentes de movimento em metades superior e inferior melhora significativamente a precisão da reconstrução de avatar 3D

A Importância da Separação: SAGE Supera as Linhas de Base Unificadas de VQ-VAE em Movimento de Corpo Inteiro

Fonte: Hackernoon

2025/10/23 03:26

Leu 3 min

Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

Tabela de Links

Abstrato e 1. Introdução

Trabalhos Relacionados

2.1. Reconstrução de Movimento a partir de Entrada Esparsa

2.2. Geração de Movimento Humano
SAGE: Geração de Avatar Estratificada e 3.1. Declaração do Problema e Notação

3.2. Representação de Movimento Desvinculada

3.3. Difusão de Movimento Estratificada

3.4. Detalhes de Implementação
Experiências e Métricas de Avaliação

4.1. Conjunto de Dados e Métricas de Avaliação

4.2. Resultados Quantitativos e Qualitativos

4.3. Estudo de Ablação
Conclusão e Referências

\ Material Suplementar

A. Estudos de Ablação Extras

B. Detalhes de Implementação

4.3. Estudo de Ablação

Realizamos um estudo de ablação sob S1 para justificar a escolha de design de cada componente em nossa SAGE Net.

\ Tabela 4. Resultados de avaliação sob configuração S3.

\ Tabela 5. Resultados de ablação de diferentes componentes na SAGE Net sob configuração S1.

\ Tabela 6. Resultados de avaliação sobre a estratégia condicional do modelo de difusão sob configuração S1.

\ Codebook Desvinculado: Estabelecemos uma linha de base usando uma representação de movimento unificada para avaliar a estratégia de desvinculação. Especificamente, desenvolvemos um modelo VQ-VAE de corpo inteiro que codifica o movimento de corpo inteiro em um único codebook discreto unificado. Outros componentes são os mesmos do modelo original. Os resultados mostrados na primeira e na última linha da Tabela 5 demonstram que nossa abordagem empregando latentes desvinculados supera significativamente a linha de base em todas as métricas de avaliação. Isso demonstra que a desvinculação pode simplificar o processo de aprendizagem, permitindo que o modelo se concentre em um conjunto mais limitado de movimentos e interações. Além disso, a Fig. 5 mostra a comparação de visualização entre nosso modelo e o modelo de linha de base, verificando que a desvinculação pode melhorar significativamente os resultados de reconstrução para os movimentos inferiores mais desafiadores.

\ Estratégia de Desvinculação: Para investigar a estratégia de desvinculação ideal, exploramos uma configuração de desvinculação extrema seguindo o caminho da raiz

\ Figura 6. Casos de falha. Todos os modelos são treinados sob configuração S1.

\ (Pelvis) para cada nó folha ao longo da árvore cinemática. Especificamente, dividimos o corpo em cinco segmentos: os caminhos da raiz para a mão esquerda (a), mão direita (b), cabeça (c), pé esquerdo (d) e pé direito (e). Conforme relatado nas duas últimas linhas da Tab. 5, as interconexões naturais das articulações dentro do corpo superior (ou inferior) foram interrompidas quando desvinculamos ainda mais o corpo humano, resultando em quedas de desempenho e complicando o design do modelo.

\ Limitação: Na Fig. 6, tanto o método anterior de última geração quanto o nosso modelo encontram dificuldades em duas situações principais: (1) Movimentos Induzidos por Força Externa (a linha superior). (2) Poses Não Convencionais (a linha inferior). A adição de amostras mais variadas ao conjunto de dados de treinamento pode potencialmente melhorar o desempenho do modelo nessas áreas.

:::info Autores:

(1) Han Feng, contribuições iguais, ordenados por alfabeto da Universidade de Wuhan;

(2) Wenchao Ma, contribuições iguais, ordenados por alfabeto da Universidade Estadual da Pensilvânia;

(3) Quankai Gao, Universidade do Sul da Califórnia;

(4) Xianwei Zheng, Universidade de Wuhan;

(5) Nan Xue, Grupo Ant (xuenan@ieee.org);

(6) Huijuan Xu, Universidade Estadual da Pensilvânia.

:::

:::info Este artigo está disponível no arxiv sob licença CC BY 4.0 DEED.

:::

Ganhe 20 USDT em apenas 1 minuto

Deposite $100 para desbloquear $300 em posições GOLD

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.