Os resultados da pesquisa com ratos foram mais precisos em relação ao aspecto temporal das imagens — Foto: Getty Images
Pesquisa usou atividade de neurônios individuais para reconstruir vídeos assistidos por camundongos, revelando como o cérebro processa informações visuais
O cérebro não funciona como uma câmera. Ele recebe sinais visuais, processa, distorce e reconstrói uma versão própria da realidade. Uma pesquisa publicada no periódico eLife deu um passo concreto para entender esse processo. Cientistas do University College London (UCL) conseguiram reconstruir vídeos assistidos por camundongos a partir, exclusivamente, da atividade elétrica dos neurônios dos animais.
A técnica, segundo o site Science Alert, envolve o monitoramento de células nervosas individuais no córtex visual, a região do cérebro responsável por processar informações visuais, e o processamento desses dados por um algoritmo capaz de gerar imagens em movimento, quadro a quadro.
O ponto de partida foi um modelo de codificação neural dinâmica desenvolvido por outro grupo de pesquisa. Esse sistema é treinado para prever quais neurônios serão ativados quando um animal assiste a determinado vídeo. O modelo leva em conta não apenas o que está sendo visto, mas também o comportamento do animal naquele momento, velocidade de deslocamento, posição e diâmetro das pupilas.
A equipe do UCL aprimorou essa base ao treinar sete versões do modelo usando uma tela cinza em branco como referência. A lógica é subtrativa: ao calcular a diferença entre a atividade neuronal diante de uma tela sem estímulo e a atividade registrada durante a exibição de um vídeo real, os pesquisadores conseguiram isolar o sinal correspondente ao conteúdo visual. A partir daí, o algoritmo atualiza a imagem em branco pixel a pixel até que ela se aproxime do que o animal havia visto.
Após o treinamento, cinco camundongos assistiram a um vídeo de dez segundos que os modelos nunca tinham processado antes. A atividade neuronal registrada foi suficiente para reconstruir o clipe com qualidade superior à de métodos anteriores. A correlação entre o vídeo original e o reconstruído chegou a 0,569, ante 0,301 obtido pelo modelo de referência anterior.
Joel Bauer, neurobiólogo do UCL e autor principal do estudo, afirmou que "a precisão das reconstruções melhorou com a inclusão de dados de mais neurônios individuais, demonstrando a importância de dados neurais abrangentes."
Mais do que uma demonstração tecnológica, o objetivo da pesquisa é entender como o sistema visual do cérebro processa e transforma a informação que chega pelos olhos. Para os pesquisadores, a representação mental de uma cena não é uma cópia fiel do mundo externo, ela é interpretada, filtrada e modificada pelo próprio processo de percepção.
"Não temos uma representação perfeita do mundo em nossas cabeças. O processamento visual distorce e modifica nossa representação de uma forma que altera a informação", disse Bauer. "Esse desvio entre a realidade e as representações no cérebro não é necessariamente um erro, mas uma característica, refletindo como nossas mentes interpretam e aumentam a informação sensorial. Queremos explorar como isso acontece no cérebro."
Os resultados foram mais precisos em relação ao aspecto temporal das imagens — ou seja, o momento em que os pixels mudam ao longo do tempo. Resolução espacial e cobertura das reconstruções ficaram abaixo do desempenho temporal, e a equipe indicou que esses pontos serão foco de trabalhos futuros.
O estudo faz parte de linha de pesquisa que busca, de diferentes formas, traduzir sinais cerebrais em conteúdo inteligível. Trabalhos anteriores utilizaram equipamentos de eletroencefalografia (EEG) para converter pensamentos de participantes humanos em texto, e ressonâncias magnéticas funcionais (fMRI) para identificar a narrativa de podcasts ouvidos por voluntários.
A diferença metodológica neste novo estudo está no uso de registros de neurônios individuais, uma resolução muito mais granular do que a obtida por EEG ou fMRI. Isso permitiu mapear com mais precisão quais células específicas respondem a quais estímulos visuais, tornando o modelo mais refinado.


