A magica por traz da detecção de movimento

Enquanto escrevo isso o primeiro evento que anuncia a E3 está ocorrendo. O evento sobre o que a Microsoft chamou até hoje de Projeto Natal agora tem outro nome. Kinect. Apesar de não ter tradução se parece muito com a palavra "kinetic", que significa "cinético". Para quem matou as aulas de física, ou ainda não as teve: cinética é a parte da física que estuda o movimento, e é isso que a palavra significa. Movimento.

Kinect for Xbox 360

Mas agora você deve estar se perguntando: "Como o Kinect consegue reconhecer as pessoas e as posições em que estão?" A base desse processo de reconhecimento é conhecido como rede neural. Uma rede neural é um sistema computacional que simula a estrutura do cérebro humano, ou seja, os computadores nessa rede neural tentam se comportar e reagir da mesma forma que os neurónios fazem para trabalhar dentro de nossos cérebros. Mais especificamente como os neurónios fazem para aprender a fazer algo. Dois problemas nesse processo são que o numero de neurónios em nosso cérebro é gigantesco para se construir um computador equivalente, e nossos neurónios não trabalham apenas com zero e uns. Mas se tratando da Microsoft ela simplesmente ignorou essas limitações e está, inclusive agora enquanto você lê esse texto, colocando imagens e vídeos para que essa tal de rede neural aprenda a reconhecer pessoas.

Mas colocar imagens e vídeos em uma rede neural que não sabe o quê fazer com elas não vai fazer nada. Então uma série de funcionários desenvolveram uma série de programas que usam uma área da computação chamada de reconhecimento de padrões, que faz exatamente isso: descreve matematicamente como se reconhecer padrões nas formas da coisas, de maneira similar a do nosso cérebro , que consegue aprender que um quadrado é um quadrado por ter os 4 lados iguais.

O resultado desse aprendizado, ou seja, a memória deste computador que mostra todo o trabalho que esses neurônios digitais tiveram, será copiada para cada unidade do Kinect que for produzida. Essa informação então será utilizada para descobrir a posição de cada parte do corpo, 30 vezes por segundo.

Outro grande detalhe de todo esse mecanismo de reconhecimento é que não é apenas a imagem convencional que é processada. O Kinect conta com o mesmo princípio das câmeras 3D. A partir de duas cameras convencionais a cena é gravada. Essas duas cameras estão a uma distância de sete centímetros (a distância média entre os olhos humanos) e o video resultante é uma interpolação entre a gravação das duas câmeras. No caso do Kinect as duas cameras são infravermelhas, que informam com grande precisão o volume dos objetos na sala.


Sony Move

Já o Playstation Move usa um principio parecido, com a diferença de que só se aplica a bola de luz na ponta do controle e outras caracteristicas primarias (que não sei dizer quais são). Para conseguir o resto da informação são utilizados acelerômetros, assim é possível saber onde exatamente para onde o controle está se movendo. O Move é naturalmente mais preciso que o Kinect por se tratar de detectar apenas um ponto através do reconhecimento da imagem, que alias já existe a muito tempo. A desvantagem é que ele consegue detectar apenas onde o controle está, e apenas controles. Nada de detectar o corpo todo.


Wiimote

Por ultimo e não menos importante o controle do Wii. O princípio de funcionamento desse são acelerômetros distribuídos de forma a saber o movimento do controle nas 3 dimensões. Ao apontar para a barra de sensor no topo da TV o controle tem uma câmera infravermelha capaz de detectar a posição da barra e descobrir para onde o controle está apontando na TV.

Sendo assim temos basicamente 3 classes de controles com detecção de movimento.
1- Com base em acelerômetros (Wiimote)
2- Com base em reconhecimento de imagens (Kinect)
3- Hibrido (Move)

Agora, cada um tem suas vantagens e desvantagens. Na minha modesta opinião de um gamer tendencioso para a Microsoft, a técnologia envolvida no reconhecimento do Kinect está em outro nível. Por não precisar de controles e usar um ramo de tecnologia pouco explorado por apresentar uma grande barreira tecnológica.

1 comentários:

  1. Ótimo post Daniel. Parabéns cara.

    Um abraço.

Postar um comentário

 
Nuclear Core Studios © 2010 | Designed by Trucks, in collaboration with MW3, Broadway Tickets, and Distubed Tour. Customizado por Bruna Lanzillotta.