Aquele adolescente é hoje uma das mentes-chave por detrás da inteligência artificial moderna. Yann LeCun, frequentemente citado como uma figura fundadora do deep learning, ajudou a transformar equações abstratas em tecnologias que andam nos nossos bolsos, conduzem os nossos carros e moldam a vida online.
O rapaz francês que queria que as máquinas vissem
Yann LeCun nasceu a 8 de julho de 1960 em Soisy-sous-Montmorency, a noroeste de Paris. A localidade era comum; a sua curiosidade não. Em criança, fazia experiências com eletrónica, fascinado com a forma como circuitos simples podiam criar comportamentos complexos.
Mais tarde, estudou na ESIEE Paris e concluiu um doutoramento na Université Pierre-et-Marie-Curie, trabalhando naquilo que viria a tornar-se a sua obsessão para a vida: fazer com que as máquinas reconhecessem formas e padrões como os humanos.
Muito antes de a IA se tornar manchete, LeCun perguntava-se como é que um computador podia olhar para uma imagem e compreender, de facto, o que estava a ver.
Nas décadas de 1980 e 1990, este objetivo era ambicioso, até excêntrico. O poder de computação era limitado. As redes neuronais estavam fora de moda nos círculos académicos. O financiamento e o reconhecimento iam para outros métodos. LeCun manteve-se fiel à sua intuição de que redes com múltiplas camadas podiam aprender a ver.
Inventar as redes neuronais que leem escrita à mão
Uma das contribuições mais influentes de LeCun é a rede neuronal convolucional (convolutional neural network), ou CNN. No essencial, uma CNN varre uma imagem em pequenas regiões, aprendendo a detetar arestas, cantos e padrões e, gradualmente, combinando-os em formas e objetos.
Liderou uma equipa nos AT&T Bell Labs que usou estas redes para reconhecer dígitos manuscritos. A tecnologia foi implementada por bancos dos EUA para ler milhões de cheques por dia. Não era glamorosa, mas funcionava à escala e provou que o deep learning não era apenas uma curiosidade teórica.
Sempre que uma máquina lê corretamente um número rabiscado num pacote ou num cheque, está a ecoar trabalho que LeCun ajudou a definir há décadas.
Dos dígitos a cenas complexas
As mesmas ideias de base alimentam hoje sistemas muito mais sofisticados. As CNNs e os seus descendentes são usados para:
- Detetar peões, sinais de trânsito e outros veículos em sistemas de assistência à condução
- Classificar imagens médicas como ressonâncias magnéticas (RM) ou radiografias
- Identificar rostos e objetos em aplicações de fotografias
- Inspecionar equipamento industrial para detetar defeitos em linhas de produção
A investigação inicial de LeCun mostrou que uma rede podia ser treinada de ponta a ponta a partir de píxeis brutos, em vez de depender de regras construídas manualmente. Essa mudança moldou praticamente todos os sistemas de IA visual desde então.
De investigador de laboratório a cientista-chefe de IA na Meta
LeCun alternou entre academia e indústria ao longo da carreira. Passou anos nos AT&T Bell Labs, ajudou a construir o departamento de ciências da computação da Universidade de Nova Iorque (NYU) e, em 2013, juntou-se ao Facebook (hoje Meta) para liderar a investigação em IA.
Hoje, como cientista-chefe de IA na Meta e professor na NYU, vive entre dois mundos: as questões abertas da investigação e a escala massiva de uma plataforma tecnológica global.
| Ano | Marco na carreira de LeCun |
|---|---|
| Década de 1980 | Trabalho inicial em redes neuronais em França e nos EUA |
| Década de 1990 | Sistemas de reconhecimento de escrita à mão adotados por bancos dos EUA |
| 2003 | Entra na NYU como professor, cria um influente grupo de investigação em IA |
| 2013 | Torna-se diretor de investigação em IA no Facebook |
| 2018 | Recebe o Prémio Turing com Yoshua Bengio e Geoffrey Hinton |
O Prémio Turing, muitas vezes comparado a um Prémio Nobel da computação, reconheceu LeCun como um dos arquitetos-chave do deep learning.
A revolução do deep learning que ajudou a desencadear
Deep learning refere-se ao treino de grandes redes neuronais com muitas camadas em conjuntos de dados gigantescos. LeCun, a par de pares como Geoffrey Hinton e Yoshua Bengio, mostrou que estes modelos podiam superar métodos anteriores em tarefas de visão, fala e linguagem.
Esse sucesso assentou em três pilares: melhores algoritmos, mais dados e hardware mais rápido. À medida que os processadores gráficos tornaram mais barato fazer cálculos intensivos, as ideias de LeCun escalaram de forma espetacular.
Dentro da máquina: como funciona o deep learning
Uma rede neuronal imita, de forma aproximada, a estrutura do cérebro. É composta por unidades interligadas, ou “neurónios”, que transmitem sinais e ajustam as suas ligações durante o treino. A rede melhora comparando as suas previsões com resultados reais e reduzindo os seus erros passo a passo.
As redes convolucionais acrescentam uma nuance: exploram a estrutura das imagens ao observar primeiro localmente. Isto torna-as eficientes e surpreendentemente robustas a detetar padrões visuais, desde os bigodes de um gato às faixas de rodagem.
LeCun tem também sido um forte defensor da aprendizagem auto-supervisionada (self-supervised learning), em que os sistemas aprendem a partir de dados brutos, sem rótulos. Em vez de fornecer milhões de imagens etiquetadas, deixa-se o modelo prever partes em falta dos dados e corrigir-se. Essa estratégia procura aproximar a aprendizagem automática da forma como os humanos aprendem com a experiência.
Uma voz audível no debate sobre o futuro da IA
LeCun é conhecido não apenas por equações, mas por opiniões. Frequentemente contesta afirmações hiperbólicas de que a IA se tornará, a curto prazo, uma ameaça todo-poderosa para a humanidade. Na sua perspetiva, os sistemas atuais são estreitos, frágeis e carecem de senso comum.
Para LeCun, o verdadeiro desafio não é travar uma superinteligência descontrolada, mas construir IA capaz de raciocinar, aprender continuamente e alinhar-se com valores humanos.
Apoia regulação que responda a danos concretos: enviesamento, vigilância, desinformação, impactos no trabalho. Ao mesmo tempo, alerta que o medo excessivo pode consolidar a dominância de algumas grandes empresas e abrandar a investigação aberta.
Equilibrar risco, progresso e utilização pública
Muitas das aplicações que nascem do trabalho de LeCun trazem benefícios e riscos:
- A condução autónoma pode reduzir acidentes, mas levanta questões de responsabilidade e privacidade de dados.
- Ferramentas de imagiologia médica podem ajudar médicos, mas têm de ser testadas cuidadosamente para evitar enviesamentos ocultos.
- Sistemas de recomendação de conteúdos podem personalizar feeds, mas também moldam o debate público e a saúde mental.
LeCun argumenta que melhor conceção técnica, dados de treino mais diversos e escrutínio aberto podem mitigar muitos destes problemas, embora a regulação continue a ter um papel.
Porque é que Yann LeCun importa para o dia a dia
A maioria das pessoas nunca ouviu falar de redes convolucionais, mas interage com elas constantemente. Permitem desbloquear smartphones com um olhar, separar spam de caixas de correio e sugerir o que ver a seguir. Esses sistemas traçam uma linha até à insistência de LeCun de que aprender a partir de dados podia superar regras feitas à mão.
Em França, o seu sucesso também alterou a forma como o país vê o seu próprio talento científico. Durante anos, muitos dos melhores investigadores franceses em IA partiram para laboratórios nos EUA e no Canadá. A projeção global de LeCun levou instituições francesas e decisores políticos a investir mais em investigação e startups nacionais.
Termos-chave que vale a pena esclarecer
Deep learning
Deep learning é um subconjunto da aprendizagem automática em que os modelos aprendem a partir de dados usando muitas camadas de computação empilhadas. Cada camada extrai características ligeiramente mais abstratas. No reconhecimento de imagens, as camadas iniciais identificam arestas e texturas; as camadas posteriores identificam olhos, rodas ou rostos inteiros.
Rede neuronal convolucional
Uma rede neuronal convolucional, central no trabalho de LeCun, processa dados em janelas pequenas e sobrepostas. Para imagens, esta abordagem permite ao sistema reconhecer uma forma independentemente de onde ela aparece na imagem. Isto torna as CNNs eficientes em tarefas como reconhecimento facial ou deteção de objetos.
Aprendizagem auto-supervisionada
A aprendizagem auto-supervisionada permite treinar modelos usando dados que não foram rotulados manualmente. Por exemplo, um sistema pode ocultar parte de uma imagem e aprender a prever a porção em falta. Com o tempo, constrói uma compreensão interna da estrutura, que pode transferir para muitas outras tarefas com treino adicional mínimo.
O que a trajetória de LeCun diz sobre o próximo capítulo da IA
A carreira de LeCun ilustra como ideias podem ficar anos à margem e, de repente, remodelar uma indústria inteira quando as condições se alinham. A sua insistência na aprendizagem orientada por dados, numa altura em que muitos colegas eram céticos, acabou por definir a abordagem dominante da IA.
A próxima fase que defende é aquela em que os sistemas de IA se tornam aprendizes mais autónomos. Em vez de treinar modelos separados para cada tarefa, imagina sistemas gerais que compreendem o ambiente físico e social, aprendem continuamente e cooperam com humanos em vez de os substituir de forma direta.
Para os trabalhadores, essa mudança pode significar ferramentas que tratam de tarefas repetitivas de perceção - monitorizar linhas de fábrica, ler formulários, analisar imagens médicas - enquanto os humanos se concentram no julgamento, na criatividade e no cuidado. Para decisores políticos, levanta novas questões sobre requalificação, governação de dados e quem beneficia dos ganhos de produtividade.
Quer a sua visão se concretize exatamente como prevê, há um facto que se mantém: a partir de uma pequena localidade perto de Paris, Yann LeCun ajudou a ensinar as máquinas a ver. Os argumentos que hoje se desenrolam sobre a promessa e o risco da IA são, em parte, consequência dessa aposta de longa duração em sistemas que aprendem.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário