A IA está melhorando ou estragando a música que amamos?
Restauração, manipulação e o risco da pasteurização sonora
1.
Desde quando o primeiro ser humano inventou a moeda, ficou fácil entender que toda tecnologia tem dois lados. Existem casos em que as inovações são apenas ruins: basta lembrar do Clippy, aquele assistente do Word que vinte em cada dez pessoas odiavam. Mas a ambivalência do nosso avanço técnico quase sempre representa um avanço que vem com um custo – financeiro, moral ou de outra ordem. De cara, pensamos na tecnologia atômica, que poderia gerar energia capaz de iluminar cidades ou bombas capazes de aniquilar essas mesmas cidades. Mas temos exemplos mais comezinhos, como o identificador de chamadas telefônicas dos anos 1980. Você tinha a ilusão de poder evitar ligações inconvenientes, mas podia gerar constrangimentos com amigos e familiares (e os mais jovens perderam o prazer de passar trotes).
Há um par de anos, as inteligências artificiais pareciam utopias de livro sci-fi, mas elas se tornaram realidade em nossa época, e, diante do fato, muita gente optou por rejeitar essa tecnologia. Quando saiu a trend do Studio Ghibli, tentei tecer reflexões para além do maniqueísmo, o que me pareceu uma posição mais razoável diante de algo tão novo. Mas tudo tem dois lados, e isso é difícil de se reconhecer quando se decide que determinado recurso tecnológico deve ser tachado exclusivamente como sendo ruim.
Veja só um exemplo de bom uso das IAs. Em 2023, os Beatles lançaram sua “última canção” Now and Then. A turma da demonização da tecnologia logo se manifestou, declarando que era um absurdo ver o quarteto de Liverpool se valendo de tecnologias modernas (apesar dos Beatles terem experimentado intensamente no estúdio nos anos 1960). Alguns internautas reclamaram que “recriar” a voz de John Lennon com IA era imperdoável – dando a entender que se tratava de um robô emulando o estilo do cantor.
Vamos contextualizar essa história. A gravação original de Now and Then foi feita por Lennon em casa, com um gravador doméstico. É o que se chama na indústria de gravação “demo” (demonstração), que o cantor gravou apenas como registro, e em cuja fita cassete ele escreveu “for Paul”. Essa fita continha outras músicas, como Free as a Bird e Real Love (que os Beatles sobreviventes acabaram gravando na coletânea Anthology, que saiu nos anos 1990). Como John faleceu, não era possível reunir toda a banda para gravar junta, e a única solução era usar a fita cassete; contudo, a voz de Lennon estava acompanhada de um piano, com dois registros sonoros (voz e piano) entrelaçados no mesmo canal de áudio. Técnicas tradicionais não conseguiam separar esses elementos sem perda de qualidade, resultando em uma voz abafada, com ruído e frequências comprometidas.
Foi então que entrou em cena o sistema de IA desenvolvido pela equipe de Peter Jackson e Fran Walsh, utilizado anteriormente na série documental The Beatles: Get Back. Essa IA foi treinada para reconhecer e distinguir elementos sonoros complexos — voz humana, instrumentos, ruído de fita etc. A partir dessa "escuta inteligente", o sistema pôde extrair a voz de John com clareza, isolando-a do piano e de outras interferências, e restaurar partes do espectro sonoro perdidas ao longo do tempo.
Podemos comparar esse processo ao trabalho de um restaurador de pinturas antigas: diante de uma obra danificada pelo tempo, o restaurador não cria algo novo, mas estuda profundamente a técnica original do artista, os pigmentos e o estilo, e preenche as falhas com base nesse conhecimento. Do mesmo modo, a IA analisou o timbre, a dinâmica e as frequências da voz de Lennon, e completou as lacunas do sinal sonoro, respeitando a integridade do material original.
Ou seja, a IA foi usada como um instrumento de preservação, e não de simulação. Ela permitiu que a voz real de John Lennon, registrada décadas atrás, fosse ouvida hoje com uma nitidez que antes seria tecnicamente impossível. É como se o cantor tivesse feito essa gravação em um estúdio com boa acústica e um microfone adequado.
Existem recursos de manipulação sonora muito mais artificiais usados há décadas na indústria e que não provocaram a repulsa dos fãs da mesma forma que a IA. Como o Autotune, que foi criado para afinar vozes digitalmente, e que rappers como Kanye West acabaram transformando em um instrumento.
Hoje em dia, o Autotune é usado até mesmo ao vivo por muitos cantores. Isso é parte de uma tendência na música atual de higienização do som, onde se busca parâmetros como “clareza” e “limpeza” do som, mesmo em casos nos quais tais critérios não combinam com a proposta estética e conceitual da obra.
2.
Agora, vamos falar de um uso ruim (ou eu diria “péssimo”?) das IAs. Ano passado, o Queen relançou seu primeiro disco, Queen I, cujos canais foram recuperados com o uso da IA. Isso por si só deveria ser uma boa notícia, e vem na esteira do que os Beatles fizeram em 2023 ao lançar a nova versão de sua coletânea vermelha (1962-66).
Porque isso é interessante? Em alguns casos, as gravadoras não possuem mais as fitas masters originais dos discos – rolos de fita com os canais separados de cada instrumento. Algumas dessas fitas foram perdidas, e outras se deterioraram antes que pudessem ter sido digitalizadas. Sem elas, era impossível há alguns anos fazer o processo de separar os instrumentos de cada música em diferentes canais de áudio. Pois as IAs conseguem fazer essa separação, do mesmo modo que extraíram e melhoraram o som da voz de John Lennon na sua fita velha e precária de Now and Then.
Ou seja, a nova versão de Queen I prometia. Mas, quando os fãs deram “play” no Spotify ou nos CDs que vieram nos seus boxes de luxo, algo parecia soar estranho. Muito estranho. Parecia não ser o mesmo disco. A primeira evidência disso era algo quase que inacreditável: a voz de Fred Mercury estava mesmo com som de Autotune? Os caras acharam que era necessário afinar artificialmente um dos maiores cantores de todos os tempos? Pois é. Imagine que um restaurador cismasse de corrigir a anatomia nos quadros de Modigliani, ou a perspectiva nos quadros de Bosch.
Acho que não dá para ficar pior, certo? Bem, diante de pessoas deslumbradas com a tecnologia, o poço sempre tem um pré-sal para cavar. E o golpe de misericórdia não veio dos engenheiros de som ou produtores, mas da própria banda. No caso, o baterista Roger Taylor, que afirmou nunca ter ficado satisfeito com o som de sua bateria nos primeiros discos. Ele então decidiu que ia aproveitar esse remix para mudar o timbre de sua bateria. Uau.
Alguns fãs até gostaram, dizendo que o som ficou tecnicamente melhor. O próprio Taylor afirmou que finalmente as faixas soavam como ele queria. Não importa que o resultado seja um disco originalmente lançado nos anos 1970 que agora tem um som de bateria reverberado estilo anos 80 – os envolvidos acharam que o remendo ficou divino. Sequer pensaram que o disco original é um documento de época.
Ora, visto que o lançamento é um box set, custava incluir dois CDs, um com melhorias que preservassem o som original, e um outro com as invenções de moda? Nos fóruns de audiófilos na internet, o consenso é que se trata de uma adulteração tosca – até porque o som da bateria Trident de Roger era bem legal sim. Por outro lado, os fãs xiitas torciam há anos para que o Queen incluísse nesse box-set um show feito pelo quarteto no Imperial College, que é tido como um registro histórico da banda. Mas o mesmo Roger Taylor que mudou o som da própria bateria decidiu vetar a inclusão desse eletrizante show.

3.
As automações são fundamentais no projeto de produção sonora. Basta ouvir uma banda ensaiando numa garagem e comparar com um disco finalizado para perceber a diferença. E, em 2025, precisamos lembrar que nem toda automação é IA. Desde o advento da indústria fonográfica, toda gravação passa por etapas como equalização, aplicação de efeitos, amostragem, compressão, dentre outros parâmetros.
Muita gente desavisada atribui a pecha de grande vilão às novas tecnologias, desconsiderando o elemento realmente perigoso dessa equação: o fator humano. Ou, melhor dizendo, o fator humano sem noção. Pessoas como Roger Taylor, que, a despeito de serem excelentes músicos, deveriam ficar longe das decisões técnicas.
Muito pior do que as IAs, do que o Autotune ou até do que o cabelo estilo Mullet é um recurso que tem literalmente destruído a música contemporânea, ao ponto de transformá-la em um problema de saúde pública: o excesso de compressão dinâmica e volume nas masterizações (fenômeno conhecido como Loudness War).
A indústria da música naturalizou o problema, e poucas pessoas questionam essa prática hoje em dia. Um dos produtores com uso mais recorrente do excesso de compressão dinâmica é o americano Rick Rubin, que produziu os discos mais famosos de artistas como Red Hot Chilli Peppers ou Slayer. Rubin vem da cena do rap, um estilo que prima por sons excessivamente comprimidos. Ele é uma dessas pessoas que aplicam seus recursos preferidos de maneira acrítica no trabalho alheio, em vez de realmente entender se aquilo realmente beneficia a proposta estética dos artistas.

4.
Mesmo artistas que ficaram conhecidos por suas produções sóbrias e equilibradas caíram nessas esparrelas da indústria. O caso mais triste, para mim, envolve o duo inglês Tears for Fears. Há alguns anos, os álbuns do grupo eram estudados em graduações de produção como sendo um case exemplar de boas escolhas técnicas. Mas, na virada do século XXI, seus trabalhos passaram a ser marcados pelo excesso de compressão dinâmica.
Essa não foi a única decisão técnica questionável do Tears for Fears. Recentemente, um You Tuber mostrou que o cantor Curt Smith também aderiu ao uso do Autotune ao vivo para corrigir sua afinação. O vídeo original desse You Tuber foi deletado, e lá podíamos ver uma comparação da versão de estúdio da música Everybody Wants to Rule the World versus uma versão ao vivo mais recente da mesma canção. Ficava claro na comparação que a voz tratada de Curt Smith pelo Autotune deixou seu timbre meio que robótico. Por outro lado, sua voz na versão original não demonstra nenhum problema grave de afinação, mas apenas as oscilações que são naturais a qualquer cantor.
É mais um caso da higienização sonora e seus fetiches por um som supostamente perfeito. Uma mentalidade perfeccionista de produtores e engenheiros de som dispostos a remover qualquer detalhe mínimo feito pela mão humana. Mesmo cantores de alta performance vão apresentar as chamadas “microafinações”, que são pequenas variações de altura (pitch) na voz cantada, algo que é natural e é parte fisiológica da performance vocal humana. Diferente de instrumentos eletrônicos que produzem notas com afinação fixa, a voz humana é um sistema orgânico, sujeito a variações sutis que ocorrem por diversos fatores: respiração, tensão muscular, emoção, acústica do ambiente e até a forma como o cantor articula uma vogal.
Essas flutuações não são erros, mas parte do que dá vida, expressividade e autenticidade a uma performance. Um cantor pode, por exemplo, intencionalmente deslizar entre notas (glissando), iniciar uma nota levemente abaixo ou acima e “cair” nela como um gesto estilístico, ou ainda fazer vibratos naturais, que são variações regulares e controladas de afinação. Tudo isso compõe o que chamamos de assinatura vocal. E é isso que os produtores contemporâneos “sem noção” querem higienizar.
A versão original de Everybody Wants to Rule the World apresenta a voz de Smith com todas as suas características expressivas intactas: pequenas oscilações de afinação, respiração orgânica, e um vibrato humano e sutil. Corrigir isso artificialmente é como alisar a pincelada de um quadro impressionista: pode torná-lo mais "limpo", mas tira justamente o que o torna humano e tocante.
O ouvido humano, por natureza, reconhece e acolhe pequenas imperfeições como parte da expressão emocional e artística. Quando eliminamos isso com correções eletrônicas excessivas, perdemos parte da alma da performance. No caso da música dos Beatles, Now and Then, a expressividade de John Lennon não foi afetada pelo método de preservação, mas no caso da remasterização de Queen I ou da música dos Tears for Fears, talvez não tenham sido as melhores decisões.
No fim das contas, as IAs ou outras tecnologias oferecem recursos incríveis, mas o tiro pode sair pela culatra se a ferramenta for má-administrada. Afinal, nessa relação “homem-máquina”, a contribuição que nós humanos podemos oferecer envolve principalmente aquilo que chamamos de “bom senso”.