quinta-feira, 5 de setembro de 2019

Todos os idiomas transmitem 39,15 bits de informação por segundo

Sonoridade, velocidade da pronúncia, entonação, vocabulário. Cada uma das milhares de línguas que existem – estima-se que sejam quase 7 mil no mundo todo, sem contar os dialetos – tem sua própria forma de usar esses recursos. 

O palavrão Nah­rungs­mit­tel­un­ver­träg­lich­keit, por exemplo, é o jeitinho delicado de dizer “intolerância alimentar” em alemão. Em mandarim, a palavra “felicidade” (幸福) tem só duas sílabas – ao contrário das cinco utilizadas em português – e é pronunciada “xingfú”.

Além do tamanho das palavras, a velocidade em que são pronunciadas também varia. Falantes de japonês produzem 50% mais sílabas por segundo do que quem fala vietnamita ou tailandês, por exemplo.

Tudo porque a língua nipônica foi concebida de forma mais concisa: o inglês tem 11 vezes mais tipos de sílabas (6949) do que o japonês (643). Ou seja: quando um japonês fala uma sílaba, ela é mais previsível do que uma sílaba em inglês, o que torna a palavra como um todo menos previsível (pois muitas outras palavras contém essa sílaba). O jeito é falar mais sílabas, mais rápido. 

Todo esse papo fonético é, sem dúvidas, pra lá de interessante e renderia assunto para vários parágrafos. Mas a pergunta que fica é: sabe o que tudo isso significa para a forma com que a informação é transmitida em uma conversa? Bem… nada. Apesar de tantas diferenças entre si, todas as línguas transmitem a mesma quantidade de informação por unidade de tempo.

Foi o que descobriu um estudo desenvolvido na Universidade de Lyon, na França, que contou com a participação de um grupo internacional de pesquisadores e foi publicado na revista científica Science Advances.

Primeiro, os pesquisadores usaram um algoritmo para calcular a quantidade de informação que uma única sílaba pode reunir. Foram testados, ao todo, 17 idiomas diferentes: vietnamita, basco, catalão, alemão, inglês, francês, italiano, espanhol, sérvio, japonês, coreano, mandarim, cantonês, tailandês, turco, finlandês e húngaro.

O passo seguinte foi encontrar 170 falantes nativos (10 de cada língua) para ler 15 textos – semelhantes entre si, semanticamente falando, e com cerca de 240 mil sílabas cada.

Ao calcular a quantidade de informação que cada sílaba de uma linguagem possui, é possível comparar o quão “eficiente” elas são. Como eficiência, você pode entender aqui a quantidade de informação que um falante consegue transmitir com uma sílaba (ou um som). Usar mais sílabas para dizer uma mesma coisa torna o idioma menos eficiente – e vice-versa.

Como destaca a revista The Atlantic, o conceito de bits de informação, muito comum quando falamos de arquivos de computador, é também bastante usado na linguística. O que não torna a coisa menos complexa de se entender, é claro.

Em resumo, dá para dizer que 1 bit de informação reduz a incerteza do papo pela metade. Calma, a gente explica. Se eu falo uma sílaba, e esse determinado som é capaz de eliminar metade do número de coisas do mundo sobre as quais eu poderia estar falando, essa sílaba carrega 1 bit de informação. Tudo porque faz o ouvinte saber que a coisa em questão tem a ver com a metade que sobrou, tornando a conversa menos estranha – e o fazendo entender que, literalmente, está falando a mesma língua de quem ouve.

Foi neste ponto que apareceu um resultado interessante: enquanto línguas como o basco possuem 4,8 bits de informação por sílaba, vietnamitas usam 8 bits a cada sílaba quando usam sua língua materna. Ainda que o ritmo de leitura dependa da pessoa que lê, os falantes de idiomas “mais eficientes” falavam, no geral, mais lentamente. E o inverso também era observado. Línguas que geram uma quantidade menor de informação por sílaba precisavam compensar falando de forma mais ligeira.

“Surpreendentemente, encontramos evidências sólidas de que algumas linguagens são [naturalmente] faladas de forma mais rápida do que outras”, disse Dan Dediu, co-autor da pesquisa, em comunicado.

O fato de línguas menos complexas compensarem a diferença falando mais rápido equilibrou as coisas. A taxa com que a informação era repassada, assim, era mais ou menos a mesma. Não importava ou quão rápida ou lenta, simples ou complexa era a linguagem: a quantidade de informação era sempre próxima a 39,15 bits por segundo em todos os casos analisados.

Os achados mostram que uma linguagem não pode ser muito densa (ou carregando muita informação em cada sílaba) e, ao mesmo tempo, falada muito rapidamente. Essa combinação poderia tornar as ideias complexas demais para se articular – e muito difíceis de serem compreendidas por quem escuta.

Da mesma maneira, não dá para que, além de dizer menos coisas por segundo, uma língua tenha palavras pronunciadas muito lentamente. Isso obrigaria quem ouve memorizar uma grande fala para captar pouca coisa. Além de tornar seus falantes extremamente enfadonhos de se ouvir durante uma conversa de bar.

O motivo pelo qual essa relação acontece e por que há um padrão fixo de 39,15 bits por segundo, de acordo com os pesquisadores, segue sendo um mistério. A hipótese mais consistente é que o esforço de falar ou entender uma conversa está ligado às frequências das ondas cerebrais – que costumam ser parecidas independentemente do local de nascimento da pessoa. Essa capacidade cerebral impõe um padrão “de fábrica” para o ritmo em que a linguagem pode ser gerada e entendida.

Moral da história? Nada de reclamar da velocidade do exercício de listening das aulinhas de inglês – ou de qualquer outro idioma. Embora pareça sabotagem com quem ouve, a informação não está sendo passada mais rápida do que deveria. É tudo questão de prática.


Todos os idiomas transmitem 39,15 bits de informação por segundo Publicado primeiro em https://super.abril.com.br/feed

Nenhum comentário:

Postar um comentário