A Universidade de Twente, no leste da Holanda, contribuiu com o conhecimento informático e o Instituto Meertens com o linguístico. Dong Nguyen, aluna do doutoramento em informática na universidade, explicou à agência France Presse que, a partir da análise de cerca de 3.000 contas Twitter, os investigadores criaram listas de palavras ou conjuntos de palavras correspondentes a uma faixa etária ou a um determinado género.
A estudante, que participou no projeto, assegurou que apenas foi tido em conta o conteúdo dos 'tweets' (que só podem ter um máximo de 140 caracteres) e não a imagem do perfil, por exemplo.
Aos interessados basta entrarem no 'site' tweetgenie.nl e inserirem o seu nome de utilizador para o programa fazer a avaliação, comparando as suas últimas 200 mensagens (apenas em holandês) com a base de dados.
Dong Nguyen disse que a distinção entre géneros "é, de facto, muito, muito estereotipada". De acordo com os exemplos dados no 'site', os homens utilizam frequentemente as palavras "futebol" e "cerveja", enquanto as mulheres preferem "unhas" e "haha".
"Quanto à idade, os jovens falam mais deles próprios e utilizam muitos 'emoticons' (símbolos gráficos de emoções), enquanto as pessoas mais velhas utilizam palavras e frases mais longas", adiantou. O programa tem uma margem de erro de quatro anos, que é menor para os jovens e maior para os mais velhos.
A estudante assinalou que a linguagem dos utilizadores é "mais uniforme" depois dos 35 anos, adiantando existirem "muito mais diferenças entre um utilizador de 15 anos e um de 20 anos, do que entre um de 45 e um de 55 anos". Segundo Dong Nguyen, a equipa que trabalhou no programa pretende agora adaptá-lo a outras línguas e a outras redes sociais, como o Facebook.