Bem-vindo: Sáb, 23 de Novembro 2024, 15:48 Pesquisa avançada

A produção automatizada de matérias jornalísticas

Esta secção é dirigida a todo o tipo de conversas que não se enquadrem nas secções acima. São proibidas conversas com teor racista, religioso, político, pornográfico, violento entre outros semelhantes.

A produção automatizada de matérias jornalísticas

Mensagempor Bitetti » Sex, 27 de Abril 2012, 20:32

Artigo original

Por Pedro Doria

Falando no último sábado a um grupo de colegas de profissão no 13° Simpósio Internacional de Jornalismo Online, que ocorreu em Austin, no Texas, o repórter do Los Angeles Times Ben Welsh causou uma boa dose de desconforto. Faz três anos que ele vem automatizando a escrita de matérias. O leitor que piscar e reler terá feito o mesmo que muitos editores e repórteres fizeram no auditório do Museu Blanton de Arte. O LA Times publica matérias escritas pelo computador. (E não é o único.)

p>O Brasil não tem uma boa legislação que regulamente a disponibilidade pública de dados que deveriam ser públicos. Nos EUA, os vários órgãos de governo são pressionados a fazê-lo digitalmente. É o caso da LAPD, a Polícia da cidade de Welsh. Todo fim de madrugada, jornais e cidadãos interessados recebem uma tabela com a lista das prisões feitas no dia e na noite anteriores.
Nada complexo: uma planilha de Excel. Lá está o nome de quem foi preso, profissão, local em que ocorreu, crime do qual o sujeito é acusado. Ben Welsh escreveu um programinha simples que lê diariamente esta planilha, distribui num banco de dados e faz algumas análises.

Como se trata de Los Angeles, terra máxima das celebridades, a primeira coisa que o software pinça é se há um ator ou músico entre os presos da noite. Ele compara também a natureza dos crimes. Há nas últimas semanas, por exemplo, uma incidência maior de furtos nalgum canto específico da cidade? O crime cometido é um crime muito raro de ocorrer? O indivíduo preso é acusado de uma série particularmente longa de crimes? É tudo coisa que um repórter policial experiente buscaria. O programa faz isso em poucos segundos.

Os dados isolados e analisados são transformados em texto. O programa tem uma série de matrizes para isso. “Ontem à tal hora se deu o crime tal, a ocorrência foi registrada por fulano” e daí vai. O texto curto, carregado de informações, é distribuído entre os repórteres policiais. Alguns deles podem virar uma reportagem maior e profunda. Por conta desse estudo diário, qualquer mudança nos hábitos de criminosos em Los Angeles é imediatamente percebida na redação. E alguns dos textos produzidos pelo computador são publicados no site exatamente como saem da forma. Não carecem de apuração adicional, fica o registro.

No LA Times, o projeto sai do esforço pessoal de Welsh. Mas pelo menos uma empresa, a Narrative Science, baseada em Chicago, já tem um software comercial para empresas de jornalismo. No momento, sua ênfase se dá no jornalismo financeiro e esportivo. Neste último caso, leia-se beisebol. O site da revista Forbes é um dos principais clientes.

Beisebol é um esporte estranho. Popular nos EUA, em Cuba, na Venezuela, no Japão e talvez em nenhum outro canto do mundo, se uma característica o define é que é predominantemente estatístico. O que o programa faz é, recebendo os números de uma partida, produz a análise de dados. Em que jogada um time começou a aumentar a diferença de pontos em relação ao outro? Em qual um time virou? Uma longa fila de derrotas foi interrompida? Qual o ponto que mais se destacou? Há várias matrizes para as inúmeras situações que podem ocorrer.

Criminalidade em Los Angeles, partidas de beisebol e o cotidiano do mercado financeiro têm em comum a base estatística. A informação está na forma de uma lista de números, e a notícia principal nasce da comparação destes números entre si. Um software não pode substituir todo o jornalismo. Não produz um texto original e instigante. É incapaz de perceber emoção. Provavelmente não seria lá muito útil para falar de futebol, que tem poucos gols e muitos lances nos quais emoção ou arte é que imperam.

Mas computadores já começam, lentamente, a produzir ao menos um pedaço do conteúdo jornalístico. Há um quê de desconforto aí, ao menos para nós. Bem usado, porém — como é o caso do trabalho no LA Times —, elimina o trabalho braçal e permite que repórteres gastem mais tempo pensando. É um mundo no mínimo diferente, este que vem por aí.
Avatar do usuário
Bitetti
 
Mensagens: 875
Registrado em: 03 Janeiro, 2012
Localização: São Paulo

Re: A produção automatizada de matérias jornalísticas

Mensagempor ZonZor » Sex, 27 de Abril 2012, 21:51

Há uns tempos ouvi falar de um software de alta inteligência artificial que gerava textos com base em notícias iguais de jornais diferentes. As máquinas a dominar o mundo :medo:
Avatar do usuário
ZonZor
 
Mensagens: 105
Registrado em: 10 Julho, 2011

Re: A produção automatizada de matérias jornalísticas

Mensagempor Bitetti » Seg, 30 de Abril 2012, 12:56

Por sorte ainda é tudo baseado em texto que segue padrão repetitivo, em locais que o leitor exige mais informação do que um texto trabalhado.

Eu mesmo ando tentando montar um botzinho desses pra fazer narração em jogo.

Mas vai demorar pra subistituirem 100% os humanos, e acho que vai chegar um momento que uma contra-cultura vai exigir textos mais humanos.
Claro existem os esforços para enganar http://www.inbot.com.br/sete/
Avatar do usuário
Bitetti
 
Mensagens: 875
Registrado em: 03 Janeiro, 2012
Localização: São Paulo


Voltar para Seja livre e converse! [OFF-TOPIC]

Quem está online

Usuários navegando neste fórum: Nenhum usuário registrado e 81 visitantes

cron