Atualização do dicionário de português do Brasil para Aspell

Acabei de atualizar o dicionário (“léxico”) de português brasileiro para Aspell 0.6. Essa nova versão traz as atualizações do Vero, o projeto de verificação ortográfica do BrOffice.org, e mais duas novidades.

Primeiro, passei a incluir um arquivo NEWS, para quem baixar o pacote mais recente poder conhecer a história do dicionário sem precisar ler meu blog :)

Segundo e mais importante, esse último lançamento é baseado na versão “completa” do BrOffice.org, e não na “ideal”. (Para conhecer as diferentes versões dos dicionários do BrOffice.org, consulte a página de downloads. Existem inclusive versões para o Acordo Ortográfico da Língua Portuguesa!) Essa decisão foi uma forma de contornar um erro do Enchant que impede o Aspell de verificar palavras com hífen por inteiro. O resultado é que palavras como “abraçá-la-ão” agora serão marcadas como corretas; o efeito colateral é considerar como corretas “abraçá”, “la” e “ão”.

Em tempo: o pacote pode ser baixado da lista de dicionários para Aspell, mas também deverá estar disponível em breve através de sua distribuição ou sistema operacional livre favorito.

Artigos relacionados:

13 respostas para “Atualização do dicionário de português do Brasil para Aspell”

    1. Atualização do dicionário de português do Brasil para Aspell…

      Essa é a nova e aprimorada versão do dicionário (léxico) para o Aspell. O Aspell é um verificador ortográfico amplamente utilizado por uma variedade de softwares livres, tanto no GNU/Linux quando em outros sistemas operacionais, inclusive Windows…

    2. Vladimir Melo disse:

      Estou em dia com o dicionário agora. Obrigado!

      Caso alguém queira a sua atualização empacotada para Debian [Ubuntu e cia.], preparei um .deb após a instalação, basta clicar aqui.

      [Link quebrado. O autor do comentário sugeriu que os leitores confiram os repositórios oficiais. — Leonardo Fontenelle]

    3. Agradecemos seu esforço e dedicação, Leonardo!
      Eu sempre seguia os passos de uma dica do Hamarcker para incrementar o dicionário em meu Debian.
      Também fico grato ao Vladimir pelo pacote!

    4. Obrigado! Naturalmente, a maior parte do esforço é do BrOffice.org, na pessoa do Raimundo Moura.

      Estou experimentando o Arch Linux, e fiquei impressionado com a velocidade com que Hugo Doria disponibilizou o dicionário pelo pacman.

    5. Vladimir Melo disse:

      O Manoel Aleksandre percebeu um erro no meu .deb. O Djavan Fagundes me enviou uma página em que o Carlos Morimoto explica o porquê desse tipo de problema. Na verdade, é apenas um arquivo ou mais que já estão instalados por fazerem parte de algum outro pacote e o gerenciador de pacotes não os sobrescreve para evitar conflito. Se não for nada mais grave, como é o caso deste .deb, basta forçar a instalação.
      Quem passar por isso, só precisa digitar no terminal:
      $ sudo dpkg -i --force-all aspell6-pt-br-20080707_0-1_i386.deb

    6. Vladimir Melo disse:

      Pacote aspell-pt-br (20080707) feito com a ajuda de Luiz Armesto, que me ensinou rapidamente como empacotar. A forma de prepará-lo foi de acordo com o guia de empacotamento do Ubuntu e não com o checkinstall (caso anterior).

      Com o tempo vou aprendendo…

      [Link excluído a pedido de Vladimir Melo, que orientou os leitores a conferir os repositórios oficiais. — Leonardo Fontenelle]

    7. [...] Vladimir Melo: Pacote aspell-pt-br (20080707) feito com a ajuda de Luiz Armesto, que me ensinou rapidamente como… [...]

    8. Olivier Hallot disse:

      Caro Leonardo
      Sou responsável pela tradução do BrOffice.org. Desejo iniciar a revisão da UI e da Ajuda (HC) para acomodar o novo acordo ortográfico.

      Baixei o aspell mais recente do site oficial e não sei se os arquivos contemplam o Acordo. Parece que não (enjoo, infraestrutura continuam grifados). Assim dei uma olhada no tarball do aspell para pt-BR e descobri que tem um script em doc/make.sh que baixa um zip do site do Raimundo com os .aff e .dic e procede a uma conversão.

      Acontece que 1) não sei qual dos arquivos do VERO ele baixa (1) (com ou sem o acordo ortográfico) e 2) o script quer um arquivo chamado proc que não esta no tarball. Que arquivo é esse?

      Agradeço sua ajuda.

      Olivier
      (1) http://www.deso-se.com.br/downloads/broffice.org/pt_BR-C.zip

    9. Olá, Olivier!

      Para criar um dicionário para o Aspell é necessário baixar o pacote ftp://ftp.gnu.org/gnu/aspell/aspell-lang-20071024.tar.bz2. Descompacte-o, crie um diretório doc/ copie lá o arquivo make.sh. Supondo que você use GNU/Linux, abra um terminal, mude o diretório atual para o do aspell-lang (não o doc), e execute “doc/make.sh”. Se você não usar GNU/Linux, me avise que a gente vê o que pode ser feito.

    10. Olivier Hallot disse:

      Grato Leonardo, pela rápida resposta.

      Sou usuário de Mandriva Linux 2009.0

      Baixei o pacote indicado e agora tenho dois diretórios (separados)

      aspell6-pt_BR-20080707-0/
      aspell-lang/

      Ao rodar o make da forma indicada dentro de aspell-lang/ o script dá por falta de arquivos que estão em aspell6-pt_BR-20080707-0/ (info, br-abnt2.kbd, etc..)

      Estes dois diretórios seriam um só? Em caso afirmativo, devo descompactar aspell6-pt_BR-20080707-0/ por cima de aspell-lang/ ? A precedência deve ser crucial, imagino, pois há arquivos de mesmo nome em cada diretório.

      Abraços
      Olivier

    11. Está certo, faltou incluir alguns arquivos. Você pode copiar do aspell6-pt_BR-20080707-0/ todos os arquivos exceto os que já existem em aspell-lang/; ou pode copiar do primeiro para o segundo os arquivos cuja falta o script sinta.

      Comentário colateral: seria bom termos em 2009 um aspell6-pt_br com as duas ortografias. Não sei ainda como fazer isso, então espere essa nova versão para começar a revisar a tradução do OOo.

    12. Olivier Hallot disse:

      No caso, prefiro trabalhar com o novo acordo ortográfico somente, ainda em 2008.

      Consegui executar o make.sh, ajustando o arquivo a baixar pelo pt_BR-2008-07-07AOV.zip do site do BrOffice.org . Pelo que verifiquei, o script cria um tarball de nome aspell6-pt_BR-20080707-0.tar.bz2. Trabalhando neste novo arquivo, infelizmente continuo esbarrando em problemas.

      [root@localhost aspell6-pt_BR-20080707-0]# ./configure
      Finding Dictionary file location … /usr/lib/aspell-0.60
      Finding Data file location … /usr/lib/aspell-0.60
      [root@localhost aspell6-pt_BR-20080707-0]# make
      /usr/bin/prezip-bin -d < pt_BR.cwl | /usr/bin/aspell –lang=pt_BR create master ./pt_BR.rws
      Error: .//pt_BR_affix.dat:3898: The condition “iquar” does not guarantee that “equar” can always be stripped.
      make: ** [pt_BR.rws] Erro 1

      a linha que gera este erro é :
      SFX h equar équem equar
      SFX h equar équem iquar <—

      Seria um erro nos arquivos do AOC? essa linha é a mesma no arquivo .aff de origem.

      Abraços
      Olivier

    13. O Aspell é mais chato que o Hun/Myspell nas suas verificações ao criar um dicionário. Relate esses erros a Raimundo Moura, ele saberá corrigir o dicionário de forma a evitá-los.

    Deixe uma Resposta


Bad Behavior has blocked 426 access attempts in the last 7 days.