Atualização do dicionário de português do Brasil para Aspell

Acabei de atualizar o dicionário (”léxico”) de português brasileiro para Aspell 0.6. Essa nova versão traz as atualizações do Vero, o projeto de verificação ortográfica do BrOffice.org, e mais duas novidades.

Primeiro, passei a incluir um arquivo NEWS, para quem baixar o pacote mais recente poder conhecer a história do dicionário sem precisar ler meu blog :)

Segundo e mais importante, esse último lançamento é baseado na versão “completa” do BrOffice.org, e não na “ideal”. (Para conhecer as diferentes versões dos dicionários do BrOffice.org, consulte a página de downloads. Existem inclusive versões para o Acordo Ortográfico da Língua Portuguesa!) Essa decisão foi uma forma de contornar um erro do Enchant que impede o Aspell de verificar palavras com hífen por inteiro. O resultado é que palavras como “abraçá-la-ão” agora serão marcadas como corretas; o efeito colateral é considerar como corretas “abraçá”, “la” e “ão”.

Em tempo: o pacote pode ser baixado da lista de dicionários para Aspell, mas também deverá estar disponível em breve através de sua distribuição ou sistema operacional livre favorito.

Compartilhe! [rec6] [delicious] [magnolia] [google]

No Translations

Artigos relacionados:

13 respostas para “Atualização do dicionário de português do Brasil para Aspell”

  1. Leonardo via Rec6 disse:

    Atualização do dicionário de português do Brasil para Aspell…

    Essa é a nova e aprimorada versão do dicionário (léxico) para o Aspell. O Aspell é um verificador ortográfico amplamente utilizado por uma variedade de softwares livres, tanto no GNU/Linux quando em outros sistemas operacionais, inclusive Windows…

  2. Vladimir Melo disse:

    Estou em dia com o dicionário agora. Obrigado!

    Caso alguém queira a sua atualização empacotada para Debian [Ubuntu e cia.], preparei um .deb após a instalação, basta clicar aqui.

    [Link quebrado. O autor do comentário sugeriu que os leitores confiram os repositórios oficiais. — Leonardo Fontenelle]

  3. Manoel Aleksandre disse:

    Agradecemos seu esforço e dedicação, Leonardo!
    Eu sempre seguia os passos de uma dica do Hamarcker para incrementar o dicionário em meu Debian.
    Também fico grato ao Vladimir pelo pacote!

  4. Leonardo Fontenelle disse:

    Obrigado! Naturalmente, a maior parte do esforço é do BrOffice.org, na pessoa do Raimundo Moura.

    Estou experimentando o Arch Linux, e fiquei impressionado com a velocidade com que Hugo Doria disponibilizou o dicionário pelo pacman.

  5. Vladimir Melo disse:

    O Manoel Aleksandre percebeu um erro no meu .deb. O Djavan Fagundes me enviou uma página em que o Carlos Morimoto explica o porquê desse tipo de problema. Na verdade, é apenas um arquivo ou mais que já estão instalados por fazerem parte de algum outro pacote e o gerenciador de pacotes não os sobrescreve para evitar conflito. Se não for nada mais grave, como é o caso deste .deb, basta forçar a instalação.
    Quem passar por isso, só precisa digitar no terminal:
    $ sudo dpkg -i --force-all aspell6-pt-br-20080707_0-1_i386.deb

  6. Vladimir Melo disse:

    Pacote aspell-pt-br (20080707) feito com a ajuda de Luiz Armesto, que me ensinou rapidamente como empacotar. A forma de prepará-lo foi de acordo com o guia de empacotamento do Ubuntu e não com o checkinstall (caso anterior).

    Com o tempo vou aprendendo…

    [Link excluído a pedido de Vladimir Melo, que orientou os leitores a conferir os repositórios oficiais. — Leonardo Fontenelle]

  7. Leonardo Fontenelle | Notas rápidas disse:

    [...] Vladimir Melo: Pacote aspell-pt-br (20080707) feito com a ajuda de Luiz Armesto, que me ensinou rapidamente como… [...]

  8. Olivier Hallot disse:

    Caro Leonardo
    Sou responsável pela tradução do BrOffice.org. Desejo iniciar a revisão da UI e da Ajuda (HC) para acomodar o novo acordo ortográfico.

    Baixei o aspell mais recente do site oficial e não sei se os arquivos contemplam o Acordo. Parece que não (enjoo, infraestrutura continuam grifados). Assim dei uma olhada no tarball do aspell para pt-BR e descobri que tem um script em doc/make.sh que baixa um zip do site do Raimundo com os .aff e .dic e procede a uma conversão.

    Acontece que 1) não sei qual dos arquivos do VERO ele baixa (1) (com ou sem o acordo ortográfico) e 2) o script quer um arquivo chamado proc que não esta no tarball. Que arquivo é esse?

    Agradeço sua ajuda.

    Olivier
    (1) http://www.deso-se.com.br/downloads/broffice.org/pt_BR-C.zip

  9. Leonardo Fontenelle disse:

    Olá, Olivier!

    Para criar um dicionário para o Aspell é necessário baixar o pacote ftp://ftp.gnu.org/gnu/aspell/aspell-lang-20071024.tar.bz2. Descompacte-o, crie um diretório doc/ copie lá o arquivo make.sh. Supondo que você use GNU/Linux, abra um terminal, mude o diretório atual para o do aspell-lang (não o doc), e execute “doc/make.sh”. Se você não usar GNU/Linux, me avise que a gente vê o que pode ser feito.

  10. Olivier Hallot disse:

    Grato Leonardo, pela rápida resposta.

    Sou usuário de Mandriva Linux 2009.0

    Baixei o pacote indicado e agora tenho dois diretórios (separados)

    aspell6-pt_BR-20080707-0/
    aspell-lang/

    Ao rodar o make da forma indicada dentro de aspell-lang/ o script dá por falta de arquivos que estão em aspell6-pt_BR-20080707-0/ (info, br-abnt2.kbd, etc..)

    Estes dois diretórios seriam um só? Em caso afirmativo, devo descompactar aspell6-pt_BR-20080707-0/ por cima de aspell-lang/ ? A precedência deve ser crucial, imagino, pois há arquivos de mesmo nome em cada diretório.

    Abraços
    Olivier

  11. Leonardo Fontenelle disse:

    Está certo, faltou incluir alguns arquivos. Você pode copiar do aspell6-pt_BR-20080707-0/ todos os arquivos exceto os que já existem em aspell-lang/; ou pode copiar do primeiro para o segundo os arquivos cuja falta o script sinta.

    Comentário colateral: seria bom termos em 2009 um aspell6-pt_br com as duas ortografias. Não sei ainda como fazer isso, então espere essa nova versão para começar a revisar a tradução do OOo.

  12. Olivier Hallot disse:

    No caso, prefiro trabalhar com o novo acordo ortográfico somente, ainda em 2008.

    Consegui executar o make.sh, ajustando o arquivo a baixar pelo pt_BR-2008-07-07AOV.zip do site do BrOffice.org . Pelo que verifiquei, o script cria um tarball de nome aspell6-pt_BR-20080707-0.tar.bz2. Trabalhando neste novo arquivo, infelizmente continuo esbarrando em problemas.

    [root@localhost aspell6-pt_BR-20080707-0]# ./configure
    Finding Dictionary file location … /usr/lib/aspell-0.60
    Finding Data file location … /usr/lib/aspell-0.60
    [root@localhost aspell6-pt_BR-20080707-0]# make
    /usr/bin/prezip-bin -d < pt_BR.cwl | /usr/bin/aspell –lang=pt_BR create master ./pt_BR.rws
    Error: .//pt_BR_affix.dat:3898: The condition “iquar” does not guarantee that “equar” can always be stripped.
    make: ** [pt_BR.rws] Erro 1

    a linha que gera este erro é :
    SFX h equar équem equar
    SFX h equar équem iquar <—

    Seria um erro nos arquivos do AOC? essa linha é a mesma no arquivo .aff de origem.

    Abraços
    Olivier

  13. Leonardo Fontenelle disse:

    O Aspell é mais chato que o Hun/Myspell nas suas verificações ao criar um dicionário. Relate esses erros a Raimundo Moura, ele saberá corrigir o dicionário de forma a evitá-los.

Deixe uma Resposta