From 7367b36877bca568d785e01be802652b6a719884 Mon Sep 17 00:00:00 2001 From: Andreas Gohr Date: Sun, 14 Aug 2005 20:10:35 +0200 Subject: added stopword support to the indexer, added indexer webbug darcs-hash:20050814181035-7ad00-ed5d879d29fcee7f925f806456675605b058966a.gz --- inc/lang/pt/stopwords.txt | 141 ++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 141 insertions(+) create mode 100644 inc/lang/pt/stopwords.txt (limited to 'inc/lang/pt') diff --git a/inc/lang/pt/stopwords.txt b/inc/lang/pt/stopwords.txt new file mode 100644 index 000000000..6abeff502 --- /dev/null +++ b/inc/lang/pt/stopwords.txt @@ -0,0 +1,141 @@ +# This is a list of words the indexer ignores, one word per line +# When you edit this file be sure to use UNIX line endings (single newline) +# No need to include words shorter than 3 chars - these are ignored anyway +# This list is based upon the ones found at http://www.ranks.nl/stopwords/ +último +acerca +agora +algmas +alguns +ali +ambos +antes +apontar +aquela +aquelas +aquele +aqueles +aqui +atrás +bem +bom +cada +caminho +cima +com +como +comprido +conhecido +corrente +das +debaixo +dentro +desde +desligado +deve +devem +deverá +direita +diz +dizer +dois +dos +ela +ele +eles +enquanto +então +está +estão +estado +estar +estará +este +estes +esteve +estive +estivemos +estiveram +fará +faz +fazer +fazia +fez +fim +foi +fora +horas +iniciar +inicio +irá +ista +iste +isto +ligado +maioria +maiorias +mais +mas +mesmo +meu +muito +muitos +nós +não +nome +nosso +novo +onde +outro +para +parte +pegar +pelo +pessoas +pode +poderá +podia +por +porque +povo +promeiro +quê +qual +qualquer +quando +quem +quieto +são +saber +sem +ser +seu +somente +têm +tal +também +tem +tempo +tenho +tentar +tentaram +tente +tentei +teu +teve +tipo +tive +todos +trabalhar +trabalho +uma +umas +uns +usa +usar +valor +veja +ver +verdade +verdadeiro +você -- cgit v1.2.3