WARNING: Version 2.0 of Elasticsearch has passed its EOL date.

This documentation is no longer being maintained and may be removed. If you are running this version, we strongly advise you to upgrade. For the latest information, see the current release documentation.

« Word Delimiter Token Filter Stemmer Override Token Filter »

› › ›

Stemmer Token Filter

edit

IMPORTANT: This documentation is no longer updated. Refer to Elastic's version policy and the latest documentation.

Stemmer Token Filter

edit

A filter that provides access to (almost) all of the available stemming token filters through a single unified interface. For example:

{
    "index" : {
        "analysis" : {
            "analyzer" : {
                "my_analyzer" : {
                    "tokenizer" : "standard",
                    "filter" : ["standard", "lowercase", "my_stemmer"]
                }
            },
            "filter" : {
                "my_stemmer" : {
                    "type" : "stemmer",
                    "name" : "light_german"
                }
            }
        }
    }
}

The language/name parameter controls the stemmer with the following available values (the preferred filters are marked in bold):

Arabic	`arabic`
Armenian	`armenian`
Basque	`basque`
Brazilian Portuguese	`brazilian`
Bulgarian	`bulgarian`
Catalan	`catalan`
Czech	`czech`
Danish	`danish`
Dutch	`dutch`, `dutch_kp`
English	`english`, `light_english`, `minimal_english`, `possessive_english`, `porter2`, `lovins`
Finnish	`finnish`, `light_finnish`
French	`french`, `light_french`, `minimal_french`
Galician	`galician`, `minimal_galician` (Plural step only)
German	`german`, `german2`, `light_german`, `minimal_german`
Greek	`greek`
Hindi	`hindi`
Hungarian	`hungarian`, `light_hungarian`
Indonesian	`indonesian`
Irish	`irish`
Italian	`italian`, `light_italian`
Kurdish (Sorani)	`sorani`
Latvian	`latvian`
Norwegian (Bokmål)	`norwegian`, `light_norwegian`, `minimal_norwegian`
Norwegian (Nynorsk)	`light_nynorsk`, `minimal_nynorsk`
Portuguese	`portuguese`, `light_portuguese`, `minimal_portuguese`, `portuguese_rslp`
Romanian	`romanian`
Russian	`russian`, `light_russian`
Spanish	`spanish`, `light_spanish`
Swedish	`swedish`, `light_swedish`
Turkish	`turkish`

« Word Delimiter Token Filter Stemmer Override Token Filter »

Was this helpful?

Feedback

The Search AI Company

ELK Stack

Elastic Cloud

Generative AI

Search

Security

Observability

By solution

Industries

Customer spotlight

Research

Build

Learn

Connect

Stemmer Token Filter

Stemmer Token Filter

Follow us

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards