Skip to contents

A dataset containing the lexicon EcSentiThemeLex - the dictionary of economic, financial and legal terms for which a thematic group(s) and sentiment score (polarity) were defined. The dictionary builded by Fedorova, Afanasyev, Demin and a group of bachelor. Table contains 4472 words and phrases.

Usage

data(key_ecsentithemelex)

Format

A data frame with 4472 rows and 5 variables:

theme

a thematic group

token

a token (word or phrase)

lemma

a lemma of token

regex

regular expression for all word forms of the token (including "е-ё" dualism)

score

the sentiment score: from −2 (strongly negative) to +2 (strongly positive) with step 1

Details

The dictionary includes the thematic groups as following:

Общеэкономическое; Макроэкономика; Международная экономика, торговля и финансы; Монетарная политика, валюта, деньги и кредит, банки; Государственные финансы, бюджет и налоги; Фондовые и товарные рынки; Маркетинг и реклама; Корпоративные финансы и управление, фирма, бухгалтерский учет, нематериальные активы; Социальная ответственность, благотворительность, спонсорская деятельность, экология; Потребление и розничная торговля; Реальный сектор экономики (производство, промышленность, добыча); Инновации .

License

The dictionary is published under Creative Commons "Attribution-NonCommercial-ShareAlike" 4.0 International License (CC BY-NC-SA 4.0). For additional permissions (including the commercial use) please contact to Elena Fedorova <ecolena@mail.ru>.

References

Fedorova, E., Afanasyev, D., Demin, I., Lazarev, A., Nersesyan, R., Pyltsin, I.V. (2020). Development of a tonal-thematic dictionary EcSentiThemeLex for the analysis of economic texts in Russian. Journal of Applied Informatics, 6 (15), 58–77. DOI: https://doi.org/10.37791/2687-0649-2020-15-6-58-77.