Новий модуль для алгоритму Стема для Українського пошуку з виділенням коренів

20.09.2017

Вітаю...
Вирішив скористатись силою спільноти для коретного створення модуля стемінга

Що робить модуль?
Він виділяє корінь слів, відкидаючи суфікси, що дозволяє здійснювати пошук не чітко по слову, а по його кореню.
Як відомо в друпал не реалізовано алгоритму саме для Української.

Для російської мови я реалізував адаптацію.
Тепер прийшла черга до української

Створив модифікований модуль на сайті drupal.org
Є релізи для 6 і 7 гілок.

Що потрібно...

На відповідному екрані опцій

6.x - admin/settings/ukstemmer
7.x - admin/config/search/ukstemmer

необхідно вказати коректні регулярні вислови для того, щоб для відповідних морфологічних форм слів автоматично виділявся корінь.

Як побачити роботоздатність модуля
таблиця SQL search_index
При коректних регулярних виразах кожна форма слова буде зберігати лише корінь.

Важливий момент.

Будь-які зміни регулярних виразів в налаштуваннях вимагають переіндексіції бази пошуку!